Page 125 - 《中国药房》2024年1期
P. 125

组成成分间的关系转换成“方剂-证型”和“证型-组成成                         算法,前者基于先验知识,后者基于树结构。上述2种算
          分”2个概率模型,表明该方法能够很好地计算方剂间的                          法均有助于识别多种属性之间的关系并生成关联规则,
                          [31]
          相似度。郭文龙等 采用词频-逆文档频率算法建立了                           例如挖掘高频药物的配方规律等,从而有助于分析用药
                                                                                [39]
                                                                                              [40]
          方剂数据挖掘系统,可用于推荐与目标方剂功能和主治                           原则、验证配伍规律 。如李德琳等 通过 FP-growth
          相似度高的方剂。                                           算法对靶点-通路网络进行了数据挖掘分析,得到 34 组
              对于联合用药产生的不良反应,王淳等 采用关联                         靶点-通路频繁项集,验证了方剂具有多成分和多靶点
                                               [32]
          规则算法分析了联合用药对心血管疾病的影响,提出应                           的特征。
                                                   [33]
          谨慎使用丹参注射液、参附注射液等。蒋先仲等 采用                           4 总结与讨论
          数据挖掘算法并引入“丰度”的概念用于衡量研究中纳                               本文对147篇中药方剂研究中运用数据挖掘算法的
          入的药品占比,提出“目标调节+整体调节+肠道微生态                          文献进行了整理与分析,结果表明,数据挖掘算法已在
          环境调节”的个体化组方策略,分别对早、中、晚期3个阶                         中药方剂的研究中广泛应用,主要应用的子领域为:中
          段的胃癌患者给出了组方设计建议。                                   药方剂作用机制研究、中药方剂量效研究、挖掘核心药
          3 算法应用效果比较                                         对/药组、发现新方剂和挖掘配伍规律。常用的数据挖掘

          3.1 分类任务中常用算法的比较                                   算法包括:关联规则、聚类分析、分类分析、复杂网络分
              分类算法是预测性任务的一种,主要目标是将数据                         析等。
          划分为不同的类别。中药方剂领域研究中常采用的分                                虽然数据挖掘算法具有较广泛的应用范围,但其对
          类算法有决策树算法和支持向量机。决策树算法因其                            中药方剂的研究还有待进一步改进。首先,数据集规模
                                                             是制约数据挖掘算法在中药方剂研究中应用的重要因
          易于理解和解释的特点而被用于研究药物与主治病证
                                                             素。现有的中药方剂领域数据集规模较小,这对于数据
          之间的关系,以及构建配伍决策模型,如构建药物和主
                                                             挖掘算法的应用和效果都带来了一定程度的限制。因
                                             [34]
          治病证关系决策树、方剂配伍决策模型等 。支持向量
                                                             此,需要采集更多的规范化数据,包括临床试验数据和
          机常用于建立预测模型、分析方剂配伍的可能性等,如
                                                             基础实验数据,以扩大数据集规模,从而提高数据挖掘
                  [35]
          金滋力等 把方剂看作从药物出发的组合决策问题,采
                                                             算法的精度和效果。其次,中药方剂研究中使用的算法
          用支持向量机达到了90%的分剂分类准确率。
                                                             比较单一,缺乏针对性的算法选择。尽管部分数据挖掘
          3.2 聚类任务中常用算法的比较
                                                             算法有规范的流程,例如关联规则和聚类分析,但其对
              聚类分析算法将未被标记的数据分为具有相似特
                                                             于中药方剂研究存在一定的局限性和适用范围,需要根
          征的簇,从而发现数据集中的内在结构和规律,在方剂
                                                             据具体问题和数据特征的选择进行调整。第三,目前数
          研究中可实现筛选核心药物的目的,以 K 均值聚类算
                                                             据挖掘算法在中药方剂研究中的应用主要集中在方剂
          法、层次聚类算法、熵聚类算法为代表。K 均值聚类算
                                                             用药规律的分析中,而对于疗效预测、“毒-效”评价、药
          法适用于大规模方剂数据分析,其关键点在于选择合适
                                                             物禁忌、方剂中药物的炮制等方面的研究相对较少,需
                                [36]
          的聚类个数K。赵凌霄等 在3次聚类中分别比较了不
                                                             要更加关注并大力开展相关领域的研究工作。
          同K值下的药物聚类结果,得到了不同K值下的药物关
                                                                 随着中医病历数字化的不断推进,必将产生大量复
          系图以及核心组合。层次聚类算法适合小规模数据集,
                                                             杂、多维度的数据。相关研究人员可专注于构建结构合
                                            [37]
          如数据量有限的自身免疫性肝炎的研究 ,可依据药物
                                                             理的中医临床数据库,以应对研究中提出的问题。为了
          性味特征进行聚类,用以挖掘药物的核心组合或生成新
                                                             实现对传统中药方剂多层次、全方位的数据挖掘,除了
          处方。熵聚类算法在处理噪声和异常值方面表现较佳,
                                                             进一步拓宽方剂研究新领域以外,研究者还应灵活地组
          如肖红等 采用复杂系统熵聚类算法分析药物关联规
                  [38]
                                                             合使用不同算法以提高结果的准确性,避免不必要的数
          则,并对聚类结果进行再次提取,通过演化得到了新的
                                                             据处理内耗。中药方剂研究若能更进一步结合数据挖
          处方。
                                                             掘等现代科学技术,必将进一步提高临床疗效,促进中
          3.3 关联规则分析中常用算法的比较
                                                             医的传承和发展。
                                                     [2]
              关联规则分析揭示的是数据之间的潜在关系 ,通                         参考文献
          常包括2个步骤:先查找所有频繁项集,然后基于高频项                          [ 1 ]  刘志华,孙晓波 . 网络药理学:中医药现代化的新机遇
          生成频繁关联规则。如果其满足最小置信度并基于第                                 [J]. 药学学报,2012,47(6):696-703.
          一步找到的频繁项集,则该规则被视为关联规则。                                  LIU Z H,SUN X B. Network pharmacology:new oppor‐
          Apriori算法和FP-growth算法都是关联规则分析的经典                        tunity for the modernization of traditional Chinese medi‐
          中国药房  2024年第35卷第1期                                                 China Pharmacy  2024 Vol. 35  No. 1    · 115 ·
   120   121   122   123   124   125   126   127   128   129   130