Page 125 - 《中国药房》2024年1期
P. 125
组成成分间的关系转换成“方剂-证型”和“证型-组成成 算法,前者基于先验知识,后者基于树结构。上述2种算
分”2个概率模型,表明该方法能够很好地计算方剂间的 法均有助于识别多种属性之间的关系并生成关联规则,
[31]
相似度。郭文龙等 采用词频-逆文档频率算法建立了 例如挖掘高频药物的配方规律等,从而有助于分析用药
[39]
[40]
方剂数据挖掘系统,可用于推荐与目标方剂功能和主治 原则、验证配伍规律 。如李德琳等 通过 FP-growth
相似度高的方剂。 算法对靶点-通路网络进行了数据挖掘分析,得到 34 组
对于联合用药产生的不良反应,王淳等 采用关联 靶点-通路频繁项集,验证了方剂具有多成分和多靶点
[32]
规则算法分析了联合用药对心血管疾病的影响,提出应 的特征。
[33]
谨慎使用丹参注射液、参附注射液等。蒋先仲等 采用 4 总结与讨论
数据挖掘算法并引入“丰度”的概念用于衡量研究中纳 本文对147篇中药方剂研究中运用数据挖掘算法的
入的药品占比,提出“目标调节+整体调节+肠道微生态 文献进行了整理与分析,结果表明,数据挖掘算法已在
环境调节”的个体化组方策略,分别对早、中、晚期3个阶 中药方剂的研究中广泛应用,主要应用的子领域为:中
段的胃癌患者给出了组方设计建议。 药方剂作用机制研究、中药方剂量效研究、挖掘核心药
3 算法应用效果比较 对/药组、发现新方剂和挖掘配伍规律。常用的数据挖掘
3.1 分类任务中常用算法的比较 算法包括:关联规则、聚类分析、分类分析、复杂网络分
分类算法是预测性任务的一种,主要目标是将数据 析等。
划分为不同的类别。中药方剂领域研究中常采用的分 虽然数据挖掘算法具有较广泛的应用范围,但其对
类算法有决策树算法和支持向量机。决策树算法因其 中药方剂的研究还有待进一步改进。首先,数据集规模
是制约数据挖掘算法在中药方剂研究中应用的重要因
易于理解和解释的特点而被用于研究药物与主治病证
素。现有的中药方剂领域数据集规模较小,这对于数据
之间的关系,以及构建配伍决策模型,如构建药物和主
挖掘算法的应用和效果都带来了一定程度的限制。因
[34]
治病证关系决策树、方剂配伍决策模型等 。支持向量
此,需要采集更多的规范化数据,包括临床试验数据和
机常用于建立预测模型、分析方剂配伍的可能性等,如
基础实验数据,以扩大数据集规模,从而提高数据挖掘
[35]
金滋力等 把方剂看作从药物出发的组合决策问题,采
算法的精度和效果。其次,中药方剂研究中使用的算法
用支持向量机达到了90%的分剂分类准确率。
比较单一,缺乏针对性的算法选择。尽管部分数据挖掘
3.2 聚类任务中常用算法的比较
算法有规范的流程,例如关联规则和聚类分析,但其对
聚类分析算法将未被标记的数据分为具有相似特
于中药方剂研究存在一定的局限性和适用范围,需要根
征的簇,从而发现数据集中的内在结构和规律,在方剂
据具体问题和数据特征的选择进行调整。第三,目前数
研究中可实现筛选核心药物的目的,以 K 均值聚类算
据挖掘算法在中药方剂研究中的应用主要集中在方剂
法、层次聚类算法、熵聚类算法为代表。K 均值聚类算
用药规律的分析中,而对于疗效预测、“毒-效”评价、药
法适用于大规模方剂数据分析,其关键点在于选择合适
物禁忌、方剂中药物的炮制等方面的研究相对较少,需
[36]
的聚类个数K。赵凌霄等 在3次聚类中分别比较了不
要更加关注并大力开展相关领域的研究工作。
同K值下的药物聚类结果,得到了不同K值下的药物关
随着中医病历数字化的不断推进,必将产生大量复
系图以及核心组合。层次聚类算法适合小规模数据集,
杂、多维度的数据。相关研究人员可专注于构建结构合
[37]
如数据量有限的自身免疫性肝炎的研究 ,可依据药物
理的中医临床数据库,以应对研究中提出的问题。为了
性味特征进行聚类,用以挖掘药物的核心组合或生成新
实现对传统中药方剂多层次、全方位的数据挖掘,除了
处方。熵聚类算法在处理噪声和异常值方面表现较佳,
进一步拓宽方剂研究新领域以外,研究者还应灵活地组
如肖红等 采用复杂系统熵聚类算法分析药物关联规
[38]
合使用不同算法以提高结果的准确性,避免不必要的数
则,并对聚类结果进行再次提取,通过演化得到了新的
据处理内耗。中药方剂研究若能更进一步结合数据挖
处方。
掘等现代科学技术,必将进一步提高临床疗效,促进中
3.3 关联规则分析中常用算法的比较
医的传承和发展。
[2]
关联规则分析揭示的是数据之间的潜在关系 ,通 参考文献
常包括2个步骤:先查找所有频繁项集,然后基于高频项 [ 1 ] 刘志华,孙晓波 . 网络药理学:中医药现代化的新机遇
生成频繁关联规则。如果其满足最小置信度并基于第 [J]. 药学学报,2012,47(6):696-703.
一步找到的频繁项集,则该规则被视为关联规则。 LIU Z H,SUN X B. Network pharmacology:new oppor‐
Apriori算法和FP-growth算法都是关联规则分析的经典 tunity for the modernization of traditional Chinese medi‐
中国药房 2024年第35卷第1期 China Pharmacy 2024 Vol. 35 No. 1 · 115 ·