Page 35 - 《中国药房》2022年22期
P. 35
为 2 时,累积解释率为 99.78%(PC1=85.47%,PC2= 表4 不同模型识别方法对干姜及其不同炮制程度姜炭
14.31%),前 2 个主成分能较好地解释样品 99.78% 的颜 的识别结果
色特征,说明提取的信息具有较好的代表性。该 PCA 模型识别 10-折交叉验证法(预测/真实) 外部验证法(预测/真实)
参数 轻炭 标炭 重炭 正判 轻炭 标炭 重炭 正判
模型的得分如图 6 所示,由图可知,除了 4 批轻炭饮片 方法 干姜 干姜
饮片 饮片 饮片 率/% 饮片 饮片 饮片 率/%
与标炭饮片比较接近外,其余炮制品均能被较好分离, LDA 14/14 14/14 14/14 14/14 100 6/6 6/6 5/6 6/6 95.83
PLS-DA components=4 14/14 12/14 11/14 13/14 89.28 6/6 6/6 5/6 6/6 95.83
提示通过将颜色客观量化从而区分不同炮制程度姜炭
SVM RBF核函数 14/14 14/14 14/14 14/14 100 6/6 6/6 5/6 6/6 95.83
具有一定的可行性。后续实验将采用有监督模式识别 c=0.659 7,g=0.006 8
方法通过进一步学习提高判别的准确率。
成分含量进行Pearson相关性分析,结果见表5。结果显
2.0 *
示,除 6-姜酚、8-姜酚、10-姜酚与颜色特征值 a 无差异
1.5 外,其余各成分和颜色特征值均具有显著差异性。姜酮
scores on PC 2-EV=14.31% -0.5 0 与颜色特征值R、G、B、L 、b 、H、S、V呈显著负相关关系,
1.0
*
*
0.5
*
6-姜酚、8-姜酚和颜色特征值a 呈负相关关系,其他成分
与颜色特征值均呈正相关关系。故进一步对颜色和5种
-1.0
轻炭饮片
-1.5 干姜 成分进行定量预测模型分析。
标炭饮片
-2.0 重炭饮片 表5 干姜及其不同炮制程度姜炭的图像颜色特征值与
-5 -4 -3 -2 -1 0 1 2 3 内在成分的Pearson相关性分析结果
scores on PC 1-EV=85.47%
图6 干姜及其不同炮制程度姜炭PCA模型得分结果 成分 R G B L * a * b * H S V
a
姜酮 -0.602 a -0.689 -0.767 -0.665 a 0.712 -0.314 -0.602 -0.689 -0.767 a
a
a
a
a
a
a
2.3.2 有监督模式识别的干姜及其不同炮制程度姜炭 6-姜酚 0.910 a 0.889 a 0.830 a 0.898 -0.067 0.877 a 0.910 a 0.889 a 0.830 a
a
8-姜酚 0.905 a 0.885 a 0.827 a 0.893 -0.063 0.871 a 0.905 a 0.885 a 0.827 a
的判别 为了提高模型对姜炭不同炮制品的判别效 10-姜酚 0.867 a 0.832 a 0.759 a 0.844 a 0.044 0.875 a 0.867 a 0.832 a 0.759 a
果,基于样品图像提取的颜色特征值,采用有监督模式 6-姜烯酚 0.488 a 0.376 a 0.230 b 0.413 a 0.634 a 0.732 a 0.488 a 0.376 a 0.230 b
识别方法,包括 LDA、PLS-DA 和 SVM。以提取的 9 个 a:P<0.01;b:P<0.05
*
*
*
颜色特征值(R、G、B、L 、a 、b 、H、S、V)作为自变量,样 2.4.2 颜色-成分定量分析 将 9 个颜色特征值(R、G、
*
*
*
品类别标签(干姜、轻炭饮片、标炭饮片、重炭饮片)作 B、L 、a 、b 、H、S、V)作为自变量,5个成分含量作为因变
为因变量,以样品正确判别率为指标,采用 10-折交叉 量,使用 SVM 建立成分含量回归模型,采用 10-折交叉
验证法和外部验证法来评价模型性能。本次实验共有 验证法和外部验证法评价模型性能,以决定系数(R)、
2
干姜及其不同炮制程度姜炭样品 80 批,将其随机分为 均方根误差(RMSE)和相对分析误差(RPD)作为回归模
训练集(56批)与验证集(24批),训练集用来训练模型, 型的评价指标。R 越大,RMSE越小,RPD值越大,表明
2
从而选出模型的最佳参数;验证集用于测试模型的应 定量模型的性能越好。样品划分方法同“2.3.2”项下,成
用效果。3种模型识别的识别结果如表4所示,PLS-DA
分含量定量预测模型结果如表6所示。由表6可知,5种
对于不同炮制程度姜炭的交叉训练模型效果较差,标
成分的RPD值均大于2,说明SVM对5种成分均有着较
炭饮片预测准确度为 11/14;LDA 和 SVM 对所有批次
2
好的预测能力。各成分的验证集相关系数(R P )与训练
样品识别的准确率都较高,两者在交叉验证训练过程
2
集的相关系数(R C )中姜酮为 0.633 9 与 0.683 3,其余 4
中对全部类别的预测准确度均达 100%,在外部验证中
2
种成分的R P和R C均大于0.75,提示用SVM建立的模型
2
仅将 1 个标炭饮片样品误判为轻炭饮片样品。综上所
预测5种成分含量时,除姜酮的稳定性较差,其余4种成
述,LDA、SVM模型识别方法建立的模型对于姜炭炮制
分稳定性均较好。综上,基于机器视觉颜色数字化融合
程度的预测结果准确快速,其中 SVM 对于学习和处理
SVM机器学习方法建立的定量模型可用于预测不同炮
样本颜色特征间存在的非共线问题具有较大的优势,
制程度姜炭中的6-姜酚、8-姜酚、10-姜酚、6-姜烯酚4种
故选择 SVM 用于接下来的不同炮制程度姜炭的定量
模型。 成分的含量。
2.4 基于机器学习的干姜及其不同炮制程度姜炭的颜 3 讨论
色-成分定量预测分析 颜色特征是传统中药质量评价和中药炮制程度判
2.4.1 颜色-成分相关性分析 使用 SPSS 23.0 软件将 断的重要标准,但由于不可避免的感官差异、主观性等
干姜及其不同炮制程度姜炭的图像颜色特征值与内在 原因,颜色特征评价容易受到干扰。随着技术的发展,
中国药房 2022年第33卷第22期 China Pharmacy 2022 Vol. 33 No. 22 · 2717 ·