Page 35 - 《中国药房》2022年22期
P. 35

为 2 时,累积解释率为 99.78%(PC1=85.47%,PC2=                表4 不同模型识别方法对干姜及其不同炮制程度姜炭
          14.31%),前 2 个主成分能较好地解释样品 99.78% 的颜                      的识别结果
          色特征,说明提取的信息具有较好的代表性。该 PCA                           模型识别            10-折交叉验证法(预测/真实)  外部验证法(预测/真实)
                                                                      参数        轻炭 标炭 重炭 正判     轻炭 标炭 重炭 正判
          模型的得分如图 6 所示,由图可知,除了 4 批轻炭饮片                        方法             干姜              干姜
                                                                                饮片 饮片 饮片 率/%    饮片 饮片 饮片 率/%
          与标炭饮片比较接近外,其余炮制品均能被较好分离,                            LDA            14/14 14/14 14/14 14/14 100  6/6  6/6  5/6  6/6 95.83
                                                              PLS-DA components=4  14/14 12/14 11/14 13/14 89.28 6/6  6/6  5/6  6/6 95.83
          提示通过将颜色客观量化从而区分不同炮制程度姜炭
                                                              SVM  RBF核函数    14/14 14/14 14/14 14/14 100  6/6  6/6  5/6  6/6 95.83
          具有一定的可行性。后续实验将采用有监督模式识别                                  c=0.659 7,g=0.006 8
          方法通过进一步学习提高判别的准确率。
                                                             成分含量进行Pearson相关性分析,结果见表5。结果显
                    2.0                                                                               *
                                                             示,除 6-姜酚、8-姜酚、10-姜酚与颜色特征值 a 无差异
                    1.5                                      外,其余各成分和颜色特征值均具有显著差异性。姜酮
                  scores on PC 2-EV=14.31%  -0.5 0           与颜色特征值R、G、B、L 、b 、H、S、V呈显著负相关关系,
                    1.0
                                                                                    *
                                                                                  *
                    0.5
                                                                                       *
                                                             6-姜酚、8-姜酚和颜色特征值a 呈负相关关系,其他成分
                                                             与颜色特征值均呈正相关关系。故进一步对颜色和5种
                   -1.0
                        轻炭饮片
                   -1.5  干姜                                  成分进行定量预测模型分析。
                        标炭饮片
                   -2.0  重炭饮片                                表5 干姜及其不同炮制程度姜炭的图像颜色特征值与
                       -5     -4     -3       -2       -1         0          1         2                                                  3  内在成分的Pearson相关性分析结果
                             scores on PC 1-EV=85.47%
          图6 干姜及其不同炮制程度姜炭PCA模型得分结果                            成分     R    G    B   L *  a *  b *  H  S    V
                                                                                         a
                                                              姜酮   -0.602 a  -0.689 -0.767 -0.665 a  0.712 -0.314 -0.602 -0.689 -0.767 a
                                                                            a
                                                                                                       a
                                                                                a
                                                                                              a
                                                                                                  a
                                                                                    a
          2.3.2 有监督模式识别的干姜及其不同炮制程度姜炭                          6-姜酚  0.910 a  0.889 a  0.830 a  0.898 -0.067  0.877 a  0.910 a  0.889 a  0.830 a
                                                                                    a
                                                              8-姜酚  0.905 a  0.885 a  0.827 a  0.893 -0.063  0.871 a  0.905 a  0.885 a  0.827 a
          的判别 为了提高模型对姜炭不同炮制品的判别效                              10-姜酚  0.867 a  0.832 a  0.759 a  0.844 a  0.044  0.875 a  0.867 a  0.832 a  0.759 a
          果,基于样品图像提取的颜色特征值,采用有监督模式                            6-姜烯酚  0.488 a  0.376 a  0.230 b  0.413 a  0.634 a  0.732 a  0.488 a  0.376 a  0.230 b
          识别方法,包括 LDA、PLS-DA 和 SVM。以提取的 9 个                     a:P<0.01;b:P<0.05
                             *
                                *
                                   *
          颜色特征值(R、G、B、L 、a 、b 、H、S、V)作为自变量,样                 2.4.2 颜色-成分定量分析 将 9 个颜色特征值(R、G、
                                                                   *
                                                                *
                                                                      *
          品类别标签(干姜、轻炭饮片、标炭饮片、重炭饮片)作                          B、L 、a 、b 、H、S、V)作为自变量,5个成分含量作为因变
          为因变量,以样品正确判别率为指标,采用 10-折交叉                         量,使用 SVM 建立成分含量回归模型,采用 10-折交叉
          验证法和外部验证法来评价模型性能。本次实验共有                            验证法和外部验证法评价模型性能,以决定系数(R)、
                                                                                                          2
          干姜及其不同炮制程度姜炭样品 80 批,将其随机分为                         均方根误差(RMSE)和相对分析误差(RPD)作为回归模
          训练集(56批)与验证集(24批),训练集用来训练模型,                       型的评价指标。R 越大,RMSE越小,RPD值越大,表明
                                                                             2
          从而选出模型的最佳参数;验证集用于测试模型的应                            定量模型的性能越好。样品划分方法同“2.3.2”项下,成
          用效果。3种模型识别的识别结果如表4所示,PLS-DA
                                                             分含量定量预测模型结果如表6所示。由表6可知,5种
          对于不同炮制程度姜炭的交叉训练模型效果较差,标
                                                             成分的RPD值均大于2,说明SVM对5种成分均有着较
          炭饮片预测准确度为 11/14;LDA 和 SVM 对所有批次
                                                                                                    2
                                                             好的预测能力。各成分的验证集相关系数(R P )与训练
          样品识别的准确率都较高,两者在交叉验证训练过程
                                                                            2
                                                             集的相关系数(R C )中姜酮为 0.633 9 与 0.683 3,其余 4
          中对全部类别的预测准确度均达 100%,在外部验证中
                                                                           2
                                                             种成分的R P和R C均大于0.75,提示用SVM建立的模型
                                                                       2
          仅将 1 个标炭饮片样品误判为轻炭饮片样品。综上所
                                                             预测5种成分含量时,除姜酮的稳定性较差,其余4种成
          述,LDA、SVM模型识别方法建立的模型对于姜炭炮制
                                                             分稳定性均较好。综上,基于机器视觉颜色数字化融合
          程度的预测结果准确快速,其中 SVM 对于学习和处理
                                                             SVM机器学习方法建立的定量模型可用于预测不同炮
          样本颜色特征间存在的非共线问题具有较大的优势,
                                                             制程度姜炭中的6-姜酚、8-姜酚、10-姜酚、6-姜烯酚4种
          故选择 SVM 用于接下来的不同炮制程度姜炭的定量
          模型。                                                成分的含量。
          2.4 基于机器学习的干姜及其不同炮制程度姜炭的颜                          3 讨论
          色-成分定量预测分析                                             颜色特征是传统中药质量评价和中药炮制程度判
          2.4.1 颜色-成分相关性分析 使用 SPSS 23.0 软件将                  断的重要标准,但由于不可避免的感官差异、主观性等
          干姜及其不同炮制程度姜炭的图像颜色特征值与内在                            原因,颜色特征评价容易受到干扰。随着技术的发展,
          中国药房  2022年第33卷第22期                                              China Pharmacy  2022 Vol. 33  No. 22    · 2717 ·
   30   31   32   33   34   35   36   37   38   39   40