Page 31 - 《中国药房》2025年6期
P. 31

3.0                                        2.4 贯叶金丝桃外观色度预测含量研究
                  2.5
                                                                 为探寻贯叶金丝桃外观色泽和内在质量的相关性,
                  2.0                                        探索建立“辨色论质”的方法,本研究利用机器学习方法
                 欧氏距离  1.5                                   构建了基于外观色度预测贯叶金丝桃主要成分含量的
                  1.0
                                                             模型(见图3)。
                  0.5
                   0                                                   含量及颜色      含量及颜色      特征提取
                    19     15             6      2       4    14  18      1        9     20   12      13     17      8       5      16      3       11  数据收集  数据预处理
                                  编号
                   图2 18批样品聚类分析的树状图
                                                                       预测评估模       模型建立      机器学习
                                                                         型性能
          2.3 贯叶金丝桃的颜色测定
                                                             图3 基于外观色度预测贯叶金丝桃主要成分含量的模
              颜色空间基于人眼对颜色的感知,能够精确捕捉和
                                                                  型路径图
          量化中药颜色的细微变化,从而真实反映其颜色特性。
                                                             2.4.1 机器学习模型的建立
          明度值(L*)范围为 0~100,表示颜色从黑到白的变化;
          红绿值(a*)表示颜色从红到绿的变化,其中正值代表红                             以 20 批贯叶金丝桃中绿原酸等 7 种成分含量、L*、
          色,负值代表绿色;黄蓝值(b*)表示颜色从黄到蓝的变                         a*、b*值为样本特征,采用 Min-Max 归一化方法进行标
                                      [12]
          化,正值代表黄色,负值代表蓝色 。                                  准化或归一化处理;再通过 Python 绘制核密度估计图
              取 20 批样品,粉碎,过三号筛,均匀放置于表面皿                     (kernel density estimation,KDE)以识别异常值并进行填
          中,使用电子眼系统采集图像,平行采集 3 次后取平均                         充;使用 Python 中的“train_test_split”命令将数据集按
          值 。 结 果 显 示 ,20 批 贯 叶 金 丝 桃 的 L* 为 62.814~         8∶2的比例随机划分为训练集和测试集。为减少过拟合
          75.668,a*为 1.409~3.490,b*为 25.249~30.759,表明贯       风险,本研究结合网格搜索和三折交叉验证提升模型精
          叶金丝桃粉末整体偏白、偏红、偏黄。结果见表5。                            度,结果见图4。由图4可见,训练集与测试集中各成分
             表5 20批贯叶金丝桃的色度值测定结果(n=3)                        分布基本一致,表明模型能很好地应用于测试集。
                                                             2.4.2 预测模型的筛选
          样品编号    L*    a*    b*  样品编号    L*    a*    b*
          S1     70.006  1.911  27.304  S11  63.617  3.038  27.299  以 XGBoost、LightGBM、AdaBoost 等机器学习算法
          S2     66.716  3.149  27.348  S12  75.668  2.062  29.700  作 为 预 测 模 型 ,使 用 均 方 根 误 差(root-mean-square-
          S3     74.926  1.763  28.295  S13  68.271  3.090  26.515  error,RMSE)评 价 机 器 学 习 模 型 效 果 ,RMSE=
          S4     64.314  2.568  26.891  S14  70.406  2.455  29.368
          S5     70.100  2.304  26.520  S15  69.188  2.006  30.759  1  n   2
                                                                       i
          S6     73.893  1.409  28.370  S16  68.856  2.450  27.120  n ∑ (y - y ̂ ) ,式中y 代表真实的测量值, y ̂ 代表机
                                                                          i
                                                                                                      i
                                                                                   i
                                                                   i = 1
          S7     73.668  2.890  29.447  S17  62.814  3.353  25.249  器学习模型的预测值,n代表样本量。RMSE值越小,表
          S8     71.808  2.314  26.895  S18  63.099  2.855  27.435
          S9     66.202  3.490  26.832  S19  64.413  3.131  27.842  示模型可以识别数据的能力越强,模型的预测越准
                                                               [13]
          S10    70.134  1.892  26.602  S20  64.822  2.805  26.526  确 。模型评估结果见表 6。由表 6 可知,XGBoost、
                                                                          5
                                          训练集      5             训练集                     训练集
                           12
                                          测试集                    测试集      4              测试集
                           10                      4
                           8                       3                      3
                          概率密度  6                 概率密度  2                概率密度  2
                           4
                                                   1                      1
                           2
                           0                       0                      0
                              0       0.05       0.10       0.15         0.20  -0.1     0         0.1                        0.2                       0.3                         0.4                         0.5   0           0.1                   0.2                 0.3                  0.4                 0.5                   0.6
                                    绿原酸                    芦丁                      金丝桃苷
                             训练集      10             训练集      12            训练集                      训练集
                6                                                                     8
                             测试集                     测试集                    测试集                      测试集
                5                      8                      10
                                                               8                      6
                4                      6
               概率密度  3                概率密度  4                 概率密度  6                概率密度  4
                2                                              4
                                                                                      2
                                       2
                1                                              2
                0                      0                       0                      0
                 -0.1                 0           0.1                                         0.2                                        0.3  -0.05      0              0.05      0.10                0.15   0.20  0       0.05            0.10           0.15         0.20  0           0.1         0.2              0.3
                       异槲皮苷                   扁蓄苷                       槲皮苷                    槲皮素
                               图4 贯叶金丝桃中7种成分含量训练集与测试集的KDE分布图


          中国药房  2025年第36卷第6期                                                 China Pharmacy  2025 Vol. 36  No. 6    · 665 ·
   26   27   28   29   30   31   32   33   34   35   36