Page 32 - 《中国药房》2025年6期
P. 32

LightGBM、AdaBoost 3 种机器学习算法预测模型的                    合考察峰形、峰数、基线、吸收差异等多项干扰因素后,
          RMSE为0.008~0.070,均较小,未见明显差异。但是鉴于                    最终选取290、354、590 nm作为检测波长。此外,本研究
          XGBoost模型能以正则化方法规避过拟风险,保持模型                         对提取溶剂(不同比例甲醇溶液和乙醇溶液)和提取方
          稳定性,精准评估特征和筛选关键项,可实现含量的精                            式(超声提取、加热回流提取)进行了筛选,结果发现,以
          准预测,因此,本研究选择 XGBoost 模型用于预测贯叶                       60%乙醇为提取溶剂,加热回流提取1 h时,各成分提取
          金丝桃中绿原酸等7种成分的含量。                                    效果最佳,含量最高。
                表6 不同预测模型效果评估的RMSE值                           3.2 20批贯叶金丝桃的含量测定结果分析
           模型    绿原酸    芦丁   金丝桃苷  异槲皮苷  萹蓄苷   槲皮苷   槲皮素          本研究结果显示,绿原酸、芦丁、金丝桃苷、异槲皮
           XGBoost  0.031  0.038  0.020  0.043  0.019  0.043  0.014  苷 、萹 蓄 苷 、槲 皮 苷 、槲 皮 素 含 量 分 别 为 0.025% ~
           LightGBM  0.022  0.044  0.031  0.037  0.023  0.033  0.021  0.166%、0.048%~0.339%、0.082%~0.419%、0.017%~
           AdaBoost  0.025  0.064  0.042  0.070  0.021  0.029  0.008
                                                              0.209%、0.011%~0.134%、0.020%~0.135%、0.041%~
          2.4.3 外观色度值预测的贯叶金丝桃中7种成分含量与
                                                              0.235%。聚类分析结果显示,18 批合格的样品聚为 3
          实测结果分析
                                                              类,其中第1类样品中7种成分的总含量均相对较高,为
              将样本的 L*、a*、b*特征值导入 XGBoost 模型作为
                                                              优品;第 2 类样品为良品;第 3 类样品的总含量相对较
          输入项,贯叶金丝桃中7种成分的含量结果作为输出项,
                                                              低,为合格品。这提示不同产地贯叶金丝桃的成分含量
          再将7种基于色度值预测的成分含量与实测结果进行比
                                                              存在差异,可能与生长环境不同有关;同一产地不同批
          较,结果见图5。由图5可知,芦丁成分的预测含量与实
                                                              次贯叶金丝桃的成分含量也存在差异,可能与药材的采
          测结果偏差较大;其余 6 种成分的 24 组预测结果中,有
                                                              收时间、农户种植水平等因素有关。
          21组的预测值与实际值基本一致,仅3组(绿原酸中的A
                                                              3.3 基于机器学习的贯叶金丝桃的含量预测研究
          组,异槲皮苷和萹蓄苷中的 D 组)的预测值与实际值存
                                                                  颜色是中药外观质量评价的重要指标,其与内在有
          在一定偏差;模型对金丝桃苷成分含量预测的准确率为                                                [14]        [12]
                                                              效成分具有一定相关性 。张一凡等 基于机器学习算
          100%。可见,建立的模型基本能够实现根据外观颜色
                                                              法将颜色特征值与测得的姜炭的5种成分含量进行相关
          预测贯叶金丝桃内在成分的含量。                                     性分析,成功建立了颜色-成分的定量预测模型,为姜炭
          3 讨论                                                炮制程度控制和质量评价提供了参考依据。本研究采
          3.1 色谱条件的选择                                         用机器学习中的XGBoost、LightGBM和AdaBoost算法,
              贯叶金丝桃中的间苯三酚类(贯叶金丝桃素)、萘骈                         利用 L*、a*、b*特征值与有效成分含量测定结果建立了
          二蒽酮类(金丝桃素)、黄酮类(金丝桃苷、芦丁、槲皮苷、                         贯叶金丝桃主要成分的含量预测模型。结果发现,绿原
          槲皮素等)及有机酸类(绿原酸)等为其主要活性成分,                           酸、金丝桃苷、异槲皮苷、萹蓄苷、槲皮苷、槲皮素6种成
          这些成分复杂多样,其中黄酮类成分和有机酸类成分在                            分的含量预测模型均具有较高的预测精度。其中,2020
          354 nm波长处响应值较高,贯叶金丝桃素和金丝桃素的                         年版《中国药典》(一部)规定的指标成分金丝桃苷含量
          最大吸收波长分别为 290、590 nm。为最大化获取指纹                       的预测准确率达到100%。上述结果提示可通过测定外
          图谱信息,实现多种成分含量的同时测定,本研究在综                            观色度值来辨识贯叶金丝桃的质量。
                           0.15                    0.3                    0.4
                                           预测                     预测                      预测
                                           真实                     真实                      真实
                                                                          0.3
                           0.10                    0.2
                          含量/%                    含量/%                    含量/%  0.2
                           0.05                    0.1
                                                                          0.1
                            0                       0                      0
                               A组        B组        C组        D组  A组        B组        C组        D组  A组        B组        C组        D组
                                     绿原酸                     芦丁                    金丝桃苷
               0.15                    0.15                   0.15                    0.3
                                预测                     预测                      预测                     预测
                                真实                     真实                      真实                     真实
               0.10                    0.10                   0.10                    0.2
               含量/%                   含量/%                    含量/%                    含量/%
               0.05                    0.05                   0.05                    0.1


                 0                      0                       0                      0
                   A组        B组        C组        D组  A组        B组        C组        D组  A组        B组        C组        D组  A组        B组        C组        D组
                        异槲皮苷                    扁蓄苷                     槲皮苷                     槲皮素
                          图5 基于外观色度值预测的贯叶金丝桃中7种成分含量与实测结果的柱形图


          · 666 ·    China Pharmacy  2025 Vol. 36  No. 6                               中国药房  2025年第36卷第6期
   27   28   29   30   31   32   33   34   35   36   37