Page 31 - 《中国药房》2025年6期
P. 31
3.0 2.4 贯叶金丝桃外观色度预测含量研究
2.5
为探寻贯叶金丝桃外观色泽和内在质量的相关性,
2.0 探索建立“辨色论质”的方法,本研究利用机器学习方法
欧氏距离 1.5 构建了基于外观色度预测贯叶金丝桃主要成分含量的
1.0
模型(见图3)。
0.5
0 含量及颜色 含量及颜色 特征提取
19 15 6 2 4 14 18 1 9 20 12 13 17 8 5 16 3 11 数据收集 数据预处理
编号
图2 18批样品聚类分析的树状图
预测评估模 模型建立 机器学习
型性能
2.3 贯叶金丝桃的颜色测定
图3 基于外观色度预测贯叶金丝桃主要成分含量的模
颜色空间基于人眼对颜色的感知,能够精确捕捉和
型路径图
量化中药颜色的细微变化,从而真实反映其颜色特性。
2.4.1 机器学习模型的建立
明度值(L*)范围为 0~100,表示颜色从黑到白的变化;
红绿值(a*)表示颜色从红到绿的变化,其中正值代表红 以 20 批贯叶金丝桃中绿原酸等 7 种成分含量、L*、
色,负值代表绿色;黄蓝值(b*)表示颜色从黄到蓝的变 a*、b*值为样本特征,采用 Min-Max 归一化方法进行标
[12]
化,正值代表黄色,负值代表蓝色 。 准化或归一化处理;再通过 Python 绘制核密度估计图
取 20 批样品,粉碎,过三号筛,均匀放置于表面皿 (kernel density estimation,KDE)以识别异常值并进行填
中,使用电子眼系统采集图像,平行采集 3 次后取平均 充;使用 Python 中的“train_test_split”命令将数据集按
值 。 结 果 显 示 ,20 批 贯 叶 金 丝 桃 的 L* 为 62.814~ 8∶2的比例随机划分为训练集和测试集。为减少过拟合
75.668,a*为 1.409~3.490,b*为 25.249~30.759,表明贯 风险,本研究结合网格搜索和三折交叉验证提升模型精
叶金丝桃粉末整体偏白、偏红、偏黄。结果见表5。 度,结果见图4。由图4可见,训练集与测试集中各成分
表5 20批贯叶金丝桃的色度值测定结果(n=3) 分布基本一致,表明模型能很好地应用于测试集。
2.4.2 预测模型的筛选
样品编号 L* a* b* 样品编号 L* a* b*
S1 70.006 1.911 27.304 S11 63.617 3.038 27.299 以 XGBoost、LightGBM、AdaBoost 等机器学习算法
S2 66.716 3.149 27.348 S12 75.668 2.062 29.700 作 为 预 测 模 型 ,使 用 均 方 根 误 差(root-mean-square-
S3 74.926 1.763 28.295 S13 68.271 3.090 26.515 error,RMSE)评 价 机 器 学 习 模 型 效 果 ,RMSE=
S4 64.314 2.568 26.891 S14 70.406 2.455 29.368
S5 70.100 2.304 26.520 S15 69.188 2.006 30.759 1 n 2
i
S6 73.893 1.409 28.370 S16 68.856 2.450 27.120 n ∑ (y - y ̂ ) ,式中y 代表真实的测量值, y ̂ 代表机
i
i
i
i = 1
S7 73.668 2.890 29.447 S17 62.814 3.353 25.249 器学习模型的预测值,n代表样本量。RMSE值越小,表
S8 71.808 2.314 26.895 S18 63.099 2.855 27.435
S9 66.202 3.490 26.832 S19 64.413 3.131 27.842 示模型可以识别数据的能力越强,模型的预测越准
[13]
S10 70.134 1.892 26.602 S20 64.822 2.805 26.526 确 。模型评估结果见表 6。由表 6 可知,XGBoost、
5
训练集 5 训练集 训练集
12
测试集 测试集 4 测试集
10 4
8 3 3
概率密度 6 概率密度 2 概率密度 2
4
1 1
2
0 0 0
0 0.05 0.10 0.15 0.20 -0.1 0 0.1 0.2 0.3 0.4 0.5 0 0.1 0.2 0.3 0.4 0.5 0.6
绿原酸 芦丁 金丝桃苷
训练集 10 训练集 12 训练集 训练集
6 8
测试集 测试集 测试集 测试集
5 8 10
8 6
4 6
概率密度 3 概率密度 4 概率密度 6 概率密度 4
2 4
2
2
1 2
0 0 0 0
-0.1 0 0.1 0.2 0.3 -0.05 0 0.05 0.10 0.15 0.20 0 0.05 0.10 0.15 0.20 0 0.1 0.2 0.3
异槲皮苷 扁蓄苷 槲皮苷 槲皮素
图4 贯叶金丝桃中7种成分含量训练集与测试集的KDE分布图
中国药房 2025年第36卷第6期 China Pharmacy 2025 Vol. 36 No. 6 · 665 ·