Page 125 - 《中国药房》2025年6期
P. 125

2.3 模型建立及解释                                        类型没有限制,也无须假设药物的药动学模型,能基
              采用 SVM、RF、XGBoost、ANN 4 种机器学习算法                于患者基本资料、临床检查指标及药物治疗情况等及
          在训练集上完成模型训练以及超参数优化,共获得4种                           时、准确地预测血药浓度 。本研究选取 SVM、RF、
                                                                                    [17]
          预测模型。4种模型预测性能比较见表3,4种模型在测                          XGBoost、ANN 4 种算法构建预测模型的原因有以下几
          试集中的预测结果见图2。                                       点 ——(1)多样性和互补性:这4种算法分别代表了不
                                                               [18]
                    表3 4种模型的预测性能比较                           同的建模思路和技术,SVM 和 ANN 具有强大的非线性
          模型            R  2          MAE         RMSE       建模能力,能够处理复杂的高维特征;RF和XGBoost则
          SVM          0.650          11.384      14.598
          RF           0.801          8.010       11.004     代表集成学习方法,具有较强的预测精度和处理缺失数
          XGBoost      0.808          7.644       10.808     据的能力。(2)普遍适用性:这4种算法是机器学习中最
          ANN          0.701          10.369      13.499
                                                             常用的算法,被广泛应用于各类分类和回归任务,具有
                                         2
              4 种预测模型中,XGBoost 的 R 高的同时 MAE 和                较强的泛化能力。(3)性能稳定性:这4种算法在处理实
          RMSE 低,表明该模型预测性能最佳。采用 SHAP 方法                      际数据时表现出良好的性能稳定性,能够适应不同数据
          对XGBoost模型进行解释,得到影响度洛西汀血药浓度                        的复杂性和维度,并且在提高模型预测准确性方面具有
          预测的特征重要性排序:BMI>年龄>其余20个特征集
                                                             显著优势。(4)参数调优灵活性:这4种算法均提供了丰
          合(包括肝、肾功能和生化指标)>用药日剂量>合并疾
                                                             富的参数调节机制,能够通过调节参数进一步优化模型
          病>联合用药>民族>白细胞计数>血红蛋白>身高。
                                                             性能,满足特定要求。通过对这4种算法的选择和对比,
          由特征分析摘要图(图3)可知,以年龄和BMI为例,血药
                                                             本研究不仅可以深入理解不同算法的适用场景,还能通
          浓度随着年龄的增大而增大,随着BMI的增大而减少。
                                                             过对比找到最适合当前任务的最佳模型。这种组合式
          2.5 实例预测
                                                             的算法选择有助于提高预测的准确性和模型的鲁棒
              由图 4 可知,合并高血压、用药日剂量为 120 mg/d、
                                                               [19]
          BMI为20.0 kg/m 、年龄为74岁、血红蛋白为142 g/L的患               性 。本研究结果显示,预测模型中XGBoost 模型预测
                        2
                                                                        2
          者服用度洛西汀达稳态后的血药浓度为101.18 ng/mL。                     性能最佳,R(0.808)最高的同时 MAE(7.644)、RMSE
          3 讨论                                              (10.808)最低。相对于其他 3 种算法,XGBoost 模型可
          3.1 XGBoost模型的预测性能最佳                               能具有如下优势:(1)其精准的残差优化机制能适配药
              机器学习作为一门交叉学科,已应用于医学各个领                         动学的复杂非线性;(2)其正则化与高效计算能力保障
          域,可以有效解决多个变量间的共线性和交互作用,具                           了模型在小样本下的泛化能力;(3)其决策树结构使得
          有较强的专属性和泛化能力,建模时对于数据的分布和                           模型结果相对易于理解和解释。

           120                     120                          120                     110
                                   110
                                                                                        100
           ( ng/mL )               ( ng/mL )  90               ( ng/mL )  100          ( ng/mL )  90
                                   100
           100
                                                                                        80
                                    80
           血药浓度/  80               预测值/  70                    血药浓度/  80               预测值/  70
                                    60
            60
                                    50                          60                      60
                                                                                        50
            40                      40          Y=0.641X+22.579                                     Y=0.746X+17.023
                                                                40
                                    30                                                  40
              0                                               20                                            40                                          60                                           80              40                                        60                80          100         120  0                                               20                                            40                                          60
                    测试样本/个                真实值/(ng/mL)                   测试样本/个                 真实值/(ng/mL)
                a.预测值与真实值的分布图         b.预测值与真实值的相关性散点图              a.预测值与真实值的分布图         b.预测值与真实值的相关性散点图
                             A. SVM模型                                              B. RF模型
                                                                                        110
           120                                                  120
                                                                                        100
                                   100
           ( ng/mL )  100          ( ng/mL )  80               ( ng/mL )  100          ( ng/mL )  90
                                                                                        80
                                                                80
            80
           血药浓度/  60               预测值/  60                    血药浓度/  60               预测值/  70
                                                                                        60
                                                                                        50
                                                Y=0.808X+11.078  40                     40          Y=0.746X+13.932
            40                      40
                                                                                        30
              0                                               20                                            40                                          60                                           80              40                                        60                80          100         120  0                                               20                                            40                                          60
                    测试样本/个                真实值/(ng/mL)                   测试样本/个                 真实值/(ng/mL)
                a.预测值与真实值的分布图         b.预测值与真实值的相关性散点图              a.预测值与真实值的分布图         b.预测值与真实值的相关性散点图
                            C. XGBoost模型                                          D. ANN模型
                                           图2 4种模型在测试集中的预测结果
          中国药房  2025年第36卷第6期                                                 China Pharmacy  2025 Vol. 36  No. 6    · 755 ·
   120   121   122   123   124   125   126   127   128   129   130