Page 108 - 《中国药房》2025年19期
P. 108

1.2.5 目标变量离散化                                       例,以此反映模型的分类性能。
              为满足机器学习分类任务需求,将万古霉素血药谷                             (4)最优模型稳健性评估:为评估最优模型的稳健
          浓度按临床治疗窗标准离散化为三类:<10 μg/mL为低                        性和泛化能力,采用自举法对训练集数据进行 100 次有
          浓度,10~20 μg/mL为中浓度,>20 μg/mL为高浓度。                   放回抽样,并在每次样本上执行 10-CV,最终展示模型
          1.2.6 模型构建与性能评估                                     的6项核心性能评估指标的均值及95%置信区间(CI)。
              采用 Python 技术栈构建实验环境,具体配置如下:                        (5)模 型 可 解 释 性 分 析 :采 用 沙 普 利 加 性 解 释
          以 Python 3.12.9 作为基础编程语言,Scikit-learn 1.6.1 提      (SHapley Additive exPlanations,SHAP)对表现最优的模
          供传统机器学习算法支持,XGBoost 3.0.0用于构建梯度                     型进行系统性解释分析。基于训练集计算各特征的
          提升树模型,TabPFN 2.0.8 作为基于 Transformer 的新型             SHAP值,绘制所有样本的 SHAP摘要图,以可视化不同
          表格数据学习框架。数据集按7∶3的比例随机划分为训                           特征对模型预测结果的影响方向与强度。
          练集与测试集。在训练集上进行模型训练、超参数调                             2 结果
          优。在测试集上进行模型预测,计算性能指标,评估模                            2.1 一般资料
          型的泛化能力。                                                 从 MIMIC-Ⅳ数据库中筛选符合条件的患者数据,
             (1)算法选择与实现:基于医学预测任务的特性和                          经数据清洗与预处理后,计算各特征缺失率发现,原始
          前期研究基础,本研究选择以下具有代表性的分类器进                            数据包括多数关键临床指标,如年龄、体重、万古霉素剂
          行基准测试。①TabPFN:基于 Transformer 的先验拟合                  量及给药频率、血清肌酐、尿素氮和白蛋白等变量的缺
          网络,适用于小样本医学数据;②LR:作为基础线性模型                          失率均低于 5%,数据完整性较好。部分实验室指标存
          参照;③RF:通过集成学习降低过拟合风险;④XGBoost:                      在较高比例的缺失,其中总蛋白、C反应蛋白、N-末端脑
          优化后的梯度提升决策树;⑤SVM:寻找最大化间隔的                           钠利肽前体及尿酸的缺失率超过 70%;氧饱和度、肌酸
          高效分类器;⑥KNN:基于局部相似性的非参数分类。                           激酶、皮质醇、铁结合能力、转铁蛋白、功能性纤维蛋白
             (2)数据平衡与训练策略:采用自适应合成采样                           原、尿肌酐、肌钙蛋白、直接胆红素、酮体、糖化血红蛋白
         (adaptive synthetic sampling,ADASYN)对数据类别不           等变量的缺失率也在 30% 以上。根据预设标准予以删
          平衡问题进行处理,通过自适应机制过采样,实现类别                            除后进行缺失值插补,最终纳入 9 902 例患者,其中男
                                                [10]
          数量的平衡,保留原始数据的临床分布特征 。所有模                            性 5 990 例(占 60.5%)、女性 3 912 例(占 39.5%),年龄
          型均采用 10 折交叉验证(10-fold cross-validation,10-         (61.92±15.65)岁,体重(82.56±20.72) kg;万古霉素血
          CV),确保每折数据保持类别比例的一致性。                               药谷浓度分布范围为 1.20~36.40 μg/mL,均值为 15.21
             (3)模型性能评估:采用多层次评估框架衡量各模                          μg/mL;按照临床治疗窗标准进行离散化处理,万古霉
          型性能,包括量化指标对比、可视化分析、分类错误分布                           素血药谷浓度为低浓度的患者有2 692例(占27.2%)、中
          评估。①量化指标对比:选取6项核心性能评估指标,展                           浓度有 4 907 例(占 49.6%)、高 浓 度 有 2  303 例(占
          示各模型在数据集上的表现。准确率(accuracy):正确                       23.3%)。数据集按照7∶3的比例随机划分为训练集和测
          预测样本占总样本的比例,适用于类别分布均衡的场                             试集,其中训练集包含 6 931条记录(70.0%),测试集包含
          景;平衡准确率(balanced accuracy):各类准确率的算术                 2 971条记录(30.0%)。
          平均值,可缓解类别不平衡对评估结果的影响;宏平均                            2.2 特征工程
          精确率(precision macro):各类精确率的未加权平均,强                  2.2.1 相关性分析
          调模型的正例识别精度;宏平均召回率(recall macro):                        特征相关性热力图分析结果表明:血液学指标红细
          各类召回率的未加权平均,反映模型对各类别正例的覆                            胞比容(hematocrit)与血红蛋白(hemoglobin)呈强正相
          盖能力;宏平均 F1(macro F1):宏平均精确率与宏平均                     关;代谢指标乳酸(lactate)与胆红素(bilirubin)呈中等正
          召回率的调和均数,衡量模型在不平衡数据中的表现;                            相关;血液学指标和电解质代谢指标呈现明显的特征分
          多类受试者工作特征曲线(receiver operationg characte-           组,这些簇反映了生理机制的内在联系。结果见图1。
          ristic curve,ROC曲线)的曲线下面积(AUC):采用“One-              2.2.2 Boruta算法特征选择
          vs-Rest”(OvR)策略计算每类与其他类之间的 AUC(以                        Boruta 算法特征重要性分析结果如图 2 所示,万古
          下简称“OvR-AUC”),取平均值,评估模型的整体判别                        霉 素 给 药 频 率(van_freq)、肌 酐(creatinine)、尿 素 氮
          能力。所有指标取值范围为0~1,数值越大表示模型性                          (urea)、红细胞分布宽度(rdw)、年龄(age)和万古霉素剂
          能越好   [6,11] 。②可视化分析:构建多类 ROC 曲线。将每                 量(van_dose)等特征的重要性得分显著高于影子特征的
          一类别视为正类,其余类别合并为负类,分别绘制 ROC                          最大值,提示这些变量在模型预测中具有核心作用;白
          曲线并计算 AUC。通过平均各类 AUC 得到整体多类                         细胞计数(wbc)和白蛋白(protein)的重要性得分较低,
          AUC,以评估模型在不同分类阈值下的判别能力。③分                           表明其在模型中的预测能力有限。
          类错误分布评估:绘制混淆矩阵热力图展示模型的分类                                基于Boruta算法结果,本研究选择重要性得分较高
          效果,矩阵中对角线元素(左上角到右下角)表示各类别                           的38个临床特征作为最终的建模特征子集,涵盖多个具
          样本的正确预测比例,非对角线元素反映误分类的比                             有临床意义的类别。(1)药物治疗参数:万古霉素日累计


          · 2450 ·    China Pharmacy  2025 Vol. 36  No. 19                            中国药房  2025年第36卷第19期
   103   104   105   106   107   108   109   110   111   112   113