Page 108 - 《中国药房》2025年19期

P. 108

1.2.5 目标变量离散化例，以此反映模型的分类性能。
为满足机器学习分类任务需求，将万古霉素血药谷（4）最优模型稳健性评估：为评估最优模型的稳健
浓度按临床治疗窗标准离散化为三类：＜10 μg/mL为低性和泛化能力，采用自举法对训练集数据进行 100 次有
浓度，10～20 μg/mL为中浓度，＞20 μg/mL为高浓度。放回抽样，并在每次样本上执行 10-CV，最终展示模型
1.2.6 模型构建与性能评估的6项核心性能评估指标的均值及95%置信区间（CI）。
采用 Python 技术栈构建实验环境，具体配置如下：（5）模型可解释性分析：采用沙普利加性解释
以 Python 3.12.9 作为基础编程语言，Scikit-learn 1.6.1 提（SHapley Additive exPlanations，SHAP）对表现最优的模
供传统机器学习算法支持，XGBoost 3.0.0用于构建梯度型进行系统性解释分析。基于训练集计算各特征的
提升树模型，TabPFN 2.0.8 作为基于 Transformer 的新型 SHAP值，绘制所有样本的 SHAP摘要图，以可视化不同
表格数据学习框架。数据集按7∶3的比例随机划分为训特征对模型预测结果的影响方向与强度。
练集与测试集。在训练集上进行模型训练、超参数调 2 结果
优。在测试集上进行模型预测，计算性能指标，评估模 2.1 一般资料
型的泛化能力。从 MIMIC-Ⅳ数据库中筛选符合条件的患者数据，
（1）算法选择与实现：基于医学预测任务的特性和经数据清洗与预处理后，计算各特征缺失率发现，原始
前期研究基础，本研究选择以下具有代表性的分类器进数据包括多数关键临床指标，如年龄、体重、万古霉素剂
行基准测试。①TabPFN：基于 Transformer 的先验拟合量及给药频率、血清肌酐、尿素氮和白蛋白等变量的缺
网络，适用于小样本医学数据；②LR：作为基础线性模型失率均低于 5%，数据完整性较好。部分实验室指标存
参照；③RF：通过集成学习降低过拟合风险；④XGBoost：在较高比例的缺失，其中总蛋白、C反应蛋白、N-末端脑
优化后的梯度提升决策树；⑤SVM：寻找最大化间隔的钠利肽前体及尿酸的缺失率超过 70%；氧饱和度、肌酸
高效分类器；⑥KNN：基于局部相似性的非参数分类。激酶、皮质醇、铁结合能力、转铁蛋白、功能性纤维蛋白
（2）数据平衡与训练策略：采用自适应合成采样原、尿肌酐、肌钙蛋白、直接胆红素、酮体、糖化血红蛋白
（adaptive synthetic sampling，ADASYN）对数据类别不等变量的缺失率也在 30% 以上。根据预设标准予以删
平衡问题进行处理，通过自适应机制过采样，实现类别除后进行缺失值插补，最终纳入 9 902 例患者，其中男
[10]
数量的平衡，保留原始数据的临床分布特征。所有模性 5 990 例（占 60.5%）、女性 3 912 例（占 39.5%），年龄
型均采用 10 折交叉验证（10-fold cross-validation，10- （61.92±15.65）岁，体重（82.56±20.72） kg；万古霉素血
CV），确保每折数据保持类别比例的一致性。药谷浓度分布范围为 1.20～36.40 μg/mL，均值为 15.21
（3）模型性能评估：采用多层次评估框架衡量各模 μg/mL；按照临床治疗窗标准进行离散化处理，万古霉
型性能，包括量化指标对比、可视化分析、分类错误分布素血药谷浓度为低浓度的患者有2 692例（占27.2%）、中
评估。①量化指标对比：选取6项核心性能评估指标，展浓度有 4 907 例（占 49.6%）、高浓度有 2 303 例（占
示各模型在数据集上的表现。准确率（accuracy）：正确 23.3%）。数据集按照7∶3的比例随机划分为训练集和测
预测样本占总样本的比例，适用于类别分布均衡的场试集，其中训练集包含 6 931条记录（70.0%），测试集包含
景；平衡准确率（balanced accuracy）：各类准确率的算术 2 971条记录（30.0%）。
平均值，可缓解类别不平衡对评估结果的影响；宏平均 2.2 特征工程
精确率（precision macro）：各类精确率的未加权平均，强 2.2.1 相关性分析
调模型的正例识别精度；宏平均召回率（recall macro）：特征相关性热力图分析结果表明：血液学指标红细
各类召回率的未加权平均，反映模型对各类别正例的覆胞比容（hematocrit）与血红蛋白（hemoglobin）呈强正相
盖能力；宏平均 F1（macro F1）：宏平均精确率与宏平均关；代谢指标乳酸（lactate）与胆红素（bilirubin）呈中等正
召回率的调和均数，衡量模型在不平衡数据中的表现；相关；血液学指标和电解质代谢指标呈现明显的特征分
多类受试者工作特征曲线（receiver operationg characte- 组，这些簇反映了生理机制的内在联系。结果见图1。
ristic curve，ROC曲线）的曲线下面积（AUC）：采用“One- 2.2.2 Boruta算法特征选择
vs-Rest”（OvR）策略计算每类与其他类之间的 AUC（以 Boruta 算法特征重要性分析结果如图 2 所示，万古
下简称“OvR-AUC”），取平均值，评估模型的整体判别霉素给药频率（van_freq）、肌酐（creatinine）、尿素氮
能力。所有指标取值范围为0～1，数值越大表示模型性（urea）、红细胞分布宽度（rdw）、年龄（age）和万古霉素剂
能越好 [6，11] 。②可视化分析：构建多类 ROC 曲线。将每量（van_dose）等特征的重要性得分显著高于影子特征的
一类别视为正类，其余类别合并为负类，分别绘制 ROC 最大值，提示这些变量在模型预测中具有核心作用；白
曲线并计算 AUC。通过平均各类 AUC 得到整体多类细胞计数（wbc）和白蛋白（protein）的重要性得分较低，
AUC，以评估模型在不同分类阈值下的判别能力。③分表明其在模型中的预测能力有限。
类错误分布评估：绘制混淆矩阵热力图展示模型的分类基于Boruta算法结果，本研究选择重要性得分较高
效果，矩阵中对角线元素（左上角到右下角）表示各类别的38个临床特征作为最终的建模特征子集，涵盖多个具
样本的正确预测比例，非对角线元素反映误分类的比有临床意义的类别。（1）药物治疗参数：万古霉素日累计

· 2450 · China Pharmacy 2025 Vol. 36 No. 19 中国药房 2025年第36卷第19期

103 104 105 106 107 108 109 110 111 112 113