Page 108 - 《中国药房》2025年19期
P. 108
1.2.5 目标变量离散化 例,以此反映模型的分类性能。
为满足机器学习分类任务需求,将万古霉素血药谷 (4)最优模型稳健性评估:为评估最优模型的稳健
浓度按临床治疗窗标准离散化为三类:<10 μg/mL为低 性和泛化能力,采用自举法对训练集数据进行 100 次有
浓度,10~20 μg/mL为中浓度,>20 μg/mL为高浓度。 放回抽样,并在每次样本上执行 10-CV,最终展示模型
1.2.6 模型构建与性能评估 的6项核心性能评估指标的均值及95%置信区间(CI)。
采用 Python 技术栈构建实验环境,具体配置如下: (5)模 型 可 解 释 性 分 析 :采 用 沙 普 利 加 性 解 释
以 Python 3.12.9 作为基础编程语言,Scikit-learn 1.6.1 提 (SHapley Additive exPlanations,SHAP)对表现最优的模
供传统机器学习算法支持,XGBoost 3.0.0用于构建梯度 型进行系统性解释分析。基于训练集计算各特征的
提升树模型,TabPFN 2.0.8 作为基于 Transformer 的新型 SHAP值,绘制所有样本的 SHAP摘要图,以可视化不同
表格数据学习框架。数据集按7∶3的比例随机划分为训 特征对模型预测结果的影响方向与强度。
练集与测试集。在训练集上进行模型训练、超参数调 2 结果
优。在测试集上进行模型预测,计算性能指标,评估模 2.1 一般资料
型的泛化能力。 从 MIMIC-Ⅳ数据库中筛选符合条件的患者数据,
(1)算法选择与实现:基于医学预测任务的特性和 经数据清洗与预处理后,计算各特征缺失率发现,原始
前期研究基础,本研究选择以下具有代表性的分类器进 数据包括多数关键临床指标,如年龄、体重、万古霉素剂
行基准测试。①TabPFN:基于 Transformer 的先验拟合 量及给药频率、血清肌酐、尿素氮和白蛋白等变量的缺
网络,适用于小样本医学数据;②LR:作为基础线性模型 失率均低于 5%,数据完整性较好。部分实验室指标存
参照;③RF:通过集成学习降低过拟合风险;④XGBoost: 在较高比例的缺失,其中总蛋白、C反应蛋白、N-末端脑
优化后的梯度提升决策树;⑤SVM:寻找最大化间隔的 钠利肽前体及尿酸的缺失率超过 70%;氧饱和度、肌酸
高效分类器;⑥KNN:基于局部相似性的非参数分类。 激酶、皮质醇、铁结合能力、转铁蛋白、功能性纤维蛋白
(2)数据平衡与训练策略:采用自适应合成采样 原、尿肌酐、肌钙蛋白、直接胆红素、酮体、糖化血红蛋白
(adaptive synthetic sampling,ADASYN)对数据类别不 等变量的缺失率也在 30% 以上。根据预设标准予以删
平衡问题进行处理,通过自适应机制过采样,实现类别 除后进行缺失值插补,最终纳入 9 902 例患者,其中男
[10]
数量的平衡,保留原始数据的临床分布特征 。所有模 性 5 990 例(占 60.5%)、女性 3 912 例(占 39.5%),年龄
型均采用 10 折交叉验证(10-fold cross-validation,10- (61.92±15.65)岁,体重(82.56±20.72) kg;万古霉素血
CV),确保每折数据保持类别比例的一致性。 药谷浓度分布范围为 1.20~36.40 μg/mL,均值为 15.21
(3)模型性能评估:采用多层次评估框架衡量各模 μg/mL;按照临床治疗窗标准进行离散化处理,万古霉
型性能,包括量化指标对比、可视化分析、分类错误分布 素血药谷浓度为低浓度的患者有2 692例(占27.2%)、中
评估。①量化指标对比:选取6项核心性能评估指标,展 浓度有 4 907 例(占 49.6%)、高 浓 度 有 2 303 例(占
示各模型在数据集上的表现。准确率(accuracy):正确 23.3%)。数据集按照7∶3的比例随机划分为训练集和测
预测样本占总样本的比例,适用于类别分布均衡的场 试集,其中训练集包含 6 931条记录(70.0%),测试集包含
景;平衡准确率(balanced accuracy):各类准确率的算术 2 971条记录(30.0%)。
平均值,可缓解类别不平衡对评估结果的影响;宏平均 2.2 特征工程
精确率(precision macro):各类精确率的未加权平均,强 2.2.1 相关性分析
调模型的正例识别精度;宏平均召回率(recall macro): 特征相关性热力图分析结果表明:血液学指标红细
各类召回率的未加权平均,反映模型对各类别正例的覆 胞比容(hematocrit)与血红蛋白(hemoglobin)呈强正相
盖能力;宏平均 F1(macro F1):宏平均精确率与宏平均 关;代谢指标乳酸(lactate)与胆红素(bilirubin)呈中等正
召回率的调和均数,衡量模型在不平衡数据中的表现; 相关;血液学指标和电解质代谢指标呈现明显的特征分
多类受试者工作特征曲线(receiver operationg characte- 组,这些簇反映了生理机制的内在联系。结果见图1。
ristic curve,ROC曲线)的曲线下面积(AUC):采用“One- 2.2.2 Boruta算法特征选择
vs-Rest”(OvR)策略计算每类与其他类之间的 AUC(以 Boruta 算法特征重要性分析结果如图 2 所示,万古
下简称“OvR-AUC”),取平均值,评估模型的整体判别 霉 素 给 药 频 率(van_freq)、肌 酐(creatinine)、尿 素 氮
能力。所有指标取值范围为0~1,数值越大表示模型性 (urea)、红细胞分布宽度(rdw)、年龄(age)和万古霉素剂
能越好 [6,11] 。②可视化分析:构建多类 ROC 曲线。将每 量(van_dose)等特征的重要性得分显著高于影子特征的
一类别视为正类,其余类别合并为负类,分别绘制 ROC 最大值,提示这些变量在模型预测中具有核心作用;白
曲线并计算 AUC。通过平均各类 AUC 得到整体多类 细胞计数(wbc)和白蛋白(protein)的重要性得分较低,
AUC,以评估模型在不同分类阈值下的判别能力。③分 表明其在模型中的预测能力有限。
类错误分布评估:绘制混淆矩阵热力图展示模型的分类 基于Boruta算法结果,本研究选择重要性得分较高
效果,矩阵中对角线元素(左上角到右下角)表示各类别 的38个临床特征作为最终的建模特征子集,涵盖多个具
样本的正确预测比例,非对角线元素反映误分类的比 有临床意义的类别。(1)药物治疗参数:万古霉素日累计
· 2450 · China Pharmacy 2025 Vol. 36 No. 19 中国药房 2025年第36卷第19期

