Page 96 - 《中国药房》2026年2期

P. 96

1.6 模型性能评估表1 患者的一般资料（n＝1 409）
通过准确率、召回率、精确率、F1值及AUROC量化项目患者项目患者
模型的预测性能。绘制校准曲线评估模型预测概率与年龄[M（P 25，P 75）]/岁 64（58.0，69.0）院外止吐治疗/例（%）
化疗周期数[M（P 25，P 75）]/个 2（1.0，4.0）有 107（7.6）
实际概率的一致性，采用 Brier 评分评估模型的校准性性别/例（%）无 1 302（92.4）
能，通过决策曲线评价模型的临床决策能力。男 865（61.4）上周期化疗后发生HEC相关性恶心
1.7 模型可解释性分析女 544（38.6）呕吐/例（%）
癌症类别/例（%）有 254（18.0）
为提高模型的可解释性，本研究采用沙普利加性解
肺癌 934（66.3）无 1 155（82.0）
[12]
释法（Shapley additive explanations，SHAP）构建双层乳腺癌 60（4.3）化疗类型/例（%）
特征分析框架：在全局维度上，通过聚合所有样本的妇科肿瘤 76（5.4）基于顺铂 731（51.9）
胃肠癌 201（14.2）基于卡铂[AUC≥4 mg/（mL·min）] 616（43.7）
SHAP 值贡献度生成特征重要性矩阵图和蜂群图，以揭
食管癌 138（9.8）基于蒽环类+环磷酰胺 62（4.4）
示影响模型预测的主导因素及其整体作用方向；在局部孕吐史 /例（%）代谢相关指标[M（P 25，P 75）]
a
维度上，针对单个预测样本生成瀑布图，解析各特征对有 183（13.0） Ccr/（mL/min） 100.6（81.5，129.9）
无 1 226（87.0） TP/（g/L） 70.0（66.0，74.0）
输出标签的差异化影响，并精确量化具体特征值对预测
饮酒史/例（%） ALB/（g/L） 39.0（35.0，42.0）
结果的促进效应（红色表示正向 SHAP 值）或抑制效应有 429（30.4） GLB/（g/L） 31.0（28.0，35.0）
（蓝色表示负向SHAP值）。无 511（36.3） AST/（U/L） 20.0（16.0，25.0）
缺失 469（33.3） ALT/（U/L） 17.0（12.0，25.0）
1.8 统计学处理
化疗前夜患者睡眠时间＜7 h/例（%） TBILI/（μmol/L） 8.1（6.2，10.4）
采用 SPSS 26.0 软件进行统计学处理，符合正态分是 422（30.0） DBILI/（μmol/L） 2.2（1.6，3.1）
布的连续变量以x±s表示，不符合正态分布的连续变量否 987（70.0） ALP/（U/L） 86.0（70.0，108.5）
预期性恶心呕吐/例（%）
以 M（P25，P75 ）表示，分类变量以频数或率（%）表示。用
是 280（19.9）
Python 3.8.3、Anaconda 3 集成开发环境，用 Scikit-learn 否 1 129（80.1）
库构建模型，用Scikit-learn metrics库计算AUROC、准确 a：有孕吐史表示该女性患者既往有孕吐史，无孕吐史表示男性和
率、召回率、精确率、F1 值等，用 Matplotlib 库和 NumPy 既往无孕吐史的女性。
库进行数据可视化处理。 2.3 模型性能评估结果
2 结果 6种模型预测性能评估结果（表2）显示，深度随机森
2.1 一般资料林模型在测试集中展现出最优预测性能，准确率为
本研究共纳入1 409例接受三联止吐方案预防HEC 0.911，精确率为 0.805，召回率为 0.783，F1 值为 0.793，
相关性恶心呕吐的癌症患者，患者中位年龄64岁，女性 AUROC 为 0.850。校准曲线对比结果（图 1）显示，深度
占 38.6%，66.3% 为肺癌患者，13.0% 的患者有孕吐史，随机森林模型的校准最佳，Brier 评分为 0.075。决策曲
30.4% 的患者有饮酒史。化疗类型主要为基于顺铂线对比结果（图 2）显示，深度随机森林模型的净获益更
（51.9%）和基于卡铂[AUC≥4 mg/（mL·min）]（43.7%）的高，表明其具有最佳决策能力。
治疗方案。患者的一般资料见表1。表2 6种模型预测性能评估结果
2.2 6种预测模型的建立模型 AUROC 准确率/% 精确率/% 召回率/% F1值
数据预处理后，采用训练集数据用于模型优化与训深度随机森林 0.850 0.911 0.805 0.783 0.793
DNN 0.799 0.780 0.638 0.744 0.655
练。分别对深度随机森林、DNN、SVM、CatBoost、随机
SVM 0.760 0.713 0.612 0.729 0.606
森林及决策树共 6 种模型进行超参数优化，通过 200 次 CatBoost 0.829 0.794 0.660 0.787 0.681
试验，确定AUROC最高的超参数组合为最优超参数。6 随机森林 0.828 0.848 0.698 0.794 0.728
决策树 0.766 0.723 0.612 0.723 0.610
种模型的超参数配置如下——深度随机森林模型：max
layers＝11，n estimators＝4，min samples split＝3，min 1.0
samples leaf＝5，delta＝0.000 250 841 573 097 396 44； 0.8
DNN 模型：units＝46，batch size＝29；SVM 模型：ker‐
nel＝poly；CatBoost模型：loss function＝MultiRMSE，ite- 实际概率 0.6
rations＝194，learning rate＝0.029 304 540 686 373 69， 0.4
depth＝10，bagging temperature＝0.008 390 032 359 576 841；深度随机森林（Brier＝0.075）
DNN（Brier＝0.518）
0.2 CatBoost（Brier＝0.119）
随机森林模型：criterion＝friedman mse，n estimators＝决策树（Brier＝0.161）
SVM（Brier＝0.716）
随机森林（Brier＝0.093）
64，min samples split＝5，min samples leaf＝4；决策树模 0 完美校准
0 0.2 0.4 0.6 0.8 1.0
型：criterion＝poisson，max depth＝8。基于上述最优超预测概率
参数，使用训练集数据分别建立6种预测模型。图1 6种模型的校准曲线图
· 222 · China Pharmacy 2026 Vol. 37 No. 2 中国药房 2026年第37卷第2期

91 92 93 94 95 96 97 98 99 100 101