Page 139 - 《中国药房》2026年7期

P. 139

表2 模型的偏倚风险和适用性评价结果态性）在理论上可能具备潜在的预测价值，但由于其检
偏倚风险适用性总体测成本较高且在临床中普及性较低，因此尚未广泛应用
纳入研究
研究对象预测因子结局统计分析研究对象预测因子结局偏倚风险适用性于实际的预测模型中。这些结果提示，在进行骨髓抑
[20]
刘若彤 [5] + + + + －－－ + －
李祎涵 [12] －－？ + －－－ + －制风险预测时，应结合儿童肿瘤患者的生理特征与治疗
徐蕊 [13] + + + + －－－ + －差异，优先选择那些易于获取、便于量化且与疾病机制
Li [2] + + + + －－－ + －紧密相关的指标，从而为临床上个体化风险评估方案的
Miedema [14] －－ + + －－－ + －
Lyman [15] －－ + + －－－ + －制定提供重要依据。
Wicki [16] + + + + －－－ + － 3.2 预测因子筛选与模型建立方法
注：“－”表示低偏倚风险/适用性好；“+”表示高偏倚风险/适用性在本研究纳入的文献中，多数预测模型在变量筛选
差；“？”表示偏倚风险/适用性不清楚。阶段仍主要依赖传统统计分析方法，只有少数研究尝试
2.5.3 结局引入基于机器学习的特征筛选技术，如信息值评估和变
在结局方面，有 6 项研究 [2，5，13―16] 被判定为高偏倚风量间相关性分析。尽管传统统计方法在识别独立预测
[2]
险，其主要问题在于：这些研究所构建的模型中包含的因子方面有一定的优势，但其在捕捉变量间复杂的非线
部分预测因子，实质上也是结局定义中相关因素的一部性关系和潜在交互效应时存在一定的局限性；相比之
[21]
分，从而可能导致预测因子与结局之间的相关性被人为下，采用 XGBoost 和 RF 等机器学习算法的研究不仅能
[12]
高估。此外，有1项研究被评为偏倚风险不清楚，原因更高效地处理高维数据、挖掘变量之间的深层交互模
在于其未明确说明预测因子的测量时间与结局评估时式，其模型性能（AUC＝0.981）也显著优于传统逻辑回
间之间的间隔，同时在预测信息不清的情况下，也未说归模型。
[22]
明是否采取盲法进行结局评估，从而影响了评估的可在模型构建策略方面，大多数研究 [5，12―13，15] 采用的是
信度。 LR 方法，仅少数研究 [2，14，16] 对 WSM、PR 和多种机器学习
2.5.4 统计分析算法进行了系统性比较。这种传统建模方法占主导地
纳入的 7 项研究 [2，5，12―16] 均被判定为高偏倚风险。6 位的趋势与文献[23]在乳腺癌风险预测模型研究中的发
项研究 [2，5，12，14―16] 的主要问题是样本量过小，具体表现为现相似，这反映了儿童恶性肿瘤化疗后骨髓抑制风险建
每变量事件数（events per variable，EPV）＜20，其中 4 项模领域尚未充分利用现代机器学习技术。
研究 [12―14，16] 的EPV＜10；另外，有6项研究 [5，12―16] 未说明缺基于此，未来的研究应考虑在模型设计中采用“混
失值情况及其处理策略；2项研究 [2，14] 在选择预测因子时合方法”策略，即在预测因子筛选阶段结合机器学习算
未进行单因素分析；3 项研究 [14―16] 未提供模型的校准信法与经典统计方法，并在模型建立过程中对多种算法进
[13]
息；有1项研究仅通过H-L检验评估模型拟合情况；另行系统性的性能评估，以降低单一方法带来的偏倚，
[24]
[14]
有1项研究未实施内部验证。所有7项研究均未说明同时提高模型的泛化能力和临床适配性。
数据复杂性的处理情况，且未对开发过程中使用的最终 3.3 预测效能与临床适配性
模型的预测因子系数或截距与多变量分析报告结果之本研究共纳入 12 个风险预测模型，AUC 为 0.748～
间的一致性进行评估。 0.981，多数模型在判别能力方面表现良好。然而，模型
3 讨论的校准与验证方面仍存在一定的局限性。在校准方面，
3.1 模型的主要预测因子只有少数研究 [2，12] 使用了 H-L 检验并结合校准曲线进行
本研究通过对7项儿童恶性肿瘤化疗后骨髓抑制风评估，而大多数研究未充分报告校准方法，这可能影响
险预测模型研究进行系统整合与分析，发现与初步筛选对模型预测精度的准确评估。有研究通过机器学习算
[2]
的候选预测因子相比，最终纳入模型的预测因子（如基法建立模型，并采用五折交叉验证进行内部验证，最终
线中性粒细胞计数、血小板水平、化疗方案强度和癌症模型的 AUC 达到了 0.981，这表明现代算法在提升模型
类型）在预测准确性和临床适用性方面具有明显优势。精度方面具有明显优势。然而，尽管机器学习模型在区
这些关键变量的选取得到了循证医学的支持——研究分度上表现优异，但其临床转化仍面临可解释性与可操
已证实，化疗方案的强度、血小板以及血红蛋白水平与作性方面的挑战。该类模型结构复杂，预测过程缺乏透
骨髓抑制的发生密切相关 [17―18] 。此外，血液系统恶性肿明性，并且该研究仅提供了全局的特征重要性，未使用
瘤的儿童患者由于骨髓浸润及接受高强度化疗，其发热如沙普利加性解释或局部可解释模型-不可知解释等更
性中性粒细胞减少的发生率显著高于实体瘤患者 [2，19] ，先进的技术来揭示个体化预测结果的决策依据，不利于
且不同类型肿瘤中，中性粒细胞计数的变化存在明显差获得临床医生的理解与信任；同时，多数模型未提供便
异，这使其成为预测骨髓抑制风险的关键指标。捷的评分工具或与医院信息系统整合的接口，限制了其
值得注意的是，尽管某些候选预测因子（如基因多在实际医疗环境中的推广。因此，在认可其高 AUC 的

中国药房 2026年第37卷第7期 China Pharmacy 2026 Vol. 37 No. 7 · 957 ·

134 135 136 137 138 139 140 141 142 143 144