Page 139 - 《中国药房》2026年7期
P. 139
表2 模型的偏倚风险和适用性评价结果 态性)在理论上可能具备潜在的预测价值,但由于其检
偏倚风险 适用性 总体 测成本较高且在临床中普及性较低,因此尚未广泛应用
纳入研究
研究对象 预测因子 结局 统计分析 研究对象 预测因子 结局 偏倚风险 适用性 于实际的预测模型中 。这些结果提示,在进行骨髓抑
[20]
刘若彤 [5] + + + + - - - + -
李祎涵 [12] - - ? + - - - + - 制风险预测时,应结合儿童肿瘤患者的生理特征与治疗
徐蕊 [13] + + + + - - - + - 差异,优先选择那些易于获取、便于量化且与疾病机制
Li [2] + + + + - - - + - 紧密相关的指标,从而为临床上个体化风险评估方案的
Miedema [14] - - + + - - - + -
Lyman [15] - - + + - - - + - 制定提供重要依据。
Wicki [16] + + + + - - - + - 3.2 预测因子筛选与模型建立方法
注:“-”表示低偏倚风险/适用性好;“+”表示高偏倚风险/适用性 在本研究纳入的文献中,多数预测模型在变量筛选
差;“?”表示偏倚风险/适用性不清楚。 阶段仍主要依赖传统统计分析方法,只有少数研究尝试
2.5.3 结局 引入基于机器学习的特征筛选技术,如信息值评估和变
在结局方面,有 6 项研究 [2,5,13―16] 被判定为高偏倚风 量间相关性分析 。尽管传统统计方法在识别独立预测
[2]
险,其主要问题在于:这些研究所构建的模型中包含的 因子方面有一定的优势,但其在捕捉变量间复杂的非线
部分预测因子,实质上也是结局定义中相关因素的一部 性关系和潜在交互效应时存在一定的局限性 ;相比之
[21]
分,从而可能导致预测因子与结局之间的相关性被人为 下,采用 XGBoost 和 RF 等机器学习算法的研究不仅能
[12]
高估。此外,有1项研究 被评为偏倚风险不清楚,原因 更高效地处理高维数据、挖掘变量之间的深层交互模
在于其未明确说明预测因子的测量时间与结局评估时 式,其模型性能(AUC=0.981)也显著优于传统逻辑回
间之间的间隔,同时在预测信息不清的情况下,也未说 归模型 。
[22]
明是否采取盲法进行结局评估,从而影响了评估的可 在模型构建策略方面,大多数研究 [5,12―13,15] 采用的是
信度。 LR 方法,仅少数研究 [2,14,16] 对 WSM、PR 和多种机器学习
2.5.4 统计分析 算法进行了系统性比较。这种传统建模方法占主导地
纳入的 7 项研究 [2,5,12―16] 均被判定为高偏倚风险。6 位的趋势与文献[23]在乳腺癌风险预测模型研究中的发
项研究 [2,5,12,14―16] 的主要问题是样本量过小,具体表现为 现相似,这反映了儿童恶性肿瘤化疗后骨髓抑制风险建
每变量事件数(events per variable,EPV)<20,其中 4 项 模领域尚未充分利用现代机器学习技术。
研究 [12―14,16] 的EPV<10;另外,有6项研究 [5,12―16] 未说明缺 基于此,未来的研究应考虑在模型设计中采用“混
失值情况及其处理策略;2项研究 [2,14] 在选择预测因子时 合方法”策略,即在预测因子筛选阶段结合机器学习算
未进行单因素分析;3 项研究 [14―16] 未提供模型的校准信 法与经典统计方法,并在模型建立过程中对多种算法进
[13]
息;有1项研究 仅通过H-L检验评估模型拟合情况;另 行系统性的性能评估 ,以降低单一方法带来的偏倚,
[24]
[14]
有1项研究 未实施内部验证。所有7项研究均未说明 同时提高模型的泛化能力和临床适配性。
数据复杂性的处理情况,且未对开发过程中使用的最终 3.3 预测效能与临床适配性
模型的预测因子系数或截距与多变量分析报告结果之 本研究共纳入 12 个风险预测模型,AUC 为 0.748~
间的一致性进行评估。 0.981,多数模型在判别能力方面表现良好。然而,模型
3 讨论 的校准与验证方面仍存在一定的局限性。在校准方面,
3.1 模型的主要预测因子 只有少数研究 [2,12] 使用了 H-L 检验并结合校准曲线进行
本研究通过对7项儿童恶性肿瘤化疗后骨髓抑制风 评估,而大多数研究未充分报告校准方法,这可能影响
险预测模型研究进行系统整合与分析,发现与初步筛选 对模型预测精度的准确评估。有研究 通过机器学习算
[2]
的候选预测因子相比,最终纳入模型的预测因子(如基 法建立模型,并采用五折交叉验证进行内部验证,最终
线中性粒细胞计数、血小板水平、化疗方案强度和癌症 模型的 AUC 达到了 0.981,这表明现代算法在提升模型
类型)在预测准确性和临床适用性方面具有明显优势。 精度方面具有明显优势。然而,尽管机器学习模型在区
这些关键变量的选取得到了循证医学的支持——研究 分度上表现优异,但其临床转化仍面临可解释性与可操
已证实,化疗方案的强度、血小板以及血红蛋白水平与 作性方面的挑战。该类模型结构复杂,预测过程缺乏透
骨髓抑制的发生密切相关 [17―18] 。此外,血液系统恶性肿 明性,并且该研究仅提供了全局的特征重要性,未使用
瘤的儿童患者由于骨髓浸润及接受高强度化疗,其发热 如沙普利加性解释或局部可解释模型-不可知解释等更
性中性粒细胞减少的发生率显著高于实体瘤患者 [2,19] , 先进的技术来揭示个体化预测结果的决策依据,不利于
且不同类型肿瘤中,中性粒细胞计数的变化存在明显差 获得临床医生的理解与信任;同时,多数模型未提供便
异,这使其成为预测骨髓抑制风险的关键指标。 捷的评分工具或与医院信息系统整合的接口,限制了其
值得注意的是,尽管某些候选预测因子(如基因多 在实际医疗环境中的推广。因此,在认可其高 AUC 的
中国药房 2026年第37卷第7期 China Pharmacy 2026 Vol. 37 No. 7 · 957 ·

