Page 140 - 《中国药房》2026年7期
P. 140
同时,也需清醒认识到其在临床落地过程中的现实 引入机器学习技术,并结合交叉验证等较为稳健的统计
瓶颈。 方法,以提高模型的预测性能和泛化能力。同时,建议
在模型验证方面,虽然大多数研究进行了内部验 未来预测模型的开发与报告严格遵循 TRIPOD 声明和
证,但仅有少数研究 [14―15] 完成了外部验证,这使得这些 PROBAST 工具的指导,以规范研究流程和提高研究质
[30]
模型在不同人群和临床环境中的应用推广受到了限 量 ,从而为儿童恶性肿瘤化疗后骨髓抑制的风险评估
[25]
制 。此外,模型展示的形式存在较大差异,包括列线 提供更加可靠的决策支持工具。
图、风险评分系统和回归方程等多种方式,导致各研究 3.5 本研究的局限性
结果缺乏可比性,并增加了临床应用的复杂性 。针对 本研究纳入研究数量较少,且在研究对象、建模方
[26]
这些问题,未来研究应更加关注模型校准的过程,如采 法及结局定义等方面异质性明显,因此降低了结论的普
用Bootstrap重抽样等方法来增强模型的稳定性,同时加 适性,也难以进行定量合并分析。此外,部分研究的方
强外部验证以提高模型的推广适用性。此外,还应尽量 法学报告不完整,如缺失数据处理方式不明、关键评估
规范和统一模型展示的方式,以提高其在临床实践中的 指标报告不全,影响了模型预测性能的全面评估。未来
[27]
可接受性和实用性 。 研究应遵循 TRIPOD 声明及 PRISMA 等国际报告规范,
从临床决策角度看,这些模型仍具有重要的启发意 以提高方法透明度与研究质量,增强研究结果在临床实
义 ,其 预 测 因 子 多 源 自 常 规 化 疗 参 数 与 实 验 室 指 践中的适用价值。
标 [17―18] ,为化疗前风险评估提供了量化参考。未来应在 4 结语
多中心样本中强化外部验证与动态校准,结合临床路 本研究系统评估了儿童恶性肿瘤化疗后骨髓抑制
径、药物毒性监测及人工智能辅助决策系统,实现模型 风险预测模型的构建方法、预测因子及其性能。结果发
从“统计预测”向“临床决策支持”的转化,以真正提升化 现基线中性粒细胞计数、化疗方案强度等核心指标具有
疗后骨髓抑制风险管理的科学性与精确性。 较高预测价值,且机器学习模型在区分度方面优于传统
3.4 偏倚风险与适用性 统计方法。然而,现有模型普遍存在校准不足、缺乏外
本研究对7项儿童恶性肿瘤患者化疗后骨髓抑制风 部验证及方法学偏倚较高等问题,限制了其在临床的直
险预测模型的研究进行了全面评估。结果显示,所有研 接应用。本文通过系统评价识别了当前模型的共性问
究均存在较高的偏倚风险,这些偏倚主要来源于研究设 题,总结了方法学优化方向,对后续高质量模型的构建
计、数据收集以及统计分析方法等方面的不足。具体而 具有循证参考价值。建议未来在该领域积累更多高质
言,在研究对象的选择上,大多数回顾性研究因存在数 量、同质化研究后,再对特定模型进行深入比较与验证;
据缺失和选择性偏倚而被判定为高风险,这表明今后研 同时,应结合儿童肿瘤的临床特征,整合多模态变量与
究应优先采用前瞻性设计,以确保在结局发生之前能够 多中心数据,构建并系统开展外部验证的动态预测模
收集到预测因子,从根本上减少回顾性设计所带来的选 型,推动此类工具从风险评估向智能临床决策支持
[28]
择偏倚 。在预测因子的评估上,大多数研究因未采取 转化。
盲法评估,可能导致研究产生测量偏倚,因此,实施严格 参考文献
的数据收集盲法对于提高测量的准确性至关重要。关 [ 1 ] 倪鑫. 国家儿童肿瘤监测年报:2022[M]. 北京:人民卫生
于统计分析,大部分纳入研究(6 项研究的 EPV<20,其 出版社,2022:4.
中4项研究的EPV<10)均存在样本量不足的问题,而确 [ 2 ] LI M J,WANG Q,LU P,et al. Development of a machine
保每个预测因子有足够的事件数(建议 EPV≥20)是提 learning-based prediction model for chemotherapy-
升模型稳定性和可靠性的关键——EPV偏低时,模型回 induced myelosuppression in children with Wilms’ tumor
归系数容易出现不稳定,判别效能指标往往被“虚高”估 [J]. Cancers,2023,15(4):1078.
计,从而产生“小样本研究看似效果更好”的假象。这种 [ 3 ] QIU B,MATTHAY K K. Advancing therapy for neuro‐
blastoma[J]. Nat Rev Clin Oncol,2022,19(8):515-533.
由样本量不足和过度拟合共同导致的偏倚,可能在一定
[ 4 ] HUANG J T,LU S Y,WANG J,et al. A multicenter phase
程度上放大部分模型的预测性能,尤其是复杂度较高的
Ⅱ trial of primary prophylactic PEG-rhG-CSF in pedi-
机器学习模型。因此,未来研究应对模型的泛化能力和
atric patients with solid tumors and non-Hodgkin lym‐
真实临床效用保持审慎态度,并通过详细报告缺失数据
phoma after chemotherapy:an interim analysis[J]. Cancer
的处理方法等措施,以提高研究的透明度。在模型评估
Med,2023,12(13):14130-14137.
方面,未来研究应结合区分度、校准度等多项评估指标, [ 5 ] 刘若彤. 肿瘤患儿化疗后骨髓抑制合并医院感染临床特
[29]
更全面地衡量模型的预测性能 。 点及风险预测模型建立的研究[D]. 济南:山东大学,2024.
综上,当前纳入研究存在的局限性在一定程度上限 [ 6 ] SALVADOR C,MERYK A,HETZER B,et al. Immature
制了所建预测模型在临床中的直接推广。未来研究可 platelet fraction predicts early marrow recovery after
· 958 · China Pharmacy 2026 Vol. 37 No. 7 中国药房 2026年第37卷第7期

