Page 140 - 《中国药房》2026年7期

P. 140

同时，也需清醒认识到其在临床落地过程中的现实引入机器学习技术，并结合交叉验证等较为稳健的统计
瓶颈。方法，以提高模型的预测性能和泛化能力。同时，建议
在模型验证方面，虽然大多数研究进行了内部验未来预测模型的开发与报告严格遵循 TRIPOD 声明和
证，但仅有少数研究 [14―15] 完成了外部验证，这使得这些 PROBAST 工具的指导，以规范研究流程和提高研究质
[30]
模型在不同人群和临床环境中的应用推广受到了限量，从而为儿童恶性肿瘤化疗后骨髓抑制的风险评估
[25]
制。此外，模型展示的形式存在较大差异，包括列线提供更加可靠的决策支持工具。
图、风险评分系统和回归方程等多种方式，导致各研究 3.5 本研究的局限性
结果缺乏可比性，并增加了临床应用的复杂性。针对本研究纳入研究数量较少，且在研究对象、建模方
[26]
这些问题，未来研究应更加关注模型校准的过程，如采法及结局定义等方面异质性明显，因此降低了结论的普
用Bootstrap重抽样等方法来增强模型的稳定性，同时加适性，也难以进行定量合并分析。此外，部分研究的方
强外部验证以提高模型的推广适用性。此外，还应尽量法学报告不完整，如缺失数据处理方式不明、关键评估
规范和统一模型展示的方式，以提高其在临床实践中的指标报告不全，影响了模型预测性能的全面评估。未来
[27]
可接受性和实用性。研究应遵循 TRIPOD 声明及 PRISMA 等国际报告规范，
从临床决策角度看，这些模型仍具有重要的启发意以提高方法透明度与研究质量，增强研究结果在临床实
义，其预测因子多源自常规化疗参数与实验室指践中的适用价值。
标 [17―18] ，为化疗前风险评估提供了量化参考。未来应在 4 结语
多中心样本中强化外部验证与动态校准，结合临床路本研究系统评估了儿童恶性肿瘤化疗后骨髓抑制
径、药物毒性监测及人工智能辅助决策系统，实现模型风险预测模型的构建方法、预测因子及其性能。结果发
从“统计预测”向“临床决策支持”的转化，以真正提升化现基线中性粒细胞计数、化疗方案强度等核心指标具有
疗后骨髓抑制风险管理的科学性与精确性。较高预测价值，且机器学习模型在区分度方面优于传统
3.4 偏倚风险与适用性统计方法。然而，现有模型普遍存在校准不足、缺乏外
本研究对7项儿童恶性肿瘤患者化疗后骨髓抑制风部验证及方法学偏倚较高等问题，限制了其在临床的直
险预测模型的研究进行了全面评估。结果显示，所有研接应用。本文通过系统评价识别了当前模型的共性问
究均存在较高的偏倚风险，这些偏倚主要来源于研究设题，总结了方法学优化方向，对后续高质量模型的构建
计、数据收集以及统计分析方法等方面的不足。具体而具有循证参考价值。建议未来在该领域积累更多高质
言，在研究对象的选择上，大多数回顾性研究因存在数量、同质化研究后，再对特定模型进行深入比较与验证；
据缺失和选择性偏倚而被判定为高风险，这表明今后研同时，应结合儿童肿瘤的临床特征，整合多模态变量与
究应优先采用前瞻性设计，以确保在结局发生之前能够多中心数据，构建并系统开展外部验证的动态预测模
收集到预测因子，从根本上减少回顾性设计所带来的选型，推动此类工具从风险评估向智能临床决策支持
[28]
择偏倚。在预测因子的评估上，大多数研究因未采取转化。
盲法评估，可能导致研究产生测量偏倚，因此，实施严格参考文献
的数据收集盲法对于提高测量的准确性至关重要。关 [ 1 ] 倪鑫. 国家儿童肿瘤监测年报：2022[M]. 北京：人民卫生
于统计分析，大部分纳入研究（6 项研究的 EPV＜20，其出版社，2022：4.
中4项研究的EPV＜10）均存在样本量不足的问题，而确 [ 2 ] LI M J，WANG Q，LU P，et al. Development of a machine
保每个预测因子有足够的事件数（建议 EPV≥20）是提 learning-based prediction model for chemotherapy-
升模型稳定性和可靠性的关键——EPV偏低时，模型回 induced myelosuppression in children with Wilms’ tumor
归系数容易出现不稳定，判别效能指标往往被“虚高”估 [J]. Cancers，2023，15（4）：1078.
计，从而产生“小样本研究看似效果更好”的假象。这种 [ 3 ] QIU B，MATTHAY K K. Advancing therapy for neuro‐
blastoma[J]. Nat Rev Clin Oncol，2022，19（8）：515-533.
由样本量不足和过度拟合共同导致的偏倚，可能在一定
[ 4 ] HUANG J T，LU S Y，WANG J，et al. A multicenter phase
程度上放大部分模型的预测性能，尤其是复杂度较高的
Ⅱ trial of primary prophylactic PEG-rhG-CSF in pedi-
机器学习模型。因此，未来研究应对模型的泛化能力和
atric patients with solid tumors and non-Hodgkin lym‐
真实临床效用保持审慎态度，并通过详细报告缺失数据
phoma after chemotherapy：an interim analysis[J]. Cancer
的处理方法等措施，以提高研究的透明度。在模型评估
Med，2023，12（13）：14130-14137.
方面，未来研究应结合区分度、校准度等多项评估指标， [ 5 ] 刘若彤. 肿瘤患儿化疗后骨髓抑制合并医院感染临床特
[29]
更全面地衡量模型的预测性能。点及风险预测模型建立的研究[D]. 济南：山东大学，2024.
综上，当前纳入研究存在的局限性在一定程度上限 [ 6 ] SALVADOR C，MERYK A，HETZER B，et al. Immature
制了所建预测模型在临床中的直接推广。未来研究可 platelet fraction predicts early marrow recovery after

· 958 · China Pharmacy 2026 Vol. 37 No. 7 中国药房 2026年第37卷第7期

135 136 137 138 139 140 141 142 143 144 145