Page 114 - 《中国药房》2025年5期
P. 114
表4 偏倚风险及适用性评价结果 3.1 预测模型的预测性能有待提高,校准度及适用性需
偏倚风险 适用性 总体 进一步验证
纳入文献
研究对象 预测变量 结局 统计分析 研究对象 预测变量 结局 偏倚风险 适用性 本研究最终纳入了7项研究,共报告了12个预测模
Dranitsaris 11] + ? + + - - - + -
Jenkins [12] + ? ? + - - - + - 型,包括11项模型开发研究和1项模型验证研究。11个
Cho [13] + + + + - + - + + 模型的AUC值为0.600~0.908,表明各模型均具有良好
Chen [14] + ? ? + - - - + - 的预测性能,但大部分研究 [11―14,17] 未报告模型校准度,无
李亚玲 [15] + ? ? + - - - + - [16]
黄家良 [16] + + ? + - - - + - 法评价模型预测的准确性。1项研究 使用H-L检验考
Chang [17] - ? + + - - - + - 察模型预测值与实际观测值之间的差异,但该方法容易
[15]
[20]
“-”表示低偏倚风险/适用性好;“+”表示高偏倚风险/适用性差; 受到样本量及数据分布的影响 。另外1项研究 使用
“?”表示不清楚。 H-L检验结合校准曲线评估模型校准度,校准曲线可直
2.5.3 结局领域 观观察预测概率与实际结果之间的关系且不受限于特
3项研究 [11,13,17] 被评为高偏倚风险,其中2项研究 [11,17] 定的数据分布。内部验证有助于减少模型过度拟合,而
[13]
存在多个结局定义,存在偏倚风险;另外1项研究 的预 外部验证不仅能够防止模型过度拟合,还能够检验模型
测变量包含化疗后 5 d 的淋巴细胞计数,而模型的应用 的泛化能力、提升研究结果的可靠性,从而增强预测模
是在患者化疗前,即预测变量的测量与结局之间的时间 型的权威性和普适性 。本文纳入的研究中仅 2 项研
[21]
间隔不合适;4 项研究 [12,14―16] 被评为偏倚风险不清楚,原 究 [12,16] 进行了外部验证,而缺乏外部验证会影响预测模
因是文献中未报告研究人员是否在不了解预测变量的 型的应用范围及决策信任度。因此,医务人员在选择或
情况下确定结局。 开发有效预测模型时需考虑模型的校准方法及模型内、
2.5.4 统计分析领域 外部验证问题。
所纳入的7项研究 [11―17] 均被评为高风险偏倚。主要 3.2 预测模型总体偏倚风险高、总体适用性良好
原因是样本量不足,即预测变量的事件数(events per 本研究纳入的 7 项研究 [11―17] 均为高偏倚风险,主要
variable,EPV)<20。4 项研究 [11,15―17] 将连续变量转换为 原因为研究设计缺陷(研究类型多为回顾性研究)、未对
分类变量。7项研究 [11―17] 均未报道缺失数据与缺失数据 研究人员实施盲法、应用模型时预测变量无法获取、多
[12]
处理方法。在模型构建方面,1 项研究 为模型验证研 个结局定义、样本量不足、变量处理方式不当、未对缺失
究,未建立模型;6 项研究 [11,13―17] 在筛选预测变量时采用 数据进行报告、模型评估指标缺乏等。由此得到对未来
[13]
单因素分析结合多因素分析,其中 1 项研究 还结合了 研究的启示:(1)回顾性研究虽然数据容易获取、收集成
递归特征消除;7 项研究 [11―17] 均未报告数据的复杂性处 本低,但存在选择偏倚及数据质量问题 。因此,当研
[22]
理情况;6 项研究 [11,13―17] 采用 AUC 评价模型区分度,1 项 究时间、经济条件等允许时,应当优先考虑采用前瞻性
[12]
研究 采用灵敏度、特异度等指标评价模型区分度;5项 队列研究、随机对照研究、巢式病例对照研究等方法所
研究 [11―14,17] 未报告模型校准度。在模型过拟合方面,2项 获取的数据作为构建风险预测模型的数据来源。(2)对
研究 [12,16] 进行了外部验证,5 项研究 [11,13―15,17] 进行了内部 收集数据的研究人员实施盲法,可进一步减少偏倚风
[13]
验证,其中1项研究 采用的是五倍交叉验证。 险。(3)在筛选模型的预测变量时,必须考虑在实际应用
2.5.5 适用性评价 该模型时是否能获取到所有预测变量所需的数据,以及
在研究对象领域,7项研究 [11―17] 均适用性好;在预测 预测变量评估与结局确定之间的时间间隔是否合适,否
变量领域,1项研究 适用性差,原因为预测变量评估时 则将会由于缺少预测变量信息导致模型准确性降低、泛
[13]
间与系统评价问题不匹配;在结局领域,7项研究 [11―17] 均 化能力及适用性受限等。(4)明确选择主要的结局定义。
适用性好。 单一结局定义可避免多个结局定义带来的选择性报告
3 讨论 偏倚及结局异质性,并可简化模型。(5)保证样本量充
[19]
乳腺癌患者数量庞大,且化疗后骨髓抑制高发 , 足。样本量不足(EPV<20)会降低模型稳定性及增加
给医生制订治疗方案带来了较大的挑战。目前,可通过 模型过拟合风险 。(6)合理转换连续变量。不合理的
[23]
制定和实施骨髓抑制的预防和管理策略降低化疗后骨 分类会导致不必要的预测信息丢失,导致预测能力下
髓抑制的发生率。风险评估可辅助医疗决策者对患者 降 ,研究人员可根据预测变量的临床阈值、业内共识
[24]
的骨髓抑制风险进行有效分层,针对高风险患者优化治 或采用限制性立方样条方式合理转换连续变量。(7)完
疗策略,提高护理人员及患者对风险管理的认知,最终 善报告缺失数据。所纳入的研究中均未描述缺失数据
[25]
增强患者对风险管理行为的依从性。因此,建立一个科 及缺失数据的处理方法,这会导致选择偏倚 。(8)完善
学、合理的风险预测模型对于乳腺癌患者的风险管理具 模型评估指标。在评估预测模型时,区分度和校准度至
有重要意义。 关重要,但本研究中仅有2项研究报告了校准度。未来
· 616 · China Pharmacy 2025 Vol. 36 No. 5 中国药房 2025年第36卷第5期