Page 114 - 《中国药房》2025年5期
P. 114

表4 偏倚风险及适用性评价结果                            3.1 预测模型的预测性能有待提高,校准度及适用性需
                         偏倚风险            适用性        总体        进一步验证
           纳入文献
                  研究对象 预测变量 结局 统计分析 研究对象 预测变量 结局 偏倚风险 适用性         本研究最终纳入了7项研究,共报告了12个预测模
           Dranitsaris 11]  +  ?  +  +  -  -  -    +   -
           Jenkins [12]  +  ?  ?  +  -    -   -    +   -      型,包括11项模型开发研究和1项模型验证研究。11个
           Cho [13]  +  +    +   +   -    +   -    +   +      模型的AUC值为0.600~0.908,表明各模型均具有良好
           Chen [14]  +  ?   ?   +   -    -   -    +   -      的预测性能,但大部分研究           [11―14,17] 未报告模型校准度,无
           李亚玲 [15]  +   ?   ?   +   -    -   -    +   -                                      [16]
           黄家良 [16]  +  +    ?   +   -    -   -    +   -      法评价模型预测的准确性。1项研究 使用H-L检验考
           Chang [17]  -  ?  +   +   -    -   -    +   -      察模型预测值与实际观测值之间的差异,但该方法容易
                                                                                                        [15]
                                                                                        [20]
            “-”表示低偏倚风险/适用性好;“+”表示高偏倚风险/适用性差;                  受到样本量及数据分布的影响 。另外1项研究 使用
         “?”表示不清楚。                                            H-L检验结合校准曲线评估模型校准度,校准曲线可直
          2.5.3 结局领域                                          观观察预测概率与实际结果之间的关系且不受限于特
              3项研究   [11,13,17] 被评为高偏倚风险,其中2项研究        [11,17]  定的数据分布。内部验证有助于减少模型过度拟合,而
                                                    [13]
          存在多个结局定义,存在偏倚风险;另外1项研究 的预                           外部验证不仅能够防止模型过度拟合,还能够检验模型
          测变量包含化疗后 5 d 的淋巴细胞计数,而模型的应用                         的泛化能力、提升研究结果的可靠性,从而增强预测模
          是在患者化疗前,即预测变量的测量与结局之间的时间                            型的权威性和普适性 。本文纳入的研究中仅 2 项研
                                                                                 [21]
          间隔不合适;4 项研究        [12,14―16] 被评为偏倚风险不清楚,原          究 [12,16] 进行了外部验证,而缺乏外部验证会影响预测模
          因是文献中未报告研究人员是否在不了解预测变量的                             型的应用范围及决策信任度。因此,医务人员在选择或
          情况下确定结局。                                            开发有效预测模型时需考虑模型的校准方法及模型内、
          2.5.4 统计分析领域                                        外部验证问题。
              所纳入的7项研究        [11―17] 均被评为高风险偏倚。主要            3.2 预测模型总体偏倚风险高、总体适用性良好
          原因是样本量不足,即预测变量的事件数(events per                           本研究纳入的 7 项研究        [11―17] 均为高偏倚风险,主要
          variable,EPV)<20。4 项研究    [11,15―17] 将连续变量转换为       原因为研究设计缺陷(研究类型多为回顾性研究)、未对
          分类变量。7项研究         [11―17] 均未报道缺失数据与缺失数据             研究人员实施盲法、应用模型时预测变量无法获取、多
                                            [12]
          处理方法。在模型构建方面,1 项研究 为模型验证研                           个结局定义、样本量不足、变量处理方式不当、未对缺失
          究,未建立模型;6 项研究         [11,13―17] 在筛选预测变量时采用         数据进行报告、模型评估指标缺乏等。由此得到对未来
                                                [13]
          单因素分析结合多因素分析,其中 1 项研究 还结合了                          研究的启示:(1)回顾性研究虽然数据容易获取、收集成
          递归特征消除;7 项研究         [11―17] 均未报告数据的复杂性处            本低,但存在选择偏倚及数据质量问题 。因此,当研
                                                                                                [22]
          理情况;6 项研究      [11,13―17] 采用 AUC 评价模型区分度,1 项        究时间、经济条件等允许时,应当优先考虑采用前瞻性
              [12]
          研究 采用灵敏度、特异度等指标评价模型区分度;5项                           队列研究、随机对照研究、巢式病例对照研究等方法所
          研究  [11―14,17] 未报告模型校准度。在模型过拟合方面,2项                 获取的数据作为构建风险预测模型的数据来源。(2)对
          研究  [12,16] 进行了外部验证,5 项研究      [11,13―15,17] 进行了内部  收集数据的研究人员实施盲法,可进一步减少偏倚风
                           [13]
          验证,其中1项研究 采用的是五倍交叉验证。                               险。(3)在筛选模型的预测变量时,必须考虑在实际应用
          2.5.5 适用性评价                                         该模型时是否能获取到所有预测变量所需的数据,以及
              在研究对象领域,7项研究           [11―17] 均适用性好;在预测        预测变量评估与结局确定之间的时间间隔是否合适,否
          变量领域,1项研究 适用性差,原因为预测变量评估时                           则将会由于缺少预测变量信息导致模型准确性降低、泛
                           [13]
          间与系统评价问题不匹配;在结局领域,7项研究                    [11―17] 均  化能力及适用性受限等。(4)明确选择主要的结局定义。
          适用性好。                                               单一结局定义可避免多个结局定义带来的选择性报告
          3 讨论                                                偏倚及结局异质性,并可简化模型。(5)保证样本量充
                                                       [19]
              乳腺癌患者数量庞大,且化疗后骨髓抑制高发 ,                          足。样本量不足(EPV<20)会降低模型稳定性及增加
          给医生制订治疗方案带来了较大的挑战。目前,可通过                            模型过拟合风险 。(6)合理转换连续变量。不合理的
                                                                            [23]
          制定和实施骨髓抑制的预防和管理策略降低化疗后骨                             分类会导致不必要的预测信息丢失,导致预测能力下
          髓抑制的发生率。风险评估可辅助医疗决策者对患者                             降 ,研究人员可根据预测变量的临床阈值、业内共识
                                                                [24]
          的骨髓抑制风险进行有效分层,针对高风险患者优化治                            或采用限制性立方样条方式合理转换连续变量。(7)完
          疗策略,提高护理人员及患者对风险管理的认知,最终                            善报告缺失数据。所纳入的研究中均未描述缺失数据
                                                                                                   [25]
          增强患者对风险管理行为的依从性。因此,建立一个科                            及缺失数据的处理方法,这会导致选择偏倚 。(8)完善
          学、合理的风险预测模型对于乳腺癌患者的风险管理具                            模型评估指标。在评估预测模型时,区分度和校准度至
          有重要意义。                                              关重要,但本研究中仅有2项研究报告了校准度。未来


          · 616 ·    China Pharmacy  2025 Vol. 36  No. 5                               中国药房  2025年第36卷第5期
   109   110   111   112   113   114   115   116   117   118   119