Page 139 - 《中国药房》2026年7期
P. 139

表2 模型的偏倚风险和适用性评价结果                           态性)在理论上可能具备潜在的预测价值,但由于其检
                       偏倚风险             适用性        总体        测成本较高且在临床中普及性较低,因此尚未广泛应用
          纳入研究
                研究对象 预测因子 结局 统计分析 研究对象 预测因子 结局 偏倚风险 适用性      于实际的预测模型中 。这些结果提示,在进行骨髓抑
                                                                               [20]
          刘若彤 [5]  +  +    +    +   -    -   -    +   -
          李祎涵 [12]  -  -   ?    +   -    -   -    +   -      制风险预测时,应结合儿童肿瘤患者的生理特征与治疗
          徐蕊 [13]  +  +    +    +   -    -   -    +   -      差异,优先选择那些易于获取、便于量化且与疾病机制
          Li [2]  +   +    +    +   -    -   -    +   -      紧密相关的指标,从而为临床上个体化风险评估方案的
          Miedema [14]  -  -  +  +  -    -   -    +   -
          Lyman [15]  -  -  +   +   -    -   -    +   -      制定提供重要依据。
          Wicki [16]  +  +  +   +   -    -   -    +   -      3.2 预测因子筛选与模型建立方法
             注:“-”表示低偏倚风险/适用性好;“+”表示高偏倚风险/适用性                    在本研究纳入的文献中,多数预测模型在变量筛选
         差;“?”表示偏倚风险/适用性不清楚。                                 阶段仍主要依赖传统统计分析方法,只有少数研究尝试
          2.5.3 结局                                           引入基于机器学习的特征筛选技术,如信息值评估和变
              在结局方面,有 6 项研究        [2,5,13―16] 被判定为高偏倚风      量间相关性分析 。尽管传统统计方法在识别独立预测
                                                                           [2]
          险,其主要问题在于:这些研究所构建的模型中包含的                           因子方面有一定的优势,但其在捕捉变量间复杂的非线
          部分预测因子,实质上也是结局定义中相关因素的一部                           性关系和潜在交互效应时存在一定的局限性 ;相比之
                                                                                                    [21]
          分,从而可能导致预测因子与结局之间的相关性被人为                           下,采用 XGBoost 和 RF 等机器学习算法的研究不仅能
                              [12]
          高估。此外,有1项研究 被评为偏倚风险不清楚,原因                          更高效地处理高维数据、挖掘变量之间的深层交互模
          在于其未明确说明预测因子的测量时间与结局评估时                            式,其模型性能(AUC=0.981)也显著优于传统逻辑回
          间之间的间隔,同时在预测信息不清的情况下,也未说                           归模型 。
                                                                   [22]
          明是否采取盲法进行结局评估,从而影响了评估的可                                在模型构建策略方面,大多数研究              [5,12―13,15] 采用的是
          信度。                                                LR 方法,仅少数研究       [2,14,16] 对 WSM、PR 和多种机器学习
          2.5.4 统计分析                                         算法进行了系统性比较。这种传统建模方法占主导地
              纳入的 7 项研究    [2,5,12―16] 均被判定为高偏倚风险。6          位的趋势与文献[23]在乳腺癌风险预测模型研究中的发
          项研究   [2,5,12,14―16] 的主要问题是样本量过小,具体表现为             现相似,这反映了儿童恶性肿瘤化疗后骨髓抑制风险建
          每变量事件数(events per variable,EPV)<20,其中 4 项          模领域尚未充分利用现代机器学习技术。
          研究  [12―14,16] 的EPV<10;另外,有6项研究   [5,12―16] 未说明缺       基于此,未来的研究应考虑在模型设计中采用“混
          失值情况及其处理策略;2项研究             [2,14] 在选择预测因子时        合方法”策略,即在预测因子筛选阶段结合机器学习算
          未进行单因素分析;3 项研究           [14―16] 未提供模型的校准信         法与经典统计方法,并在模型建立过程中对多种算法进
                      [13]
          息;有1项研究 仅通过H-L检验评估模型拟合情况;另                         行系统性的性能评估 ,以降低单一方法带来的偏倚,
                                                                                [24]
                   [14]
          有1项研究 未实施内部验证。所有7项研究均未说明                           同时提高模型的泛化能力和临床适配性。
          数据复杂性的处理情况,且未对开发过程中使用的最终                           3.3 预测效能与临床适配性
          模型的预测因子系数或截距与多变量分析报告结果之                                本研究共纳入 12 个风险预测模型,AUC 为 0.748~
          间的一致性进行评估。                                         0.981,多数模型在判别能力方面表现良好。然而,模型
          3 讨论                                               的校准与验证方面仍存在一定的局限性。在校准方面,
          3.1 模型的主要预测因子                                      只有少数研究      [2,12] 使用了 H-L 检验并结合校准曲线进行
              本研究通过对7项儿童恶性肿瘤化疗后骨髓抑制风                         评估,而大多数研究未充分报告校准方法,这可能影响
          险预测模型研究进行系统整合与分析,发现与初步筛选                           对模型预测精度的准确评估。有研究 通过机器学习算
                                                                                             [2]
          的候选预测因子相比,最终纳入模型的预测因子(如基                           法建立模型,并采用五折交叉验证进行内部验证,最终
          线中性粒细胞计数、血小板水平、化疗方案强度和癌症                           模型的 AUC 达到了 0.981,这表明现代算法在提升模型
          类型)在预测准确性和临床适用性方面具有明显优势。                           精度方面具有明显优势。然而,尽管机器学习模型在区
          这些关键变量的选取得到了循证医学的支持——研究                            分度上表现优异,但其临床转化仍面临可解释性与可操
          已证实,化疗方案的强度、血小板以及血红蛋白水平与                           作性方面的挑战。该类模型结构复杂,预测过程缺乏透
          骨髓抑制的发生密切相关           [17―18] 。此外,血液系统恶性肿          明性,并且该研究仅提供了全局的特征重要性,未使用
          瘤的儿童患者由于骨髓浸润及接受高强度化疗,其发热                           如沙普利加性解释或局部可解释模型-不可知解释等更
          性中性粒细胞减少的发生率显著高于实体瘤患者                      [2,19] ,  先进的技术来揭示个体化预测结果的决策依据,不利于
          且不同类型肿瘤中,中性粒细胞计数的变化存在明显差                           获得临床医生的理解与信任;同时,多数模型未提供便
          异,这使其成为预测骨髓抑制风险的关键指标。                              捷的评分工具或与医院信息系统整合的接口,限制了其
              值得注意的是,尽管某些候选预测因子(如基因多                         在实际医疗环境中的推广。因此,在认可其高 AUC 的


          中国药房  2026年第37卷第7期                                                 China Pharmacy  2026 Vol. 37  No. 7    · 957 ·
   134   135   136   137   138   139   140   141   142   143   144