Page 124 - 《中国药房》2025年11期
P. 124

表1 2类模型采用的数据集基线特征

                                                 三分类模型                                  二分类模型
           基线资料
                                    训练集(n=556)     测试集(n=139)  Z/χ 2  P    训练集(n=524)    测试集(n=131)  Z/χ 2  P
           VPA血药浓度[M(P 25,P 75)]/(μg/mL)  56.84(41.19,76.00)  59.21(35.43,74.75)  0.398  0.691  54.61(39.75,72.73)  59.21(35.43,74.75)  -0.099  0.922
           性别(男)/例(%)               365(65.65)     93(66.91)   0.078  0.779  360(68.70)  78(59.54)   3.969  0.046
           年龄[M(P 25,P 75)]/岁       50.00(31.00,64.00)  51.00(26.00,64.00)  0.044  0.965  51.00(30.00,65.00)  49.00(30.50,61.00)  0.803  0.422
           身高[M(P 25,P 75)]/cm     170.00(162.00,174.00)  170.00(162.00,174.75)  -0.329  0.742  170.00(162.00,175.00)  170.00(164.00,173.00)  -0.213  0.831
           体重[M(P 25,P 75)]/kg      65.00(55.00,74.00)  65.00(56.75,75.00)  -0.688  0.491  65.00(55.00,74.62)  65.00(57.00,75.00)  -1.193  0.232
           给药途径(口服)/例(%)            419(75.36)    117(84.17)   4.895  0.027  407(77.67)  102(77.86)  0.002  0.963
           日剂量[M(P 25,P 75)]/g      1.00(0.80,1.20)  1.00(0.80,1.00)  0.775  0.426  1.00(0.80,1.20)  1.00(0.80,1.20)  -1.410  0.148
           ALT[M(P 25,P 75)]/(U/L)  17.00(10.70,26.34)  17.32(11.29,27.50)  -0.406  0.685  17.00(11.24,26.93)  18.19(11.19,27.70)  -0.305  0.761
           AST[M(P 25,P 75)]/(U/L)  19.00(15.00,27.00)  19.00(14.50,26.00)  0.313  0.754  19.45(15.00,27.08)  18.10(14.70,25.93)  0.963  0.336
           ALB[M(P 25,P 75)]/(g/L)  37.20(33.19,41.52)  36.59(33.24,41.69)  0.186  0.853  37.24(33.29,41.56)  36.55(32.35,41.16)  0.716  0.398
           Cr[M(P 25,P 75)]/(μmol/L)  55.00(41.70,68.90)  52.65(43.58,68.03)  0.015  0.989  54.95(41.48,70.50)  53.80(43.30,65.20)  0.455  0.650
           CCR[M(P 25,P 75)]/(mL/min)  111.34(96.31,126.72)  111.95(97.79,126.06)  -0.134  0.894  110.47(95.52,126.54)  114.25(103.62,126.26)  -1.321  0.187
           胱抑素C[M(P 25,P 75)]/(μg/mL)  0.93(0.81,1.12)  0.94(0.80,1.05)  0.312  0.755  0.94(0.82,1.12)  0.91(0.80,1.08)  1.101  0.271
                         -1
           白细胞计数[M(P 25,P 75)]/(×10  L )  6.36(5.00,8.44)  6.33(5.10,8.49)  -0.075  0.940  6.36(5.04,8.45)  6.52(5.04,8.38)  0.309  0.758
                        9
           血小板计数[M(P 25,P 75)]/(×10  L )  183.00(138.00,233.00)  188.00(146.00,244.00)  -1.110  0.267  187.00(140.00,237.00)  191.00(145.00,238.00)  -0.333  0.739
                         -1
                        9
           总胆红素[M(P 25,P 75)]/(μmol/L)  7.72(5.40,11.09)  7.34(5.27,9.93)  1.079  0.281  7.67(5.36,11.24)  7.22(5.21,10.14)  0.963  0.336
           间接胆红素[M(P 25,P 75)]/(μmol/L)  4.50(3.09,6.92)  4.65(2.86,6.70)  -0.073  0.942  4.75(3.09,7.01)  4.20(3.05,6.38)  1.081  0.280
           合并高同型半胱氨酸血症/例(%)          13(2.34)      4(2.88)     0.136  0.713  12(2.29)     3(2.29)   <0.001  1.000
           合并高血压/例(%)               154(27.70)     32(23.02)   1.241  0.265  138(26.34)  38(29.01)   0.381  0.537
           合并糖尿病/例(%)                67(12.05)     17(12.23)   0.003  0.954  64(12.21)   16(12.21)  <0.001  1.000
           合并低蛋白血症/例(%)              72(12.95)     23(16.55)   1.219  0.269  81(15.46)   13(9.92)    2.611  0.106
           合并电解质紊乱/例(%)              52(9.35)      12(8.63)    0.069  0.793  55(10.50)    8(6.11)    2.323  0.128
           合并肝病/例(%)                 36(6.47)      4(2.88)     2.653  0.103  28(5.34)     8(6.11)    0.118  0.732
           合并肾病/例(%)                 19(3.42)      5(3.60)     0.011  0.917  20(3.82)     3(2.29)    0.721  0.396
           合并感染/例(%)                193(34.71)     45(32.37)   3.106  0.078  185(35.31)  45(34.35)   0.042  0.838
           合并使用质子泵抑制剂/例(%)           75(13.49)     17(12.23)   0.153  0.695  71(13.55)   17(12.98)   0.030  0.864
           合并使用组胺H 2受体拮抗剂/例(%)       32(5.76)      7(5.04)     0.109  0.742  24(4.58)     9(6.87)    1.149  0.284
           合并使用具有酶诱导作用的抗癫痫药/例(%)     30(5.40)      9(6.47)     0.244  0.621  28(5.34)    11(8.40)    1.745  0.187
           合并使用其他抗癫痫药/例(%)          168(30.22)     46(33.09)   0.432  0.511  151(28.82)  50(38.17)   4.308  0.038
           合并使用碳青霉烯类抗生素/例(%)         30(5.40)      6(4.32)     0.264  0.608  28(5.34)     8(6.11)    0.118  0.732
           合并使用蛋白酶抑制剂/例(%)           2(0.36)       1(0.72)     0.335  0.563  1(0.19)      2(1.53)    4.102  0.043
           合并使用护肝药/例(%)              44(7.91)      12(8.63)    0.078  0.780  41(7.82)    13(9.92)    0.611  0.435
           合并使用抗精神病药/例(%)            85(15.29)     30(21.58)   3.191  0.074  88(16.79)   21(16.03)   0.044  0.834

          表2 不同分类模型前16个特征的XGBoost重要性评分                        的区分效果差 ;(2)正常组 vs. (不足组+超限组),
                      三分类模型                 二分类模型             AUC=0.21,表明模型对“正常”类别与不足组+超限组
           排名                 XGBoost重要             XGBoost重要  的区分效果差 ;(3)超限组 vs. (不足组+正常组),
                    特征                     特征
                               性评分/%                 性评分/%    AUC=0.89,表明模型对“超限”类别与不足组+正常组
           1 合并肾病               21.92  合并使用碳青霉烯类抗生素   21.01
           2 合并使用碳青霉烯类抗生素       12.02  合并使用具有酶诱导作用的抗癫痫药  8.06  的区分效果较好。
           3 合并电解质紊乱            6.45  日剂量             6.76        将上述3个AUC结果融合得到Random Forest方法
           4 合并使用护肝药            6.43  性别(男)           5.82    在三分类模型中的平均AUC为0.519 3,综合学习曲线,
           5 日剂量                5.20  间接胆红素           5.81    提示三分类模型存在过拟合问题,表明超限组与其他组
           6 血小板计数              4.71  AST             5.70   (不足组+正常组)的样本分布存在显著差异,三分类模
           7 合并使用具有酶诱导作用的抗癫痫药   4.55  ALT             5.48
           8 性别(男)              4.30  胱抑素C            5.30    型的可靠性较低,泛化能力较差。
           9 合并感染               4.23  给药途径(口服)        5.14    2.3.2 二分类模型中的结果
           10 胱抑素C              4.20  血小板计数           5.02        在二分类模型中 CatBoost 方法为最优,其训练集 5
           11  AST              4.17  合并使用护肝药         4.84
                                                              倍交叉验证的性能指标为:准确率 0.668 8、F1 分数为
           12 ALT               4.16  总胆红素            4.69    0.668 5;测试集的性能指标为:准确率 0.786 3、F1 分数
           13 总胆红素              4.04  体重              4.44
           14 间接胆红素             3.96  白细胞计数           4.34    0.785 7、AUC 0.819 5,对不足组和正常组的区分效果较
           15 白细胞计数             3.51  合并肾病            3.83    好。由于二分类模型数据样本分布较为均衡,其测试集
           16 体重                3.16  合并感染            3.74    准确率和 F1 分数均能有效反映模型性能。此外,各机


          · 1402 ·    China Pharmacy  2025 Vol. 36  No. 11                            中国药房  2025年第36卷第11期
   119   120   121   122   123   124   125   126   127   128   129