Page 124 - 《中国药房》2025年11期
P. 124
表1 2类模型采用的数据集基线特征
三分类模型 二分类模型
基线资料
训练集(n=556) 测试集(n=139) Z/χ 2 P 训练集(n=524) 测试集(n=131) Z/χ 2 P
VPA血药浓度[M(P 25,P 75)]/(μg/mL) 56.84(41.19,76.00) 59.21(35.43,74.75) 0.398 0.691 54.61(39.75,72.73) 59.21(35.43,74.75) -0.099 0.922
性别(男)/例(%) 365(65.65) 93(66.91) 0.078 0.779 360(68.70) 78(59.54) 3.969 0.046
年龄[M(P 25,P 75)]/岁 50.00(31.00,64.00) 51.00(26.00,64.00) 0.044 0.965 51.00(30.00,65.00) 49.00(30.50,61.00) 0.803 0.422
身高[M(P 25,P 75)]/cm 170.00(162.00,174.00) 170.00(162.00,174.75) -0.329 0.742 170.00(162.00,175.00) 170.00(164.00,173.00) -0.213 0.831
体重[M(P 25,P 75)]/kg 65.00(55.00,74.00) 65.00(56.75,75.00) -0.688 0.491 65.00(55.00,74.62) 65.00(57.00,75.00) -1.193 0.232
给药途径(口服)/例(%) 419(75.36) 117(84.17) 4.895 0.027 407(77.67) 102(77.86) 0.002 0.963
日剂量[M(P 25,P 75)]/g 1.00(0.80,1.20) 1.00(0.80,1.00) 0.775 0.426 1.00(0.80,1.20) 1.00(0.80,1.20) -1.410 0.148
ALT[M(P 25,P 75)]/(U/L) 17.00(10.70,26.34) 17.32(11.29,27.50) -0.406 0.685 17.00(11.24,26.93) 18.19(11.19,27.70) -0.305 0.761
AST[M(P 25,P 75)]/(U/L) 19.00(15.00,27.00) 19.00(14.50,26.00) 0.313 0.754 19.45(15.00,27.08) 18.10(14.70,25.93) 0.963 0.336
ALB[M(P 25,P 75)]/(g/L) 37.20(33.19,41.52) 36.59(33.24,41.69) 0.186 0.853 37.24(33.29,41.56) 36.55(32.35,41.16) 0.716 0.398
Cr[M(P 25,P 75)]/(μmol/L) 55.00(41.70,68.90) 52.65(43.58,68.03) 0.015 0.989 54.95(41.48,70.50) 53.80(43.30,65.20) 0.455 0.650
CCR[M(P 25,P 75)]/(mL/min) 111.34(96.31,126.72) 111.95(97.79,126.06) -0.134 0.894 110.47(95.52,126.54) 114.25(103.62,126.26) -1.321 0.187
胱抑素C[M(P 25,P 75)]/(μg/mL) 0.93(0.81,1.12) 0.94(0.80,1.05) 0.312 0.755 0.94(0.82,1.12) 0.91(0.80,1.08) 1.101 0.271
-1
白细胞计数[M(P 25,P 75)]/(×10 L ) 6.36(5.00,8.44) 6.33(5.10,8.49) -0.075 0.940 6.36(5.04,8.45) 6.52(5.04,8.38) 0.309 0.758
9
血小板计数[M(P 25,P 75)]/(×10 L ) 183.00(138.00,233.00) 188.00(146.00,244.00) -1.110 0.267 187.00(140.00,237.00) 191.00(145.00,238.00) -0.333 0.739
-1
9
总胆红素[M(P 25,P 75)]/(μmol/L) 7.72(5.40,11.09) 7.34(5.27,9.93) 1.079 0.281 7.67(5.36,11.24) 7.22(5.21,10.14) 0.963 0.336
间接胆红素[M(P 25,P 75)]/(μmol/L) 4.50(3.09,6.92) 4.65(2.86,6.70) -0.073 0.942 4.75(3.09,7.01) 4.20(3.05,6.38) 1.081 0.280
合并高同型半胱氨酸血症/例(%) 13(2.34) 4(2.88) 0.136 0.713 12(2.29) 3(2.29) <0.001 1.000
合并高血压/例(%) 154(27.70) 32(23.02) 1.241 0.265 138(26.34) 38(29.01) 0.381 0.537
合并糖尿病/例(%) 67(12.05) 17(12.23) 0.003 0.954 64(12.21) 16(12.21) <0.001 1.000
合并低蛋白血症/例(%) 72(12.95) 23(16.55) 1.219 0.269 81(15.46) 13(9.92) 2.611 0.106
合并电解质紊乱/例(%) 52(9.35) 12(8.63) 0.069 0.793 55(10.50) 8(6.11) 2.323 0.128
合并肝病/例(%) 36(6.47) 4(2.88) 2.653 0.103 28(5.34) 8(6.11) 0.118 0.732
合并肾病/例(%) 19(3.42) 5(3.60) 0.011 0.917 20(3.82) 3(2.29) 0.721 0.396
合并感染/例(%) 193(34.71) 45(32.37) 3.106 0.078 185(35.31) 45(34.35) 0.042 0.838
合并使用质子泵抑制剂/例(%) 75(13.49) 17(12.23) 0.153 0.695 71(13.55) 17(12.98) 0.030 0.864
合并使用组胺H 2受体拮抗剂/例(%) 32(5.76) 7(5.04) 0.109 0.742 24(4.58) 9(6.87) 1.149 0.284
合并使用具有酶诱导作用的抗癫痫药/例(%) 30(5.40) 9(6.47) 0.244 0.621 28(5.34) 11(8.40) 1.745 0.187
合并使用其他抗癫痫药/例(%) 168(30.22) 46(33.09) 0.432 0.511 151(28.82) 50(38.17) 4.308 0.038
合并使用碳青霉烯类抗生素/例(%) 30(5.40) 6(4.32) 0.264 0.608 28(5.34) 8(6.11) 0.118 0.732
合并使用蛋白酶抑制剂/例(%) 2(0.36) 1(0.72) 0.335 0.563 1(0.19) 2(1.53) 4.102 0.043
合并使用护肝药/例(%) 44(7.91) 12(8.63) 0.078 0.780 41(7.82) 13(9.92) 0.611 0.435
合并使用抗精神病药/例(%) 85(15.29) 30(21.58) 3.191 0.074 88(16.79) 21(16.03) 0.044 0.834
表2 不同分类模型前16个特征的XGBoost重要性评分 的区分效果差 ;(2)正常组 vs. (不足组+超限组),
三分类模型 二分类模型 AUC=0.21,表明模型对“正常”类别与不足组+超限组
排名 XGBoost重要 XGBoost重要 的区分效果差 ;(3)超限组 vs. (不足组+正常组),
特征 特征
性评分/% 性评分/% AUC=0.89,表明模型对“超限”类别与不足组+正常组
1 合并肾病 21.92 合并使用碳青霉烯类抗生素 21.01
2 合并使用碳青霉烯类抗生素 12.02 合并使用具有酶诱导作用的抗癫痫药 8.06 的区分效果较好。
3 合并电解质紊乱 6.45 日剂量 6.76 将上述3个AUC结果融合得到Random Forest方法
4 合并使用护肝药 6.43 性别(男) 5.82 在三分类模型中的平均AUC为0.519 3,综合学习曲线,
5 日剂量 5.20 间接胆红素 5.81 提示三分类模型存在过拟合问题,表明超限组与其他组
6 血小板计数 4.71 AST 5.70 (不足组+正常组)的样本分布存在显著差异,三分类模
7 合并使用具有酶诱导作用的抗癫痫药 4.55 ALT 5.48
8 性别(男) 4.30 胱抑素C 5.30 型的可靠性较低,泛化能力较差。
9 合并感染 4.23 给药途径(口服) 5.14 2.3.2 二分类模型中的结果
10 胱抑素C 4.20 血小板计数 5.02 在二分类模型中 CatBoost 方法为最优,其训练集 5
11 AST 4.17 合并使用护肝药 4.84
倍交叉验证的性能指标为:准确率 0.668 8、F1 分数为
12 ALT 4.16 总胆红素 4.69 0.668 5;测试集的性能指标为:准确率 0.786 3、F1 分数
13 总胆红素 4.04 体重 4.44
14 间接胆红素 3.96 白细胞计数 4.34 0.785 7、AUC 0.819 5,对不足组和正常组的区分效果较
15 白细胞计数 3.51 合并肾病 3.83 好。由于二分类模型数据样本分布较为均衡,其测试集
16 体重 3.16 合并感染 3.74 准确率和 F1 分数均能有效反映模型性能。此外,各机
· 1402 · China Pharmacy 2025 Vol. 36 No. 11 中国药房 2025年第36卷第11期