Page 122 - 《中国药房》2025年11期
P. 122
丙戊酸(valproic acid,VPA)是一种广谱抗癫痫药, 酸血症、糖尿病、高血压、电解质紊乱、肝病、肾病、感染、
通过增加脑内γ-氨基丁酸(γ-aminobutyric acid,GABA) 低蛋白血症)以及合并用药(使用碳青霉烯类抗生素、具
水平等机制发挥抗癫痫和稳定情绪作用,可用于全面性 有酶诱导作用的抗癫痫药、其他抗癫痫药、质子泵抑制
癫痫、部分性癫痫及肌阵挛癫痫等多种类型的癫痫发作 剂、组胺 H2受体拮抗剂、蛋白酶抑制剂、护肝药、抗精神
及双相情感障碍等精神疾病的治疗 [1―3] 。但VPA体内代 病药)。本研究经西安国际医学中心医院伦理委员会批
[4]
谢的个体差异较大,血药浓度与剂量呈非线性相关 。 准(批准号:GJYX-KY-2024-032),在研究过程中采用的
此外,VPA 的有效血药浓度范围较窄,当 VPA 血药浓度 数据已完全删除患者隐私信息。
低于 50 μg/mL 时可能导致临床治疗失败,而超过 100 1.2 数据预处理与规范化
[5]
μg/mL时患者出现不良反应的风险又会显著升高 。因 (1)分类特征的数值化:将合并症和合并用药情况
此,监测VPA的血药浓度对于提升临床用药的安全性和 转换为二进制数值(“1”代表存在/使用,“0”代表不存在/
有效性至关重要。 不使用);同样地,将性别和给药途径也转换为二进制数
VPA血药浓度通常通过血液生化检测,这需要对患 值(“1”代表男性/静脉给药,“0”代表女性/口服给药)。
者进行采血,并且其检测过程不仅耗时还需投入较高经
(2)临床资料特征的缺失值填充:695 份数据样本
济成本。因此,开发VPA血药浓度预测模型成为了近年
中,仅有285份样本的数据完整,临床资料特征的缺失比
[6]
来的研究焦点 。传统的VPA药代动力学预测模型主要
例 具 体 为 :身 高(29.74%),体 重(28.59%),CCR
[6]
[7]
[8]
包括一室模型 、二室模型 、群体药代动力学模型 以及
(26.58%),Cr(15.8%),间接胆红素(19.54%),胱抑素 C
[9]
基于生理的药代动力学模型 4种。然而,由于药代动力
(16.09%) ,ALB (13.22%) ,ALT (11.21%) ,AST
学的高度非线性和多因素影响,使得药代动力学预测模
(11.93%),白细胞计数(11.64%),血小板计数(11.64%),
型的构建颇具挑战性。随着机器学习技术的发展,VPA
总胆红素(10.78%),日剂量(3.59%),年龄(0.14%)。本
血药浓度预测建模成为可能,且国内外相关研究已经取
研究按照缺失值的常规填充步骤,采用中位数填充法对
得了一定成果,如有研究者通过构建模型来预测癫痫患
缺失的临床资料特征进行填充。
[11]
[10]
者转氨酶异常升高情况 、老年癫痫患者血药浓度 、儿
(3)数值特征的归一化:对所有数值特征执行归一
科抗癫痫血药浓度 以及精神类疾病患者血药浓度 [13]
[12]
化处理。
等。鉴于此,本研究回顾性采集了西安国际医学中心医
1.3 目标数据集的构建
院的真实世界数据,构建了用于VPA血药浓度预测的三
(1)三分类模型数据集:VPA 的有效血药浓度为
分类和二分类模型并比较了其性能,旨在辅助临床制定
50~100 μg/mL。因此,本研究将 VPA 血药浓度作为目
更精确的用药方案。
标变量结果,分为不足组(<50 μg/mL,n=278)、正常组
1 资料与方法
(50~100 μg/mL,n=377)和超限组(>100 μg/mL,n=
1.1 研究对象与样本收集
40),构成三分类模型数据集。分别将不足组、正常组和
收集 2022 年 11 月-2024 年 9 月在西安国际医学中
超限组内的样本取 80%,重新组合为训练集(n=556),
心医院服用 VPA 并接受血药浓度检测的患者的临床资
将各组剩余的 20% 样本重新组合为测试集(n=139)。
料。患者纳入标准如下:连续接受 VPA 治疗 4~5 个半
为避免因超限组样本数量较少引起的样本不均衡问题,
衰期达到稳态血药浓度后,于下次给药前采血的患者。
本研究共纳入 554 例门诊及住院患者(包括重症监护室 本研究采用 SMOTE 算法(参数为 sampling_strategy=
患者),共计 841 份 VPA 血药浓度数据样本。排除 VPA 'auto')对训练集数据进行了增强。经数据增强处理后,
血药浓度异常(低于 VPA 血药浓度检测下限)的数据样 训练集内超限组和不足组的样本数量均扩增到训练集
本28份和VPA给药途径不详的数据样本118份,最终获 内正常组样本数量,即302例。
得有效数据样本 695 份,涉及 480 例患者。根据文献报 (2)二分类模型数据集:从 695 份 VPA 血药浓度样
道及临床经验,本研究统计了患者临床资料的 32 个特 本中移除超限组的40份样本数据,将目标变量简化为不
征,共分为 5 大类,具体包括:基础信息(性别、年龄、身 足组(<50 μg/mL,n=278)和正常组(50~100 μg/mL,
高、体重),给药相关信息(给药途径、日剂量),实验室生 n=377),构成二分类模型的数据集。与三分类模型数
化指标[白细胞计数、血小板计数、总胆红素、间接胆红 据集的划分相似,正常组和不足组内的所有样本数据也
素 、胱 抑 素 C、丙 氨 酸 转 氨 酶(alanine transaminase, 按照 8∶2 的比例进行划分,并组合成训练集(n=524)和
ALT)、天冬氨酸转氨酶(aspartate transaminase,AST)、白 测试集(n=131)。需要指出的是,二分类模型与三分类
蛋白(albumin,ALB)、肌酐(creatinine,Cr)、肌酐清除率 模型的数据集构建过程是相互独立的,相关样本数据是
(creatinine clearance rate,CCR)],合并症(高同型半胱氨 随机选取的(随机种子不同)。
· 1400 · China Pharmacy 2025 Vol. 36 No. 11 中国药房 2025年第36卷第11期