Page 112 - 《中国药房》2026年8期
P. 112
相关,其中,与药师(编号 2)的评分结果的相关性最高 栓药物的停药与重启时机的判断,是术前用药管理中风
[决定系数(R )=0.611,P<0.001],其次是药师(编号1) 险最高的环节之一。华法林、氯吡格雷、阿司匹林等药
2
2
的评分结果(R =0.538,P<0.001),与药师(编号 3)的 物会抑制凝血功能,若术前未及时停用或调整,可能导
2
评分结果的相关性相对较低(R =0.487,P<0.001)。内 致术中出现难以控制的出血情况 。这些药物的重整
[21]
部一致性检验结果显示,Cronbach’s α=0.876,表明3名 处理需综合考量药物半衰期、手术出血风险和患者血栓
药师的内部一致性良好(α≥0.80)。 栓塞风险,传统上高度依赖临床经验。本研究借助提示
2.3.3 药物重整耗时 词,能够依据药物种类自动识别不同药物的干预点,进
简单组、中等组、高难度组药物重整任务分别有65、 而提高抗血栓管理的精准度。降糖药物的分类管理同
21、9 份。与人工药物重整耗时比较,LLM 药物重整耗 样存在显著的类别差异,模型初期对部分高风险降糖药
时在简单组、中等组、高难度组中均显著减少(减少90% 物的药物重整处理要点有所遗漏。本研究通过补充不
以上,P<0.001)。结果见表3。 同类别降糖药物的管理要点,在知识库中明确标注了术
表3 不同难度组的人工药物重整耗时与 LLM 药物重 前停药时间、术中替代方案以及术后重启指征。优化
整耗时比较[M(P25,P75 ),s] 后,模型对降糖药物的处理建议更为系统全面,有助于
组别 药物重整任务份数 人工药物重整耗时 LLM药物重整耗时 U P 降低围手术期血糖波动相关风险。
简单组 65 185.00(138.00,242.00) 11.15(9.78,12.84) 4 225.00 <0.001 3.3 本地化LLM辅助胃癌术前药物重整模式的创新与
中等组 21 349.00(291.00,414.00) 14.68(13.24,16.31) 441.00 <0.001 效率优势
高难度组 9 733.00(697.00,914.00) 19.29(17.98,21.00) 81.00 <0.001
目前,LLM 在医疗领域具有较大潜力,但多集中在
3 讨论 诊断、文档撰写、问答支持等较为通用的任务层面 [22—24] 。
3.1 本地化LLM辅助胃癌术前药物重整模式的可行性
与准确性 本研究在药物重整和用药管理这一细分任务中,尤其是
在术前用药的临床环境下,尝试将 LLM 进行知识库化
本研究依托本院私有化部署 LLM 环境,针对胃外
科术前用药场景,构建了胃癌术前药物重整模式,结果 并实现机器人化,建立了仅服务于单个任务的LLM。该
显示,在验证集中 BERT Score 的 F1 分数为 0.796,这表 模式不仅达成了智能化的信息整合,改善了传统模式下
药师需手动在多个系统间切换、查阅纸质资料的耗时状
明该模式在语义内容覆盖与忠实度方面表现良好,具有
[16]
较强的临床语义理解与复现能力 。其生成的药物重 况,使药师从重复性劳动中解放,而且显著提高了工作
效率,促使药师能够将宝贵的时间与精力投入到更高级
整建议的人工评分(7DI 评分)在 32.06~33.45 分之间,
这表明 LLM 的输出在信息完整性、问题识别全面性等 别的临床服务中。在药物重整中最为耗时且高度依赖
临床维度上具有较高质量,能够满足临床评价要求。进 知识检索与综合判断的是“用药建议生成环节”,本研究
结果显示,在不同难易程度任务中,LLM 药物重整耗时
一步分析结果显示,机器评分的 F1 分数与 3 名药师的
2
7DI评分均呈显著正相关(R 最高为0.611),且3名药师 仅为人工药物重整耗时的 10% 以内。这种效率提升在
的内部一致性良好(Cronbach’s α=0.876)。以上结果表 高复杂度病例中尤为明显,这表明该模式在真实的临床
明,机器评分与药师人工评分在整体趋势上高度一致,既 场景中具有显著节省时间的潜力,进而可能间接优化药
验证了自动评价指标在本研究中的适用性,也为后续大 师人力资源配置并提升服务可及性。
规模应用中的质量监控提供了可替代人工的量化工具。 3.4 本地化LLM与知识库的优势
3.2 本地化LLM辅助胃癌术前药物重整模式在关键用 既往研究显示,在医疗环境中直接运用通用 LLM
药场景中的优化路径与效果 存在可解释性欠佳、知识不透明、与本地临床流程脱节
[25]
术前药物重整的核心挑战在于应对临床用药的复 等风险 。本研究在本院可控的环境下运用LLM,并构
杂性与异质性。用药信息不一致、未停药或误停药、药 建本院的知识库,而非直接调用通用大模型。此举有助
物相互作用以及剂量不当等状况,均可能引发术后出 于提升模型建议的临床适用性,降低通用模型因脱离具
[20]
血、心血管并发症、感染等不良事件 。本研究基于训 体场景而产生的偏差或幻觉风险,还能有效规避诸多数
[26]
练集对模型进行系统验证,识别出模型在药物重整环节 据隐私问题 。本研究依托本地化知识库,在胃癌术前
存在的4类核心偏差,并通过针对性优化,形成了一套能 用药场景中得以应用,为该场景下的药物重整实践提供
够覆盖常见及高风险用药场景的辅助决策流程。 了初步的实证参考;同时,本研究采用真实患者数据,而
复方制剂与商品名识别是术前用药重整的基础环 非使用仿真或模拟数据,增强了研究的现实意义。
节。训练集验证表明,当患者使用复方制剂(如氯沙坦 3.5 研究局限性
钾氢氯噻嗪),或电子病历仅记录商品名时,模型初期对 本研究仍存在一定局限性。首先,研究样本量与时
活性成分的识别存在遗漏或错误。针对这一问题,本研 间跨度有限,这可能会对 LLM 建议效果的稳定性造成
究完善了药物术语标准化规则,在提示词中明确要求对 影响。其次,知识库是根据近2年的用药目录构建而成
复方制剂进行成分拆解、将商品名映射至通用名,并通 的,尽管已初步建立更新机制,但尚未对其稳定性进行
过知识库补充常用商品名与通用名的对应关系。抗血 长期验证;且低频用药类别(如抗精神病药、免疫抑制
· 1066 · China Pharmacy 2026 Vol. 37 No. 8 中国药房 2026年第37卷第8期

