Page 112 - 《中国药房》2026年8期

P. 112

相关，其中，与药师（编号 2）的评分结果的相关性最高栓药物的停药与重启时机的判断，是术前用药管理中风
[决定系数（R ）＝0.611，P＜0.001]，其次是药师（编号1）险最高的环节之一。华法林、氯吡格雷、阿司匹林等药
2
2
的评分结果（R ＝0.538，P＜0.001），与药师（编号 3）的物会抑制凝血功能，若术前未及时停用或调整，可能导
2
评分结果的相关性相对较低（R ＝0.487，P＜0.001）。内致术中出现难以控制的出血情况。这些药物的重整
[21]
部一致性检验结果显示，Cronbach’s α＝0.876，表明3名处理需综合考量药物半衰期、手术出血风险和患者血栓
药师的内部一致性良好（α≥0.80）。栓塞风险，传统上高度依赖临床经验。本研究借助提示
2.3.3 药物重整耗时词，能够依据药物种类自动识别不同药物的干预点，进
简单组、中等组、高难度组药物重整任务分别有65、而提高抗血栓管理的精准度。降糖药物的分类管理同
21、9 份。与人工药物重整耗时比较，LLM 药物重整耗样存在显著的类别差异，模型初期对部分高风险降糖药
时在简单组、中等组、高难度组中均显著减少（减少90% 物的药物重整处理要点有所遗漏。本研究通过补充不
以上，P＜0.001）。结果见表3。同类别降糖药物的管理要点，在知识库中明确标注了术
表3 不同难度组的人工药物重整耗时与 LLM 药物重前停药时间、术中替代方案以及术后重启指征。优化
整耗时比较[M（P25，P75 ），s] 后，模型对降糖药物的处理建议更为系统全面，有助于
组别药物重整任务份数人工药物重整耗时 LLM药物重整耗时 U P 降低围手术期血糖波动相关风险。
简单组 65 185.00（138.00，242.00） 11.15（9.78，12.84） 4 225.00 ＜0.001 3.3 本地化LLM辅助胃癌术前药物重整模式的创新与
中等组 21 349.00（291.00，414.00） 14.68（13.24，16.31） 441.00 ＜0.001 效率优势
高难度组 9 733.00（697.00，914.00） 19.29（17.98，21.00） 81.00 ＜0.001
目前，LLM 在医疗领域具有较大潜力，但多集中在
3 讨论诊断、文档撰写、问答支持等较为通用的任务层面 [22—24] 。
3.1 本地化LLM辅助胃癌术前药物重整模式的可行性
与准确性本研究在药物重整和用药管理这一细分任务中，尤其是
在术前用药的临床环境下，尝试将 LLM 进行知识库化
本研究依托本院私有化部署 LLM 环境，针对胃外
科术前用药场景，构建了胃癌术前药物重整模式，结果并实现机器人化，建立了仅服务于单个任务的LLM。该
显示，在验证集中 BERT Score 的 F1 分数为 0.796，这表模式不仅达成了智能化的信息整合，改善了传统模式下
药师需手动在多个系统间切换、查阅纸质资料的耗时状
明该模式在语义内容覆盖与忠实度方面表现良好，具有
[16]
较强的临床语义理解与复现能力。其生成的药物重况，使药师从重复性劳动中解放，而且显著提高了工作
效率，促使药师能够将宝贵的时间与精力投入到更高级
整建议的人工评分（7DI 评分）在 32.06～33.45 分之间，
这表明 LLM 的输出在信息完整性、问题识别全面性等别的临床服务中。在药物重整中最为耗时且高度依赖
临床维度上具有较高质量，能够满足临床评价要求。进知识检索与综合判断的是“用药建议生成环节”，本研究
结果显示，在不同难易程度任务中，LLM 药物重整耗时
一步分析结果显示，机器评分的 F1 分数与 3 名药师的
2
7DI评分均呈显著正相关（R 最高为0.611），且3名药师仅为人工药物重整耗时的 10% 以内。这种效率提升在
的内部一致性良好（Cronbach’s α＝0.876）。以上结果表高复杂度病例中尤为明显，这表明该模式在真实的临床
明，机器评分与药师人工评分在整体趋势上高度一致，既场景中具有显著节省时间的潜力，进而可能间接优化药
验证了自动评价指标在本研究中的适用性，也为后续大师人力资源配置并提升服务可及性。
规模应用中的质量监控提供了可替代人工的量化工具。 3.4 本地化LLM与知识库的优势
3.2 本地化LLM辅助胃癌术前药物重整模式在关键用既往研究显示，在医疗环境中直接运用通用 LLM
药场景中的优化路径与效果存在可解释性欠佳、知识不透明、与本地临床流程脱节
[25]
术前药物重整的核心挑战在于应对临床用药的复等风险。本研究在本院可控的环境下运用LLM，并构
杂性与异质性。用药信息不一致、未停药或误停药、药建本院的知识库，而非直接调用通用大模型。此举有助
物相互作用以及剂量不当等状况，均可能引发术后出于提升模型建议的临床适用性，降低通用模型因脱离具
[20]
血、心血管并发症、感染等不良事件。本研究基于训体场景而产生的偏差或幻觉风险，还能有效规避诸多数
[26]
练集对模型进行系统验证，识别出模型在药物重整环节据隐私问题。本研究依托本地化知识库，在胃癌术前
存在的4类核心偏差，并通过针对性优化，形成了一套能用药场景中得以应用，为该场景下的药物重整实践提供
够覆盖常见及高风险用药场景的辅助决策流程。了初步的实证参考；同时，本研究采用真实患者数据，而
复方制剂与商品名识别是术前用药重整的基础环非使用仿真或模拟数据，增强了研究的现实意义。
节。训练集验证表明，当患者使用复方制剂（如氯沙坦 3.5 研究局限性
钾氢氯噻嗪），或电子病历仅记录商品名时，模型初期对本研究仍存在一定局限性。首先，研究样本量与时
活性成分的识别存在遗漏或错误。针对这一问题，本研间跨度有限，这可能会对 LLM 建议效果的稳定性造成
究完善了药物术语标准化规则，在提示词中明确要求对影响。其次，知识库是根据近2年的用药目录构建而成
复方制剂进行成分拆解、将商品名映射至通用名，并通的，尽管已初步建立更新机制，但尚未对其稳定性进行
过知识库补充常用商品名与通用名的对应关系。抗血长期验证；且低频用药类别（如抗精神病药、免疫抑制

· 1066 · China Pharmacy 2026 Vol. 37 No. 8 中国药房 2026年第37卷第8期

107 108 109 110 111 112 113 114 115 116 117