别瞎忙了，icd编码大模型到底能不能替人干活？老码农掏心窝子说句实话

发布时间：2026/5/13 19:54:31

做这行十五年，我见过太多医院信息科和病案室的兄弟，半夜两点还在盯着屏幕，为了一个“慢性阻塞性肺疾病急性加重”的主诊断编码纠结半天。是选J44.1还是J44.9？并发症合并症（MCC/CC）有没有漏掉？一旦编码错了，DRG/DIP付费直接亏钱，甚至被医保局飞检盯上。这种焦虑，我太懂了。

很多人现在一听到“人工智能”，第一反应就是：这玩意儿能不能直接替我干活？省点人力？甚至有的领导拍板，买套系统回来，指望它全自动出结果，从此高枕无忧。兄弟，听我一句劝，别做梦了。目前的icd编码大模型，绝对不是来“抢饭碗”的，它是来给你“递扳手”的。

我上周刚帮一家三甲医院部署了一套内部测试用的编码助手。效果咋样？说实话，有惊喜也有惊吓。

先说惊喜。对于那些描述非常标准、教科书式的病例，大模型的准确率确实高得吓人。比如一个典型的“急性阑尾炎伴穿孔”，它能在0.5秒内给出J44.1这样的精准编码，还能顺手把相关的次要诊断也列出来。对于每天要审几百份病案的编码员来说，这相当于多了个不知疲倦的初级助手，把那些重复性高、难度低的工作给干了。这要是算人力成本，一年省下的钱够买好几台服务器了。

但惊吓也真实存在。大模型有个通病，叫“幻觉”。你给它一段医生写得比较口语化、甚至有点逻辑混乱的病程记录，它可能就会自信满满地给你编一个编码。比如医生写“患者高血压病史，今日血压180/100”，它可能直接给个高血压3级，却忽略了医生后面写的“继发性高血压待查”。这种错误，如果不经过人工复核，直接录入系统，那就是重大医疗事故隐患。

所以，现在的icd编码大模型，最正确的用法是什么？是“人机协同”。

我把这个模式总结为“AI初筛+人工复核+持续学习”。让大模型先跑一遍，把它的建议编码、置信度评分、以及它依据的原文片段都展示出来。编码员不需要从头读起，只需要看AI标红的高风险部分，或者置信度低于90%的部分。这样，编码员的效率提升了至少40%，而且因为只关注重点，反而减少了疲劳导致的低级错误。

这里有个坑，很多同行容易踩。就是以为买了模型就完事了。错！大模型是需要“喂”数据的。你们医院自己的历史高质量编码数据，才是训练它的宝贝。通用的医疗大模型不懂你们医院的专科特色，比如你们心外科特有的某种术式编码规则，通用模型根本不知道。所以，必须做私有化部署，用你们自己的数据去微调（Fine-tune）。这个过程很痛苦，数据清洗就要脱层皮，但这是必经之路。

另外，别指望它能完全替代临床医生写病历。病历质量才是编码的源头。如果医生写得含糊其辞，再强的icd编码大模型也变不出金子来。所以，推动临床病历规范化，比买软件更重要。

最后，给各位一点实在的建议。如果你还在犹豫要不要上这套系统，先别急着买断。找供应商谈POC（概念验证）测试，拿你们过去半年的真实脱敏数据跑一跑，看看准确率到底有多少。别听销售吹牛，数据不会撒谎。同时，一定要组建一个由资深编码员、IT人员和临床专家组成的项目组，代码是死的，人是活的，只有流程理顺了，技术才能落地。

别被概念忽悠了，技术只是工具，解决实际问题才是王道。如果你正在为编码效率低、质控压力大发愁，或者想深入了解如何搭建适合你们医院的编码辅助系统，欢迎随时交流。咱们不整虚的，直接聊干货。

本文关键词：icd编码大模型