国内首个“产业级”医疗大模型百度灵医智惠发布

北大青年CEO俱乐部 2024-01-12

The following article is from 动脉网 Author 赵泓维

刘军伟，百度智慧医疗总经理，北大青年CEO俱乐部理事，22级软件与微电子学院在读博士生。曾作为业务部门负责人从0到1带领团队打造百度聚屏业务，在智慧医疗领域参与主导推出了以“循证AI赋能基层医疗”为愿景的智慧医疗品牌“灵医智惠”。并将业务及远景范围拓展至“循证AI赋能大健康产业”。

几个月前，OpenAI 的GPT系列走出实验室，向世人重新定义了人工智能的能力界限，亦在世界范围内掀起了新一代AI的研发潮。

在国内，百度的文心、腾讯的混元、阿里的通义千问等通用模型相继推出，不少模型已在智能化及赋能空间两个维度上跃入世界前列，能与谷歌Bard、Open AI的ChatGPT斗个势均力敌。

这些通用模型的本质大抵相同，可以视作下一代人工智能的“底座”。它们供养了一批面向C端的应用，但其能力远不止于此。更为庞大的价值隐藏在冰山之下——垂直深入至具体场景，使得大模型能在技术层面完成革命性重构。

不过，打造一个符合专业需求的模型并不简单。尤其是在医疗这一领域，表面上沉寂着难以计量的大数据，但当深入到具体的应用场景时，开发者仍受制于数据的稀缺性，时常会因数据的数量、质量与获取成本而停滞不前。

但百度灵医智惠，凭借在通用大模型领域的领先地位和在医疗大数据治理上的深厚积累，成功地迈出了这一步。前日的一场发布会上，灵医智惠以国内首个产业级医疗大模型“灵医大模型”为答，破解大模型时代的医疗难题。

千亿医疗token只是基础？灵医智惠“示范”构建医疗大模型的必要条件

如何将机器学习与“逻辑推理”结合，是人工智能领域的“圣杯问题”，或偏重于推理，或偏向于学习，真正能够平衡两者并发挥AI全力的尝试寥寥无几。直至如今的大语言模型，终才实现海量知识与数据的深度融合，成功突破了推理与学习的界限。

但实际应用中，通用大模型仍有缺陷。一个典型的问题在于：当我们在学习工作时对其提问，AI仍会偶尔给出与提问风马牛不相及的回复，或是将少量的有效信息藏匿于冗长的文本中，需要我们二次加工。

面对这样一个场景，C端用户可能会调整提问策略，重新向人工智能发问。但对于B端用户，尤其是医疗这样的严肃领域，一次错误的回答，轻则失去医生信任，重则影响用户健康，使AI应用难以实际落地，由此产生的后果并非算法本身所能承担。

因此，从通用领域到医疗领域的跃迁，不仅要考验模型的泛化能力，使其能够应对各式医疗场景下的各类提问，更要做到“精准安全”，保证每次回答都能为用户提供正确的建议。

为了满足高泛化与高精准的要求，灵医智惠在算法、算力、数据三要素中同时发力。

首先是算法层面。垂直模型由通用模型迁跃而来，但是构建通用模型的过程极其复杂且成本昂贵。因此，绝大多数企业在开发医疗大模型时，往往选择使用开源的基础模型，这导致生成的模型往往存在语法、逻辑上的问题，无法处理医学上的复杂任务。

相较之下，灵医大模型基于国产自研的文心大模型打造，具备独一无二的中文文本推理、理解、生成能力，且内置了知识增强、检索增强和上下文增强等多项增强技术，有效提升了大模型生成的准确性和多样性。

其次是数据层面与知识层面。在模型训练过程中，灵医智惠兼顾医、患、药三方信息，先后投入了自有积累的超1000万优质医疗问答数据、超2000万多语种医学文献资源、超2亿用户每日医疗类搜索数据、超5亿权威健康科普内容……这些海量的医疗训练数据，加上反馈强化学习机制，确保了灵医大模型给出的每一条回答都能有迹可循。

为保证数据的准确性和多样化，灵医智惠与与人卫智数、爱思唯尔 (Elsevier)等业内权威医学知识库达成深度战略合作，在智慧医疗相关产品及服务维度深度合作，保证循证AI的基因。同时与固生堂、零假设等达成合作，并定向为公立医院、药械企业、互联网医院平台、连锁药房等200多家医疗机构开放体验。又派遣大量研发人员进入医院，探索模型与医疗应用场景的深度结合，进一步打磨模型的易用性、准确性、安全性。

最后是算力层面。垂直模型的构建需要走完通识预训练、领域后预训练、任务精调这一系列技术步骤，以逐步提高模型的性能。但对于大模型而言，任何一个预训练都要耗费大量数据及计算资源。

成本压力下，很多企业在开发医疗大模型时只能在参数上面做减法，将参数控制在亿级至十亿级，以负担后续的训练及优化。或者不做预训练，只做上层的任务微调。而拥有万卡集群和全生命周期模型开发工具链支撑的灵医大模型完全不用担心算力上的问题。

这意味着，灵医大模型能够借助充足的算力实现预训练，更好地去优化底层参数，而不仅仅是局部的微调。这使得灵医大模型能在实战之中持续优化，使其输出结果的准确率不断逼近于“1”。

经100余名超10年资历的三甲医生参与的大模型评测结果显示：灵医大模型能够处理各类医疗场景下的医患交互，且在正确性、逻辑性、安全性、理解力四个方面上远超其他大模型。

定位“产业级”，

灵医大模型的底气与能力

所谓产业级，是指脱离单一场景限制，围绕医疗体系真实诊疗、运营、科研、教培等全场景打造全链条大模型解决方案。相较于点状的产品，线状的解决方案可以更好地吻合业务流程，避免数据流转受阻导致的孤岛化，保障用户的安全、体验与效率。

构造这样一个复杂的产品矩阵并不简单。除了技术上的突破外，来源于灵医大模型的丰富“实战经验”同样至关重要。作为国内首个“产业级”医疗行业大模型，灵医大模型已积累近100类的医疗AI机器学习任务，整合800+家医院、2000家药企、4000多家基层诊疗机构的智慧医疗服务经验。

同时，“产业级”的定位也有利于灵医大模型商业化进程的推进。具体而言，灵医大模型将其商用路径划分为能力层、模型层与应用层。

医疗领域之大，即便是百度这样规模的企业也远做不到全场景覆盖，因而更为有效的打法是构建一个大模型生态，携手合作伙伴一起赋能医疗。

能力层的价值便在于此。灵医智惠主要以API或AI插件的方式提供服务，将已有的基础能力在这一层重点向合作伙伴开放，比如文档理解、病历生成、医疗问答等。合作伙伴可以API方式调用这些能力，或是基于AI插件将大模型的能力嵌入到已有产品系统中，打造AI原生的应用产品，不断拓展灵医的产业场景。

模型层提供基于数据微调或预训练的服务。作为整个架构的基座，灵医大模型推出三个版本，Lite版、旗舰版和定制版。其中，旗舰版作为千亿规模的参数模型，主要以公有云服务方式为广大用户提供服务，达到开箱即用的效果，用户无需担心部署成本。

Lite版是面向医院客户或者对私有数据较为重视的客户提供的模型服务。这类客户对隐私要求高，又无需过大的算力资源，因而该方案支持进行私有化方式部署，分档设置十亿和百亿两种参数量级的模型，在模型能力与部署成本之间进行了平衡。

最后是定制版，主要针对自有高质量数据且具备一定的研发能力的客户，可针对具体场景，如专科专病，提供定制化模型训练或者调优的服务。研究型医院、药企均是定制版的主要服务对象。

应用层则为患者、医院、企业等终端用户提供 AI 原生应用。作为一个产业级的大模型，其服务场景覆盖了整个大健康产业链，既将公立医院、科研机构纳入其中，又为药械企业、互联网医院平台、连锁药店等提供最前沿的数字化工具。

具体而言，这些应用目前均可纳入智能医生助手、智能健康管家、智能企业服务三大方向，进而满足“医－患－药”各自的特定需要。

对于医疗从业者而言，可将灵医大模型视为一个真正的医生助手。譬如，在诊疗中，大模型能基于自由文本、医患对话、检验检查报告生成结构化病历，过去几十分钟才能完成的住院病历，现在数秒内便能生成；在教培场景中，灵医大模型的优势在于推荐过程本身的及时性与完整性，大模型支持下，年轻医生能够及时将自己的认知与AI给出的建议进行及时比对，既可提高医生决策的准确率，又能在诊疗过程中学习知识，获得能力提升；在科研场景中，大模型能对多篇中英文文献进行一键解析，并实现对话式要点提炼，助力医生科研。

面向患者，灵医大模型可担当患者的“健康管家”。大模型赋能下，灵医智惠推出的“AI用药说明书”不仅可以将纸质的说明书有声化，还能实时面向患者解读用药的各类知识；在院内场景中，“智能健康管家”一方面可为用户提供更佳的交互体验、更准确的问答结果帮助患者分诊导诊，另一方面可基于全生命周期医疗健康数据为患者提供个性化的健康服务。

在大健康场景中，灵医智惠强调“专业赋能”，即提供运营助手、职业培训、知识服务等功能。以药企服务方向为例，灵医大模型能够帮助药企各个部门全面提升生产效率，同时智能化管理企业积累的领域知识。其核心思路是以智能化的手段降低企业经营中产生的各项成本，帮助企业完成数字化转型。

活动现场，中医医疗服务龙头固生堂分享了和灵医大模型的合作情况，相关人士表示：固生堂利用灵医大模型提供的底层技术能力，重构了线上诊疗业务，并推出了面向患者的智能健康助手，24小时在线为患者提供精准的分导诊和智能客服服务，支持开放式的医患问答。根据最新调研数据，合作以来患者挂号体验满意度提升了12%，客服人员工作效率提升76%。

掀起产业变革，

灵医智惠医疗大模型的下一程

从垂直领域大模型发展的整体情况看，各行各业的大模型在做的都是提质增效，少有企业在做场景上的创新。回顾百度现有的产品布局，灵医大模型似乎采取了相似的路径，以新的技术重构服务能力深度赋能老场景。

但若对灵医智惠产线的背后逻辑进行推敲，它并非是把老旧的产业重新做一遍——事实上，一场关乎整个医疗应用的变革正在酝酿之中。

据灵医智惠相关人士表示：借助大语言模型，灵医智惠能够有效降低临床数据治理成本，帮助医院、医生建立更多专科数据库，进而推动特定病种的智能算法训练。拥有大模型的赋能，单个AI应用的开发成本将显著降低，节省量可高达90%。

这一能力的构建将对AI行业带来颠覆性的改变。过去受制于医疗数据的缺失、训练成本的高昂等因素限制，从通用大模型到垂直大模型的跃迁一直进展缓慢。如今拥有自研新技术栈的支持，百度有能力实现多模态临床数据的治理及自动化分析，优化模型训练及调整中产生的各种成本，进而带来智能应用的新一轮爆发。

在此趋势下，未来的我们或许能看到更多的智能化应用深度赋能医疗机构乃至大健康领域。

而百度，已为前路打好基底。

来源：动脉网

—往期推荐—

孟眸生物完成数千万元天使轮融资

ARM，哪有想象中光鲜