2023年12月15日-17日,首届CCF数字医学学术年会(CCF Digital Medicine Symposium,DMS)在苏州CCF业务总部召开,为大家呈现了一场计算机辅助手术、医学大模型、医学图像智能分析等研究前沿的学术盛宴。会议为领域内研究人员搭建了一个国际化的学术交流平台,探讨数字医学的发展现状、应用前景及未来挑战,共同推动计算机技术在医学领域应用中的发展和创新。

复旦大学数字医学研究中心主任、上海市MICCAI重点实验室主任、CCF数字医学分会主任宋志坚教授
复旦大学数字医学研究中心主任、上海市MICCAI重点实验室主任、CCF数字医学分会主任宋志坚教授为会议致辞,他表示,随着数字医学的迅猛发展,现已成为医学领域新的增长点,很高兴今天能够见证这一领域的科学发现与技术创新方面的新成就,与大家共同讨论这一领域的前沿问题与发展趋势。
数字医学作为信息技术,尤其是AI技术与医学深度融合交叉的产物,正在深刻改变着我们对医学的认知和实践,这让医学迎来了新的智能时代,充满了挑战和机遇。CCF数字医学分会为大家提供了一个数字技术与医学深度融合交叉的学术平台,形成了一个产学研的合作机制,促进了领域内专家学者们共同推动数字医学的技术创新和成果转化。期望可以通过交流,共同从数字医学的角度提出新的解决方案,推动这一领域的科学进步与技术创新,并努力实现产业化,为人类的健康事业做出突出贡献,携手共建数字医学新未来。

中国科学院自动化研究所研究员、
中国科学院研究生院教授、博士生导师田捷
中国科学院自动化研究所研究员、中国科学院研究生院教授、博士生导师田捷在会议上做了题为《基于人工智能和医疗大数据的影像组学及其临床应用》的专题报告,围绕人工智能技术在肿瘤量化评估中的典型应用进行介绍。他讲到,随着人工智能技术的迅速发展和医学影像大数据的急剧增长,其在肿瘤可视化和量化评估方面形成了典型临床应用。基于人工智能结合分子影像可以实现肿瘤分子细胞水平的精准量化,术中定位肿瘤的边界和微小病灶,并人工智能结合现有医学影像大数据(CT、MRI、PET、超声等图像),可以量化肿瘤分子细胞水平的信息,进而辅助肿瘤的诊断、疗效评估和预后预测。

中国科学技术大学讲席教授、生物医学工程学院创始执行院长、医学影像智能与机器人(MIRACLE)研究中心主任周少华博士
中国科学技术大学讲席教授、生物医学工程学院创始执行院长、医学影像智能与机器人(MIRACLE)研究中心主任周少华博士在题为《生成式人工智能在医学成像的探索》的专题报告中概述了在聚焦医学成像方面,人工智能是如何恢复和合成医学影像的。医学影像广泛用于临床决策,而人工智能技术则常用于医学成像和影像分析,报告中提到的恢复和合成方法,是以深度神经网络为核心,集成特定的领域知识,以此获得高质量的医学影像。
医学影像恢复是试图在不利的成像条件下(如金属伪影、降采样等)得到原始高清影像;医学影像合成是试图从当前条件下采集到的影像,合成不同条件下的新影像。报告主要介绍三种方法:一、双域网络:通过正弦图和影像域中的联合学习减少CT中的金属伪影,以及通过频率域和影像域的联合和递归学习从欠采样的k空间数据重建MR影像;二、因果影像合成:利用因果图和3D StyleGAN来反事实合成3D的MR脑影像;三、统一多模态影像合成:学习单个统一模型,以可变数量的MR影像模态为输入,推理缺失的影像模态。

卫宁健康人工智能研发总监刘鸣谦
卫宁健康人工智能研发总监刘鸣谦在分论坛发表题为《WiNGPT评价和验证体系的探索和构建》的演讲。在演讲中,刘鸣谦介绍,卫宁健康于今年10月发布了基于通用模型的医疗垂直领域大模型WiNGPT,结合高质量医疗数据,针对医疗场景需求专门优化和定制,通过将专业的医学知识、医疗数据融会贯通,提供医疗行业各种场景的智能知识服务,辅助医护人员提高诊疗效率和医疗服务质量。
从2023年初开始研发到正式发布,WiNGPT经过了基于公开数据和医疗领域数据的大量训练,通过低质量数据过滤-通过人工审核和大模型主动学习等多种技术手段,筛除低质量数据;数据处理-对数据进行统一分类后,统一文本格式,并去除隐私等信息;数据去重-集成“哈希”、“embedding”等算法,去除相似数据,保证数据的唯一性;裁剪与拼接-根据数据集的质量与分布需求,针对不同医疗场景进行权重调整。
经过以上筛选,可以把更优质、更精准的数据给到大模型,让其可以更加高效、高质地进行数据训练。
发布34B 模型
经过不断地迭代和升级,WiNGPT目前训练的新模型-34B模型较原有模型具有以下优势:
更强的能力:具备涌现能力和更强的理解能力;更简单的部署:4Bit量化模型几乎无损,同时使得单一大模型降低部署成本;开源社区:14B-Chat已开源。
为了更客观地进行模型的测评,卫宁健康设计了自己的测评体系。34B模型的测评数据维度有两类,通过提出客观题和场景题两种方式进行严格测评。
客观题部分,我们会输入问题和选项,让模型输出答案,根据标准答案判断模型答案是否正确,并据此统计准确率。目前题库共有1.3万道客观题。
场景题部分,让GPT-4模型根据回答的准确性、相关性、一致性、完整性、权威性,参照标准答案对模型生成的答案进行评分。目前题库共有题目160道,涵盖8类业务场景、17类一级分类、32类二级分类。
通过内部测评得分我们可以看到,34B模型的客观题成绩几乎都是80多分,主观题的成绩也在3.7分-3.75分的较好水平。
覆盖的医疗场景
经过模型的不断训练与升级,我们认为,大模型可以定义新的智能交互,同样在10月发布的WiNEX Copilot 是面向医护工作者,基于WiNGPT和行业的开放大模型。结合患者的各类诊疗服务数据,为医护人员提供病历文书生成、医疗质量监管、风险监测预警、医学知识服务以及诊疗过程优化、管理效率提升等30多个场景的智能化服务,实现了交互系统的数智化协作。
目前,WiNEX Copilot已经集成涵盖医院管理、医生增效以及患者端等100多个临床应用场景,在辅助诊断、内容生成、信息抽取、内涵质控等医学场景中,从提升工作效率到优质医疗质量下沉,为医护人员提供全面的智能知识服务。
基于医疗场景的临床评价
在评价方面,医学场景评价有很多难点,如:缺乏金标准、不同场景的数据偏见、医生主观标注一致性有待提升、系统集成后评价等。
医学场景的大语言模型评价体系以标准、方法和指标为切入点,结合传统评价方法、人工评价、基于客观题的评价、基于GPT-4的评价为评价手段,在执行方面参考相关标准和文件、构建评价数据集、主观/客观评价体系和对应的指标。
以报告生成、内涵质控、基于大语言模型的后结构化抽取三个场景为例,经过实验、实践与测评,通过结果我们可以看出,WiNGPT在这三个医疗场景下都获得了很好的成绩,未来将在更多场景下进行测试评价,加速产品应用落地的过程。

卫宁健康副总裁兼CTO赵大平
在论坛尾声,与会的演讲嘉宾进行了圆桌讨论,围绕数据质量对于医疗大模型的重要性等话题进行了与现场嘉宾的互动交流。卫宁健康副总裁兼CTO赵大平在讨论中表示,越来越多的医院用户意识到医疗数据质量对于训练医疗大模型的重要性,甚至开始尝试定义医疗数据,而卫宁一直坚持的理念是从生产端产生标准化的高质量数据,这是通过WiNEX产品实现的,然后通过WiNEX Copilot(基于WiNGPT卫宁医疗大模型的人工智能医疗助手)将高质量的数据用到实际应用场景中去。相信使用卫宁产品的用户会感受到不同。
卫宁健康作为中国医疗卫生信息化及互联网+医疗健康的领军企业,将会继续深耕智慧医疗领域,并在实践中促成更多的技术成果转化,为健康中国的建设和医院的高质量发展持续提供科技动能。