搜索
当前所在位置:首页 >> 娱乐

【SPA会馆入职培训录像】国内首个医疗专科推理数据集开源,蚂蚁百灵大模型助力行业落地

发布时间:2025-09-13 17:22:33 作者:z 点击:7 【 字体:


12月28日,国内由信通院主办的首个数据“虹桥之源”大模型驱动数字经济新生态峰会在上海召开。会上,医疗源蚂蚁百蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理数据集,专科助力这将有助于提升大模型在医疗领域的推理专业性。 国内首个医疗专科推理数据集开源,集开<strong>SPA会馆入职培训录像</strong>蚂蚁百灵大模型助力行业落地蚂蚁集团商业机器智能部总经理顾进杰介绍国内首个医疗专科推理数据集

在医疗行业,通用型语言模型在应对医疗问诊时,模型会直接给出答案,行业而医生则会根据专业知识进行反复的国内症状探讨,才能给出答案。首个数据另外,医疗源蚂蚁百大模型的专科助力幻觉问题和推理能力不足,当前高质量的推理中文医学专科数据集又较为稀缺,这对训练出色的集开医疗领域大模型提出了挑战。

为克服这些难题,蚂蚁集团与上海仁济医院泌尿科专家团队联合研发,基于医生团队临床经验,通过构造模拟病例数据的泰国异国恋人视频方式,推出了首个中文医疗专科问答推理数据集RJUA-QA,这也是业内首个临床专科数据集。

数据集由训练、验证、测试三部分组成,包含2132个问答对,每个问答对由医生根据临床经验编写的问题、专家提供的回答以及用于帮助推理的上下文构成,病种覆盖了97.6%以上的泌尿科就医人群,能真实复刻诊疗场景。数据集能提高大模型在医疗诊断推理方面的能力,并作为在严肃可控场景下应用的评测基准。

顾进杰进一步介绍了蚂蚁百灵大模型在医疗领域的技术进展。“专业性、可控性、轻量化是大模型技术在医疗行业落地的三个重要挑战和机会。”顾进杰说道。

专业性上,由于医疗行业有超百个科室,每个专科和疾病,都需要专业的调试。蚂蚁集团联合医疗专家共同研发了多模态医疗知识引擎,进一步推动中国专业医疗数据集的构建与开放。

在可控性方面,百灵大模型结合知识图谱技术,让大模型的每一个回答都有据可依。“生成内容可以满足不同医院、不同科目的定制需求,包括风格与调性等”,顾进杰说。蚂蚁集团在超大规模图学习和知识图谱技术长期积累,今年联合OpenKG发布的OpenSPG开源项目,重新定义了工业界的知识图谱语义架构,知识检索增强技术也是大幅提升大模型正确性与可控性的重要课题。

医疗行业有数据隐私、专业知识和系统自主性的需求,考虑到机构的算力成本与便捷部署,百灵大模型还攻坚了轻量化技术。在12月份开源的模型轻量化框架(PIA)中,集成了模型剪枝、压缩、量化、推理加速等全链路环节的优化,具备开箱即用、功能无损、低代码接入等优点,可在天级别完成10倍以上压缩比。

据雷峰网(公众号:雷峰网)了解,目前,蚂蚁百灵大模型在中英文的医疗考试以及基准测试达到或超过了GPT4水准,例如,在中文医疗LLM评测榜单promptCBLUE上,取得A榜第一,B榜第二的成绩;在国际医疗问答榜单PubMedQA中,以80.6%的准确率取得了前五的成绩,而且是前十中参数量最小的模型,更适合被机构部署和使用。


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

国内首个医疗专科推理数据集开源,蚂蚁百灵大模型助力行业落地

阅读全文
相关推荐

对话 HiDream.ai 梅涛:做一家对标 MJ 和 SD 的公司,比扎堆做 LLM 机会更大|AGI十人谈

对话 HiDream.ai 梅涛:做一家对标 MJ 和 SD 的公司,比扎堆做 LLM 机会更大|AGI十人谈
梅涛2002年底就进入了微软,博士5年,他有3年半都在微软度过。2006年他拿到博士毕业证后,继续回到微软工作,直到12年后才离开微软亚洲研究院。他说:“在微软加起来总共15年,不管是技术的价值观还是 ...

独家丨知名AI科学家叶杰平、薄列峰,加入阿里达摩院

独家丨知名AI科学家叶杰平、薄列峰,加入阿里达摩院
雷峰网独家消息,近日,达摩院新增两位AI 科学家,原贝壳技术副总裁、首席科学家叶杰平,前京东数科 AI 实验室首席科学家薄列峰已于近日入职阿里,分别担任达摩院城市大脑实验室和XR实验室X Lab)负责 ...

大模型「点火」,AI for Science 提速

大模型「点火」,AI for Science 提速
在生产环节中,95% 是一个分水岭。以人为对照标准,人工的准确率在 92% 至 98% 之间,因此,行业对机器容忍度的判别标准取之中位数,未达到 95% 的部分,无论是 80% 乃至 90% 的准确率 ...

DALL·E 3 推理能力炸裂提升,OpenAI 抢跑「ChatGPT 原生」

DALL·E 3 推理能力炸裂提升,OpenAI 抢跑「ChatGPT 原生」
时隔一年半,OpenAI 直接玩了个大的,把文生图和 ChatGPT 做了结合,带着最新版本 DALL·E 3 来了。DALL·E 3 的巨大飞跃主要体现在两大方面。第一,只需要提示词,ChatGPT ...

独家丨小鹏机器人团队“广招兵马”,原字节 Seed 陈杰已加入

独家丨小鹏机器人团队“广招兵马”,原字节 Seed 陈杰已加入
雷峰网(公众号:雷峰网)AI科技评论独家获悉,小鹏机器人团队正“广招兵马”,原 Seed 强化学习大佬陈杰已加入。陈杰,在香港大学取得博士学位,后在哈佛大学做博士后,毕业后加入Momenta工作,随后 ...

对话 HiDream.ai 梅涛:做一家对标 MJ 和 SD 的公司,比扎堆做 LLM 机会更大|AGI十人谈

对话 HiDream.ai 梅涛:做一家对标 MJ 和 SD 的公司,比扎堆做 LLM 机会更大|AGI十人谈
梅涛2002年底就进入了微软,博士5年,他有3年半都在微软度过。2006年他拿到博士毕业证后,继续回到微软工作,直到12年后才离开微软亚洲研究院。他说:“在微软加起来总共15年,不管是技术的价值观还是 ...

大模型助力企业数据驱动,火山引擎数智平台发布 AI 助手

大模型助力企业数据驱动,火山引擎数智平台发布 AI 助手
9月19日,火山引擎在其举办的“V-Tech数据驱动科技峰会”上宣布,火山引擎数智平台VeDI推出“AI助手”,通过接入人工智能大模型,帮助企业提升数据处理和查询分析的效率。即使是不会写代码的运营人员 ...

【ICIG 2023】聚力创新,共赢未来,第十二届国际图象图形学学术会议圆满落幕

【ICIG 2023】聚力创新,共赢未来,第十二届国际图象图形学学术会议圆满落幕
2023年9月22-24日,第十二届国际图象图形学学术会议ICIG 2023)在南京隆重召开。本届大会由中国图象图形学学会主办,南京邮电大学承办,南京理工大学和南京信息工程大学协办,Springer支 ...

新加坡国立大学尤洋:高性能 AI 的突破丨GAIR 2023

新加坡国立大学尤洋:高性能 AI 的突破丨GAIR 2023
过去数年,AI 模型的参数发生了极大变化。尤洋指出,从 2016 年至 2021 年 1 月,AI 模型的参数量是每 18 个月增长 40 倍;从 2018 年 1 月到 2021 年 1 月,AI ...

Alex Smola 与李沐师徒官宣创业:舍亚马逊,入大模型

Alex Smola 与李沐师徒官宣创业:舍亚马逊,入大模型
作者 | 李梅编辑 | 陈彩娴雷峰网消息:近日,亚马逊机器学习部门原杰出科学家/VP Alex Smola与首席科学家李沐师徒二人已从亚马逊离职,并且确立新去向:进军大模型方向创业。此前两个月,雷峰网 ...

前京东 AI 掌门人周伯文也入局 ChatGPT,衔远科技正在招募合伙人

前京东 AI 掌门人周伯文也入局 ChatGPT,衔远科技正在招募合伙人
作者 | 李梅编辑 |岑峰2月26日晚,周伯文发布一则AI英雄帖,招募合伙人一起打造中国版ChatGPT。周伯文于朋友圈发布英雄帖这是继前王慧文、李志飞、王小川之后又一位下场的业界大牛。不过,周伯文如 ...

Fellows Fund 创始人 Alex Ren :硅谷视角下的 AI 价值创造丨GAIR 2023

Fellows Fund 创始人 Alex Ren :硅谷视角下的 AI 价值创造丨GAIR 2023
2023 年 8 月 14 日,由 GAIR 研究院、雷峰网(公众号:雷峰网)、世界科技出版社、科特勒咨询集团联合主办的第七届 GAIR 全球人工智能与机器人大会在新加坡乌节大酒店拉开帷幕。在 AI ...
返回顶部