发布时间:2025-09-13 19:39:24 作者:p 点击:7619 【 字体:大中小 】
7月4日,无限可信大模型公司无限光年(INF)在2024年世界人工智能大会(WAIC)上发布可信光语大模型及其技术报告。光年光语耕专可信光语大模型结合大语言模型与符号推理,发布有效解决幻觉问题,大模大幅增强模型可信度,型灰信技行百赋能金融服务、术深深圳高中偷拍视频评价医疗诊断等垂直领域,业场业让生成式AI真正成为新质生产力工具。景赋
据雷峰网(公众号:雷峰网)了解,无限在金融和医疗垂直领域评测中,光年光语耕专可信光语大模型超越OpenAI的发布万亿参数大模型GPT4-Turbo,同时作为“精专”的大模百亿规模大模型,有效提升推理精度,型灰信技行百降低服务成本。术深北京理工大学实拍全集通过解决模型幻觉问题对企业级应用的业场业重大挑战,无限光年深入金融、医疗场景,目前已服务多家头部公司和机构。
在“人工智能:科研范式变革与产业发展”主题论坛上,无限光年联合创始人徐盈辉博士表示,幻觉问题是大模型被用作生产力工具的核心挑战之一:如果大模型生成的内容不可控、难以解释,就很难满足专业领域对准确性、可靠性、严谨性的要求。
针对该挑战,无限光年致力于研发神经符号计算等多种创新技术,并在此基础上打造新一代可信大模型。
徐盈辉博士介绍,人工智能在多年发展长河中形成了符号学派和联结学派两种不同的路径和理念。神经符号技术将符号学派的推理能力与联接学派的学习能力有机结合,大幅提升生成式AI在行业应用中的可信生成能力,降低错误率、提高可靠性。正如诺贝尔经济学奖得主丹尼尔·卡尼曼提出的“人类思维有快与慢两个系统”的理论,符号计算与大模型的结合不仅能用神经网络实现快速的“黑盒”概率预测,更能进行慢思考的“白盒“逻辑推理。这两个系统的融合代表着通往未来通用人工智能(AGI)的重要技术方向,也正是无限光年独特的“灰盒“可信路线。
无限光年联合创始人徐盈辉博士在2024年WAIC上发布光语垂直领域大模型
无限光年积极发展“灰盒”大模型,解决垂直领域的专业问题。
在金融领域,特许金融分析师(Chartered Financial Analyst,CFA)考试是全球投资业最严格、含金量最高的资格认证,分为三级考试,包含丰富的金融类知识问题和计算推理问题。基于CFA数据集,无限光年金融大模型在一级和二级考试中准确率均超过GPT4-Turbo和Llama3。在一级和二级考试准确率的表现上,无限光年金融大模型得分分别为0.7772和0.5518,GPT4-Turbo分别为0.7177和0. 5259,Llama3分别为0.6723和0.4812。
同时,在公开数据集FinanceIQ和Fin-Eval上,无限光年金融大模型的表现也均超过GPT4-Turbo和Llama3。徐盈辉博士同时宣布,无限光年将光语金融大模型API试用,助力大模型在金融行业的发展和应用。
无限光年光语大模型在垂直领域测试超越OPENAI的万亿参数大模型
此外,光语大模型在4个公开的权威逻辑推理数据集上准确率都超过GPT-4 Turbo,在ProofWriter、FOLIO、ProntoQA和MedExam Grading中的得分分别为0.99、0.58、0.99和0.80,而GPT4分别为0.91、0.56、0.94和0.64。
在医疗领域,无限光年医疗大模型在权威医疗数据集MedBench上,API和自测榜双榜第一,是首家双榜超过90分的医疗大模型。API榜综合得分90.4。
自成立以来,基于可信大模型技术,无限光年已在大模型产业应用中取得多方面成果。在金融领域,无限光年与头部证券公司合作推出AI投研助手。借助新一代可信技术,这一投研助手在国内率先实现了用大模型精准、高效、深度解读企业财报,为分析师等专业人士提供包括信息总结分析、范式写作和精准搜索在内的一站式功能。到目前为止,该产品已被多家证券公司和资管机构使用。
在医疗领域,无限光年与国内头部三甲医院合作,共同基于可信技术创新打造医疗行业大模型,在体检报告解读方面有效协助医生提升报告效率和准确度。
徐盈辉博士认为,在经历“百模大战”后,模型的行业应用已成为大模型的发展重心。但在深入专业化场景时,当前通用大模型的表现并不理想。无限光年团队将持续探索新一代可信的灰盒大模型技术,让垂直领域大模型更精准、更可信,成为“金融顾问” 、“专业医生”和更多领域的专家,让AI技术人人可用、行行受益。
据了解,无限光年团队既有来自阿里巴巴、蚂蚁集团、字节跳动、微软的国际顶尖AI人才,也有来自摩根大通等金融机构、协和医院等医疗机构的资深行业专家。基于对行业需求的深入了解,无限光年开发AI原生产品与解决方案,为行业提供多元化的专业服务,推动“灰盒大模型”和生成式AI技术在行业场景的持续落地。此前,无限光年已完成多轮融资,投资人包括阿里云、启明创投等头部投资机构。
(公司最新发布技术报告下载链接:https://s.infly.cn/f/img/pdf/Towards_Trustworthy_LLMs.pdf?20240703)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的
指数科技AFH技术打造AI生成硬件范式,做垂直领域“刚需”
拓元智慧完成近亿元人民币Pre
AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025
超 50 位两院院士、200 位青年科学家!2023「青年科学家 50² 论坛」深圳举办
湾区聚力 开源启智
第一个走入全面AI化的行业,正在经历一次「系统升级」
下注端到端:一场具身智能的谨慎豪赌
超百万 B 端月活用户,ZMO.AI 用 AIGC 打开营销的潘多拉魔盒
实测文小言升级:开始「卷体验」的百度都眉清目秀了
智源线虫登上Nature子刊封面,具身元年尾声深长
斯坦福 AI 指数报告发布:2024年美国 AI 私人投资约为中国的 12 倍、GPT3.5 级别模型推理成本下降 280 倍
边缘人工智能提供商 Gcore 获 6000 万美元融资;马斯克开训最大 AI 集群,目标年底开发全球最强 AI丨AI情报局
网易有道全面拥抱DeepSeek
实测字节豆包·视频生成模型:Sora画的饼被实现了......
硅谷巨头要学会接受:「DeepSeek 现象」只是开始
异构智能体自主协作,大模型扮演了什么角色?
SIGGRAPH Asia 2024:传统与创新并存,3D 生成与具身智能热度上升
“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样
UCL强化学习派:汪军与他的学生们
港大马毅:现在的大模型只有「知识」,没有「智能」
Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现
Bonree ONE 2025春季版全球发布
独家丨字节招兵买马,拟在欧洲设立AI研发中心
Groq 获 6.4 亿美元融资;传 ResNet 作者张祥雨加盟阶跃星辰;OpenAI 研发 ChatGPT 文本水印丨AI情报局
枫清科技高雪峰:从数据到知识,跨越生成式AI与决策智能间的鸿沟
实测文小言升级:开始「卷体验」的百度都眉清目秀了
上交大冷静文:模型发展需要和芯片、系统厂商协同
大模型热度退潮,真正的技术创新者开始被「看见」
CNCC 落幕:国产大模型已经进化到能在横店给我们点咖啡
JHU 陈杰能:世界模型+心智模型,让具身智能体拥有「想象力」
国产 AI Infra 变革进行时:新势力正在崛起
巴西最高法院多数票判定前总统博索纳罗多项罪名成立
Harrison Chase:独创AI智能体「认知架构」,定制+极简加减法双驱动
Sim2Real新突破:Jim Fan团队造机器人“修仙”模拟器,挂机50分钟=修炼一整年
梁文锋亲自挂名,DeepSeek 最新论文丢出注意力新机制,推理速度直线提升 11 倍