讯飞星火4.0 Turbo发布,首发多模态视觉和超拟人数字人交互

深圳特区报记者 闻坤
2024-10-24 19:12

深圳特区报

深圳市委机关报,改革开放的窗口

摘要

大模型应用7项第一!10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布讯飞星火4.0 Turbo:七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集中讯飞星火4.0 Turbo实现9项第一。与此同时,国产超大规模智算平台“飞星二号”正式启动。

会上,科大讯飞首发10项基于讯飞星火底座能力的硬核产品与创新应用:定义多模AIUI标准,发布超拟人数字人;发布星火多语言大模型、讯飞星火医学影像大模型、汽车端侧星火大模型;发布首个基于“问题链”的高中数学智能教师系统、星火智慧黑板2.0、AI作业过滤器等;发布星火智办一体机、智能座舱人机交互效果评测机器人VIAS以及科大讯飞多语种 AI 翻译透明屏。

讯飞星火4.0 Turbo:国际14项主流测试集9项超越,提效50%

讯飞星火大模型4.0 Turbo正式发布,在数学能力、代码能力上超过了GPT-4o。由艾伦人工智能研究所、OpenAI等国内外权威单位发布,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中,讯飞星火4.0-Turbo在其中9项测试集中实现超越,效率相对提升50%。

刘庆峰特别提到“硬碰硬”的数学能力和代码能力。

根据实用数学任务构建测试集CAppliedMath-1.0,讯飞星火4.0 Turbo在计算、财务、金融、度量等多个维度的任务中均超过GPT-4o水平,已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类“o1”的高难度数学能力显著提升。

根据代码生成HumanEval测试集上的效果对比,讯飞星火4.0 Turbo在Python、Java、JavaScript等任务上和GPT-4o的差距微弱,在C++能力上超过GPT-4o。在真实应用场景,基于认知智能全国重点实验室构建的iFLYCode-Eval-2.0代码实用场景测试集,讯飞星火4.0 Turbo在代码生成、代码检错、单元测试等任务上都超过了GPT-4o。

首发语音视觉虚拟人交互“三合一”

发布会上,超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。科大讯飞研究院院长刘聪现场和超拟人数字人玩了个“角色扮演”游戏,无论是扮演孙悟空还是小猪佩奇,数字人反应都惟妙惟肖。

多模态视觉能力加持下的人机交互有多惊喜?刘聪现场给超拟人数字人打了个“视频电话”,他不断调整道具“孙悟空”“奥特曼”“怪兽”的摆放位置,无需拍照,超拟人数字人看图说话,马上回应:“奥特曼和孙悟空停止了打斗,正在联合对抗怪兽 ”,和刘聪畅聊不同角度的所见。

“目前,讯飞星火支持用户创建自己的个性化数字人,打造每个人的数字分身。”刘聪现场演示了一个自己的“数字分身”,只需在后台进行简单的编辑、定义,就可快速生成自己的卡通形象,更能一句话复刻自己的声音作为发音人,随时随地与自己对话。目前,已支持1300+种人设打造。

首发星火多语言大模型,为世界提供第二种选择

在语音识别领域,科大讯飞的远场高噪场景语音识别领先优势进一步扩大。

在多语言能力上,首次实现全国地级市方言全覆盖,含全国288个地市、202种方言,讯飞输入法14.0即将支持202种方言免切换自由说。

在多语种能力上,首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种。根据实用任务场景构建测试集MMT-Eval-1.0,讯飞星火在汽车、家电、办公、翻译等行业的任务场景应用效果超过了GPT-4o。

多模态多语言能力升级,将全面赋能汽车产业。科大讯飞还首发了汽车端侧星火大模型,据悉,今年第四季度起,奇瑞、广汽、长城等多款搭载端侧大模型的车型将上市开售。

大模型赋能民生刚需:发布教育、医疗、司法、政务等领域AI助手

“用人工智能技术解决社会刚需”,是科大讯飞一直以来的出发点之一。此次1024科大讯飞全球开发者节上,科大讯飞面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了最新的产品应用。

在教育行业,首次发布基于“问题链”的高中数学智能教师系统。

搭载了高中数学智能教师系统的星火智慧黑板2.0也将于10月25日在第84届教育装备展上正式发布,从AI均衡视听更公平、AI教学工具更高效、AI教师助手更智慧、全国产化算力更安全等四个方面推动黑板从板书工具跃迁为教学AI助手。

在医疗行业,发布讯飞星火医疗大模型2.0,医疗海量知识问答、医疗复杂语言理解、医疗专业文书生成、医疗诊断治疗推荐、医疗多轮交互、医疗多模态交互等六大医疗核心场景能力重大升级并持续领先。

在司法领域,星火法律大模型赋能庭审笔录制作、裁判文书编写、法条类案检索等司法场景,和星火通用大模型相比,效率提升从61.7%提升到87.9%。

在政务服务场景,政务大模型持续迭代,全面覆盖4500多种标准化事项和60多种材料,老百姓和政务大模型“聊天”就能实现边聊边确认办事意图,审核时间缩短80%,登记效率提升5倍。

“讯飞星火已成为央国企大模型的第一选择。”刘庆峰晒出了大模型应用成绩单:央国企中标第一、教育医疗市场第一、智能汽车市场第一、大模型开发者生态第一、智能硬件市场第一、赋能科研应用第一、赋能工业应用第一。

截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖300+应用场景,所覆盖行业和场景数都是第一。

讯飞星火持续为高校提供基础科研提效服务。刘庆峰介绍,星火科研助手自去年底发布以来,已在中科院下属116个院所使用。北京邮电大学EZCoding雏雁/大创团队基于讯飞星火大模型打造的编程教学应用平台“码上”,目前已在全国332所院校开通使用,学生主动提问率增加1倍,教师辅导工作减少80%。

“AI for Science决定了中国科技发展的速度,赋能科研是讯飞星火的重要使命”,刘庆峰说。

(受访单位供图)

编辑 冯思颖 审读 张雪松 二审 党毅浩 三审 赵明

(作者:深圳特区报记者 闻坤)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读

读特热榜

IN视频

鹏友圈

首页