500道题目、对标接受过高等教育的人类水平、更强调对产业和生活的实际价值,严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计……8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中的智商指数和工具提效指数两个维度获得第一,《报告》认为讯飞星火“在工作提效方面优势明显”。

《报告》认为,具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力)的讯飞星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
面对国产大模型“涌现”,讯飞星火认知大模型从立项到发布,再到迭代升级,每个节点都紧锣密鼓:5月6日发布讯飞星火认知大模型及其在教育、办公、汽车、数字员工等领域的应用落地;6月9日突破开放式问答,并在数学能力和多轮对话能力上迭代升级;即将到来的8月15日会在代码能力上实现重大突破,并在多模态交互能力上升级;10月24日对标ChatGPT,实现中文超越、英文相当的水平。
在智商评估方面,《报告》认为,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对大模型进行考量,结果显示,讯飞星火排名第一。
在工作效率提升方面,《报告》认为, AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效(50%)和生成创新(50%)方面进行考量,结果显示,讯飞星火以350分排名第一并遥遥领先。
《报告》认为,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。
(原标题《新华社研究院AI大模型体验报告出炉:讯飞星火智商指数和工具提效指数第一》)
编辑 刘悦凌 审读 吴剑林 二审 郑蔚珩 三审 詹婉容
读特热榜
IN视频
鹏友圈

@报业er,深圳报业集团“光影跃动·全员视界”系列视频大赛第二季来啦!无论是采访中“猝不及防”的温情小插曲、同事间双向奔赴的默契神助攻,还是深圳街头藏不住的烟火小美好,只要藏着暖意与感动,都能参赛秀出来! 即刻开拍,并在鹏友圈带话题晒你的独家创作,用光影传递身边的温柔与力量吧! 【话题标签】#暖心2025# 【参与时间】即日起至12月31日 【参与形式】个人赛/团队赛 【提交方式】在读特客户端鹏友圈带话题#暖心2025# 发布相关视频 【提交提示】在鹏友圈发布视频后,请同时将视频作品原片发送到指定邮箱:dutenews@163.com。请务必在鹏友圈文案/邮件标题中注明:【暖心2025】- [个人赛/团队赛] - [作品名称] - [作者/团队负责人姓名+部门]。 别犹豫啦,拿起手机/相机开拍,让你的镜头故事被更多人看见!
01:35#读特小记者哈利·波特禁林体验# 魔法世界降临深圳,全国首个正版授权的“哈利·波特禁林体验”限时开放。 我们邀请读特小记者成为“魔法体验员”,用笔与镜头,记录并定义属于这座城市的魔法记忆。 【如何报名】 请于2025年12月19日前,微信扫码关注“读特在线”,回复“读特小记者”获取报名方式。 具体信息戳https://mp.weixin.qq.com/s/wgD6tVEEqdTfPXxJTUYUDw?scene=1&click_id=13
00:39#暖心2025#【路见不行,搬“杆”相助!网友:为深圳市民点赞!】12月4日13:34,福田区深南中路中航路段发生意外导致路桩变形造成拥堵,路过市民见到后纷纷伸出援手,帮助交警一同将拦路路桩恢复原状,让道路重新恢复顺畅。深圳晚报记者 严文婷 摄影
00:10#暖心2025#- [个人赛] - [深圳来点秋天的颜色] - [严文婷+深圳晚报图片新闻中心]
经典
- 友情链接: 深圳新闻网
- 粤ICP备10228864号
- 粤公网安备 44030402000917号
- Copyright @1997-2023 深圳特区报社









