500道题目、对标接受过高等教育的人类水平、更强调对产业和生活的实际价值,严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计……8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中的智商指数和工具提效指数两个维度获得第一,《报告》认为讯飞星火“在工作提效方面优势明显”。
《报告》认为,具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力)的讯飞星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
面对国产大模型“涌现”,讯飞星火认知大模型从立项到发布,再到迭代升级,每个节点都紧锣密鼓:5月6日发布讯飞星火认知大模型及其在教育、办公、汽车、数字员工等领域的应用落地;6月9日突破开放式问答,并在数学能力和多轮对话能力上迭代升级;即将到来的8月15日会在代码能力上实现重大突破,并在多模态交互能力上升级;10月24日对标ChatGPT,实现中文超越、英文相当的水平。
在智商评估方面,《报告》认为,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对大模型进行考量,结果显示,讯飞星火排名第一。
在工作效率提升方面,《报告》认为, AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效(50%)和生成创新(50%)方面进行考量,结果显示,讯飞星火以350分排名第一并遥遥领先。
《报告》认为,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。
(原标题《新华社研究院AI大模型体验报告出炉:讯飞星火智商指数和工具提效指数第一》)
编辑 刘悦凌 审读 吴剑林 二审 郑蔚珩 三审 詹婉容
读特热榜
IN视频
鹏友圈
5月18日,黄子韬主理的卫生巾品牌“朵薇”正式发布,定价49.8元全国包邮,包含不同尺寸卫生巾共62片,开售15分钟即卖出19.5万件。黄子韬此前在直播中称“那些赚卫生巾黑心钱的人太恶心了”,透露想做透明化卫生巾工厂。那么,你会购买吗?
第21届深圳文博会智恒文化科技创意园分会场开幕 中摄在线(记者 黄建华)第21届深圳文博会智恒文化科技创意园分会场于5月20日下午在园区启幕。市文体局广电处处长胡红昱,公共文化处副处长许祎,南山区委常委、宣传部部长王远辉,国际知名导演唐季礼,智恒文化科技创意园创办人陈秉文等市区两级政府领导、社会各界嘉宾200余人出席了开幕仪式。 智恒文化科技创意园作为南山区的数字创意产业高地,本次分会场围绕“智创新程·恒筑未来”的主题,聚焦数字创意、影视文娱等领域的文化精品打造与品牌出海,开展为期一周的分会场文化活动,内容包括签约仪式、文化精品与品牌出海交流活动、“精品·出海·聚势·突围”微短剧创投交流会、智恒数字创意产业创新成果展、IP赋能农文旅融合创新展、香港青年创新创意邀请展、中国名家书画展、“乐游智恒·集印有礼”游园打卡、yoose有色潮流街头空间首发和分会场闭幕式文艺演出等系列活动,为市民朋友们呈现一场精彩纷呈、独具特色的文化产业盛会。 开幕式举办了一系列重大文化精品项目签约、企业入驻签约以及湾区影视文化公园和唐季礼导演工作室的揭牌,深圳微短剧产业联盟秘书处和南山区微短剧公共服务中心揭牌,同时启动“影视文娱精品培育计划”。#读特小记者#
00:56
洪湖公园荷花开了一部分,主要在荷美空间周边的荷塘,其他荷塘开的还不多,品荷园关闭养护中,到下月中旬才开。
#读特小记者#🐘各种动物🐎 在有限⚡的空间🕸️争夺生存🍃 满眼👁葱绿中🍀遇见野性🐴自然🐾 感受💫雨林💦中独特魅力🌴 🌳——西双版纳🐊
好
- 友情链接: 深圳新闻网
- 粤ICP备10228864号
- 粤公网安备 44030402000917号
- Copyright @1997-2023 深圳特区报社