让AI长出眼睛耳朵,商汤大模型学会“察言观色”

读特新闻记者 严偲偲
05-24 17:16

读特客户端

读特在线,您的新闻观察眼

摘要

“人气王”AI下棋机器人元萝卜一同亮相。

“请看着我眼前的风景作一首诗”“告诉我演讲者的语气表达了哪些情绪”……5月22日-24日,在深圳举办的2025全球人工智能终端展上,商汤科技展出了新一代的“日日新V6”大模型,让AI拥有了拟人的视觉和听觉,不仅能够理解和分析视频内容,还能感知人类语气背后的情绪。

展会上,商汤旗下的明星产品AI下棋机器人元萝卜也一同亮相,其四合一启蒙版首次实现了在同一款机器上配备四个棋盘,通过一个机械臂即可完成象棋、围棋、国际象棋、五子棋四种棋的对弈,是行业首款家用四合一下棋机器人。此外,商汤科技已经在全球开展人工智能教育业务,将AI与教育深度融合。

赋予AI人类情感和记忆

如果说市面上大部分AI大模型是拥有海量知识的“理工直男”,那么日日新V6大模型则多了一份“共情能力”。据介绍,日日新V6大模型具备强大的多模态综合能力,在强推理、强交互、长记忆三项技术上取得了关键突破。

“我们研发的流式多模态交互模型,把文本、声音、图像还有视频等模态全都囊括到了一起,让AI拥有‘眼睛’和‘耳朵’,不仅能够实时‘看见’现实世界,理解和分析视频内容,甚至能分辨人类语气,例如哭声、笑声等非语言类信息。”商汤科技大模型工作人员林小雅介绍道。

观众现场体验商汤日日新V6大模型功能。

据了解,日日新V6大模型具备高度拟人化的感知、表达和情感理解能力,可针对不同的对话内容和场景需求,即时切换语气、情感与音调,同时还拥有强大的实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,在对话交互中显著提升AI亲和力与生动性。

在应用方面,商汤基于该模型打造了数学解题、点读翻译、文旅讲解、绘本讲解四大功能。以数学解题为例,AI如同一位个性化的数学私教,具备“一对一讲解能力”,剖析解题思路,支持语音实时答疑。在文旅场景下,AI又能化身“拟人导游”,为用户带来沉浸式的文旅场景介绍。

将AI与教育深度融合

在商汤展区,人气最高的当数AI下棋机器人元萝卜。“元萝卜会根据棋友的下棋水平不同,自行调节与之匹配的棋力水平。同时,结合家用级机械臂进行互动,达到手眼协同,自如完成拾取棋子、人机对弈、人人对弈、记谱复盘等功能”元萝卜工作人员陈佳锋介绍道。

元萝卜AI下棋机器人。

据了解,元萝卜是全球第一家规模化量产家用AI机械臂机器人的企业,自2022年推出下棋机器人以来,已经开发了象棋版、围棋版、国际象棋版等多种棋类。此外,其四合一启蒙版面向3-12岁儿童设计,首次实现了在同一款机器上配备四个棋盘,通过一个机械臂即可完成象棋、围棋、国际象棋、五子棋四种棋的对弈,成为儿童学棋入门的“全能陪练”。

深耕“AI+教育”领域,除了旗下的元萝卜外,早在2018年商汤就已进入人工智能教育领域,把最前沿的AI技术在各行业的赋能案例转换为AI教学的项目式、实践性的课程。展会现场,商汤演示了“垃圾分类”主题AI教具的教学场景。

商汤教育开发了多款AI教具。

“学生通过拼搭建人工智能教具的方式,可以进行数据采集、分析和训练,AI教具通过计算机视觉技术对干垃圾和湿垃圾进行分类,学生在这过程中还可以了解计算机视觉原理。”商汤教育工作人员王琪丝表示,目前商汤已全面构建从“小学—初中—高中—高校”全周期、多层次、阶梯化的人工智能教学和人才培养体系,全面助推人工智能教育发展。

编辑 张克 审读 张蕾 二审 关越 三审 万晖

(作者:读特新闻记者 严偲偲)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读

读特热榜

IN视频

鹏友圈

首页