戴上VR头显,你可以穿梭在唐朝洛阳的街头挑选年货,置身浩瀚的宇宙搭乘太空电梯,或是在游戏中用手接住天上掉下来的彩虹糖……这些沉浸式的VR体验都来自于一家AI与3D技术服务公司——深圳元象信息科技有限公司(以下简称“元象科技”)。
“我们认为虚拟仿真是实现AGI(通用人工智能)的一条路径。”元象科技联合创始人肖志立表示。从做3D渲染引擎到自研AI大模型,元象科技从元宇宙切入,期望构建一个真实且智能的数字世界。
视频剪辑:王晓林
元象科技创立于2021年。肖志立形容,“元象是一家特别本土的,成长于深圳的企业”——创始人姚星是腾讯集团前副总裁,创建了腾讯AI Lab和腾讯Robotics X Lab,团队核心成员来自腾讯。从创立之初,这家公司就自带了AI基因。
“我们心中的元宇宙,一直是‘用AI方法来生成3D世界内容’。”近日,在接受读特新闻等媒体采访时,肖志立表示,未来的3D世界将由感知智能和认知智能组成。“3D是信息升维,将重塑信息交流的方式,而在智能的世界里,需要有灵魂、有智慧、有温度的智能体与人类互动。”肖志立说,元象科技在探索过程中发现,大语言模型是一条可行的技术路径。
根据姚星此前接受媒体采访的实录,在早期,他曾使用深度强化学习方法,也就是DeepMind采用的路径,探索通往AGI之路。随着ChatGPT问世,姚星意识到,大模型路线也许才能突破强化学习方法的局限。“它不用去虚拟世界仿真数据,而是直接从真实世界中拿到大量的高质量自监督数据,这样的数据具备多样性,提升了GPT的泛化能力,可以做不同的任务类型,而且这些数据都是人类长期积累的经验和知识数据,让AI具备很强的认知能力。”姚星说道。
于是,从2023年开始,元象科技开始投入研发大模型。在一年半间,元象科技迭代了多个版本的大模型。2023年11月,元象科技开源了650亿参数的通用大语言模型XVERSE-65B。
2024年1月,元象开源了XVERSE-Long,据介绍,这一大模型支持256K 上下文长度,能够满足更长的多轮对话、知识问答与摘要等需求,“相当于我们给大模型喂一部25万字的小说,读取之后,它可以跟我们进行互动。”肖志立解释。同年9月,元象科技发布了中国最大的MoE开源模型XVERSE-MoE-A36B,该模型总参数量达到2550亿,在性能上实现了“跨级”跃升。
读特新闻记者了解到,MoE指的是Mixture of Experts,即混合专家模型架构,它将多个细分领域的专家模型组合成一个超级模型,打破了传统扩展定律(Scaling Law)的局限。值得注意的是,元象科技这一MoE模型在训练时间上减少了30%,推理性能提升了100%,大幅降低了每token的成本。
从作为广东最早获得国家备案的大模型之一起步,元象科技如今成为了国内除DeepSeek外,为数不多把MoE大模型开源的公司。
在元象科技展示的画面中,读特新闻记者看到,在大模型搜索框输入一段文字,即可生成相对应的3D成果,它可以是人,也可以是物体,也可能是某种环境和场景。此外,基于大模型,也可以通过视频和图像生成3D空间。
肖志立介绍,基于3D+AI的技术路线,元象科技在to B和to C端都取得了落地成果。其中,大模型在to B端的应用主要在AI智能体方向,除了用于虚拟世界的智能角色和内容生成,在智能驾驶领域的陪伴机器人、泛娱乐行业的智能角色等领域也有潜力。在to C端方面,2024年,元象科技打造了VR大空间品牌“VISION WALK 幻旅之门”,并推出《登月奇旅》《海底两万里》《永远的盛唐》等VR沉浸式体验内容,在33个城市开设超过50家门店。
元象科技VR沉浸式体验的部分内容画面。
“新的一年,我们将在AI和3D这两大核心业务领域持续深耕。在AI领域,将基于自研大模型,打造多模态AI技术生态,在VR大空间会计划加大内容创作投入,挖掘更多样化的题材。”肖志立表示。
编辑 刘悦凌 审读 郭建华 二审 李怡天 三审 刘思敏