向元宇宙出发！“深圳造”大模型托起虚拟世界

读特客户端

读特在线，您的新闻观察眼

摘要

“我们认为虚拟仿真是实现AGI（通用人工智能）的一条路径。”

戴上VR头显，你可以穿梭在唐朝洛阳的街头挑选年货，置身浩瀚的宇宙搭乘太空电梯，或是在游戏中用手接住天上掉下来的彩虹糖……这些沉浸式的VR体验都来自于一家AI与3D技术服务公司——深圳元象信息科技有限公司（以下简称“元象科技”）。

“我们认为虚拟仿真是实现AGI（通用人工智能）的一条路径。”元象科技联合创始人肖志立表示。从做3D渲染引擎到自研AI大模型，元象科技从元宇宙切入，期望构建一个真实且智能的数字世界。

视频剪辑：王晓林

元象科技创立于2021年。肖志立形容，“元象是一家特别本土的，成长于深圳的企业”——创始人姚星是腾讯集团前副总裁，创建了腾讯AI Lab和腾讯Robotics X Lab，团队核心成员来自腾讯。从创立之初，这家公司就自带了AI基因。

“我们心中的元宇宙，一直是‘用AI方法来生成3D世界内容’。”近日，在接受读特新闻等媒体采访时，肖志立表示，未来的3D世界将由感知智能和认知智能组成。“3D是信息升维，将重塑信息交流的方式，而在智能的世界里，需要有灵魂、有智慧、有温度的智能体与人类互动。”肖志立说，元象科技在探索过程中发现，大语言模型是一条可行的技术路径。

根据姚星此前接受媒体采访的实录，在早期，他曾使用深度强化学习方法，也就是DeepMind采用的路径，探索通往AGI之路。随着ChatGPT问世，姚星意识到，大模型路线也许才能突破强化学习方法的局限。“它不用去虚拟世界仿真数据，而是直接从真实世界中拿到大量的高质量自监督数据，这样的数据具备多样性，提升了GPT的泛化能力，可以做不同的任务类型，而且这些数据都是人类长期积累的经验和知识数据，让AI具备很强的认知能力。”姚星说道。

于是，从2023年开始，元象科技开始投入研发大模型。在一年半间，元象科技迭代了多个版本的大模型。2023年11月，元象科技开源了650亿参数的通用大语言模型XVERSE-65B。

2024年1月，元象开源了XVERSE-Long，据介绍，这一大模型支持256K 上下文长度，能够满足更长的多轮对话、知识问答与摘要等需求，“相当于我们给大模型喂一部25万字的小说，读取之后，它可以跟我们进行互动。”肖志立解释。同年9月，元象科技发布了中国最大的MoE开源模型XVERSE-MoE-A36B，该模型总参数量达到2550亿，在性能上实现了“跨级”跃升。

读特新闻记者了解到，MoE指的是Mixture of Experts，即混合专家模型架构，它将多个细分领域的专家模型组合成一个超级模型，打破了传统扩展定律（Scaling Law）的局限。值得注意的是，元象科技这一MoE模型在训练时间上减少了30%，推理性能提升了100%，大幅降低了每token的成本。

从作为广东最早获得国家备案的大模型之一起步，元象科技如今成为了国内除DeepSeek外，为数不多把MoE大模型开源的公司。

在元象科技展示的画面中，读特新闻记者看到，在大模型搜索框输入一段文字，即可生成相对应的3D成果，它可以是人，也可以是物体，也可能是某种环境和场景。此外，基于大模型，也可以通过视频和图像生成3D空间。

肖志立介绍，基于3D+AI的技术路线，元象科技在to B和to C端都取得了落地成果。其中，大模型在to B端的应用主要在AI智能体方向，除了用于虚拟世界的智能角色和内容生成，在智能驾驶领域的陪伴机器人、泛娱乐行业的智能角色等领域也有潜力。在to C端方面，2024年，元象科技打造了VR大空间品牌“VISION WALK 幻旅之门”，并推出《登月奇旅》《海底两万里》《永远的盛唐》等VR沉浸式体验内容，在33个城市开设超过50家门店。