“大模型会重构千行百业。”28日,在第四届“青年科学家50²论坛”上,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋在发表《大模型时代的机遇和挑战》主题演讲时表示,以大模型为代表的人工智能将带来新的技术融合和产业跃迁,但其发展还要跨过算力、数据等门槛,其技术路径也要经历从各模态独立发展,到多模融合,再到联接真实物理世界的过程。从其对产业的影响来看,个人大模型、云、端的设备相结合,在未来将产生特别的意义。
对于应该怎么去思考大模型,沈向洋谈了十点自己的思考。
第一个思考,今天的通用人工智能最重要的一件事是最近这些年整个人工智能算力整体的增长。算力越多,智能越增长,现在都还没有摸到算力天花板。其中很不幸的是,整个数据量大了以后,算力的增长还不是线性增长,而更加像是一个平方的增长。
“为什么英伟达现在已经超越了英特尔?很重要的原因就是它的增长速度不一样。”
第二个思考,是关于数据的数据。算力、算法和数据,是人工智能重要的三个因素。需要很多数据才能训练通用人工智能。现在大家一直等待着GPT5出来,但它一直迟迟没出来,如果未来要做GPT5,除了现有的数据,还要更多的多模态数据,甚至人工合成的数据。
第三个思考,是大模型的下一步应该怎么办?首先是语言模型。以ChatGPT为代表,它的底层技术是自然语言处理。今天大家正在干的是多模态模型,以GPT4为代表,里面很多技术是计算机视觉;再向前走,就是要做具身智能。具身智能的目的是要建一个世界模型。世界模型要求你不仅要读万卷书,还要行万里路,把世界上更多的知识再反馈回你的大脑里。所以应该做机器人。
第四个思考,是人工智能的范式转移。现在一个新的维度出现了,就是在推理这一步强化学习,不断地自我学习。就像人的大脑思考,有一个快系统、一个慢系统,就像我们做数学题一样,先打个草稿,看看哪个路走得通,有一个思维链,再看优化思维链过程中的机会。现在,只有OpenAI把这个系统放出来了。
第五个思考,大模型横扫千行百业。所有的公司都要面对大模型带来的机会,但是不需要每个公司都做通用的大模型。对一个企业来讲,你有自己的数据,有内部数据、客户数据,把这些数据拿出来,几十张、上百张卡就可以做一个面向自己企业的非常好的模型。所以它是一层一层不断地搭起来的。另外,还有未来的个人大模型。“今天我们已经慢慢在PC、手机里面应用AI,未来会有这样一个超级智能的AI帮助你,在收集了相关数据以后,它可以建一个自己的个人大模型。手机是一个很自然的事情,PC方面,微软、联想等PC公司也在推一个AI PC的概念,所以也有这样一些机会。
第六个思考,是AI Agent,从愿景到落地。大模型最大的超级应用就是一个超级助理,是一个超级Agent。
第七个思考,是开源和闭源。他说,过去几十年世界科技的发展,有两件事非常重要。第一是出现了互联网,有了互联网之后,你就可以在网上找到所有的论文、资料。第二是开源,是你做应用的时候,跟领先者的差距急剧缩短。
第八个思考,是重视AI治理。因为AI发展太迅猛了,全世界对AI安全都非常重视。因为这件事情的影响实在是太大了,人工智能对千行百业、对整个社会的冲击非常大,整个世界的发展实际上是要大家共同来面对的。
第九个思考,是重新思考人机关系。今天人工智能的界面已经非常清晰了,就是对话的过程。
第十个思考,是智能的本质。今天深度学习的框架到不了真正的通用人工智能。
沈向洋认为,大模型产业的未来将从大语言模型发展到多模态模型,最终迈向世界模型。技术发展将朝着理解和生成统一的方向发展,这将推动AI技术在更多领域的应用和创新。
截至7月底,中国备案大模型是197个。其中,约30%是通用大模型,70%是行业大模型。沈向洋说,未来也将会有越来越多的行业大模型诞生。
编辑 温静 审读 匡彧 二审 王雯 三审 周国和