距离6月25日OpenAI宣布向中国停止服务已一个半月。当时,业界曾对此事预言:“OpenAI断供或将引起国内大模型行业“大地震”。
“雷声大,雨点小”。深圳一大模型企业从业者近日向记者表示。事实上,OpenAI从未对中国“开放过”。据他统计,过去,OpenAI的API向161个国家和地区开放,并未包括中国。“这次OpenAI宣布对中国停止服务,只是把已有的事情搬到‘台面’上讲。”
同时,这一个多月里,中国大模型格局也开始了新一轮的扩张与发展,大模型创业公司打响“价格战”,争相推出“迁移计划”,资本也重新开始向头部大模型企业聚集。
国内大模型加速抢占市场的一个半月
2022年底,Open AI发布ChatGPT,AI大模型便在全球范围内掀起了有史以来规模最大的人工智能浪潮,成百上千个大模型如雨后春笋般涌现,生成式人工智能遍地开花,“大模型之争”拉开序幕,一度被称为“百模大战”。
“其实国内的大模型产品,有不少是“套壳”Chat GPT(可以理解为调用开源大模型API提供服务,而非自研模型),但现在通过微软云等,也可以用中国IP访问OpenAI,Open AI断供只能说麻烦了一点,但远远没到行业‘地震’的程度。”该从业者表示。
“这也印证了OpenAI对我们来说始终不是一个稳定而长久的选择,在这场中美的AI角力中,中国大模型企业有没有自主可控的强大底座能力作支撑?这是值得思考的问题。”香港大学经管学院创新及咨询管理教授蒋镇辉教授向记者表示。
企业国内的大模型企业也将此次OpenAI断供视为机会,“连夜”推出了API接口“搬家”服务。比如,阿里云百炼宣布将为OpenAI API用户提供最具性价比的中国大模型替代方案,并为中国开发者提供2200万免费tokens和专属迁移服务;通义千问GPT4级主力模型Qwen-plus在阿里云百炼上的调用价格为0.004元/千tokens,仅为GPT-4的50分之一。
除了降价、零成本迁移,国内大模型企业还不断发布新产品。据记者不完全统计,这一个半月新推出的大模型产品已超过20款。6月27日,在OpenAI宣布退出中国后的两天,科大讯飞发布了星火V4.0大模型。7月,生数科技打造的视频大模型Vidu上线,智谱AI正式发布视频生成大模型“清影”,商汤发布可控人物视频生成大模型Vimi;阿里达摩院推出一站式AI视频创作平台“寻光”……进入8月,则有面壁智能最新打造的面壁“小钢炮”MiniCPM-V 2.6正式开源等。
争夺大模型“四龙五虎”最后席位
公开数据显示,截至7月底,国内共推出超300个大模型;10亿参数规模以上的大模型数量已超100个。
在蒋镇辉教授看来,过去一年多,中国大模型企业发展迅速,中国的人工智能初创公司正在激增,AI大模型产业规模仅次于美国,位居全球第二。
科技界时常会将一些新兴的、有潜力的、四家典型的独角兽公司称为“四小龙”。随着这批人工智能初创公司的冒头,大模型的“四小龙”“五虎”概念也开始登场。关于大模型的“四小龙”“五虎”的指代对象,目前仍没有统一说法,但记者梳理发现,有人把智谱AI、月之暗面、百川智能、MiniMax称为“四小龙”,有人把百川智能、智谱AI、月之暗面、MiniMax、零一万物称为“五虎”,但也有人认为“五虎”应包括面壁智能。整体而言,取得较大共识的是智谱AI、月之暗面、百川智能这三家都能入围。
智谱AI成立于2019年,也是“四龙五虎”里成立最早的一家,脱胎于清华大学计算机系知识工程实验室。早在2020年,智谱AI就研发并训练了一个百亿参数的模型。OpenAI发布GPT-3模型后,智谱AI加大在预训练大模型上的投入,后来几乎全模型产品线对标OpenAI。
月之暗面和百川智能均成立于2023年4月。月之暗面的明星产品是今年3月爆火的人工智能助手Kimi,现可支持200万字无损上下文输入。月之暗面的创始人杨植麟出生于1992年,也是这几家公司里最年轻的创始人,曾就职于谷歌。百川智能的创始人为前搜狗公司CEO王小川,该公司成立后短短数月,百川智能便跻身科技独角兽行列,成立至今更是连续发布了11款基础大模型。
大模型“下半场”或落子应用
在一批轰轰烈烈的人工智能创业潮中,中美在AI领域差距还有多大?在蒋镇辉教授看来,经过一年多的发展,虽然中美的AI发展仍有一定差距,但这种差距正在大幅缩小。
“一年前,我们(中国)落后OpenAI、Google7-10年,我认为现在差距在6个月左右,大大降低了。”创新工场董事长、零一万物首席执行官李开复近期在接受公开采访时也说,从落后7-10年,到落后6个月,是一个不可思议的“超级速度”。
新发布的中文多模态大模型SuperCLUE-V 基准 8 月榜单显示,腾讯混元大模型在总榜上位居第二,仅次于GPT-4o;除了“BAT”外,上海人工智能实验室、跃阶星辰、靠谱AI、零一万物的大模型也位于榜单第一梯队。
经过大模型数量之争的“上半场”,“下半场”中国大模型该如何押宝?“持续稳定的政策支持、庞大的算力规模和广阔的应用场景是中国独特的竞争优势和巨大的发展潜力。”蒋镇辉教授认为,2024年也是大模型的场景之年,将从“卷”模型数量到“卷”应用,相较美国,我国的大模型优势在于有更丰富的应用场景,因此,未来在坚持重视底层技术发展之余,应该更重视应用端的发展。
资本重回大模型头部企业
不管是“卷”数量、技术,还是“卷”应用,大模型都很“烧钱”,这是业内共识。数千万元一次的训练成本,让不少企业和投资者望而却步,大模型热潮一直难以带火一级市场。
研究机构CB Insights发布的《2023年人工智能(AI)行业现状报告》数据显示,2023年,中国AI领域投融资数量约为232笔,同比下降38%;融资总额约为20亿美元,同比下降70%。其中,2023年第一季度,不管是融资额还是融资量,都创下了5年来最低。
近日,国产大模型新一轮融资潮却正在袭来,融资金额在亿元级别的有20余起。8月,月之暗面、零一万物相继传来完成新一轮融资消息,金额均高达数亿美元。更早前,MimiMax、百川智能、智谱AI也已完成融资,上述五家公司融资金额累计超100亿元。此外,阶跃星辰也传出正在融资的消息。
知名经济学者盘和林接受媒体采访时表示,相比于去年的融资潮,今年大模型投资人更关注应用端落地,比如月之暗面是因为Kimi的用户增长,百川智能是因为在工业等领域的应用落地等,AI大模型未来还是要靠应用变现。