由国产大模型公司深度求索(DeepSeek)旗下最新模型带来的影响在海外持续发酵,市场密切关注上游AI(人工智能)硬件市场是否会波及。
1月27日,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。DeepSeek系量化巨头幻方量化旗下大模型公司,1月20日,该公司正式发布推理大模型DeepSeek-R1。
推出后不久,R1就凭借其开源的性质、大幅下降的售价和训练成本获得了广泛关注。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。
更令市场惊讶的是,据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成。
此前,AI初创企业OpenAI和Anthropic一直在与谷歌、Meta等科技巨头围绕大模型展开激烈竞争,“大力出奇迹”的“烧钱”模式成为了在这些企业间流行的选项。例如,Meta预计2024年资本支出为 380亿至400亿美元,而根据此前财报的统计,谷歌的2024年资本支出或超480亿美元。微软和亚马逊也预计2025年资本支出将继续上行。
毫无疑问,DeepSeek的横空出世又增强了这些企业的危机感。当地时间1月23日,一名脸书母公司Meta的员工在匿名职场论坛Teamblind上发帖称,Meta内部已经因为DeepSeek-R1进入“恐慌模式”:“Meta的工程师们正在争分夺秒地分析DeepSeek,试图复制其中一切可能的技术。”有认证为谷歌员工的网友回复称:“DeepSeek做的事情很疯狂。不仅是Meta,OpenAI、谷歌和Anthropic都因为他们而火烧屁股。”
R1发布后不久,Meta首席执行官马克·扎克伯格就宣布,Meta在2025年的资本支出将超600亿美元,加大对AI的投入。1月27日,据外媒报道,Meta成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型DeepSeek的工作原理,并基于此来改进旗下大模型Llama。
当地时间1月24日,2024年诺贝尔化学奖得主、谷歌DeepMind的CEO德米斯·哈萨比斯(Demis Hassabis)也在采访中评价了DeepSeek:“可以肯定的是,他们取得的成就令人印象深刻,中国具有极强的工程和规模化能力。”
DeepSeek-R1的出现不仅让Meta等科技巨头产生了危机感,还震动了上游概念股。由于R1的显著进步并非完全建立在算力基础上,华尔街开始考虑科技行业巨头对AI基础设施的巨额投资以及对英伟达芯片的需求是否合理。
截至发稿时,美股盘前,英伟达(Nasdaq:NVDA)跌超11%,博通跌超11%,台积电、Arm跌超10%,同时,在日本股市,英伟达的主要供应商Advantest Corp(TYO:6857)的股价暴跌8.6%。
外媒分析指出,如果DeepSeek的成功能够鼓励AI初创公司用更少的芯片构建强大的AI模型、并将它们更快地推向市场,那么英伟达的收入增长可能会放缓,因为大模型开发人员会复制DeepSeek使用数量更少且配置较低的AI芯片的策略。
华尔街研究机构Yardeni Research的分析师Ed Yardeni在报告中写道:“对于计划通过高昂的AI服务主导市场的‘美股七巨头’而言,(DeepSeek-R1)可能是个坏消息。关键在于,当AI资本支出的飙升速度远超收入增速,这是否会导致市场失望?”Yardeni认为,在这种情况下,英伟达的营收也可能受到波及。
美国投行Raymond James的分析师Srini Pajjuri也在报告中写道:“DeepSeek显然无法获得与美国超大规模企业一样多的算力,但却设法开发出了一种看起来极具竞争力的模式。一个自然浮现的问题是,DeepSeek的出现将如何影响算力的增长以及对硬件和半导体的需求?”
不过,Pajjuri指出,DeepSeek-R1也可能转而促使美国科技巨头们“更加迫切地利用其关键优势(即英伟达GPU)来与更便宜的替代品拉开距离”。
摩根大通分析师Joshua Meyers写道,DeepSeek颠覆性的主张是“更多的投资并不等于更多的创新”,这一观念开始在美国AI领域引起关注。不过,Meyers也表示,降低的成本并不意味着AI企业不再需要更多的算力,更不意味着投入最多资金的一方不会获胜,而是会迫使DeepSeek的竞争对手提高效率、降低推理成本。
对于DeepSeek-R1为何能大幅降低训练成本,Logenic AI公司联合创始人李博杰对记者表示,这是由于R1的核心在于后训练阶段,所需要的数据量和成本都会远低于预训练阶段,相当于“站在巨人的肩膀上”。不过,虽然这样的成功可以复制,但最前沿的大模型探索还是需要消耗很大的算力和成本,然后才能实现“左脚踩右脚”的数据飞轮效应。
而对于AI模型的训练成本下降是否会影响上游AI硬件企业,李博杰认为,虽然AI目前看起来发展很快,但背后其实有很多大家看不到的试错的过程,整体依然处于研究阶段,所以“更多的(算力)卡和更多的资源肯定还是有优势的”。
FutureLabs未来实验室首席专家胡延平表示,接下来要看DeepSeek的热度能够持续多久:“如果不看开源生态,只看C端角度,DeepSeek要想站稳,至少需要尽快具备多模态文生图文生视频、理解图像、语音交互等能力,尤其类AVM(全景影像系统)、知识库、结合Agent(智能体)等既有形态,能否形成模型矩阵和Apps生态等,可能会决定其热度是短期还是长期,舆论热度能否充分转化为市场实地,以及能否内与豆包、外与ChatGPT分食市场。”
编辑 张克 审读 张蕾 二审 郑蔚珩 三审 张颖
读特热榜
IN视频
鹏友圈
5月18日,黄子韬主理的卫生巾品牌“朵薇”正式发布,定价49.8元全国包邮,包含不同尺寸卫生巾共62片,开售15分钟即卖出19.5万件。黄子韬此前在直播中称“那些赚卫生巾黑心钱的人太恶心了”,透露想做透明化卫生巾工厂。那么,你会购买吗?
第21届深圳文博会智恒文化科技创意园分会场开幕 中摄在线(记者 黄建华)第21届深圳文博会智恒文化科技创意园分会场于5月20日下午在园区启幕。市文体局广电处处长胡红昱,公共文化处副处长许祎,南山区委常委、宣传部部长王远辉,国际知名导演唐季礼,智恒文化科技创意园创办人陈秉文等市区两级政府领导、社会各界嘉宾200余人出席了开幕仪式。 智恒文化科技创意园作为南山区的数字创意产业高地,本次分会场围绕“智创新程·恒筑未来”的主题,聚焦数字创意、影视文娱等领域的文化精品打造与品牌出海,开展为期一周的分会场文化活动,内容包括签约仪式、文化精品与品牌出海交流活动、“精品·出海·聚势·突围”微短剧创投交流会、智恒数字创意产业创新成果展、IP赋能农文旅融合创新展、香港青年创新创意邀请展、中国名家书画展、“乐游智恒·集印有礼”游园打卡、yoose有色潮流街头空间首发和分会场闭幕式文艺演出等系列活动,为市民朋友们呈现一场精彩纷呈、独具特色的文化产业盛会。 开幕式举办了一系列重大文化精品项目签约、企业入驻签约以及湾区影视文化公园和唐季礼导演工作室的揭牌,深圳微短剧产业联盟秘书处和南山区微短剧公共服务中心揭牌,同时启动“影视文娱精品培育计划”。#读特小记者#
00:56
洪湖公园荷花开了一部分,主要在荷美空间周边的荷塘,其他荷塘开的还不多,品荷园关闭养护中,到下月中旬才开。
#读特小记者#🐘各种动物🐎 在有限⚡的空间🕸️争夺生存🍃 满眼👁葱绿中🍀遇见野性🐴自然🐾 感受💫雨林💦中独特魅力🌴 🌳——西双版纳🐊
【图片动态】
- 友情链接: 深圳新闻网
- 粤ICP备10228864号
- 粤公网安备 44030402000917号
- Copyright @1997-2023 深圳特区报社