近日,在华为全联接大会2025上,华为轮值董事长徐直军罕见地“剧透”未来三年昇腾芯片规划,一口气公布四款新品发布时间表,并同步推出“全球最强算力超节点”和“百万卡级集群”,还宣布开放自研互联协议“灵衢2.0”。这波操作,不亚于在AI算力战场上投下一颗“核弹”。这不仅是叫板英伟达那么简单,更是一次绕开“卡点堵点”的漂亮反击,再次让业界直呼“没想到”。
“算力过去是,未来也将继续是人工智能的关键,更是中国人工智能的关键。”徐直军首次披露了昇腾芯片未来三年的详细路线图:2026年第一季度推出昇腾950PR芯片,四季度推出昇腾950DT,2027年四季度推出昇腾960芯片,2028年四季度推出昇腾970芯片。
这条几乎“一年一代算力翻倍”的演进路径,标志着中国AI算力产业从过去的“被动补课”转向“主动对标”。
徐直军的一句“从2020年到去年,啥都不敢讲,今年终于能秀点肌肉”,道尽了华为过去的隐忍。2020年起,美国对华为启动最严苛的芯片封锁,切断EDA设计软件供应,禁止台积电等代工厂为其代工先进制程芯片,限制AI芯片相关技术授权。
面对困境,华为选择韬光养晦。一边低调推进昇腾芯片的迭代,从昇腾910到920再到如今的950;一边联合国内产业链搭建超节点集群,解决“单芯片强但集群弱”的问题。
甚至连底层的AI框架MindSpore都在悄悄优化,只为避免因过度曝光引发更严厉的打压。
徐直军坦言:“由于美国制裁,我们不能产出最先进工艺制程的芯片,但我们基于过去三十多年构筑的联接技术能力,使得我们能够做到万卡级的超节点”。
过去,AI芯片的竞争焦点是“谁的单卡算力更强”。英伟达凭借CUDA生态和领先的芯片工艺,一度占据绝对优势。然而,华为的策略显然不同。
徐直军公布的Ascend 950/960/970芯片路线图,虽然在单颗芯片性能上可能仍有差距,但其重点在于“互联”和“集群”。即将推出的Atlas 950 SuperPoD支持8192张卡,Atlas 960 SuperPoD更是支持高达15488张卡,这已经不是简单的“堆料”,而是系统工程能力的体现。
这意味着,昇腾不是在单卡性能上硬刚,而是另辟蹊径,用“超节点+集群”的系统级创新,直接叫板英伟达的“卡王”霸权。业内人士告诉记者,英伟达像一辆布加迪威龙,极速400km/h,但一次只能送一个人;而昇腾像一个拥有10万辆电动货车的物流网络,每辆车速度没那么快,但通过智能调度系统+高速公路网(灵衢协议),能把海量包裹同时、准时送达。
对比数据令人震惊。相比英伟达明年下半年上市的NVL144,Atlas950超节点卡的规模是其56.8倍,总算力是其6.7倍,内存容量是其15倍,互联带宽是其62倍。即使是与英伟达计划2027年上市的NVL576相比,Atlas950超节点在各方面依然保持领先。
华为的超节点集群方案目前已服务于百度文心一言、阿里通义千问的部分训练任务,实实在在解决了国内AI企业的“算力焦虑”。据IDC数据,2024年华为昇腾AI芯片出货量为64万片,远高于寒武纪的2.6万片和百度昆仑芯的6.9万片。
更令人振奋的是,华为宣布开放“灵衢2.0”技术规范,包括基础规范、固件规范和操作系统参考设计。这相当于把“超节点”的“操作系统”开源,邀请整个产业界共建生态。
“就像当年安卓开放,让全球手机厂商都能基于其开发产品。”GKURC产经智库首席分析师丁少将评价,“华为不再只是卖芯片或服务器,而是提供一整套算力基础设施的‘参考设计’。这将极大加速国产算力生态的成熟。”华为的这一步棋,看似绕开正面战场,实则直击要害。在制造工艺受限的背景下,用系统级创新弥补单点短板,用生态开放凝聚产业合力,这才是真正的“破局之道”。
中信证券研报指出:“当前以昇腾为代表的国产算力加速迭代,自主可控趋势已成,建议重视华为昇腾链投资机遇”。这不仅是对华为技术实力的认可,更是对整个国产AI生态未来发展的看好。