国内DPU芯片领域唯一独角兽企业,研发人员占比90%以上……围绕深圳云豹智能有限公司(以下简称“云豹智能”),有许多亮眼的数字。2月11日,由市委宣传部组织的“高质量发展调研行之走进深圳人工智能企业”采访活动走进云豹智能,探访这家成立不到5年初创公司的成长密码。
云豹智能创始人兼CEO萧启阳。
DPU,即Data Processing Unit的缩写,直译为数据处理单元。2020年,英伟达创始人黄仁勋在一次公开演讲中表示,“DPU将成为未来计算的三大支柱之一,未来的数据中心标配是CPU+DPU+GPU。”2021年,DPU项目成为了投资方关注的焦点。
读特新闻记者从云豹智能创始人兼CEO萧启阳处了解到,我们熟悉的CPU芯片应用于通用计算,GPU芯片应用于人工智能和图像技术,而随着数据的爆发性增长和摩尔定律逐步失效,专注于数据处理、低时延高性能网络与调度的DPU应运而生。
DPU的出现首先要解决的就是网络数据包处理的问题,“卸载”CPU软件的“负担”。“DPU也是一个加速器,加速网络存储方面的性能。”萧启阳解释,DPU可以执行原本需要CPU处理的网络、存储和安全等任务,接手CPU所不擅长的网络协议处理、数据加解密、数据压缩等数据处理任务,并且对各类资源分别管理、扩容、调度。
“CPU跟GPU,我们叫算力芯片,它还要靠一个关键芯片,就是DPU,去把算力连起来,这样的网络成为了人工智能的一个算力平台。”萧启阳介绍,有一些案例指出训练AI模型的时间成本,超过一半用在网络上,相当于算力芯片一半的时间都在等待数据传输。在AI计算需求不断增长的今日,DPU可以提升算力效率,降低算力成本。
云豹智能成立于2020年8月。萧启阳介绍,目前英伟达等龙头企业已在深度布局DPU,云豹智能自主研发了国内首款高性能、通用可编程DPU SoC,目前达到业界顶尖水平。
相比传统方案,云豹DPU芯片方案在性能上提升4倍,同时功耗降低50%以上,网络宽带达到400 Gbps,RDMA 200 Gbps,成本得到大幅下降。该芯片采用创新的层级化可编程设计,集成支持P4语言的数据处理单元,自研RISC-V微处理器单元,以及高性能服务器CPU处理单元,将全面覆盖用户多元化,业务自定义的需求,显著提升数据中心的算力效率。
读特新闻记者了解到,云豹这款芯片已经实现量产,被多家国内头部云服务商和运营商广泛使用,并应用于多个行业。去年11月,中国移动发布了基于云豹芯片的网络“智算琢光”DPU,是全球首颗支持全调度以太网(GSE)标准的芯片,同时云豹DPU也已在腾讯等互联网公司成功商用。
萧启阳分享道,公司刚成立时,团队只有5个人。2021年4月才开始真正地拓展团队,短短两年的时间,就研发出DPU芯片。“2023年中流片,2023年底回片,我们‘一次过’就成功了。”萧启阳说,这在初创公司算是破历史的成就。
据悉,云豹智能将持续研发下一代数据中心DPU芯片及周边产品,针对目标客户进行更大范围市场推广及拓展更多客户,实现公司DPU大规模应用和落地,并带动产业链上下游生态。
编辑 许家宜 审读 郭建华 二审 郑蔚珩 三审 刘思敏