无问芯穹获近10亿元累计融资,致力于成为大模型时代首选的“算力运营商”

深圳特区报记者 闻坤
2024-09-02 14:44

深圳特区报

深圳市委机关报,改革开放的窗口

摘要

2024 年 9 月 2 日,无问芯穹(Infinigence AI)宣布完成近 5 亿元 A 轮融资,至此,在成立短短 1 年 4 个月内,无问芯穹累计已完成近 10 亿元融资。无问芯穹本轮融资联合领投方为社保基金中关村自主创新专项基金(君联资本担任管理人)、启明创投和洪泰基金,跟投方包括联想创投、小米、软通高科等战略投资方,国开科创、上海人工智能产业投资基金(临港科创投担任管理人)、徐汇科创投等国资基金,以及顺为资本、达晨财智、德同资本、尚势资本、森若玉坤、申万宏源、正景资本等财务机构。

无问芯穹本次融资募集的资金将用于加强技术人才吸纳与技术研发,保持软硬协同、多元异构的技术领先优势;深入推动产品商业化发展,保持Infini-AI异构云平台产品与市场间的紧密嵌合;强化生态合作,激活异构集群算力资源,构建支撑“M种模型”和“N种芯片”的AI算力底座,做AI模型算力的“超级放大器”,致力于成为大模型时代首选的“算力运营商”。

无问芯穹联合创始人、CEO夏立雪表示:“感谢多方资本对无问芯穹的青睐,让我们在‘天时、地利、人和’的创业征途上多了一份不负厚望的笃定。AI 2.0浪潮带来的新‘二八定律’,Transformer 架构统一了新的技术范式,意味着只需解决20%的关键技术问题即可支撑80%的垂直场景泛化,给软硬件联合优化技术的标准化和规模化提供了难得的机遇;中国算力生态正面临的供需矛盾以及资源分布不均的现状,为我们拉动上下游协力实现多元异构算力的高效整合创造了时代机遇;而我们源于清华电子系的深厚底蕴、十余年的技术积累和丰富的产业经验所形成的产研结合的‘复合型’团队,更成为AI领域的人才‘引力井’,构成了无问芯穹独特的人才竞争力。”

大模型能够支撑的实际产业规模,取决于AI模型的实际可用算力,是一个壁垒更高、玩家更稀缺、价值量更高的领域。基于对AI行业的深刻理解和长期实践,无问芯穹超前判断大模型的实际可用算力不仅取决于芯片的理论算力,还可通过优化系数放大算力利用效率,通过集群规模放大整体算力规模,由此,无问芯穹提出“芯片算力×优化系数(软硬协同)×集群规模(多元异构)=AI模型算力”公式。遵循这一公式,无问芯穹将通过软硬件联合优化技术,持续提升芯片算力在大模型任务中的利用率,并通过多元异构算力适配技术,提升集群算力利用率,扩大行业整体算力供给。

在软硬件联合优化方面,无问芯穹通过自研的推理加速技术FlashDecoding++大幅提升主流硬件和异构硬件的利用率,超越在先SOTA,完成多个主流开源大模型在AMD、华为昇腾、壁仞、寒武纪、燧原、海光、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡上的适配,并在部分计算卡上实现了行业第一的推理加速成果,高效满足各行业愈发高涨的大模型推理需求。基于这一方案取得的优化效果,无问芯穹已与AMD签署战略合作,携手推动商用AI应用的性能提升。

无问芯穹构建的 Infini-AI异构云平台不仅可帮助下游客户轻松屏蔽硬件差异,无感高效地使用底层异构算力的强大能力,还将有力打破国内异构算力的生态困境,加速上层应用逐渐向异构算力基座迁移,有效整合并扩大国内大模型产业可用算力的规模,真正将异构算力转化为能用、够用、好用的大算力,助力构建具有中国特色的本土化异构算力生态。遵循算力利用率提升思路,结合软硬件联合优化实力,无问芯穹在端侧大模型和LPU IP领域亦有超前布局,致力打造“端模型+端芯片”闭环能力。无问芯穹坚信端侧场景快速增长和应用爆发的必然趋势,AI PC、AI手机将成为未来人机交互的重要接口,将助力每一个终端实现AGI级别的智能涌现。

(受访单位供图)

编辑 秦天 审读 吴剑林 二审 李璐 三审 赵明

(作者:深圳特区报记者 闻坤)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读

读特热榜

IN视频

鹏友圈

首页