迈特芯科技公司创始人余浩:小芯片让大模型从云端走入终端 | 创新创业深圳人

深圳特区报记者 吴凡/文 温涛/图/视频
05-02 14:12

深圳特区报

深圳市委机关报,改革开放的窗口

摘要

晨光中的石鼓山公园满目青翠,迈特芯科技公司创始人余浩教授无暇远眺窗外,看着屏幕多窗口的代码和数据陷入沉思,身侧的办公大通间坐满研发人员。他起身参与一个小组讨论,大家正在调试大模型,桌面图纸上的芯片已进入流片阶段,将以不足5瓦的功耗高速运行十亿乃至百亿参数级的大模型。

成立仅一年多的迈特芯自主研发低功耗高性能的端侧大模型推理芯片,吸引华为、荣耀、海尔、优必选等多领域龙头企业纷至迭来有意开展合作,手机、电脑、机器人、智能家居、可穿戴设备等将添“中国芯”加速智能体演进,助推人人可用易用的AI加快落地。

低功耗芯片高效运行端侧大模型

具身智能融入生活,芯片是生根开花的“钥匙”。现场演示中,迈特芯LPU芯片让手机秒级规划日常行程合理无遗漏、2个人形机器人相互语音对话协作、巡检机器人自主避障……余浩说,芯片是人工智能从云端到线下的核心载体之一,可以让手机、电脑和机器人像人类一样思考、按指令主动解决问题。

余浩在高性能集成电路芯片设计领域研究深耕逾20年,他2017 年归国加入南方科技大学创办国家示范性微电子学院,担任未来通信集成电路教育部工程研究中心执行主任、南科大人工智能实验室负责人,曾2次荣获中国人工智能最高奖项—吴文俊人工智能奖。2023年底,他带领团队通过深圳市孔雀团队孵化项目成立迈特芯公司,专注具身智能芯片研发,支持大模型在 AI 手机、穿戴设备及机器人端侧拓展应用。

针对不同需求和应用场景的研发齐头并进,迈特芯成立次年就实现大模型产品初步突破。其中,端侧大模型推理芯片主要用于手机、平板和电脑;泛端侧产品大模型推理芯片可实现极低功耗,适用于AI 耳机、AI 眼镜、桌面机器人等各类智能硬件;高性能集成端侧大模型推理一体机重点协助企业自主部署大模型应用,已在工业智能制造、智慧医疗等领域开展试用,让机器人、无人车、无人机对外界看得见更“看得懂”。多款样片、样机预计在今年底明年初完成测试,明年实现量产。

低门槛高性价比推动AI融入生活

“我们芯片能帮助合作方降低20倍人力成本,开发出更加智能的手机和电脑”。余浩自豪地说,自研芯片有三大特点:立方脉动架构、张量压缩算法、感算一体系统,算力可达 2.46 TOPS,带宽高达 1000GB/s,带宽利用率达到 80%,大模型推理高达120Tokens/s,而功耗仅为5瓦,相当于一盏节能灯。

他透露,目前推理卡实测带宽利用率达 75%,性能达 75 Tokens/s,加速器已完成 DeepSeek、GLM、Llama、Qwen、InternVL、miniCPM等主流大模型部署,迈特芯LPU芯片在性能、能效等各方面已跻身国际领先行列。

“日常生活用的最多就是端侧大模型,我们从系统、架构等各方面综合发力实现更好的芯片性能,推动国产化快速落地。”余浩举例说,同样是适用于手机和电脑的7B(70亿)参数端侧大模型,迈特芯性能是许多国际同行的5-8倍甚至更高,目前售价500元,只是国际同类产品价格的零头。

产学研联动共振创新不止步

迈特芯办公大通间里,坐着70后国家万人计划科技创新领军人才、80后的吴文俊人工智能奖团队成员、90后的芯片研发骨干、00后的测试工程师,大家随时沟通交流融洽。

余浩透露,迈特芯通过企业实践与课堂教学的互动互促,让不少“天才少年”崭露头角,从芯片架构设计到编译器、系统、算法都有南科大培养的优秀博士、硕士乃至本科生参与开发,实战“淬火”培育芯片产业人才。他高兴地说:“我们在全球高校首批实现课堂实践芯片系统的开发和编译,软硬件结合教学让学生们紧跟全球产业发展节奏。”

迈特芯位于深圳“机器人谷”腹地,余浩开车前往深圳集成电路设计应用产业园只需经过3个红绿灯。他说,深圳对科创企业的支持不是“撒胡椒面”,而是精准聚焦产业链痛点,例如牵头搭建的集成电路公共服务平台,整合EDA工具、封装测试等全链条资源,使芯片企业研发效率普遍显著提升,同时对初创企业给予针对性研发资助、办公租金减免等,产业“土壤”深厚龙头聚集,从设计到流片、从测试到产线试用,所有环节都能在一小时车程内解决。

从教授到创业者,从论文到产品,从实验室到产业链,余浩在深圳身兼多职,切换自如,他感受到创新理想与产业脉搏同频共振,“有了深圳的全方位支持,我们对研发出更加高效低功耗的芯片更有信心了。”

编辑 白珊珊 审读 吴剑林 二审 王雯 三审 陈晨

(作者:深圳特区报记者 吴凡/文 温涛/图/视频)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读

读特热榜

IN视频

鹏友圈

首页