深耕算力“根”技术,构筑“网络”新生态,未来AI产业发展大有可为
深圳特区报记者 周雨萌 文/图
2021-09-28 14:33

近两年,深圳的人工智能技术发展迅猛,喜讯不断,今年更是硕果累累。

继5月,鹏城实验室通过鹏城云脑Ⅱ训练出了业界首个2000亿级中文NLP鹏程.盘古大模型之后,在日前的华为全联接2021上,鹏城实验室又公布了一项重要成果:面向生物医学领域的人工智能平台——鹏程.神农,它将助力制药企业和医药研究机构,加速新型药物的筛选与创制,对未来人工智能技术能在生物医药领域的拓展应用具有重要意义。

当天,中国科学技术信息研究所、新一代人工智能产业技术创新战略联盟(AITISA)与鹏城实验室还联合发布了《人工智能计算中心发展白皮书2.0——从人工智能计算中心走向人工智能算力网络》。深圳、武汉、西安、成都、北京、上海等21个城市更在大会上共同点亮了“人工智能算力网络”,未来,全国各地的人工智能计算中心将通过人工智能算力网络实现算力、数据和生态的三汇聚,也标志着我国人工智能产业发展又迈上了更高阶。

AI算力是根,算力使能大模型

众所周知,人工智能技术的发展和落地应用离不开算力的支撑,算力是根,是基石。不论是2000亿级的中文NLP鹏程.盘古大模型,还是生物信息研究平台鹏程.神农,它们都是AI取得重大进展的标志。换句话说,没有足够的算力做支撑就不会有2000亿级的中文盘古大模型;没有一个支持超大模型训练的AI框架,也做不出像鹏程.神农这样的AI平台。

2019年,华为首次发布了Atlas 900 AI 集群,并在2020年发布了昇腾AI基础软硬件,这对人工智能技术发展来说是里程碑式的节点。基于昇腾AI基础软硬件,鹏城实验室打造出了鹏城云脑Ⅱ。

据了解,鹏城云脑Ⅱ采用Atlas 900 AI集群,算力高达1000P,相当于每秒百亿亿次的运算。在国际超算大会发布的IO500排行榜中,“鹏城云脑II”再次刷新世界纪录,蝉联全系统输入输出和10节点规模系统两项世界冠军。具备世界顶尖的数据吞吐能力和AI算力水平。

而正是基于鹏城云脑Ⅱ强大的算力能力,鹏城实验室和华为才能在之后训练出包括鹏程.盘古大模型和鹏程.神农生物信息研究平台等一系列重大AI科研创新。

那么,大模型训练出来又有什么好处呢?华为轮值董事长徐直军说,“有了大模型以后,基于少量的样本数据,也能够训练出高精度模型,来满足特定行业需求。所以说大模型是各行各业真正能把AI用起来、解决各行各业问题、从而提升生产效率和降低生产成本的关键。”此次发布的生物信息研究平台鹏程.神农就是加速研制生物医药的关键平台。

大模型孵化新应用,新应用产生行业新价值

在人工智能领域有句术语叫作:“算力使能大模型,大模型孵化新应用,从而推动AI产业发展。”鹏程.盘古大模型和鹏程.神农平台是最好例证。

今年5月18日,在深圳召开的华为生态大会2021上,中国工程院院士、鹏城实验室主任高文发布了业界首个2000亿参数中文预训练语言模型鹏程.盘古。这是国产全栈式AI基础设施支持2000亿级超大规模语言模型训练的首次,探索并验证了国产E级人工智能平台在软硬件协同优化、大规模分布式并行训练等核心关键技术的可行性。

基于鹏城云脑Ⅱ和全场景AI框架昇思MindSpore,鹏程.盘古大模型在模型性能方面全球领先, 16个下游任务中性能指标优于业界SOTA模型,其中零样本学习任务11个任务领先,单样本学习任务12个任务领先,小样本学习任务13个任务领先。

在应用方面,鹏程. 盘古支持丰富的应用场景,在知识问答、知识检索、知识推理、阅读理解等文本生成领域表现突出。

另一个案例来说说最新发布的鹏程.神农生物信息研究平台。

抗生素的出现让人类的寿命延长了数十年,然而,由于细菌的耐药性变强,人们迫切需要寻找下一代抗生素,而抗菌肽是重要的研究方向。过去科学家们是通过生物萃取的方式去发现一种新药物,而现在用人工智能方式就可以生成氨基酸训练,再经过临床试验方式看它是否有效,这种智能化的方式开始慢慢在生物医药领域全面升级。

本次发布的鹏程.神农是面向生物医学领域的人工智能平台,它包含蛋白质结构预测、小分子生成、靶点与小分子相互作用预测以及新抗菌多肽设计与效果评价等。制药企业和医学研究机构使用鹏程.神农提供的AI能力,将大大加速新型药物的筛选与创制,未来对新冠药物的研制也有同样的意义和作用。

“我们是先有了目标,先有了要做抗菌肽这个事,才开发的鹏程.神农平台,因为我们知道自己具备足够的昇腾AI算力,同时基于全场景AI框架昇思MindSpore,前后大概用了两个月的时间便开发出了鹏程.神农平台。”一位参与研发的科学家对记者说。

AI 算力网络汇聚算力、数据和生态,将推动我国AI产业发展

在我国,像深圳这样拥有人工智能算力基础设施,并在人工智能技术方面取得成绩的城市还有很多。当前,人工智能计算中心建设已纳入我国多个城市的重点布局和规划中,目前全国20多个城市的人工智能计算中心建设已在陆续规划中。

然而,随着我国算力基础设施不断发展,不同区域AI算力使用存在波峰波谷情况,各中心技术标准不统一、AI相关技术优势很难跨区域互补,且AI大模型的研发具备阶段性、高密度等算力使用特点,因此各地人工智能计算中心之间算力网络互连、资源共享、协同调度是大势所趋。

在此背景下,中国科学技术信息研究所、AITISA(新一代人工智能产业技术创新战略联盟)、鹏城实验室在华为全联接2021上发布了《人工智能计算中心发展白皮书2.0》,它特别提出要从人工智能计算中心走向人工智能算力网络;而会上,深圳、武汉、西安、成都、北京、上海等21城共同点亮人工智能算力网络,也标志着我国未来在区域级算力资源上将实现共享。

未来,人工智能算力网络将通过最新技术连接各地分布的人工智能计算中心,动态实时感知算力资源状态,进而统筹分配和调度计算任务,构成全国范围内可感知、可分配、可调度的AI算力资源,以“一网络”实现“三汇聚”:算力汇聚、数据汇聚、生态汇聚。这是一种多资源深度融合、释放人工智能赋能能力的新范式,更将进一步加速我国的数字经济发展。

值得指出的是,因为人工智能算力网络汇聚了算力、数据和生态,这也为大模型的训练创造了天然有利的条件,未来也将会推动更多的大模型等重大AI科研创新诞生。目前鹏城云脑Ⅱ已应用于智慧医疗、智慧交通、智慧金融等领域。

正如徐直军所言,华为已经打造出全栈全场景的AI解决方案,它能够全面支持国内的AI技术研究和应用开发及商业实践。相信我国未来在“一网络,三汇聚”的新发展模式下定能走出一条令世界瞩目的人工智能产业发展之路。

原标题:《深耕算力“根”技术,构筑“网络”新生态,未来AI产业发展大有可为》

编辑 特区报-刘彦审读 韩绍俊审核 特区报-王雯,李林夕
(作者:深圳特区报记者 周雨萌 文/图)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读
读特热榜
IN视频
鹏友圈

首页