中国力量︱神威·太湖之光:青春华彩写就中国超算世界第一
读特记者 李剑辉 王剑锋 李丽 秦绮蔚/文 何龙 邢峻豪/图、视频
2019-07-31 08:09
收录于专题:中国力量

在无锡市静谧的蠡湖畔,有一处毫不起眼的所在,矗立在写字楼群中的无锡研创大厦,这就是国家超级计算无锡中心。

国家超级计算无锡中心。

2016年6月,世界首台峰值运算能力超过每秒10亿亿次、拥有千万核的超级计算机“神威·太湖之光”在这里诞生,此后连续四次雄踞“全球超级计算机500强”榜首,并蝉联两届乌镇互联网大会“世界领先科技成果”奖;同年11月,基于该系统的应用成果折桂“戈登·贝尔奖”,实现该奖项创办近30年来我国“零的突破”。从此,在国际高性能计算及其应用领域,中国拥有了独立话语权。

“神威·太湖之光”有一颗“中国芯”。

国家超级计算无锡中心副主任、清华大学地球系统科学系教授付昊桓告诉记者,这台超级计算机全面采用由国家高性能集成电路设计中心自主研制的“申威26010”众核处理器,核心部件全部国产化、软硬件系统全部自主可控,是对海外技术封锁和国际限售的有力回击。

“神威·太湖之光”还有哪些突破?

整台计算机峰值速度达到每秒12.54亿亿次,持续计算速度每秒9.3亿亿次,性能功耗比为每瓦60.51亿次,三项关键指标均创当时世界第一。付昊桓补充,超算不仅仅是“速度战”,更要赢得“应用战”,“戈登·贝尔奖”零的突破意味着中国超算应用进入了一个新量级。

那么,这台计算机到底有多快?

“一块5平方厘米左右的‘芯片’集成260个运算核心,数十亿晶体管,拥有每秒3万多亿次计算能力,这样的处理器‘神威·太湖之光’上有40960个。‘神威·太湖之光’超级计算机1分钟的计算能力,大约是全球70多亿人同时用计算器不间断计算32年。”

1000平方米的机房内,这台名副其实的“神算子”正有条不紊地工作着,似静水流深,不闻一丝响动。付昊桓声音不大,却足以把空气凝成一股震撼的力量。

一枚“中国芯”,击碎“封锁咒”

超级计算机堪称“国之重器”。它的问世源于人类对天、地、人的终极探索,在解决气候变暖、地震预警、能源危机、探索宇宙、生命基因等全球超级难题方面,具有不可替代的作用。

“提起超算,有很多故事……”在付昊桓的“故事”里,一个与市民生活似远实近的世界徐徐拉开帷幕。

上世纪80年代,我国已迈入研制巨型机之列,可CPU却只能依赖进口。当时,美国卖给我国一个神秘的“玻璃房”,却连研究都要在其监视之下进行;步入“十二五”,内置英特尔芯片的“天河二号”异军突起,成为世界超算史上第一台实现“全球超级计算机500强”六连冠的超级计算机。2015年4月,美国以“涉核”为由,对华限售英特尔芯片,企图锁死中国超算脚步。

关键核心技术要不来、买不来、讨不来。与其受制于人,不如主动出击。

在“十二五”期间,国家“863计划”重点支持下,由科技部、江苏省和无锡市共同出资,由国家并行计算机工程技术研究中心研制、清华大学管理运维的“神威·太湖之光”身负使命提上日程。

“那是2015年的夏天,刚来时内心十分忐忑。全国产超算架构不同于以往见过的任何一台机器,而且超算应用的交叉性很高,团队需要各领域的跨学科人才,从计算到通讯、架构设计、集成技术、电源配置、水冷技术、软件优化……都要在尖端领域找到出口。”除了挑战前所未有,付昊桓满脑子都是“热晕”的画面。

梅雨、台风、烈日……建设中的机房如同一个闷罐。40个运算机柜、8个网络机柜安装、调试,为保证电路负荷,仅有的空调要优先保证机器运行……自己添置了一堆黑色落地大风扇后,小伙子们常打趣自己像烧烤摊师傅;半年后终于有了空调,可开关时间受限,日夜兼程的研发人员经常如水洗一般。

2015年7月基本完成机房施工;12月31日,主机移交; 2016年1月,清华大学高性能计算研究中心核心团队进驻,启动全年工作清单与时间表“倒计时”……2016年6月20日,国家超级计算无锡中心正式启动。也是这一天,“神威·太湖之光”登上法兰克福国际超算大会发布的新一期“全球超级计算机500强”榜首——这意味着,中国成功打破了长达30年的技术封锁。

而此时,距离海外限售仅一年有余。

“超算不只是计算机,硬件是平台、应用是出口、软件体现水平,三者缺一不可。从低功耗、高集成度的处理器设计,到高速高密度的工程实现技术;从世界领先的高效水冷技术,到软硬件协同、智能化的功耗控制方法,‘神威·太湖之光’实现了层次化、全方位的绿色节能,比‘天河二号’节能60%以上。此外,‘申威26010’的全新异构结构,基于Linux系统优化而成的神威睿思系统,极大提升了基础硬件平台和核心软件系统的安全性。” 中心展厅里,工作人员连神情都写着荣耀。

工作人员对设备进行检查测试。

国之重器,“好用”更要“用好”

国之重器,重在应用。

“超级计算机作为一种战略资源,只有在应用中才能发挥其引领作用。一个系统先让它好用,才能把它用好。” 建设伊始,国家超级计算无锡中心主任、清华大学计算机科学与技术系教授杨广文就带领整个团队剑指应用。而此前,中国超算鲜有顶尖应用成果,国际质疑声比比皆是。

2016年上半年,尚在试运行的“神威·太湖之光”就吸引了八方来客。清华大学、北京大学、国家计算流体力学实验室、远景能源、中国船舶702研究所、中航工业航空动力控制系统研究所等30多家单位与中心缔结合作。此时,海外也高度聚焦,“神威”在“一带一路”倡议下也日渐发挥作用。美国、日本、法国、瑞士、白俄罗斯……海外企业、高校、专家纷至沓来。

“恰如生产一台F1赛车,我们要用全球最好的计算机解决全世界最顶尖的问题。‘神威’成功完成对‘天宫一号’回收路径的精准模拟,20天完成了12个月的计算量。上海药物所开展药物性能研究,‘神威’两周完成了常规10个月的计算任务,大大加速了抗癌等新药设计进度,所耗费的人力物力成本仅为原来的1/20……”

“打个比方,假设硬件允许,这个药物研究项目用个人电脑计算大概需要5-10年时间,但几乎是不可完成的任务……”付昊桓还提供了一组数字,“近三年,无锡中心致力于支持国家重大挑战性应用需求,依托‘神威·太湖之光’完成百余项应用课题计算任务,800多万项作业任务,平均每天完成近10000项作业任务。今年上半年,排期一度供不应求。”

“我们的基础定位是通过超算平台提供三个支柱:支持基础研究拓展学科边界,为国家重大战略提供计算支撑,结合产业发展为工业升级提供辅助。”付昊桓补充道,“超算中心不仅仅是计算力汇聚地,还应该是关键科学和工程数据的集聚地,是一个高效的科研平台。”

2016年-2018年,连续三年6个项目入围被誉为“超级计算应用领域诺贝尔奖”的“戈登·贝尔奖”,“千万核可扩展全球大气动力学全隐式模拟”、“非线性地震模拟”两个项目先后折桂,成为中国超算应用的实力“背书”。前者可全面提高应对极端气候事件和自然灾害的减灾防灾能力;后者可为防震救灾以及地震高发区城市建筑规划设计提供科学依据。

可探索从未因荣誉停歇半步,“2017年国际大数据与E级计算研讨会”在无锡召开,汇集了美国、欧洲、日本等国际高性能计算领域的顶级专家学者。同年,搭载国产众核处理器的小型化工作站“神威小型机”研制成功……

下好“先手棋”,迎接E超算时代

1997年世界首台万亿次机出现,2001年“全球超级计算机500强”名单中没有一台来自中国;2016年中国自主研发的“神威·太湖之光”登上榜首,2018年这份500强名单上,中国独占206席。

“为什么要争世界第一?因为,超算是一个国家最尖端制造实力的集成,是大国科技较量的‘赛点’。”付昊桓解释,“一个超算系统背后是全系技术的极致追求,唯有夯实基础领域才可能实现。自主超算技术创新与产业化跨越发展的新时代已经到来,对各个行业都具有极其重要的战略意义。”

他指出,当下任务是要用足用好超算资源,拓宽加深研究领域、提升技术服务能力、加强专业软件开发、加快技术成果转化,满足国家重大需求及面向制造业升级的计算支撑工作,加速高性能计算技术产业化。“当然,我们还肩负着让国产高端处理器推向市场、推向应用的战略任务。”

目前,“神威·太湖之光”的整机应用涉及天气气候、地球科学、海洋环境、材料设计、生物制药、航空航天、图计算、量子计算、生命科学、天体物理等众多行业;在先进制造、船舶、3D电影、能源、国防等领域也已展开全面布局,并日渐成为百姓生活福祉的一部分——世界领先的超级算力正演化为中国制造强劲的生产能力、经济动力、国家实力。在面向未来的“深度学习和人工智能”领域,超算人工智能平台、“神威深度学习算法库”等项目也逐渐建构出一套完整的解决方案……伴随5G时代的到来,超算更将无处不在。

“特区尤其是深圳前海的发展,非常有创新活力。”采访前,刚刚赴深调研的付昊桓,表达出对大湾区的浓厚兴趣,“无锡中心与深圳一直保持着密切联系,且在高精度雾霾模拟、精准医疗等领域已有深入合作。超算的一个存在价值就是把计算力转化为科研、创新能力,这一点上深圳有着毋庸置疑的优势。非常期待无锡和深圳在超算领域实现双城合作。”

付昊桓补充道,新一轮科技和产业变革正在重构全球创新版图、重塑全球经济结构,目前,中国、美国、欧盟、日本等国家与地区均在积极推进每秒百亿亿次量级的E级计算机研制。“可以预测,未来5-10年,这是国家战略必争之地。”

青年人领衔“国之重器”

“与奖项相比,中心更看重人才培养。”

国家超级计算无锡中心副主任付昊桓带领记者一行来到办公区,这里尚未毕业就投身国之重器的年轻人比比皆是。一如办公室“个性桌牌”上,他们亲笔写下的几个字——“社会主义接班人”。

国家超级计算无锡中心副主任付昊桓与团队进行交流。

“高性能专委会”首位中国“杰出新人”

甘霖是杨广文、付昊桓两位清华教授的优秀弟子,攻读博士时被推荐加入“神威”项目,现任中心研发部部长。

国家超级计算无锡中心研发部部长甘霖。

“初期调试,甘霖和团队每天都要面对几百万行代码,哪怕一个细微错误,都要耗费几天甚至几周时间排除。最终,团队设计出的精巧算法,解决了运算中普遍存在的‘内存带宽受限’问题,让‘神威’如虎添翼。”

“2010年甘霖就参与了‘戈登·贝尔奖’申报,然而,只能基于国外计算机研发运行,始终未能如愿,直到有了‘神威·太湖之光’。”他所在团队2016年摘得“戈登·贝尔奖”,第二年全球仅有3个项目入围终选,甘霖团队依然在列。甘霖也成为“现场可编程逻辑与应用国际会议——25年领域最具影响力论文奖”唯一中国获奖者、摘得“全球超级计算大会——高性能专委会杰出新人奖”的首位中国学者。科研之余,“甘霖们”还主动做起了青少年科普教育的义务宣传员……

正介绍,甘霖脚步匆匆地走过,一席质朴的衬衫一张专注的脸,与这里每一个埋头科研、无问西东的年轻人一般无二。

30岁“老人家”是位应用“专家”

“从粗糙到精细、从单部件到系统、从单学科到跨学科,高精度仿真和模拟已成为现代先进制造业数字化研发的主要手段。然而,国内制造业仍大量依靠海外商用软件,我们要借助‘神威’,把超算能力像‘供电’一样输给企业,提高整体制造水平。”

国家超算无锡中心先进制造部部长任虎。

作为中心为数不多的非90后,国家超算无锡中心先进制造部部长任虎刚满30岁,却自称“老人家”。可在记者看来,这是个如假包换的超算应用“专家”。

中国制造需要创新驱动、绿色发展。航空发动机更新换代以往需要十几年甚至几十年,有了超算几年就实现了;工业设计中精度1%与0.1%,意味着10倍差距;与远景能源合作开展的“全球高分辨率风资源预测”等研究,可助力实现风机的风场设计、精确选址和风资源高效利用,同时,远景能源格林威治平台运行速度也整体提升了4.1倍,每年可以节约数百万机时费……任虎如数家珍。

任虎接受读特记者的采访。

“超算正朝着产业化发展,这是一个宝贵资源,我们有如此好的平台和人才,不把事情做好,会心不安。”任虎认真地说。

90后“元老”以实力赢得尊重

“我1993年的,毕业后在南京工作,中心建成第二年来到无锡,那时中心还没有正式成立应用开发部。黄毅是1991年的,进入中心稍晚一点。”应用平台开发部的乔宇开门见山地介绍着。

乔宇和黄毅接受读特记者的采访。

两个年轻人是辉煌的见证者,更是超算应用的开拓者。“部门21人,是中心第一大部门;处于市场前端,也是唯一一个‘男女比例均衡’的特殊部门。”黄毅开口就是满满的幸福感,“根据用户需求,我们基于不同领域的专业知识和神威数据接口,进行可视化窗口的程序设计,让不懂超算的人也可以完成项目上传等操作。”

去年,他们与一家企业合作设计联合调度平台,第一次会面对方见是几个“毛头小子”,一脸不屑。可历时一年,团队不仅出色完成项目,还顺手为对方解决了不少自有技术难题,结项时已经被对方称为“专家”…… 乔宇说,“每天下午三点‘奶茶时间’是最放松的时刻,品奶茶开脑洞,有时部门会都省了。”

工作人员对设备进行检查测试。

敢于有梦、勇于追梦、勤于圆梦。在攻坚克难的一个个“趣事”里,两个青年曾忐忑、曾摸索,却始终一往无前……记者豁然瞥见他们身后,会议室门上几个字格外醒目——“奋斗的青春最美丽”。

记者手记

太湖之光 镌刻着人才战略蓝图

“超算领域的中国力量是国家力量,是交叉型人才的力量!”采访中,付昊桓脱口而出,为中国力量给出了超算的诠释。

付昊桓感慨,出席国际会议、进行海外交流时,欧美国家代表是有二三十年经验的科学家、工程师,无锡代表是清一水儿的年轻人。可就是这样一群青年把自己打造成了“权威”:携手“神威·太湖之光”不断开辟应用新天地,去年又将“神图”送入“戈登·贝尔奖”决赛,成功突围美国最新超级计算机“巅峰”。

走出研创大厦,吟白路转向鸿桥路,交叉路口的一丛矮墙上,“国家超级计算(无锡)中心”几个黑色铸字,不经意地提醒着过往的人们,这里是超算的中国力量所在。再回首,那一张张年轻的面庞、坚毅的眼神都让我们如此笃定地相信,中国比任何时候都更需要这样的知识与胆略,世界领先的科技蓝图正在年轻一代的手中实践、落地,变成中国发展的坚实足迹。

“中国力量”报道团采访国家超级计算无锡中心项目。

编辑 郑蔚珩

(作者:读特记者 李剑辉 王剑锋 李丽 秦绮蔚/文 何龙 邢峻豪/图、视频)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读
读特热榜
IN视频
鹏友圈

首页