“要尽快启动E级超算整机系统建设,距离2020年的建设目标只有两年多的时间了。”3月6日,全国人大代表、青岛海洋科学与技术国家实验室主任吴立新院士在接受科技日报记者采访时连连感慨,“时间太紧迫了”。
因为在吴立新看来,中美超算竞争的窗口期恰在2020年,我国应尽快确定超算建设方案及建设单位。
中国超算冠军宝座或难保
吴立新说的E级超算,是我国已经在规划建设的每秒可进行百亿亿次并行计算的下一代超级计算机。“它是我们实施创新驱动发展、海洋强国战略等重大举措,及开展全球气候研究、能源矿产勘探、生物医药研发、战场环境保障、人工智能支撑等必不可少的大科学装置。”吴立新强调。
中国摘取皇冠雄心勃勃,我国已将E级超算的研究写入了“十三五”规划。
我国“神威·太湖之光”连续两年领先全球,天河系列也曾全球领先,超算成为我们国家国际竞争力的重要标志和国家科技创新能力的国际名片。不过领先优势岌岌可危,美国2018年夏天就会在橡树岭和劳伦斯两大国家实验室分别建设200P和130P的超算。
而且,美国布局的第三台超算是计划安装在阿贡国家实验室的E级超算,正加紧研制,计划于2021年建成。
“在2018年、2019年,我们有可能失去全球领先地位,如何积极应对,成为一个挑战。”吴立新说。
中国计算机学会高性能计算专委会秘书长、九三学社中央科技委委员张云泉听到吴立新的建议后,脱口而出:“我完全赞成。”他告诉科技日报记者,过段时间相关单位会发布研制指南,此次或将研制两台E级超算。“不过就2020年的建设目标来说,进度确实稍有些慢。”
超算应用远远滞后于超算能力
若E级超算建成,另一个问题就显得越发重要——我国超算应用发展还远远滞后于超算能力的发展。“如果应用的短板补不上,就会造成算力的浪费。”张云泉表示。
2018年两会,九三学社中央就提出了关于将超算速度优势转化为应用优势的建议。
“目前运行的大部分作业,其并行规模仍停留在几千或几万个处理器甚至更低的量级,没有切实发挥出千万亿次量级超级计算机上几十万甚至百万核并行的能力。”张云泉告诉科技日报记者,在超算应用比较多的制造业和基础科研等关键领域,大部分应用软件都被国外垄断,“有些人家还不卖给你”。
应用软件开发难在哪儿?张云泉说,不同于超算硬件,超算软件开发的周期更长,动辄需要二三十年。它要经历科学问题建模、网格划分、求解数学方程、算法设计、运行验证等一系列流程,还牵涉到多种学科,“非常复杂”。
由于此前对应用软件不够重视,软件和硬件没能并肩奔跑。现在,软件在迎头追上,可是仍然有差距。“经费不够,研发力量分散,软件人才严重匮乏……都是现实困难。”张云泉说。
九三学社中央在提案中建议,成立若干国家级超级计算并行应用软件行业工程中心,制定我国超级计算机应用中长期研究规划和路线图,着力开展应用相关的基础问题和关键共性技术研究。“此外,中心应以重大专项为牵引,集中多学科人才和资源,稳定研发方向和人才队伍。也要统筹协调研制计划和经费安排,使得软硬件经费投入比尽量做到1:1。”
可与国家实验室建设结合
吴立新也表示,以大型综合性研究基地为载体来建设超算中心才能更好地促进应用。“纵观国际,尤其是美国,超算中心大部分都建在国家实验室,因为超算是一种非常重要的手段,支撑综合基础研究、应用基础研究以及技术研发,而后者又能促进超算技术的发展,形成协同生态发展。”他说,目前我国正处于建设国家实验室的战略机遇期,应抓住机会思考如何将超算和国家实验室的建设结合在一起。
“现在几所建设中的科学城都有超算团队,但他们只是运维团队,并不负责软件开发。”张云泉说。九三学社中央也建议,鼓励超算中心联合应用部门组建联合实验室。实验室主任由应用方的学科带头人担任,超算中心提供高性能运算支持并指导或协助进行程序移植,自主研发大型并行应用软件,并通过应用在用户中培养人才。(记者 张盖伦 操秀英)