高性能计算与AI融合之路已在脚下

七月流火,八月未央。

2019年8月22日,第十五届全国高性能计算学术年会在内蒙古呼和浩特举办。《亲爱的数据》观察到,高性能计算与人工智能正在融合之路上前进。

高性能计算跟人工智能的深度融合已经可以看到趋势了。早在2018年6月,中国高性能计算机性能榜单中的几台新的计算机都声称具有支撑人工智能的能力,从这点就可以看出,人工智能的能力已经是现在高性能计算界比较关注的一点了。

国家并行计算机工程技术研究中心总工程师、中国工程院院士陈左宁曾在上届学术年会上专门探讨“云端AI高性能计算计算能力及计算环境研究”。在会上她提出,现阶段HPC与AI融合问题的关键在于两个方面:

第一、在HPC体系结构发生改变的过渡阶段,如何在AI的演进阶段支撑其计算能力需求,“这是目前HPC应该考虑的问题”。

第二、说得简单点,现在的问题,有点像是人工智能所需要的能力,高性能计算没给它提升上去。而已经能够提供的能力,却是人工智能不需要的这种计算能力。

困难依然存在,但融合不会止步。

高性能计算未来趋势与AI高度相关。清华大学计算机系教授、本届年会共同主席郑纬民也这样认为。他在大会上用一句话总结高性能计算未来趋势——AI+科学计算。他提出的两个趋势分别是:

一、异构架构在超算系统构建层面被广泛接受。他解释道,“TOP 10系统中异构超算占据7成,异构架构已经成为构建顶级超算系统的大势所趋,加速器异构还是异构众核之争还将继续。”

二、人工智能应用有望成为超算主流应用之一。随着深度神经网络规模的扩大,最新的网络生成和训练往往需要数万GPU小时(如BERT, NASNet等)甚至更多,具有顶级计算能力的超算系统理应为大规模人工智能应用提供支持。

这次,郑纬民教授的报告主题是《从2019年TOP500和2018年戈登贝尔奖看E级超级计算机与应用发展趋势报告》。据报告介绍,高性能计算是一个国家综合国力的体现,最近十几年来取得了非常大的进展。国家的高性能计算机已在世界Top500强排行榜里位列第一, 2016年和2017年连续两次夺得了高性能计算应用专项奖-戈登贝尔奖。

高性能计算实力增强已是事实,如何与人工智能融合值得期待。

香港中文大学教授黄铠分享了融合超算云与5G边缘计算升级大数据智能物联网应用,他认为,今天人工智能更应该强调群体智能,比如几千个无人飞机,不光是计算问题,协调问题。控制问题更大。同时他认为严格讲,超算和云不分家。今天基于计算机视觉在云、终端设备和AI芯片集成上已经服务生活各个方面。

黄铠教授谈到,华为2019年在5G网络领域取得进展,并预计到2025年在全球实现增长。2019年,华为5G实现了15 Gbps的数据速率,比竞争对手快15-24倍。在全球范围内,华为5G系统目前有50个国际订单,拥有30-35%的5G基站。华为预计,到2025年,58%的人口将使用5G,14%的家庭将使用机器人管家,97%的企业将采用人工智能。

英特尔公司数据中心集团副总裁兼E级计算业务总经理Trish A.Damkroger,认为当今世界正在以数据中心进行创新,HPC也从小众的应用走向大众。今天传统的HPC正在向融合平台进化。因此高性能基础设施成为基础,需要更先进的互联、更快的计算,更强的存储和内存。高性能在计算流、人工智能仿真加速以及AI替换方面发挥重大的作用。

英特尔在三个层面为数据中心加速创新。在技术基础架构上通过嵌入式CPU 和AI处理器实现创新,在内存和存储层面通过扩张内存和存储层次结构来提升性能和容量。在软件方面抽象可读、可维护、可移植的软件架构创新。

期间,Trish A.Damkroger女士邀请第四范式上台分享了采用了最新的英特尔CPU和傲腾内存和存储技术的SageOne高性能AI软硬一体集成系统,大幅度提升AI训练、推理和特征存储的性能表现

从2018开始,内蒙古自治区科技厅与和林格尔新区共同启动超算中心即内蒙古高性能计算公共服务平台建设工作,旨在推动内蒙古的数据存储能力与计算能力同步发展,把内蒙古打造成新一代信息技术创新发展的良好生态区。

内蒙古高性能计算公共服务平台项目,总投资是3亿元人民币,项目建设包括通用计算系统、人工智能加速计算系统、大数据存储支撑系统、节点互联网络、配套基础设施五部分内容,平台建设要求浮点运营能力不低于10Pflops、存储容量不少于80PB、理论存储聚合带宽不低于800GB/s。

其理论峰值计算能力可在2018年发布的国内高性能计算TOP100排名中名列前3位,CPU+GPU混合算力的理论峰值计算能力也可排到第3位。项目建成后,将支持科学计算、人工智能、大数据处理等方面的计算需求,助力内蒙古自治区高科技产业发展和智慧内蒙古建设,成为国际先进、国内领先的高性能计算公共服务平台。