经济日报本日宣布了神威E级超算原型机的,经济日报看到,神威E级原型机放置在一个玄色机柜中,机柜门上镶嵌着“神威E级原型验证系统”字样。“神威E级原型机就好比是一台能够上路的观点车,原型机的成功研制,对E级打算机研制方案和技能路线进行了全面系统验证,为下一步E级打算机的研制成功铺平了道路。”山东省打算中央(国家超级打算济南中央)主任杨美红先容,神威E级原型机系统紧张由硬件、软件和运用三大系统组成。其处理器、网络芯片组、存储和管理系统等核心器件全部为国产化。
这一原型机的系统软件,由完备自主研发的神威睿思操作系统、神威睿智编译器等构建。运算系统全部采取“神威26010+”众核处理器,高速互连网络系统全部采取申威网络交流芯片、申威处理芯片,这些关键部件均具备完备自主知识产权。存储和管理系统由申威多核处理器构建,实现对该领域产品的国产化替代。

此前,国家超级打算济南中央已支配有中国首台全部采取国产CPU和系统软件构建的千万亿次打算机—“神威·蓝光”,至今已运行7年。现在神威E级原型机的运算能力达到“神威·蓝光”的3倍,体积仅为后者的九分之一,能耗同比低落75%。

这不是神威E级超算第一次被媒体宣布,但这是首次有媒体明确提到神威E级超算的处理器——申威26010+,这个名字跟目前神威·太湖之光上利用的申威26010(SW26010)处理器很相似,有情由相信神威E级超算利用的是升级版的SW26010处理器,架构设计坚持之前的4+256核不变,但是规格、性能会大幅提升。
申威处理器是海内的上海江南所研发,上文提到的神威蓝光超算利用的是SW1600处理器,2010年问世,当时利用的是DEC Alpha指令集,而2016年神威·太湖之光首次得到TOP500冠军之后,田纳西大学教授、TOP500创始人Dongarra Jack曾经先容过SW26010处理器,他的文档中也提到了是Alpha指令集体系,不过后来申威方面表示SW26010的指令集已经是自己开拓的申威64。虽然详情还不清楚,不过申威处理器的指令集有点类似龙芯购买MIPS指令集之后自行开拓的情形,现在利用的处理器指令集跟最初版本相比已经是魔改了,没多大关系了。
申威26010处理器的紧张规格
申威SW26010处理器支持乱序实行,频率1.45GHz,260个核心,全体处理器包括4个MPE(Management Processing Element)管理单元、4个CPE(Computing Processing Element)打算单元及4个MC内存掌握器单元组成,个中CPE单元又由8x8阵列的64核心组成,以是总计是260个核心(4x64+4=260)。
这样1个处理器便是1个节点,每个节点8GB DDR3内存,256个节点组成1个超级节点,160个超级节点互联连接,因此总计是40960个节点,10649600个核心,内存容量1.3PB。
申威26010处理器的浮点性能可达3.06TFLOPS,这个性能跟英特尔的14nm工艺72核Xeon Phi加速卡的3TLFOPS性能差不多,而且这两个产品都是MIC众核架构的。
至于经济日报提到的申威26010+处理器,现在还没有详细资料,但从命名上看是升级版的申威26010处理器,后者目前的频率只有1.45GHz,同时支持的还是DDR3内存,虽然没有确切资料提到申威26010的制程工艺,但考虑到研发的韶光点及海内的工艺情形,它最多是28nm工艺的,而现在的申威26010处理器显然不可能再利用28nm工艺了,如果利用16/14nm工艺制造,那么处理器频率会大幅提升,比如2.5GHz下性能大概就可以提升60%了。
除了频率 、架构优化之外,神威26010+处理器在缓存、内存等方面也有提升的余地,之前的申威26010在测试中就反响出内存、缓存性能不敷的问题,这部分也是改进的重点。
太湖之光超算的性能是12.5亿亿次,Linpack性能是9.3亿亿次,要想变成百亿亿次超算,不是大略提升10倍规模那么大略,由于还要考虑到能效及体积问题,提升性能的关键还是看处理器及网络节点等核心部件。








