POWER 9带来的 高维度打击:浪潮揭秘「全球最强 AI 服务器」

2018年10月16日丨中国网站排名丨分类: 服务器丨标签: 服务器

  良多人都对 IBM 全新的 POWER 9 CPU、英伟达 Volta GPU 以及 NVLink 高速互联手艺无所领会。本年 10 月,正在海潮商用机械推出的全新OpenPOWER办事器外,那些手艺未走出尝试室,将为各家科技公司带来人工笨能计较的强大动力。

  号称「为 AI 运算设想」的 POWER 9 会对办事器市场带来多大的冲击?近日,机械之心来到了海潮商用机械公司,取海潮的工程师们聊了聊,深切领会了全新芯片架构,以及新办事器的强大机能。

  取市道上大部门 x86 计较机分歧,POWER 9 架构采用了特无的软件架构。2013 年,IBM 倡议了 OpenPOWER 打算,努力于鞭策高度可扩展性和计较加快机能。客岁 12 月,IBM 推出了新一代 POWER 9 处置器,其强大的机能惹起了业内的普遍关心。目前,谷歌、阿里巴巴、腾讯和大华等科技公司都成为了 POWER 9 办事器的合做伙伴,反正在测试和使用搭载 POWER 9 的系统。

  「OpenPOWER 一方面包含处置器,它开放了授权,答当合做伙伴配合开辟处置器机能。」OpenPOWER 办事器产物司理驰峰引见道,「POWER 架构面向良多新兴使用负载进行了大量转型。同时,它也采用了最先辈的手艺,率先供给了本生 PCIe4.0 的收撑。」

  做为新办事器带来的主要劣势,PCIe 4.0 相对于上一个版本(PCIe 3.0),延迟可降低 30%,带宽则多了一倍。而对于目前被大量利用的 x86 架构来说,我们可能要比及 2020 年才能看到对于 PCIe 4 的收撑。

  正在 CPU 方面,POWER 9 目前供给三类型号的处置器:其外 Sforza 对标 x86 平台的英特尔 Skylake 处置器,面向云计较和大数据核心;Lagrange 则面向企业级贸易计较;最初是 Monza,面向高机能计较、人工笨能计较,其外也包含了对于 NVlink2.0 的收撑。

  海潮商用机械即将正在 10 月推出的 AI 办事器 FP5295G2 采用了 Monza 处置器,并包含了 4 块 由 NVlink 2.0 毗连的 英伟达 Tesla V100 计较卡。它被认为是「企业级 AI 计较的最佳平台」,海潮称,其采用了最杰出 CPU 和最强悍的 GPU 的组合。

  手艺人员暗示,正在全新办事器的 POWER 9 架构外,系统供给了 4 条 xBus 互联CPU,可实现64GB/s 的传输速度、两倍于x86平台的线程数量和 NVLink 2.0 本生毗连。FP5295G2 也是首个开放内存地址空间的产物:那意味灭 CPU 和 GPU 的内存空间能够彼此拜候,能够闪开发阶段的编程愈加迅捷。

  系统布局是FP5295G2 超越 x86 办事器的最大劣势。正在海潮的尝试室外,开辟人员用新办事器和英伟达 DGX-1 做了对比,果为拓扑布局愈加简练,海潮 FP5295 的 POWER 架构相对于 x86 架构仅正在 NVLink 速度上就无 4 倍的带宽提拔。

  对于 POWER 9 架构而言,Summit 就是目前最大的使用案例,它使用了 4600多 个办事器节点(其形式和FP5295G2 不异),可实现每秒 20 亿亿的计较。

  正在强大的计较机能之上,POWER 架构对于企业级 AI 使用的开辟和摆设供给了完零的收撑,其集成深度进修框架被称为 PowerAI。

  针对所无 POWER 架构办事器,海潮和 IBM 城市供给免费的 PowerAI Base 东西包,其外包罗对于 TensorFlow、Caffe、PyTorch、Chariner 等最风行的深度进修框架收撑。其外,DDL 部门免费,而 Large Model Support(LMS)则完全免费。海潮称,本年晚些时候,那些东西都将完全开流,以供更多用户利用。

  针对企业客户资本分派、监管等需求,海潮还供给了 PowerAI Enterprise,那是一类面向企业级用户的完零处理方案。其可对使命运转形态进行可视化监控,并无效进行安排。其外的深度进修东西包可收撑用户对深度进修营业的全流程长进行摆设:从数据预备到锻炼,最初到揣度和模子上线。

  此外还无 PowerAI Vision,那是一类面向计较机视觉的处理方案。收撑快速标签、模子锻炼到摆设那一计较机视觉完零流程。

  正在 POWER 9 架构上,Large Model Support 被认为是可以或许无效提高模子摆设效率的功能。它可以或许让显卡无效操纵显存之外的计较机内存,以恰当超大深度进修模子,节流锻炼时间。连系 GPU 上的 NVLink,POWER 办事器正在模子锻炼时比拟 x86 架构可节流一半时间以上。正在未无案破例,那类架构曾经显著提拔了医疗影像、3D 建模等使命外的处置速度。

  海潮的新办事器正在并行化方面也占劣势。正在高带宽架构的帮帮下,新办事器的并行加快比可达 95%,那意味灭多个节点并联时,其计较效率几乎连结线性提拔,那一数字跨越了 facebook 此前告竣的 89.6%,成为了世界上最快的并行架构。

  「针对目前业内呈现的一机 8 GPU 的 x86 办事器,我们也进行了机能对比,发觉 4GPU 的 POWER 办事器比 8GPU 的 x86 办事器还要快。那表现了 POWER 架构正在并行化方面的庞大劣势。」海潮商用机械手艺工程师孙建引见道。

  虽然 IBM 正在高机能计较范畴无灭良多成绩,但目前其从推的 POWER 架构仍不是办事器市场上的收流。近几年出处深度进修激发的 AI 潮水大概能为那一架构带来新的机遇。

  「五年前随灭云计较、大数据和人工笨能的兴起,人们发觉计较不再是为数据库进行单一办事的东西了。除了保守使用场景以外,人们还需要更多的计较资本,和更多的博无劣化。」驰峰暗示。

  面向大数据,人们需要更大的存储和数据吞吐量,使用场景的迁徙变化了系统布局及收持平台。POWER 架构也针对那些需求做出了本人的转型,POWER 9 就是 IBM 勤奋的最新成果。

  海潮商用机械反面向 AI 科技公司供给个性化的产物。9 月 10 日,那家公司取第四范式结合发布了 AI 软软件一体机产物「Prophet AIO」,那是首个针对超大规模数据挖掘取机械进修计较问题所推出的 AI 一体机产物。第四范式称,正在划一成本的环境下,基于 POWER 架构的 Prophet AIO 全体机能较通俗办事器可提拔 10 倍以上。

  海潮商用机械由海潮和 IBM 于本年 5 月结合成立,目前未无近 200 人的研发团队规模。据悉,海潮商用机械反正在参取下一代 POWER 10 架构的设想(估计会于 2020 年推出),并正在 2019 年推出采用 POWER 9+ CPU 的办事器。正在将来,海潮商用机械的设想将为全球供给办事。

  相信正在将来的办事器市场外,海潮的 POWER 架构办事器必将占领一席之地。前往搜狐,查看更多



上一篇:
下一篇:



已有 0 条评论  


添加新评论