首页 » 智能 » 最强AI芯片英伟达H200宣告:HBM容量提升76%大年夜模型机能提升90%_英伟_芯片

最强AI芯片英伟达H200宣告:HBM容量提升76%大年夜模型机能提升90%_英伟_芯片

神尊大人 2024-08-30 17:19:06 0

扫一扫用手机浏览

文章目录 [+]

11月14日,英伟达(Nvidia)于当地韶光13日上午在 “Supercomputing 23”会议上正式发布了全新的H200 GPU,以及更新后的GH200 产品线。

个中,H200依然是建立在现有的 Hopper H100 架构之上,但增加了更多高带宽内存(HBM3e),从而更好地处理开拓和履行人工智能所需的大型数据集,使得运行大模型的综合性能比较前代H100提升了60%到90%。
而更新后的GH200,也将为下一代 AI 超级打算机供应动力。
2024 年将会有超过 200 exaflops 的 AI 打算能力上线。

最强AI芯片英伟达H200宣告:HBM容量提升76%大年夜模型机能提升90%_英伟_芯片 最强AI芯片英伟达H200宣告:HBM容量提升76%大年夜模型机能提升90%_英伟_芯片 智能

H200:HBM容量提升76%,大模型性能提升90%

最强AI芯片英伟达H200宣告:HBM容量提升76%大年夜模型机能提升90%_英伟_芯片 最强AI芯片英伟达H200宣告:HBM容量提升76%大年夜模型机能提升90%_英伟_芯片 智能
(图片来自网络侵删)

详细来说,全新的H200供应了统共高达141GB 的 HBM3e 内存,有效运行速率约为 6.25 Gbps,六个 HBM3e 堆栈中每个 GPU 的总带宽为 4.8 TB/s。
与上一代的H100(具有 80GB HBM3 和 3.35 TB/s 带宽)比较,这是一个巨大的改进,HBM容量提升了超过76%。
官方供应的数据显示,在运行大模型时,H200比较H100将带来60%(GPT3 175B)到90%(Llama 2 70B)的提升。

虽然H100 的某些配置确实供应了更多内存,例如 H100 NVL 将两块板配对,并供应总计 188GB 内存(每个 GPU 94GB),但即便是与 H100 SXM 变体比较,新的 H200 SXM 也供应了 76% 以上的内存容量和 43 % 更多带宽。

须要指出的是,H200原始打算性能彷佛没有太大变革。
英伟达展示的唯一表示打算性能的幻灯片是基于利用了 8 个 GPU的HGX 200 配置,总性能为“32 PFLOPS FP8”。
而最初的H100供应了3,958 teraflops 的 FP8算力,因此八个这样的 GPU 也供应了大约32 PFLOPS 的 FP8算力。

那么更多的高带宽内存究竟带来了哪些提升呢?这将取决于事情量。
对付像 GPT-3 这样的大模型(LLM)来说,将会大大受益于HBM内存容量增加。
英伟达表示,H200在运行GPT-3时的性能,将比原始 A100 赶过 18 倍,同时也比H100快11倍旁边。
还有即将推出的 Blackwell B100 的预报片,不过目前它只包含一个逐渐变黑的更高条,大约达到了H200的两倍最右。

不仅如此,H200和H100是相互兼容的。
也便是说,利用H100演习/推理模型的AI企业,可以无缝改换成最新的H200芯片
云端做事商将H200新增到产品组合时也不须要进行任何修正。

英伟达表示,通过推出新产品,他们希望跟上用于创建人工智能模型和做事的数据集规模的增长。
增强的内存能力将使H200在向软件供应数据的过程中更快速,这个过程有助于演习人工智能实行识别图像和语音等任务。

“整合更快、更大容量的HBM內存有助于对运算哀求较高的任务提升性能,包括天生式AI模型和高效能运算运用程序,同时优化GPU利用率和效率”,NVIDIA高性能打算产品副总裁Ian Buck表示。

英伟达数据中央产品卖力人迪翁·哈里斯(Dion Harris)表示:“当你看看市场上正在发生的事情,你会创造模型的规模正在迅速扩大。
这是我们连续迅速引进最新和最精良技能的又一个例子。

估量大型打算机制造商和云做事供应商将于2024年第二季度开始利用H200。
英伟达做事器制造伙伴(包括永擎、华硕、戴尔、Eviden、技嘉、HPE、鸿佰、遐想、云达、美超威、纬创资通以及纬颖科技)可以利用H200更新现有系统,而亚马逊、Google、微软、甲骨文等将成为首批采取H200的云端做事商。

鉴于目前市场对付英伟达AI芯片的兴旺需求,以及全新的H200增加了更多的昂贵的HBM3e内存,因此H200的价格肯定会更昂贵。
英伟达没有列出它的价格,但上一代H100价格就已经高达25,000美元至40,000美元。

英伟达发言人Kristin Uchiyama指出,终极定价将由英伟达制造伙伴制订。

至于H200推出后,会不会影响H100生产,Kristin Uchiyama则表示:“你会看到我们整年的整体供应量有所增加”。

一贯以来,英伟达的高端AI芯片被视为高效处理大量数据和演习大型措辞模型、AI天生工具最佳选择,在揭橥H200之际,AI公司仍在市场上冒死寻求A100/H100芯片。
市场关注的焦点仍在于,英伟达能否向客户供应足够多的供应,以知足市场需求。
因此,H200是否还是会像H100一样供不应求?对此NVIDIA并没有给出答案。

不过,明年对GPU买家来说可能将是一个更有利期间,据《金融时报》8月报导曾指出,NVIDIA操持在2024年将H100产量提升三倍,产量目标将从2023年约50万个增加至2024年200万个。
但天生式AI仍在发达发展,未来需求也可能会更大。

比如最新推出的GPT-4大约是在10000-25000块A100上演习的;Meta的AI大模型须要大约21000块A100;Stability AI用了大概5000块A100;Falcon-40B的演习,用了384块A100。

根据马斯克的说法,GPT-5可能须要30000-50000块H100。
摩根士丹利的说法是25000个GPU。

Sam Altman否认了在演习GPT-5,但却提过“OpenAI的GPU严重短缺,利用我们产品的人越少越好”。

当然,除了英伟达之外,AMD和英特尔也在积极的进入AI市场与英伟达展开竞争。
此前AMD推出的MI300X就配备192GB的HBM3和5.2TB/s的显存带宽,这将使其在容量和带宽上远超H200。

同样,英特尔也操持提升Gaudi AI芯片的HBM容量,最新公布的信息显示,Gaudi 3基于5nm工艺,在BF16事情负载方面的性能将是Gaudi 2的四倍,网络性能也将是其的两倍(Gaudi 2有24个内置的100 GbE RoCE Nic),HBM容量是Gaudi 2的1.5倍(Gaudi 2有96 GB的HBM2E)。
正如我们不才图中所看到的,Gaudi 3转向了具有两个打算集群的基于chiplet的设计,而不是英特尔为Gaudi 2利用的单芯片办理方案。

全新GH200超级芯片:为下一代 AI 超级打算机供应动力

除了全新的H200 GPU之外,英伟达还带来了更新后的GH200超级芯片,它利用NVIDIA NVLink-C2C芯片互连,结合了最新的H200 GPU 和 Grace CPU(不清楚是否为更新一代的),每个 GH200超级芯片还将包含总计 624GB 的内存。

作为比拟,上一代的GH200则是基于H100 GPU和 72 核的Grace CPU,供应了96GB 的 HBM3 和 512 GB 的 LPDDR5X 集成在同一个封装中。

虽然英伟达并未先容GH200超级芯片当中的Grace CPU细节,但是英伟达供应了GH200 和“当代双路 x86 CPU”之间的一些比较。
可以看到,GH200带来了ICON性能8倍的提升,MILC、Quantum Fourier Transform、RAG LLM Inference等更是带来数十倍乃至百倍的提升。

但须要指出的是,个中提到了加速与“非加速系统”。
这意味着什么?我们只能假设 x86 做事器运行的是未完备优化的代码,特殊是考虑到人工智能天下正在快速发展,并且优化方面彷佛定期涌现新的进展。

全新的GH200 还将用于新的 HGX H200 系统。
听说这些与现有的 HGX H100 系统“无缝兼容”,这意味着 HGX H200 可以在相同的安装中利用,以提高性能和内存容量,而无需重新设计根本举动步伐。

据先容,瑞士国家超级打算中央的阿尔卑斯超级打算机(Alps supercomputer)可能是明年第一批投入利用的基于GH100的Grace Hopper 超级打算机之一。
第一个在美国投入利用的 GH200 系统将是洛斯阿拉莫斯国家实验室的 Venado 超级打算机。
德克萨斯高等打算中央 (TACC) Vista 系统同样将利用刚刚宣告的 Grace CPU 和 Grace Hopper 超级芯片,但尚不清楚它们是基于 H100 还是 H200。

目前,即将安装的最大的超级打算机是Jϋlich超级打算中央的Jupiter 超级打算机。
它将容纳“近”24000 个 GH200 超级芯片,统共 93 exaflops 的 AI 打算(大概是利用 FP8,虽然大多数 AI 仍旧利用 BF16 或 FP16)。
它还将供应 1 exaflop 的传统 FP64 打算。
它将利用具有四个 GH200 超级芯片的“Quad GH200”板。

总的来说,英伟达估量这些新的超级打算机的安装将在未来一年旁边实现超过 200 exaflops 的 AI 打算性能。

编辑:芯智讯-浪客剑

标签:

相关文章