首页 » 通讯 » Marvell宣布OCTEON 10 DPU平台:采用ARM N2 CPU内核与5nm制程_吞吐量_该公司

Marvell宣布OCTEON 10 DPU平台:采用ARM N2 CPU内核与5nm制程_吞吐量_该公司

神尊大人 2024-09-06 12:29:47 0

扫一扫用手机浏览

文章目录 [+]

上一代的 OCTEON TX 和 OCTEON TX2,仅被 Marvel 称作“根本架构处理器”。
而最新的 OCTEON 10 平台,则被该公司称作 DPU 加速器。
这种类型的多功能芯片,旨在帮助移动和处理那些通过网络传输的数据。

在 OCTEON 10 身上,我们不仅看到了与上一代相同的多功能构建块阵列,还看到了某些前辈的 IP、以及一些新功能。
比如集成机器学习推理的引擎、内联加密处理器、以及矢量数据包处理器,且它们都能够以虚拟化办法运行。

Marvell宣布OCTEON 10 DPU平台:采用ARM N2 CPU内核与5nm制程_吞吐量_该公司 Marvell宣布OCTEON 10 DPU平台:采用ARM N2 CPU内核与5nm制程_吞吐量_该公司 通讯

值得一提的是,OCTEON 10 也是 Marvell 首款采取台积电 N5P 工艺制造的 DPU 芯片。
其不仅率先集成了 ARM 的 Neoverse N2 CPU 核心,还支持最新的 PCIe 5.0 I/O 与 DDR5 内存。

Marvell宣布OCTEON 10 DPU平台:采用ARM N2 CPU内核与5nm制程_吞吐量_该公司 Marvell宣布OCTEON 10 DPU平台:采用ARM N2 CPU内核与5nm制程_吞吐量_该公司 通讯
(图片来自网络侵删)

作为 DPU 的主要补充,Marvell 还为 OCTEON 10 引入了内部机器学习(ML)引擎。
只管去年完成的早期 IP,最初是为专用型的推理加速运用而打造的。

但在激烈的市场竞争面前,该公司还是决定暂时按下不表,直到将 ML 加速器集成到最新的 OCTEON DPU 芯片中。

Marvel 指出,将推理加速器放到同一芯片、并直接集成到数据管道中,对付此类数据流用例所需的高吞吐量 / 低延迟处理至关主要。

与此同时,Marvel 正在为英伟达下一代 BlueField-3 DPU 供应优于竞争对手的办理方案,尤其在 AI 处理性能和产能等方面。

据悉,首批 OCTEON 10 产品估量将于 2021 年底前出样,而英伟达 BF2 则要等到 2022 年。

此外 OCTEON 10 新系列引入了矢量数据包处理引擎,与当前一代的标量处理引擎比较,它能够将数据包的处理吞吐量,大幅提升至 5 倍。

如前所述,OCTEON 10 DPU 系列是首款公开宣告采取 ARM 最新的 Neoverse N2 根本架构的 CPU IP 设计。

AnandTech 在数月前先容过 N2 与面向高性能打算的 HPC V1,可知与亚马逊 Graviton2 或 Ampere Altra 比较,其承诺带来 40% 的性能提升。

对付 Marvell 而言,在从 TX CPU 核心切换到 N2 之后,其单线程性能亦有望提升 3 倍。
2020 年底的时候,该公司已宣告停用自家的 CPU IP,转而支持 ARM 的 Neoverse 内核。

从 DPU 用例来看,这款 Armv9 CPU 也支持 SVE2,个中包含了有利于数据处理和机器学习功能的主要指令,这点较英伟达 BlueField3 DPU 设计具有很大的上风(后者仍勾留在 Armv8.2+ 的 Cortex-A78 内核)。

Marvel 还为 N2 配备了完全的缓存选项,包括 64KB L1I 和 L1D 缓存,以及完全的 1MB L2 缓存。
不过在网状网络办理方案上,Marvell 还是选择了为该 SoC 集成自家的设计。

这部分的规格相称高,网状网络中供应了 256-bit 数据路径,辅以 2MB 的 L3 共享缓存,并且能够随着核心数量的增加而加大。

在交流集成和网络吞吐量方面,Marvell 结合了 1 Tbps 交流与多达 16 路 50G MAC 整合到了一起,只管实际产品 SKU 还是会针对特定场景而有所区分。

AnandTech 指出,OCTEON 10 系列涵盖了广泛的运用,从 4G / 5G RAN 数字 / 中心单元、到前传网关 \ vRAN 卸载处理器等。

在云和数据中央用例上,这些办理方案可在打算与网络吞吐量性能方面,供应广泛的多功能性。
对付企业而言,OCTEON 10 系列亦可供应深度集成的数据包处理和安全加速特性。

首个 OCTEON 10 产品将基于 CN106XX 设计,在 PCIe 5.0 形状尺寸上供应了 24 个 N2 内核 + 双路 100GbE QSFP56 端口,

目前 CN106XX 已经完成流片,估量将于 2021 下半年出样,且有望在 4 季度上市。
规格方面,Marvell 对 OCTEON 10 系列的各种设计进行了细分。

比如本文先容的 DDR5 掌握器特指 40-bit 通道(含 8-bit ECC),辅以 SPECint2006 基准测试的性能参考数据。

此外 Marvell 准备了其余三款 OCTEON 10 SKU,包括仅配备 8 个 N2 内核、TDP 低至 10-25W 的入门级 CN103XX,两款改进网络连接的高端款 CN106XXS,以及多达 32 个 N2 内核、运算能力和网络连接吞吐量都最高的旗舰级 DPU400 。

好是,即便是规格最强的产品,其热设计功耗也只有 60W,远低于当前一代 CN98XX Octeon TX2 旗舰 SKU 的 80-120W。
不过这些产品尚未流片,估量出样韶光为 2022 年。

Marvell 总结道,该公司在 DPU 出货量方面一贯处于行业领先地位,且在所有大型数据中央都有广泛的支配。
随着全新一代 OCTEON 10 系列产品的到来,其将在性能和效率方面拥有更显著的竞争上风。

标签:

相关文章