首页 » 智能 » 华为DCN 学院派丨200G vs 400G:谁是数据中央收集下一站?_芯片_成本

华为DCN 学院派丨200G vs 400G:谁是数据中央收集下一站?_芯片_成本

萌界大人物 2024-12-06 04:33:00 0

扫一扫用手机浏览

文章目录 [+]

DCN学院派将精选优质内容,分享数据中央网络最新的前沿趋势、家当不雅观点和技能创新。

互联网联接环球 40 亿多用户,支撑着VR/AR、16K视频、自动驾驶、人工智能、5G、物联网等层出不穷的数字化运用。
教诲、医疗、办公等用户线上与线下的结合,正在影响和改变人们生活的方方面面。

华为DCN 学院派丨200G vs 400G:谁是数据中央收集下一站?_芯片_成本 华为DCN 学院派丨200G vs 400G:谁是数据中央收集下一站?_芯片_成本 智能

数据中央网络,作为互联网业务赖以生存和发展的根本举动步伐,早已从最初的千兆、万兆网络,走到了“25G接入+100G互联”规模支配的阶段。

华为DCN 学院派丨200G vs 400G:谁是数据中央收集下一站?_芯片_成本 华为DCN 学院派丨200G vs 400G:谁是数据中央收集下一站?_芯片_成本 智能
(图片来自网络侵删)
100G互联 全盒架构被大型互联网企业看重

“25G接入+100G互联”的架构下,数据中央网络通过三级组网实现大规模接入,单集群做事器规模可以超过10万台。

如下图所示,基于T1和T2层的Pod可以像乐高积木一样灵巧扩展,按需培植。

随着大容量转发芯片的能力提升以及100G光互联本钱的降落,市场上涌现了单芯片交流机设备构建100G互联的全盒式设备组网方案。
这种单芯片多平面的互联方案,以12.8T芯片为范例代表,单芯片可供应128x100G的端口密度,单个POD可供应2000台做事器的接入能力。

图2:范例128口100GE高密盒式交流机

全盒式设备组网方案,相对传统框盒设备方案,虽然网络节点数量和设备间的光互联模块数量有所增加,带来了运维事情量的增长,但因引入了高性能转发芯片,有效降落了数据中央网络端口的单比特本钱,对大型互联网企业吸引力很强。
大型互联网企业一方面快速引入100G全盒架构,以降落网络培植本钱,另一方面基于自身较强的研发能力,提升网络自动化支配和掩护水平来应对运维事情量增长寻衅。

因此,大型互联网企业对付100G网络方案思路趋同,全盒设备组网成为100GE网络架构演进的基座。

网络提速成为一定,谁会是下一站

25G接入+100G互联网络方案匆匆成芯片选型的统一和快速上量,充分解释了技能红利驱动了IDC网络架构的快速演进。
随着单芯片网络产品的推出,100G代际的技能红利也已经得到了完备的获取。

在当前业务持续快速发展的背景下,带宽升级成为一定。
一个选择题摆到了企业面前:选200G还是400G?

网络从来都不是伶仃的存在,家当的环境是决定技能是否能够发展、成熟的大土壤。

我们先从网络标准、做事器和光模块三方面核阅下200G和400G的家当现状。

200G vs 400G标准:协议标准均已成熟

在IEEE 协议标准演进过程中,200G标准启动晚于400G标准。

IEEE 802.3以太网事情组(Working Group)在完成BWA I(Bandwidth Assessment I)项目调研后,于2013年立项制订400G标准。
2015年,为了进一步扩展市场范围纳入50G做事器和200G交流机规格,IEEE成立802.3cd项目,启动制订200G标准。

因200G与400G规格具备干系性,200G单模规格终极纳入了802.3bs项目。
届时,400G已经基本完成PCS、PMA、PMD的紧张设计,200G单模规格总体上是基于400G单模规格减半制订。

2017年12月6日,IEEE 802终极批准IEEE 802.3bs 400G以太标准规范,包含400G以太和200G以太单模,标准正式发布。
IEEE 802.3cd 定义了200G以太多模的标准,于2018年12月正式发布。

图3:IEEE 802.3bs 400GE 标准关键里程碑

如下表所见,400G已实现全场景的标准支持,包括100m、500m、2km和长距80km。

50G vs 100G做事器:100G做事器将会成为主流

图4:剖析师机构对网卡和做事器的发货趋势预测

根据剖析师机构CREHAN的预测,截止2019年,50G和100G网卡都已经启动发货。
25G网卡的下一代升级选择上,全体家当在2018和2019年存在着摇摆。
2019年50G和100G做事器发货量产生了逆转,但2020年后100G做事器的势头全面超越了50G做事器,家当又开始对100G做事器充满信心。

从CPU芯片来看,两家主流厂商I厂和A厂都陆续推出了新的产品路标。
I厂支持PCIe 4.0的芯片将于2020年Q3推出,主流I/O达到50G,高端运用时IO达到100G/200G。
两家巨子估量将在2021年H1分别推出支持PCIe5.0的芯片,再次将主流I/O提高到100G,高端运用时IO可达到400G【1】。

因此,CPU芯片节奏和做事器发货预测均显示出50G昙花一现,100G做事器正快速成为主流。

200G VS 400G光模块:400G本钱更优,家当更成熟

数据中央接入做事器从25G向100G演进,那么当前的100G互联网络该当选择200G还是400G呢?

从上表可以看出,当数据中央从10G做事器演进到25G,网络互联从40G升级到100G,网络带宽增长一倍,但互联本钱、功耗却保持不变,即Gbit互联本钱与功耗低落一半,以是100GE取代40GE成为25GE时期的主流网络互联方案。

200GE和400GE光模块与以往有点不同。
传统光模块采取NRZ(Non-Return-to-Zero)的旗子暗记传输技能,采取高、低两种旗子暗记电平表示数字逻辑旗子暗记的0、1,每个时钟周期可以传输1bit的逻辑信息。
而200G和400G光模块皆采取了高阶调制技能——PAM4(Pulse Amplitude Modulation 4四阶脉冲幅度调制)。
PAM4旗子暗记采取4个不同的旗子暗记电平进行旗子暗记传输,每个时钟周期可以传输2bit的逻辑信息,即00、01、10、11。

因此,在同样波特率条件下,PAM4旗子暗记比特速率是NRZ旗子暗记的2倍,传输效率提高一倍,有效降落Gbit本钱。
从光模块构成看,200G和400G模块都是采取4-lane的主流架构,以是模块设计本钱、功耗趋同。

由于400G模块的带宽是200G的两倍,以是Gbit本钱和功耗是200G的一半。

另一方面,模块本钱除了架构设计,也取决于规模上量的规模。
根据第三方咨询公司Omdia (原OVUM)的发货数据, 对TOP8供应商当前在200G、400G模块的布局梳理如下。

如上图所示,200G的模块种类只有100m SR4和2km FR4两种,个中100m SR4只有两家供应商。
反不雅观400G的模块种类达到了5种,TOP8厂商皆对100m、500m和2km模块进行告终构。
400G的家当成熟度远胜于200G,客户的选择也更为丰富。

这一剖析结果也进一步解释了由于PAM4技能的引入,存在本钱和功耗的技能代价。
对在本钱、功耗敏感的数据中央网络领域,家当急迫期望跨过200G迈入400G来吸纳这个代价。
采取同样技能和本钱构成的400G在演进方面更具竞争力。

小结:400G接档势头明显,200G一代或将跳过

数据中央网络是做事于业务的存在。
从业务驱动上看,高速增长的数字化培植将推动100G做事器在2020年快速起量,并成为主流。
从本钱上看,由于数据中央光器件本钱占全体数据中央网络设备本钱的一半以上,由于PAM4技能的引入,400G光器件单Bit本钱比200G光模块更具上风,光模块支配本钱将直接带动全体整体建网本钱的低落。

从总体上看,400G接档势头明显,200G代际或成为临时过渡或被直接跳过。

那么,400GE的数据中央组网架构该当如何演进呢?

400G组网形态,高密400G全盒仍在路上

交流机作为数据中央做事器的接入与互联设备,容量随做事器的IO增长而增长,核心部件转发芯片的交流容量仍旧延续着每一代翻一番的节奏。
为联接的浩瀚做事器供应大带宽的连通性,转发芯片容量翻番的寻衅比起网卡容量翻番难度大很多。

如上图所示,半导体工艺的PPA(Performance、Power、Area)收益越来越不明显。
个中,芯片事情时钟频率影响到芯片线速字节性能(Performance),但半导体工艺每代时钟性能仅提升20%,因此须要增加更多逻辑(Area)与功耗(power)来提升Performance。
转发芯片的面积不断增大,功耗也随之上升终极将遭遇功耗瓶颈,须要更前辈的半导体工艺获取合理的功耗指标。

以范例的128口100GE高密盒式交流机为例,采取12.8T芯片16nm工艺,芯片功耗约350W,含100G光模块的整机最大功耗1998瓦。
估量未来25.6T 128200G整机最大功耗3000瓦。
设备的整机功耗与芯片单点散热能力越来越高。
如此大的功耗,对网络设备的工程设计能力(如散热等)提出了极大的寻衅。

如果400G单网络节点,期望得到同100G网络一样的128个端口密度,则哀求转发芯片性达到51.2T。
如果未来面世的51.2T芯片仍旧利用7nm工艺技能,则预估芯片功耗或可高达1000W,这个数字对付盒式设备,按照当前散热工艺基本不可实现。

因此,利用51.2T转发芯片构建高密128端口400G盒式交流设备,严重依赖于5nm或3nm芯片技能的升级,将转发芯片功耗降落到900W以下。
但如果利用5nm或3nm芯片工艺,芯片能够量产交付韶光估量到2023年了。

400G已经到来,400G框盒是当前最佳选择

可支撑高密400G的交流芯片(51.2T)产品商用交付节奏偏晚,在目前可得到的条件下,网络设备面临三个选择:

方案一,高密200G盒式:利用25.6T芯片供应128 x 200G端口。

方案二,低密400G盒式:利用25.6T芯片供应64 x 400G端口。

方案三,高密400G框式:通过多芯片叠加实现更高密的400G端口,供应400G框式设备,知足128 x 400G乃至更高端口密度。

高密200G盒式:错失落400G先机

做事器100G必将快速成为主流,400G光连接本钱最优,全体家当的版图中目前唯一缺失落的是尚不成熟51.2G(128400G)的转发芯片。
这个的短暂缺失落的确让那些已经支配100G全盒架构的企业犹豫未定,开始转向考虑200G。

但是选择了200G,意味放弃了向400G直接演进的最短路线,导致在200G上重复投资;同时由于数据中央网络的培植本钱中光互联本钱霸占了一半以上,那么200G的选择将错过第一韶光拥抱400G技能红利的契机。

低密400G盒式:做事器集群规模缩小3/4

利用64x400G的盒式设备形态进行组网,那么由于T2层设备的端口密度较100G网络架构中的128口密度减少一半,则POD内接入做事器的数量也会减少一半。
同时,T3也利用64x400G的网络设备,则做事器数量会再次减半,导致全体做事器集群规模缩减至原有的1/4。
纵不雅观数据中央网络发展,存在一个朴素的基本原则:在担保既有做事器集群规模的条件下,进行速率升级。
低密400G网络设备形态,将造成做事器集群规模的大幅缩水,较难被业务运用所接管。

高密400G框式:历史证明过的最优选择

我们不妨回顾下100G网络的演进历史。
早期,云打算业务和打算资源虚拟化技能的发展推动了100G家当标准的成熟。
25G接入做事器逐步得到了规模运用,100G光互联在市场快速起量,本钱进一步低落。

当家当成熟发布100G网络时期到来之时,高性能100G转发芯片存却在滞后,在100G网络培植初期不可获取(下图的阶段1)。
行业最初采取了多芯片构建高密100G框式交流机的方案,一方面确保网络规模可达到预期,另一方面快速开释了100G网络的技能红利。

随着芯片性能的升级、6.4T和12.8T芯片的推出,网络从100G框式平滑过渡到了100G盒式阶段(下图的阶段2、3)。

400G网络也将上演类似的演进规律,在51.2T芯片能力尚不可得到的情形下,多芯片构建的400G框式交流机设备是当前更为明智的选择。

通过支配高密400G框式设备,可实现网络规模不变乃至进一步扩展,得到更低的单bit本钱。
目前业界主流厂商都已经发布了400G框式设备,将推动400G网络的商用进程。
后续随着51.2T交流芯片的上市,400G框盒架构可向全盒平滑演进,终极成为400G时期数据中央网络的主流架构。

图1:右侧图片引用自

https://techblog.comsoc.org/2019/03/18/facebooks-f16-achieves-400g-effective-intra-dc-speeds-using-100ge-fabric-switches-and-100g-optics-other-hyperscalers/

图3:引自http://www.ieee802.org/3/bs/timeline_3bs_0915.pdf

【1】出自:

https://s21.q4cdn.com/600692695/files/doc_presentations/2019/05/2019-Intel-Investor-Meeting-Shenoy.pdf

https://wccftech.com/amd-zen-3-epyc-milan-and-zen-4-epyc-genoa-server-cpu-detailed

标签:

相关文章

eMTC啥玩意?盘他!_技巧_速度

随着移动通信技能的发展,在传统“短间隔”物联网技能的根本上,呈现了很多“长间隔”物联网技能,给行业带来了一阵东风。这些新兴物联网技...

智能 2024-12-09 阅读0 评论0

igbt拆解_这是_基座

这个焊锡都是焊锡焊上去的,全体基座是铜的。再来拆这一款,这块该当是动了,直接下来,芯片摘下来,还有点焦。这个大芯片便是一块很大的芯...

智能 2024-12-09 阅读0 评论0