首页 » 智能 » 华为五大年夜系列芯片的自研之旅!【深度】(干货)_芯片_华为

华为五大年夜系列芯片的自研之旅!【深度】(干货)_芯片_华为

雨夜梧桐 2025-01-22 06:37:20 0

扫一扫用手机浏览

文章目录 [+]

1991年,华为芯片奇迹刚起步,由集成电路设计中央卖力。

当时,华为面临着芯片本钱高、产品利润空间小的困境。
首款流片成功的芯片为SD502,用于交流机多功能接口掌握。

华为五大年夜系列芯片的自研之旅!【深度】(干货)_芯片_华为 华为五大年夜系列芯片的自研之旅!【深度】(干货)_芯片_华为 智能

1993年,华为依托外洋采购的EDA软件,成功开拓出支持无壅塞时隙交流的SD509,并用于自主研发的第一台数字程控交流机C&C08,该款交流机后成为环球销量最大的交流机之一。

华为五大年夜系列芯片的自研之旅!【深度】(干货)_芯片_华为 华为五大年夜系列芯片的自研之旅!【深度】(干货)_芯片_华为 智能
(图片来自网络侵删)

1995年,华为中心研究部成立,下设根本业务部,接手通信系统芯片研发事情。

2004年,华为决定成立海思半导体,以数字安防芯片起身。

2009年,推出一款GSM低端智好手机的一站式办理方案,芯片名为K3V1,开启了手机芯片的漫漫探索之路。

此后,华为2012实验室成立,海思归属实验室统领,但地位等同于华为一级部门。

经历三十载的费力探索,目前,华为共有五大系列芯片。

麒麟芯片为手机SoC芯片,集成运用场置器与基带处理器,广泛运用于华为系列手机上。

打算芯片中,鲲鹏用于高性能打算,昇腾为商用AI芯片。

通信芯片中,巴龙与天罡分别用于基带与基站,正打造5G布局。

联接芯片对应万物互联时期,包括Boudica与凌霄两大品牌。

视频芯片是华为长期发力的方向,安防芯片、机顶盒芯片霸占大量市场份额,芯片出货量也达到千万级。

快速崛起的打算芯片双底座:鲲鹏、昇腾

当今数字化时期,万物互联带来数据量的爆发式增长,向IT根本架构的打算能力提出了更高哀求。
IDC预测,到2023年,环球打算家当投资空间高达1.14万亿美元,中国占比近10%,是环球打算家当发展的主要驱动。

为知足新算力需求,华为环绕“鲲鹏+昇腾”双算力引擎,打造了“算、存、传、管、智”五个子系统的芯片族,实现了打算芯片领域的全面自研。
华为是唯一同时拥有“CPU、NPU、存储掌握、网络互联、智能管理”5大关键芯片的厂商。
我们将重点环绕核心芯片“鲲鹏+昇腾“展开剖析。

2023年,何庭波任华为董事、科学家委员会主任、ITMT主任、海思总裁!

(一)打算芯片鲲鹏系列

鲲鹏系列包括做事器和PC机处理器。

早在十余年前,华为开拓的嵌入式CPU Hi1380小有所成,成为鲲鹏处理器的开端。

后历经鲲鹏912、916两代产品,终极开拓出旗舰产品鲲鹏920与鲲鹏920S,分别用于做事器和PC机。

鲲鹏处理用具备“端边云算力同构”的上风。

其基于ARM V8架构,处理器核、微架构和芯片均由华为自主研发设计。

市场上目前存在超过500万基于ARM指令集的安卓运用,与ARM做事器天然兼容,无需移植即可直接运行,且运行过程中无指令翻译环节,性能无丢失,比较X86异构最高能够提升3倍性能。

2019年1月,华为宣告推出业界最高性能ARM架构处理器——鲲鹏920,以及基于鲲鹏920的TaiShan做事器和华为云做事。

鲲鹏920处理器,采取7nm制造工艺。

规格方面,支持64内核,主频可达2.6GHz,集成8通道DDR4,支持PCIe4.0及CCIX接口,可供应640Gbps总带宽。

鲲鹏920主打低功耗、强性能,在范例主频下,SPECint Benchmark评分超过930,超出业界标杆25%;同时,能效比优于业界标杆30%。

之前的记录保持者是富士通的7nm A64X,每个芯片可以达到2.7 teraflops的性能。

除了发布鲲鹏920处理器,华为还推出了三款泰山ThaiShan系列做事器,利用的便是自家的做事器芯片:

包括TaiShan 2280、Thaishan 5280/5290、ThaiShan X6000,

分别面向均衡做事器、存储做事器及高密度做事器市场,详细规格如下:

华为研发高性能ARM做事器处理器已经不是新闻了,之前就有过基于Cortex-A57架构的32查究事器芯片,只不过并没有大规模推广。

此前还有爆料称华为自主研发64核ARM做事器芯片Hi1620,基于7nm工艺。

2019年1月发布的鲲鹏920,便是这款产品Hi620的正式品牌及型号,跟“麒麟”处理器一样,也是利用了中国古代神兽的名字“鲲鹏”!

鲲鹏(Kunpeng )920芯片的架构:

1、Chip:芯片(Chip)是指有大规模集成电路的硅片,我们见过的cPu这种是最常见的芯片。
一样平常几块硅片可以封装在一起组成一个芯片。

2、DIE:芯片的最小物理单元。
Kunpeng 920封装了3个DIE,两个用来做打算,第三个用来做IO。

晶粒(die)因此半导体材料制作而成未经封装的一小块集成电路本体,该集成电路的既定功能便是在这一小片半导体上实现。
常日情形下,集成电路因此大批办法,经光刻等多项步骤,制作在大片的半导体晶圆,然后再分割成方型小片,这一小片就称为晶粒,每个晶粒便是一个集成电路的复制品。

3、Core:真正的打算单元,我们在操作系统侧看到的“核”。

4、Cluster:多少个核(core)的凑集。
Kunpeng 920把4个core凑集成为一个cluster,而一个DIE上有8个cluster。

5、soc:System on chip,例如,Kunpeng 920除了CPu外,还集成了RoCE 网卡、SAS掌握器和南桥。

SoC可以理解为一个芯片集成了一个别系,可以完成特定的一系列的事情,例如,CPU是大脑,SoC是不仅有大脑,还有手、脚、身体等等,这些手脚就相称于,GPU,网卡处理器,声卡处理器等。

1片SoC上包含3个DIE,2个打算DIE,1个IO DIE。

1个打算DIE中8个Cluster。

1个Cluster中4个Core。

因此一个鲲鹏kunpeng 920芯片中包含482=64个核。

打算DIE上的每一个core具有自己的L1和L2级Cache,所有的core共享L3级Cache。

IO DIE上集成有网络模块、PCle模块。

这些DIE在芯片内部通过高速内部总线进行连接。

打算芯片昇腾系列

在摩尔定律逐渐失落效的情形下,AI芯片有助于办理算力问题。
昇腾系列是华为全面AI计策的主要支撑。

2018年华为全联接大会上,昇腾310与910同时发布,证明了外界对华为研制AI芯片的预测。

昇腾310面向边缘场景,高效、灵巧、可编程。
基于范例配置,八位整数精度(INT8)下的性能达到16TOPS,16位浮点数(FP16)下的性能达到8 TFLOPS,而其功耗仅为8W。

基于已实现量产的昇腾310,华为发布Atlas 200、Atlas 300、Atlas 500、Atlas 800等产品,广泛运用于安防、金融、医疗、交通、电力、汽车等行业。

昇腾910面向演习场景,具有超高算力,其最大功耗为310W,自研的达芬奇架构大大提升了其能效比。

八位整数精度下的性能达到512TOPS,16位浮点数下的性能达到256 TFLOPS。

昇腾910的测试表现远超NVIDIATesla V100和Google TPU v3。

2019年8月,910正式发布,标志着华为AI计策的实行进入新的阶段。

未来,针对不同场景,华为仍将持续推出更多的AI处理器,供应更充裕、更经济、更适配的AI算力。

华为部分在研与方案的AI芯片包括,用于自动驾驶开拓的昇腾610、310升级而来的昇腾320以及910升级而来的昇腾920。

先容一下达芬奇架构:

达芬奇架构实质上是为了适应某个 特定领域 中的常见运用和算法。
常日称为 “特定域架构 ”

(Domin Specific Architecture,DSA)。

达芬奇架构包括三种根本打算资源:

矩阵打算单元 (CubeUnit)、

向量打算单元 (Vector Unit) 和 标量打算单元 (Scalar Unit)。

在实际的打算过程中各司其职,形成了三条独立的实行流水线,在系统软件的统一调度下相互合营达到优化的打算效率,并且每一种打算单元都供应了不同精度和不同类型的打算办法。

达芬奇架构包含:scalar,tensor和cube运算,灵巧性scalar>tensor>cube,效率 scalar<tensor<cube。

标量打算单元 (Scalar Unit):

类似一个MCU,可以是ARM的,也可以是RISC-V,用于标量打算、逻辑判断、掌握调度等;

向量打算单元 (Vector Unit):

类似一个DSP,用于矢量、向量打算,AI CPU即为向量打算单元;

矩阵打算单元 (CubeUnit):

类似谷歌TPU脉动阵列构造,是一个乘累加阵列,用于矩阵、卷积、张量打算,AI Core即为矩阵打算单元,适宜打算密集型算子。

华为达芬奇核心分为三种,最完全的是“Max”,其次是Lite,再次是Tiny,Max可在一个周期内完成8192次MAC运算,Tiny仅512次。

整体来看,两个bufferL0A和L0B作为输入,个中一个暂存activition,另一个暂存权重。

赤色的Cube模块,打算结果输出存放在其余一个buffer L0C。

Vector Unit,从buffer L0C中取得乘累加打算结果,然后进行pooling/padding,BN,激活,加法等处理。

如果还没得到终极结果,就暂时返回存储在buffer L0C,如果得到了终极结果,就通报给Unified Buffer。

昇腾AI处理器的打算核心紧张由 AI Core 构成,包含三种根本打算资源:矩阵打算单元(Cube Unit)、向量打算单元(Vector Unit)和标量打算单元(Scalar Unit),卖力实行张量、矢量、标量打算。

个中向量是数学上的叫法,矢量则是物理上的叫法。

AI Core 中的矩阵打算单元支持 Int8 和 fp16 的打算,向量打算单元支持 fp16 和 fp32 的打算。

AI Core 基本构造如下:

(二)麒麟手机SoC(System-on-a-Chip)

芯片由运用场置器(AP)与基带处理器(BP)组成。

个中,AP包括CPU(中心处理器)、GPU(图形处理器)、ISP(图像处理器)等,卖力操作系统、用户界面和运用程序处理;

BP包括基带和射频部分,卖力通信旗子暗记处理。

近年来,各大芯片厂商开始研发SoC芯片,供应整体办理方案,华为海思也积极布局。
从技能上来看,SoC芯片研发的难点在于各个组成部分的集成与协同。

华为起步于一款算不上成功的产品——K3V1。

2006年,成立两年的海思受联发科启示,开始研究手机芯片,三年后推出第一款运用场置器,即K3V1,但由于110nm工艺远掉队于当时的主流方案,且对应Windows Phone系统,终极未能上市。

2012年,K3V2发布,工艺仍相对掉队且发热较严重,但性能差距在缩小,搭载于华为D、P和Mate系列上,勉励着芯片技能的提升。

转机终极涌现于2013年,海思推出第一款手机SoC芯片——麒麟910,是环球首款四核SoC芯片,采取当时主流的28nm工艺,匹配Mali 450MP4 GPU,集成自研巴龙710基带,运用于华为P6s。
这次崭露锋芒为更大的成功奠定了根本。

此后,麒麟920、925、928、930、935、950、960、970、980以及面向中端手机的620、650、710、810等先后发布,制程工艺不断升级,实现了由追赶到并排,再到领跑的转变。

个中,麒麟925运用于华为Mate7上,环球销量超700万部;

麒麟620先后运用于中真个光彩4X、4C上,光彩4X销量破千万;

麒麟930标志动手机芯片进入64位时期;

麒麟950、970、980分别在环球率先商用16nm、10nm和7nm工艺;

麒麟970还首次在SoC芯片中集成人工智能打算平台NPU,首创端侧AI先河,搭载该芯片的Mate 10出货量累计达1000万台。

2019 年 9 月,华为一代旗舰芯片麒麟 990 系列推出,包括麒麟 990 和麒麟990 5G 两款芯片。

采取 7nm+工艺 ,个中前者采取7nm工艺,后者采取7nm+工艺。

个中,麒麟990 5G是环球首款旗舰5G SoC芯片,首次将5G Modem集成到SoC芯片中,率先支持NSA/SA双架构和TDD/FDD全频段,是业界首个全网通5G SoC。

基于巴龙5000的5G联接,麒麟990 5G实现了2.3Gbps的5G峰值下载速率,5G上行峰值速率达1.25Gbps。

(三)5G通信设备制霸的核心芯片:巴龙、天罡

布局一:巴龙系列基带芯片

基带芯片用来合成即将发射的基带旗子暗记,对吸收到的基带旗子暗记进行解码。

2007年开始,华为布局基带芯片研发,缘故原由是华为当时的热门产品数据卡的基带芯片依赖于高通,常常断货。

2010年,华为推出首款TD-LTE基带芯片——巴龙700,冲破高通的垄断。

2014年,在麒麟910上,华为第一次将基带芯片和AP集成在一块SoC上。

目前,巴龙4G系列套片环球累计发货过亿,有完全的产品组合,能力从Cat 4到Cat 19,对应单连接速率从150Mbps到1.6Gbps不等。

2018年2月,华为发布巴龙5G01基带芯片,是第一款商用的、基于3GPP标准的5G芯片,但体积较大;此前,高通曾发布业界首款5G调制解调器骁龙X50,但并非基于3GPP标准,且仅支持5G网络而不兼容前代网络。

2019年1月,华为发布巴龙5000。
其体积小、集成度高,支持5G及前代网络制式。

巴龙5000率先实现了业界标杆的5G峰值下载速率,在Sub-6GHz(低频频段,5G的主用频段)频段实现4.6Gbps,在毫米波(高频频段,5G的扩展频段)频段达6.5Gbps,是4G LTE可体验速率的10倍。

华为表示,巴龙5000除用于智好手机外,还可以在家庭宽带终端、车载终端等场景下利用。

布局二:天罡系列基站芯片

天罡是业界首款5G基站核心芯片,在集成度、算力、频谱带宽等方面取得了打破性进展。
天罡首次在极低的天面尺寸规格下, 支持大规模集成有源功放和无源阵子;实现2.5倍运算能力的提升,搭载最新的算法及波束赋形,单芯片可掌握高达64路通道;极宽频谱,支持200M运营商频谱带宽。
天罡芯片为有源天线处理单元带来了革命性的提升,实现基站尺寸缩小超50%,重量减轻23%,功耗节省达21%,安装韶光比标准的4G基站节省一半。

(四)为物联网而生的链接芯片:Boudica、凌霄

布局一:Boudica系列NB-IOT芯片

NB-IoT(NarrowBand Internet of Things,窄带物联网)聚焦低功耗、广覆盖物联网(IoT)市场,可在智能停车、聪慧农业、远程抄表等垂直行业广泛运用,具有低功耗、连接稳定、本钱低、架构优化出色等特点。
近年来,工信部以及三大运营商均在不同程度上予以扶持。
但受限于技能成分,NB-IoT发展仍较为缓慢,个中终端芯片是核心难点之一。

华为2014年开始进行NB-IoT芯片研发。

2015年,推出基于预标准的芯片原型产品。

2016年9月,发布业界首款商用NB-IoT芯片Boudica 120。

此后,又推出支持3GPPR14的完备成熟的Boudica 150,可实现更低的能耗,并运用于更多的场景。

2019年4月,华为表露,Boudica 120出货量打破700万;性能更优胜的Boudica 150出货量则打破了1300万。

2020年推出Boudica200,支持3GPPR15及后续标准演进,拥有更优的集成度、安全性与开放性。

布局二:凌霄系列WiFi芯片

在路由器的现实利用中,掉线、延时、卡顿等问题普遍存在,为理解决这些问题,华为研发了凌霄系列路由芯片,由路由CPU、路由WiFi芯片、电力猫芯片三大产品线组成。

2018年12月,凌霄芯片正式亮相,光彩路由Pro 2搭载了凌霄5651和凌霄1151。
个中,凌霄5651为四核1.4GHz CPU,凌霄1151为双频Wi-Fi芯片。

2019年的华为开拓者大会(HDC2019)上,华为正式发布凌霄WiFi-loT芯片,做事于华为的全场景聪慧生活计策。
该芯片于2019年底上市,用于家庭接入类产品。

(五)始于安防、彰于显示的视频芯片:鸿鹄

布局一:安防芯片

安防产品须要四类芯片:ISP(图像旗子暗记处理)芯片对前端摄像头采集的旗子暗记进行处理,DVR(数字硬盘录像机)SoC芯片用于仿照音视频的数字化、编码压缩与存储,IPC(IP摄像机)SoC芯片支持视频剖析,NVR(网络硬盘录像机)SoC芯片用于视频数据存储。

海思芯片奇迹起步于安防领域,首先量产的是安防芯片,并在与德州仪器、博通等巨子的竞争中茁壮发展。
不同于德州仪器采取的ARM+DSP架构,海思采取ARM+IVE架构,在功耗、本钱和运算效率上具备上风。

目前,海思是环球IPC芯片的领头羊,市场份额一度高达70%;在其他三大类芯片中,海思同样具有较高的市场份额。
在市场开拓方面,海思同海康威视、大华长期保持紧密互助。

布局二:机顶盒芯片

在安防芯片领域取得巨大造诣的同时,2008年海思也开始积极发力机顶盒芯片,并在与意法半导体和高通等的竞争中崭露锋芒,基本做到海内第一,环球第二,仅次于博通。
智能机顶盒芯片方案分为OTT和IPTV两种,根据格兰研究,2018年,我国IPTV/OTT机顶盒采取的芯片方案以海思和晶晨为主。

布局三:鸿鹄系列显示芯片

鸿鹄芯片紧张用于聪慧显示领域。
华为已积累多年,海思于2014年就推出首款4K电视芯片。
华为2019年透露,鸿鹄视频显示芯片累计发货已超4000万片。

2019年7月,华为发布的光彩聪慧屏率先搭载了鸿鹄818芯片。
鸿鹄818采取双A73+双A53架构CPU和4Mali-G51 GPU,解码速率领先。
鸿鹄818具备动态画面补偿、高动态范围成像等七重画质技能,集成Histen音质优化技能,能给用户带来出色的音画体验。

目前,华为五大芯片系列正并驾齐驱,在各自的领域均取得了打破性造诣,成功走出了一条“逆袭”之路。

回望华为芯片奇迹刚刚起步的1991年,正是当时对芯片独立自主的觉醒,才为如今的辉煌埋下了伏笔;

正是在一步一步的试错中,才走出了一条独立设计之路。

展望未来,随着我国自主创新力量的不断崛起,以“中国芯”为底座的IT家当必将迎来巨大机会,华为公司作为国产之光,在“开源、开放”的计策下,有望带领家当链干系公司快速崛起。

标签:

相关文章