海光信息研究申报：实现自力迭代的X86国产化做事器领军_架构_机能

文章目录 [+]

采纳“发卖一代、验证一代、研发一代”研发策略。
海光建立了完善的高端处理器的研发环境和流程，截至 2021 年 3 月，海光 CPU 系列产品海光一号、海光二号已经实现商业化运用，海光三号完成实验室验证，2022 实现发卖，海光四号处于研发阶段；海光 DCU 系列产品深算一号已经实现商业化运用，深算二号处于研发阶段。

公司 2021 年实现业务收入 23.1 亿元，收入高增，利润扭亏。
随公司紧张产品放量， 2021 年公司实现收入 23 亿元，净利润 3.27 亿元。
收入紧张来自运用于高端处理器的 7000 系列。
2021 年公司 7000、5000、3000、 8000 系列分别占比 65.01%、8.30%、16.34%、10.34%。
个中 7000 系列对标 Intel 至强铂金（Platinum）、至强金（Gold），面向关键任务和数据中央关键运用，目前是驱动公司发卖收入高增紧张产品。
同时 2021 年后 8000 系列 DCU 产品开始形成发卖。

海光信息研究申报：实现自力迭代的X86国产化做事器领军_架构_机能海光信息研究申报：实现自力迭代的X86国产化做事器领军_架构_机能智能

估量公司未来三年保持无实际掌握人状态。
上市发行前，公司紧张股东中科曙光、成都国资分别持有公司 32.10%、19.53%股份，上述两大股东持股比例较为靠近，均在一段期间内持有公司 30%以上股权。
根据招股书，公司第一大股东变革并未对公司经营管理造本钱质性影响，股东各方均无法对公司形成掌握，且承诺在公司上市之日起 36 个月内不谋求得到或者参与争夺公司的掌握权。

（图片来自网络侵删）

Fabless 经营模式，专注于高端处理器的研发、设计和发卖，通过向客户供应高端处理器产品获取业务收入。
公司紧张通过向客户供应高端处理器产品获取业务收入，并将晶圆制造、封装测试等别的环节交由晶圆制造企业、封装测试企业及其他加工厂商完成。
海光信息与 AMD合伙成立海光微电子和海光集成，从事x86 CPU的干系业务。
个中，海光微电子：紧张卖力 x86 处理器核开拓，处理器制造、封装及测试的外协事情；海光集成：紧张卖力处理器整体设计，及处理器产品的推广和运用。
公司主营业务收入系向外部客户发卖海光 CPU 产品形成；海光微电子定位为生产本钱中央，产品只能发卖给海光集成。
海光微电子和海光集成间发卖合伙产品的定价办法是按照产品发卖总价在公司间按一定的比例分割，海光微电子主营业务收入占海光集成主营业务收入的比重为 30-40%。

目前已完成海光 3 号、海光 4 号两代产品独立迭代。
2019 年 6 月在公司被列入美国《出口牵制条例》“实体清单”后，AMD 不再供应干系技能做事，公司自行实现了后续产品和技能的迭代开拓。
海光一号和海光二号的成功量产，证明了公司已经完成了对 AMD 授权技能的消化、接管；海光三号成功流片、海光四号完成了电路设计和性能仿照，证明了公司全面节制了高端处理器设计技能，具备了产品迭代研发能力。
公司本次公开拓行不超过 3 亿股公民币普通股（A 股），发行价格 36 元/股，召募资金 108 亿元，投入新一代通用途理器研发等项目。

2.依托X86架构，在国产CPU三路径中地位领先

2.1.国产CPU的三条路线

当前，国产 CPU 公司走出三条不同的道路，核心差异在于选择何种架构以实现国产化需求：1）X86 架构：兆芯、海光。
X86 指令集的发展受限于 Intel、AMD。
优点是技能门槛低、性能出发点高、没有生态壁垒，缺陷是自主创新的程度低，且购买授权的本钱较高。
以这条路线发展，不存在生态壁垒，在技能上通过不断迭代逐步缩小差距。
海光是采取这种办法得到市场，但是这种购买授权的办法，没有从根本上办理自主创新的需求。

2）ARM 架构：飞腾、鲲鹏。
此种模式为指令集架构授权，自主化程度相对较高，ARM 紧张有三种授权等级：个中指令集层级授权等级最高，企业可以利用指令集进行 CPU 设计，从而加入 ARM 生态。
此前海思、飞腾已经得到 ARMV8 永久授权，ARM 此前确认 ARM v9 架构不受约束,华为海思依然可获授权。
以这条路线发展，存在较高的技能门槛，只管 ARM架构目前发展迅速，但在桌面和做事器真个生态与 X86 仍有差距。
指令集架构的永久授权，一定程度上知足了自主创新的需求，依然存在未来更新版本被断供的风险。
3）MIPS、LoongArch 等自主架构：龙芯、申威。
此种模式是自主研制的指令集，高度自主创新，但是技能门槛最高，生态构建极其困难。
龙芯已经切换到纯自主的 LoongArch；申威目前在专用高性能方面比较突出。

基于目前国产 CPU 替代市场的紧张特色，我们认为，利用 X86 架构的产品，性能和生态显著较好，短期内可利用本钱上风打开一部分企业市场，但长期看受外部影响较大，存在较大的不愿定性;利用 ARM 架构的国产 CPU，将在短期内受益于重点领域信创市场的快速增长；利用自主架构的国产 CPU，生态建立须要一定的韶光，中长期看，有望实现党政及分外领域的大面积乃至全面替代。

2.2.目前国产CPU芯片与Intel仍旧存在差距

想要磋商国产 CPU 未来的走势，就一定要面对一个十分现实的问题：国产 CPU 到底弱在哪里？我们认为，国产 CPU 与环球领先水平的差距紧张概括为：性能差距、生态差距。
性能上，国产 CPU，尤其 PC 芯片存在明显劣势。

详细到 CPU 产品来看，国产 CPU 与环球领先水平有哪些方面差距？我们认为紧张包括： 1、单核性能弗成还是核数不足多？目前国产 CPU 的关键问题还是在于单核的性能较弱。
Intel 还在做 4 核产品的时候，海内核高基操持就已经实现了 8 核产品的研制，但是整体性能完备劣后于 Intel 同期产品。
2、工艺弗成还是设计能力弗成？目前国产 CPU 的紧张差距在于设计能力上。
从纵向发展进程来看，相同工艺条件下，设计能力提升带来的产品性能提升十分显著，在 fabless 模式下，设计能力的差距显得尤为主要。
工艺水平对性能有较大影响，在相同设计水平上，能带来 20%-30%的稳定提升，但是更为主要的设计水平，能给产品带来一倍以上的性能提升。

3、产品性能完备决定用户体验？产品性能是影响用户体验的主要成分，但是系统优化同样主要。
例如，在 2010 年 iPad 就风靡环球，但当时的 CPU 性能只有 Intel 的 1/2 到 1/3 旁边，但是用户体验和评价都很好，便是得益于苹果的系统优化。
而国产 CPU 由于积累不足，纵然在产品性能已经能知足某些重点领域信创的哀求的情形下，用户体验依然比 Intel 差一些。

性能差距只是外在表现，我们认为造成这种差距的内因，紧张有以下几点：1、微架构设计能力存在显著差距。
所谓微架构，即在指令集架构体系之内的一种构造设计，是 CPU 内部晶体管的一种排列办法，属于指令集架构体系的框架之内，例如 Intel 的 Icelacke、Broadwell。
Intel 和 AMD 不断更新微架构，实现性能的不断迭代提升，国产 CPU 的微架构在乱序实行、高速缓存、多核互联等技能上，由于起步较晚，都与前辈水平有一定差距。

2、定制化水平差导致风雅度不敷。
Intel 针对特定领域和客户，会采取高度定制化的设计，例如人工设计版图、采取锁存器 Latch 更换触发器 flipflop、全定制设计关键单元等方案。
定制化的实现须要多年的技能积累和人力投入，目前国产 CPU 很难实现，基本还是采取传统的 EDA 工具天生版图和做版图优化的办法，风雅度远低于定制化产品。

3、利用通用 EDA（Electronic Design Automation）工具缺少协同。
环球 EDA 软件市场中，美国产品份额超过 95%，“三巨子”即 Synopsys、Cadence、Mentor。
Intel 等欧美大厂许多都有自研的 EDA 工具或拓展，以及成熟的 flow，设计过程中涌现的问题可以与 EDA 部门直接协同办理，显著提升了设计效率和设计能力，不断拓展边界，而国产 CPU 厂商目前普遍采取的是外购的 EDA 工具，短缺与设计工具的协同，且国产 EDA 工具竞争力较弱，这一环节也难以实现自主创新。

4、与 Foundry 合营不足密切。
在生产模式上，Intel 是范例的 IDM 厂商，AMD 虽然是 Fabless 厂商，但与之前分拆出去的 Global Foundries 保持密切联系，两者都能实现设计与制造环节的密切合营与协同。
国产 CPU 由于起步晚、规模小以及海内芯片制造能力弱，都是 Fabless 模式，难以与 Foundry 实现密切合营，限定了产品技能发展的速率。

掉队的软硬件生态系统是制约国产 CPU 发展的另一瓶颈。
X86 是目前桌面和做事器领域的绝对主流架构，以是选用 X86 架构的受影响最小，可以直策应用 Windows 系统及软件，ARM 架构的生态在环球范围内逐渐完善，而利用自主架构的面临巨大寻衅。

生态系统很主要的一点是能够吸引环球程序员共同参与的各种运用软件开拓的盈利模式、知识产权分享机制等制度安排。
CPU 设计须要耗费大量韶光和人力开拓编译器，芯片流片成功后，还须要移植 Linux 内核、Android 系统等，后期系统的软件也涵盖了驱动层、中间层到运用层，还须要不断针对这种架构进行迭代优化。
前期纵然大量投入，如果软件上适配和推广不敷，销量受限，软件开拓者便会勉励不敷，用户更少，引起恶性循环，商业模式便会涌现问题。
除了 Wintel 同盟的强大压力，我国集成电路、软件等家当整体实力弱是另一核心掣肘。
以龙芯为例，目前环绕龙芯已有百余家国产软件企业共同构筑家当生态系统，但这些企业多数起步晚、规模不大、客户渠道单一，与国际领先水平可能存在差距，难以带来较大的市场竞争力。

2.3.云化时期，X86领先上风明显

做事器发展到云化阶段，对性能提出更高哀求，紧张的性能指标大致包括： 1）单颗处理器核心数一样平常在 8 核~64 核，20 核以上居多； 2）支持多路互连，两路、四路、八路等； 3）可靠性、稳定性哀求高，常年无端障运行； 4）高端内存，支持 ECC 等可靠性哀求； 5）功耗比较高，一样平常 100W 以上。
根据做事器的性能指标，做事器端 CPU 技能特点大致包括： 1）微构造繁芜、前辈，制造工艺前辈，核心数多，单核及多核性能皆精良； 2）指令集功能完好； 3）片上集成缓存容量大； 4）内存通道数多； 5）I/O 带宽高；6）支持多处理器同等性互连； 7）可靠性高，RAS 功能丰富； 8）TDP 功耗较高。

由于 X86 处理器起步较早，生态环境较其他处理用具有明显上风，运用 X86 处理器的做事器发卖额占全部做事器发卖额的比例约为 91%，发卖量占比超过 97%，处于显著领先的地位。
根据 IDC 环球做事器跟踪报告，2020 年整年，环球 X86 做事器市场发卖额为 826.5 亿美元，较 2019 年增长 3.31%；环球 X86 做事器市场发卖量为 1180.2 万台，较 2019 年增长 1.82%。

做事器企业考试测验将 ARM 架构利用于做事器端，重现 ARM 在移动终端中的成功，但奏效甚微。
基于 X86 对付做事器芯片的长期绝对垄断，以及 ARM 在移动真个突出表现，部分做事器企业开始考试测验推出 ARM 的做事器，比较突出的包括 18 年亚马逊推出的 CPU Graviton 和华为 19 年基于鲲鹏的泰山做事器。
未来做事器市场，依然会是 X86 绝对领先，ARM 只能作为少量补充。
必须明确，ARM 在移动端成功的核心是低功耗，这不是做事器的第一关注点。
ARM 处理器是低功耗、小体积的代表，很好地适应了移动真个运用处景，但做事器产品的核心还是性能和生态，上文中也提到了对 CPU 的高技能哀求。
繁芜指令集的特点便是包含了大量的指令，因此在这种架构的 CPU 中进行程序设计更大略，每一条繁芜或大略的任务都有对应的指令。

详细看，X86 因其长期耕耘，目前绝大多数做事器真个程序开拓都是基于 X86 完成，为了云端支配的大略稳定，开拓者惯性选择该架构的云端做事器。
在迁移本钱方面，云端支配过程中须要考虑操作系统内核、虚拟化技能、云存储、云安全等，各项分支都是由 X86 主导，若选用 ARM 架构的做事器，在运维到运用各方面都要进行 ARM 指令集的交叉编译，高本钱且低效。
因此，我们估量未来做事器市场还将延续 X86 绝对领先的局势，ARM 主要作为一些边缘打算的补充。

3.海光验证X86 CPU自主迭代能力

目前海光详细产品包括：1）CPU 产品：包括海光 7000 系列、海光 5000 系列和海光 3000 系列。
海光 7000 系列紧张运用于高端做事器，海光 5000 系列紧张运用于中低端服务器，海光 3000 系列紧张运用于事情站和边缘打算做事器。
2）DCU 产品：海光 DCU 产品方案为海光 8000 系列，目前海光 8100 系列产品已实现商业化运用。
截至 2022 年招股书发布，公司已完成海光三号的验证和试产，并开始四号的硅后验证。

3.1.得到AMD Zen授权，海光一号有市场化竞争力

基于 Zen 架构的 Ryzen/EPYC 系列芯片对 AMD 意义重大，验证了 Zen 架构的成功。
2017 年 AMD 发布了基于 Zen 架构的 Ryzen 1000 系列处理器及 AM4 平台，可支持领先的 USB、图形、数据及其他 I/O 技能。
Zen 架构在架构和工艺双重升级下具备了更高的性能和更低的能耗。
比较于原有产品的 28nm/32nm 工艺，Ryzen 1000 利用了 GF 的 14nm 工艺，大幅降落功耗。

比较 Excavator，Zen 架构在大核心和低本钱之间做出平衡。
Zen 的设计思想仍旧为避免始用繁芜的大核心以降落本钱，但是比较 Excavator 的过度简化做出平衡。
Zen 架构最小的 CPU Complex 模块（CCX）内有四个 x86 核心，每个核心都有独立的 L1 和 L2 缓存，单个模块共享 8MB L3 缓存，核心一改前代的 CMT 多线程技能，采取了更加主流的 SMT 多线程。
8 核 16 线程的产品具有两个 CCX，相互之间利用高速 Infinity Fabric 进行通信，这种模块化设计也奠定了之后几年 AMD 在处理器上的扩展基调。

Ryzen 1000 系列开始，AMD 大幅缩小与 Intel 的差距。
Intel 从 2016 年开始陷入工艺制程的瓶颈与 Tick-Tock 计策脱节，被外界称为“挤牙膏”模式。
只管 Ryzen 1000 单核性能比英特尔弱，但后续高端桌面处理器 Threadripper Ryzen 凭借多线程运用中的精良表现，和相较英特尔高端系列 i9 更高的性价比，二者开始缩小差距。

2018 年 4 月 AMD 发布第二代锐龙，单核性能有了大幅提升，也办理了内存上的问题；再加上英特尔 IDM 模式工艺制程升级碰着瓶颈，AMD 依赖台积电代工先英特尔一步进入 7nm 制程，AMD 开始大幅打劫英特尔份额。
综上，Zen 架构比较于 AMD 以往架构实现质的飞跃，也是 AMD 在个人电脑市场开始冲击英特尔的核心抓手。
AMD 原来估量基于 Zen 的 Ryzen 1000 IPC 性能上比起 Excavator 挖掘机可提高 40%，实际上终极以 52%的提升幅度超越了预期目标。
此外，AMD 还推出集感知、自适应和学习技能于一体的 SenseMI 技能，让 Zen 架构处理器有更好的表现。

2016年后海光得到 AMD 高端处理器授权，并基于此研发设计了第一代产品。
2016 年 3 月和 2017 年 10 月，海光微电子、海光集身分离与 AMD 签署了《技能容许协议》，约定 AMD 将高端处理器干系技能及软件容许给两家合伙公司，授权专利评估价格分别为 4738、8886 万美元，共计 1.36 亿美元。
2016 年 3 月，基于 AMD 授权技能公司启动海光一号 CPU 产品设计；2018 年 4 月，海光一号实现量产。
2018 年公司第一代范例 CPU 产品与 AMD 同代产品性能靠近。
海光一号高端做事器 Hygon 7185 是基于 AMD 授权的第一代产品，AMD 基于该授权技能的第一代产品为 AMD EPYC 7551。
根据 SPEC 官方网站干系数据，SpecCPU 2017 测试中二者性能靠近。

造成以上差距的紧张缘故原由系海光创立之初，研发团队构成及职员组成较 AMD 有较大差距，因此第一代产品海光 7185 尚无法进行全面系统调优。
同样，来自外洋威信硬件评测网站 AnandTech 的一篇测评也验证了类似的结论1。
该网站测试了 8 核 PC 芯片 Dhyana（Hygon 3100）、32 查究事器芯片 Dhyana Plus（Hygon 7100）。
在 RDRAND（用于从芯片上的硬件随机数天生器中获取随机数）指令延迟测试中，海光 PC 芯片相对 Zen 初代锐龙更有上风，且海光做事器芯片上风达到 40~50%；但同时，该测评创造在 RDSEED 算法测试中，只管海光 PC 芯片保持上风，但海光做事器版 CPU 将延迟速率减慢 1/10，AnandTech 预测这是因指令集不完全带来的性能折损。

在 AES Encoding、GeekBench Crypto 两项加密测试中，海光结果较差，紧张由于 Zen 架构中 AMD SEV 虚拟化加密技能，涉及 RSA、ECDSA、ECDH、SHA、AES 等加密算法，海光以海内标准 SM2、SM3、SM4 进行修正。
事实上后续 SiSoftware Sandra 测试数据库中，海光 7185 在加解密测试项目中，一度达到环球第一，加密、解密、哈希带宽均达到了 101GB/s。
综上，2016 年海光取得 AMD 授权的 Zen 架构后，2018 年推出的一代芯片与同代次的AMD芯片，只管存在差距，但差距较小。
同时下表可见，价格上初代产品与 AMD/Intel 靠近。

3.2.独立研发后海光二、三号迭代路径，三方面重点提升

2018 年后，海光持续迭代，截至 2021 年发卖以海光二号为主，研发开始迭代至海光四号。
2019 年 6 月，AMD 依照美国商务部《出口牵制条例》规定，不再向公司供应处理器设计干系技能。
在该等不利条件下，公司仍旧成功研发出第二代 CPU 产品。
海光二代产品 Hygon 7285 与 AMD 二代做事器芯片 EPYC 7542 核心参数类似。
二者都利用 32 核 64 线程，差异在于 EPYC 7542 利用 7nm 工艺，且 L3 缓存达到 128MB。
AMD 在 Zen 二代架构做出的升级在后文论述。

海光二代做事器 CPU 与 AMD 同代产品虽然有性能差距，且比较一代可能差距扩大，然仍属于同代际产品。
根据 SPEC 数据，海光第二代 CPU 产品较公司第一代 CPU 产品的性能提升了 22.71%-24.24%，整型与浮点性能提升程度靠近。
AMD 基于授权技能的第二代同类型产品 AMD EPYC 7542 在整型打算性能上差距 16%-18%，在浮点打算能力上差距 13%-16%，比较一代差距扩大，然仍属于同代际产品。

海光二代做事器 CPU 与 Intel 同代次产品性能靠近，尤其是浮点性能差异缩小明显。
通过综合比较处理器市场定位、核心数量、产品售价等成分，公司选取了 Intel 在 2020 年（与海光 7285 同期）发布的 6 款至强铂金系列做事器 CPU，与海光 7285 进行性能比拟。
结果显示，海光 7285 与 Intel 同期发布的 8376H 芯片，在整数和浮点测试终性能差距分别为 8.62%、4.38%。
英特尔至强铂金 8300 系列利用 28 核 56 线程，海光 7200 系列使用 32 核 64 线程，通过更高的核数，海光性能与英特尔同代产品靠近。

比较于华为鲲鹏 920，海光 7285 有更佳的测试结果。
2019Q1，华为发布了鲲鹏 920 芯片，支持最大 64 核，主频 2.6GHz，8 通道 DDR4，支持 PCIe 4.0。
根据 SPEC 2017，基于鲲鹏 920 的 4 路做事器测试结果，整型根本性能 628，浮点根本性能 516，2 路做事器整型根本性能 314，浮点根本性能 279.这一结果在 2019 年的同代做事器中较精良。
但其后由于多种缘故原由鲲鹏并未公布新处理器参数与结果。
若比较 2020Q1 发布的海光 7285，鲲鹏在双路测试中数据已掉队，性能差异鲲鹏/海光-1，整数/ 浮点分别 -9.77%/-9.42%。

比较一号，海光二号紧张增加浮点性能，同时增加国密算法等适应海内需求的增值功能。
根据公司招股书和部分专业硬件网站测评整理，我们认为公司在海光二代后紧张做出以下方向迭代考试测验：

1、微架构的更新，尤其是浮点性能提升

2018 年后，公司投入更多浮点自研。
由 CPU 设计中央主任工程师黄河3带队，对 CPU 浮点协处理器微构造设计、验证与实现进行前瞻性根本研究。
2020 年 10 月，取得了浮点数处理装置、浮点数加法装置及浮点数处理方法发明专利。
截至招股书发布，海光在微架构设计方面已取得多项前辈性成果。
自主研发的基于 TAGE 算法和 ITTAGE 算法的分支预测器有效适配了海光 CPU 微构造；高带宽指令译码微构造技能和新的高效微构造算法在硬件资源开销基本不变的情形下得到额外的性能收益，并提升了指令并行实行度；同时多线程技能实现了硬件多线程间资源划分与动态分配、解决多线程导致的微构造性能瓶颈；逻辑设计与物理布局紧密交互实现了打算指令节拍数种类多、流水线时序掌握较繁芜、向量打算数据通路位宽高的繁芜浮点协处理器微构造设计。

2、加密和处理器安全技能提升，更加适应本土环境

在密码运算方面，海光以海内标准 SM2、SM3、SM4 进行适配。
事实上后续 SiSoftware Sandra 测试数据库中，海光 7185 在加解密测试项目中，一度达到环球第一，加密、解密、哈希带宽均达到了 101GB/s。
除此以外，海光在可信实行、可信平台打算方面也取得了技能前辈性。
可信实行环境方面，基于数据自动加解密，有效防止安全攻击，供应前辈的云打算上全流程安全实行环境；海光加密安全容器方案利用不同密钥对容器的运行状态进行加密。
处理器内置可信计算平台，支持中国标准 TPCM 和国际标准 TPM 2.0。
可信打算平台不仅实现了可信打算所需的信赖根，还可以对系统进行主动的度量及监控，并在检测到非常时及时采纳方法，有效保护系统，符合等保 2.0 哀求。
在 CPU 漏洞防御方面，海光 CPU 对熔断漏洞免疫，对幽灵漏洞和侧信道漏洞则采取有效的软硬件技能进行防御。

在得到授权之初，海光一号发展初期将基板开拓委托至 AMD 完成。
双 Die CPU 封装基板属于高端处理器专用，技能难度很高。
公司得到 AMD 技能授权初期，尚不具备独立开拓双 Die CPU 封装基板能力，因此，海光通过技能做事协议将基板开拓事情委托给 AMD 完成。
2020 年往后，公司已经基本节制了干系基板开拓技能，并独立组建了技能开拓团队，具备了双 Die CPU 封装基板开拓能力。

3.3.与AMD不合，Zen3后可能更看重提升消费级市场

AMD Zen2 后比较一代迭代较大，无论工艺、IPC、缓存，整体性能差距一度拉大。
海光一号处理器在核心布局上和原版 Zen 完备相同，缓存容量、TLB 容量、端口布局等接近，如一级指令缓存 4 路 64KB，一级数据缓存 8 路 32KB，二级缓存 8 路 512KB，三级缓存 16 路 8MB。
二者性能上也靠近。
但是根据上文可知，海光二代与 AMD 二代开始出现差异，紧张由于 Zen 架构开始涌现较大迭代。

2019 年 7 月，AMD 发布了基于 Zen 2 架构的 Ryzen 3000 系列处理器，比较前代 Zen 2 提升显著。
一代 EPYC 利用 4x MCM，4 块 Zeppelin die 用 IF 连接。
第二代 EPYC 则利用 Infinity Fabric，将 I/O 部分分离成一颗独立的 I/O die（IOD），利用 14nm 制程制造（做事器 14nm，PC TSMC 12nm），位于封装中央；周围则是 8 颗 7nm 的 CPU 核心 chiplet，每颗包含 8 颗 Zen2 核心。

7nm 带来的变革。
基于 Zen 2 架构 Ryzen 3000 系列是首款采取 7nm 工艺的处理器，同时期工厂不再是格罗方德，而是台积电。
这一工艺实现了两倍的晶体管密度、同性能下功耗降落 50%或者同功耗下性能提升 25%的变革。
Zen 2 架构与 Zen+架构比较，单线程性能提升了 21%，个中有 60%是来自架构优化 IPC 的提升，其余 40%则是来自 7nm 工艺所带来的频率提升。

L3 缓存比较 Zen 实现翻倍，做事器最大 L3 缓存升级到 128MB。
Zen2 支持 4K 指令 AVX2 指令集，1 个核心内部有 4 个整数单元和 2 个浮点单元，AMD Zen2 的每个 8 核的 die 里拥有 32MB 的共享式三级缓存。
采取了新的 TAGE 分支预测器，将预测缺点率大幅降落了 30%。
引入新的内存掌握器。
过往内存频率和 Infinity Fabric 总线频率是 1:1 对应，新的内存掌握器引入 IF 总线与内存的分频机制，以 DDR4-3733 为分边界，在该频率以下内存/IF 总线因此 1:1 对应，以上就会自动切换到内存/IF 总线 2:1 分频，使得内存频率不再受到 IF 总线限定，从而得到更高的内存带宽。

首款支持 PCIe 4.0 的消费级处理器。
AMD 供应了 X570 芯片组，拥有 16 条 PCIe 4.0 通道以及 12 个 SATA 6Gbps。
PCIe 4.0 的引入，使得 M.2 SSD 接口的带宽从 4GB/s 翻倍到 8GB/s。
整体来看，Zen2 架构升级较大：将打算核心和 I/O 接口部分分离，首次开始利用 7nm 核心，做事器核心数与L3最大缓存都比较前一代翻倍，微架构连续优化，首次支持 PCIe4.0。
AMD声称通过这些改进，得到了在SPEC2006 intSpeed/Base上取得了15%的IPC提升，这与 Skylake 比较 Haswell，Haswell 比较 Sandy Bridge 在该项目的提升类似。

只管 Zen3 在工艺和核心架构设计上延续了 Zen2 整体思路，但仍旧通过核间共享内存等改进提升 IPC 约 19%。
在指令集方面，基于 Zen3 的 AMD 做事器芯片扩展了 AVX2 指令到 256 位，设计思路上连续采取了 9 个小芯片的 Chiplet（8 CCD+IOD），Zen3架构中每个 CCD 小芯片中的 8 个核心都能够同时共享 32MB 的缓存，以此来降落时延、极大提升了单核性能，对付那些须要用内存子系统比较密集的运用提高性能。

单核性能的增加使得 Zen3 架构处理器在游戏任务上比较二代有了显著的提升。
2020 年后，AMD 基于 Zen3 架构推出了 PC 处理器 Ryzen 5000 系列，此后 PC 市场 AMD 开始反超 Intel。
Zen2 时期 PC 市场中，只管 AMD 处理器有较强多核性能、更高性价比的上风，但由于单核性能限定，在游戏任务中表现与 Intel 仍有差距。
Zen3 后，AMD 处理器游戏性能提升明显，在战地 4、CS、英雄同盟、绝地求生等游戏等分别取得了 27%-39%的性能提升。

根据 AMD，截至 Zen3 架构，AMD 已在根本芯片性能上正式反超 Intel。
尤其在 PC 市场，有了较高竞争力。
但在做事器市场，性能只是客户考虑的浩瀚成分之一，适配、稳定性、生态也是极为主要的成分，因此 Intel 仍旧在做事器市场稳定霸占较高份额。

综上，AMD 从 Zen1 到 Zen2/3 每一代次都实现了较大的迭代，包括性能、工艺、微架构等。
但 Zen3 后的升级可能更加重视单核性能的提升，这一重点使得 AMD 处理器在消费级 PC 市场有更强的竞争力。
而在做事器市场，由于生态、稳定性等缘故原由，Intel 仍具有无法撼动的地位。
因此，我们可以认为，以做事器作为核心市场的海光处理器芯片，在海光二号后所选取的迭代路线与 AMD Zen3 后的路线开始涌现不合。

3.4.如何理解海光研发能力和生产线独立性

海光研发团队架构完全，多数核心研发职员具有二十年以上高端处理器研发履历。
公司已经在北京、成都、苏州、上海等地建立了近千人的研发团队，从事处理器微构造设计、 SoC 架构设计、处理器安全、IP 设计、验证测试、物理设计、封装设计等事情。
公司核心技能职员均已实现市场化勉励，且通过持股平台蓝海轻舟合资实现核心员工全体股权勉励。
核心技能职员通过员工持股平台间接持有公司股份，将个人利益与公司可持续发展的长期利益绑定，从而确保了核心技能团队的稳定性和凝聚力。

AMD 仅供应技能授权以及针对技能授权的部分做事支持，不会供应后续更新技能，相关技能面临迭代风险。
海光按照协议和 AMD 同时在该技能授权的根本上进行产品研发。
海光三号成功流片、海光四号完成了电路设计和性能仿照，证明了公司全面节制了高端处理器设计技能，具备了产品迭代研发能力。

海光是范例的 Fabless 模式企业，紧张卖力制订芯片的规格参数与方案、进行芯片设计和验证、交付芯片设计版图等。
而芯片的晶圆加工、封装测试通过委外办法完成。
公司向晶圆制造厂采购定制加工生产的晶圆，向封装测试厂采购封装测试做事，期间公司辅以工艺管理和测试支持。
详细来说 1）对海光 CPU 产品：晶圆代工厂向封测代工厂的交付物为半成品晶圆或成品晶圆，由封测代工厂完成裸片封装和产品测试事情；2）对海光 DCU 产品：晶圆代工厂向封测代工厂的交付物为已完成晶圆加工、裸片封装的 DCU 半成品，由封测代工厂完成产品测试事情。

4.充分把握做事器国产化机遇，收入高增

4.1.CPU量：充分有益于做事器行业市场国产化替代

CPU 的下贱运用市场紧张分为：政务及重点行业市场、企业级市场、消费级市场。
其中，政务及重点行业市场对安全性以及自主可控哀求最高，同时对生态的哀求相对最低，是与国产 CPU 前期发展水平相匹配的，因此这部分市场是国产 CPU 发展的根基所在。
整体静态市场，2021 年，根据 IDC 数据，环球 PC 出货近 3.5 亿台，环球做事器出货超过 1300 万台。
考虑国产 CPU 未来较长一段韶光紧张聚焦海内市场，海内出货量更有代表性。

整体市场，做事器 CPU 需求约 800 万颗/年。
根据行业老例，一台 PC 对应一颗 CPU， 2021 年中国 PC 出货量超过 5000 万台，则整体 PC CPU 需求超过 5000 万颗。
根据 IDC 数据，做事器市场超过 85%的做事器为 2 路做事器，即一台做事器对应 2 颗 CPU，则中国区整体做事器 CPU 需求约为 800 万颗。

4.2.CPU价：通过产品迭代，保持价格稳中有增

我们预测 7000 系列产品 2022-2025 年出货量分别为 27.60/35.97/47.15/61.31 万片，总发卖金额分别为 31.88/43.16/59.41/76.64 亿元。
主要假设为： 1）7000 发卖量占海光中高端做事器 75%（海光中高端做事器出货量测算见 4.1）， 2022 年发卖金额占整体收入约 60%； 2）2022-2024 年主力出货型号分别为 7200、7300、7400 系列，详细每个型号出货量占比； 3）7200、7300、7400 芯片第一年发卖价格约为 14000 元/片，第二年、第三年发卖价格逐渐低落为约 12000、10000 元旁边。

我们预测 5000 系列产品 2022-2025 年出货量分别为 9.20/11.99/15.72/20.44 万片，总发卖金额分别为 6.31/9.11/12.70/16.35 亿元。
主要假设为： 1）5000 发卖量占海光中高端做事器 25%（海光中高端做事器出货量测算见 4.1）； 2）2022-2024 年主力出货型号分别为 5200、5300、5400 系列，详细每个型号出货量占比； 3）5200、5300、5400 芯片第一年发卖价格约为 9000 元/片，第二年、第三年发卖价格逐渐低落为约 7500、4500 元旁边。

综上，我们预测 2022-2025 年海光信息中高端服务器出货片数分别为 36.81/47.96/62.87/81.75 万片。
个中 75%发卖量为 7000 系列出货。
预测整体中高端系列发卖金额 2022-2025 为 38.19/52.27/72.11/92.99 亿元。

除中高端做事器以外，海光同时发卖 3000 系列，紧张运用于事情站和边缘打算做事器，面向入门级计算领域。
我们预测 3000 系列产品 2022-2025 年出货量分别为 44.17/58.08/80.50/103.32 万片，总发卖金额分别为 4.24/5.81/8.01/10.33 亿元。
重要假设为： 1）3000 发卖金额占海光整体 CPU 发卖金额约 10%（海光 CPU 中高端产品发卖金额预测如上，假设占整体 CPU 中发卖金额的 90%）； 2）2022-2024 年主力出货型号分别为 3200、3300、3400 系列，详细每个型号出货量占比； 3）3200、3300、3400 芯片第一年发卖价格约为 1100 元/片，第二年、第三年发卖价格逐渐低落为约 1000、900 元旁边。

综上，我们预测 2022-2025 年海光 CPU 发卖收入为 42.43/58.08/80.12/103.32 亿元，同比增速达到 105%/37%/38%/29%。
实现了伴随重点行业国产化率提升的规模发卖。

4.3.DCU：2022年后发卖占比逐渐提升

海光 DCU 属于 GPGPU 的一种，兼容“类 CUDA”5环境。
海光 DCU 协处理器全面兼容 ROCm GPU 打算生态，紧张支配在做事器集群或数据中央。
海光 8100 能够充分挖掘运用的并行性，发挥其大规模并行打算的能力，快速开拓高能效的运用程序。
海光 8100 采取前辈的 FinFET 工艺，范例运用处景下性能指标可以达到国际同类型高端产品的同期水平。

海光深算二号、三号与国际一线同类产品基本属于同一代际。
根据公司 IPO 前公开拓布会，海光 DCU 同时支持全精度和半精度演习，有稀缺性。
估量 2023 年底量产的 DCU3 性能与 NVDIA H100 性能持平。
已量产的 DCU2 约即是 70% NVDIA A100，双方在仿照效率和精度都处于同一代际。

我们预测海光 DCU 8000 系列产品 2022-2025 年出货量分别为 4.10/6.44/8.04/11.66 万片，总发卖金额分别为 7.49/11.90/17.59/24.24 亿元。
主要假设为： 1）2022 年 8000 系列占整体发卖收入约 15%，到 2025 年这一比例逐渐提升至靠近 20%； 2）2022-2024 年主力出货型号分别为 8100、8200、8300 系列，详细每个型号出货量占比； 3）8100、8200、8300 芯片第一年发卖价格约为 22000 元/片，第二年发卖价格逐渐低落为约 18000 元旁边。

（本文仅供参考，不代表我们的任何投资建议。
如需利用干系信息，请参阅报告原文。
）

精选报告来源：【未来智库】未来智库 - 官方网站