译者 | Sambodhi
策划 | 凌敏
随着人工智能(AI)在企业运营中的核心浸染日益凸显,越来越多的企业开始将目光投向这一前沿技能,准备投入巨资以获取竞争上风。AI 芯片则成为推动这统统的关键。只管过去 AI 芯片在一定程度上被忽略,但最近,OpenAI 的 Sam Altman 流传宣传,他操持筹集高达 7 万亿美元的资金,用于支持一项 “野心勃勃” 的科技项目,旨在大幅提升环球芯片产能。抛开地缘政治等成分不谈,关注 AI 芯片意味着要理解本日的寻衅和来日诰日的机遇。

根据 IMARC 最近的一项研究,到 2029 年,环球人工智能芯片市场估量将达到 8960 亿美元。这一预测基于多个成分,包括人工智能技能的持续进步、消费电子产品对 AI 芯片需求的不断增长,以及 AI 芯片领域的创新活动日益生动。
在 AI 硬件领域,拥有丰富履历和深刻见地的专家并不多见,Alphawave 的首席实行官兼联合创始人 Tony Pialis 正是个中之一。在一次对话中,Pialis 分享了他对 AI 芯片领域的独到不雅观点,个中涉及芯片技能的变革性发展、专用于演习和推理的硬件创新,以及仿照和光学打算等新兴方向的前景。
在半导体创业领域,Tony Pialis 的名字堪称传奇。他先后创立并成功出售了两家初创公司:Snowbush Microelectronics 和 V Semiconductor Inc。个中,V Semiconductor 在 2012 年被英特尔收购,Pialis 在此期间担当了仿照和稠浊旗子暗记 IP 的副总裁。
2017 年,Pialis 与互助伙伴共同创立了 AlphaWave,目标直指 “下一个伟大的半导体公司”。Alphawave 于 2021 年上市,市值达到 45 亿美元。该公司的核心产品包括硅 IP、芯片、定制硅和高速互连技能,专为谷歌、微软、亚马逊和 Meta 等紧张超级扩展客户量身定制。
Alphawave 之以是能成为人工智能领域的幕后推手,背后离不开 Pialias 的前瞻性思考。他敏锐地不雅观察到,如今推动数据中央和打算扩展的紧张力量已不再是传统的网络设备供应商如思科,而是转向了谷歌、微软、亚马逊和 Meta 等超级扩展器。这些科技巨子不仅具备强大的内部设计能力,还自主构建做事器、网络、数据中央和校园根本举动步伐。
在 Pialias 看来,人工智能发展的紧张寻衅并非打算本身。实际上,设计和实现打算的能力早已成熟。真正的寻衅在于如何处理海量数据所需的连接技能。而这正是 AlphaWave 所专注的领域。
专用人工智能硬件的爆炸性增长虽然像 ChatGPT 这样的消费者运用在 2023 年初引发了热潮,但有关企业采取的报告却褒贬不一。然而,据 Pialis 称,AI 半导体行业在 2023 年下半年在各行各业和地理位置都涌现了巨大的投资和新的设计。
Pialis 指出,美国、加拿大、英国、法国、德国、韩国和日本等国家纷纭提出了建立海内 AI 芯片能力的紧张国家倡议。这些国家长期以来依赖于 NVIDIA 等供应商,但现在各国政府正努力造就本土芯片家当,以减少对单一供应商的计策依赖。只管 NVIDIA 首席实行官 Jensen Huang 也强调每个国家都须要主权 AI,但这彷佛不包括硬件层面。
Pialis 认为,这种激增的需求不仅促进了初创企业的兴起,还推动了科技巨子开拓专门的演习和推理硬件。在他看来,虽然并非每个组织都能或该当开拓自己的 AI 模型,但这种情形注定会发生变革。
Pialis 预测:“随着韶光的推移,AI 将不可避免地发展成为类似公用奇迹的东西,超级扩展器将供应所有打算能力的访问权,就像电力一样。我认为这将是价格合理的。任何人都将能够利用这种公用奇迹来演习、开拓、优化和支配他们自己的模型。”
然而,他也承认,在达到这一状态之前,还有很多收益可以获取,而终极实现这种状态所需的韶光仍充满不愿定性。
人工智能芯片竞赛中的参与者在 AI 加速器领域,NVIDIA 无疑是当前的领军者,这一点得到了包括 Pialis 在内的业界人士的广泛认可。同时,AMD 也被视为有力的竞争者,其 CEO Lisa Su 的领导能力受到了赞誉。此外,还有如 Ben Lorica 等行业不雅观察者看好 AMD 在 GenAI 芯片市场上的潜力。
然而,Pialias 警告称,不应忽略英特尔在这个领域中的潜力。他特殊提到,由 David Dahan 领导的英特尔 Habana 收购部门是该领域的一匹黑马,具有强大的实力。作为曾在英特尔事情过的人,Pialis 对 Habana 的事情给予了高度评价。
通过宣布 Habana、与 Dahan 见面并追踪他们的 MLPerf 结果,我们方向于赞许这一不雅观点。Dahan 帮助设计了新的英特尔处理器,在关键基准测试中展现出了超越 NVIDIA 最新 GPU 的性能。
只管性能至关主要,但 Pialias 也指出,NVIDIA 在 AI 芯片领域的软件平台,包括 CUDA,为其带来了巨大的竞争上风。生态系统效应显著,浩瀚工程师和研究职员为 NVIDIA 的架构开拓了优化的框架和模型。
然而,这并不虞味着没有替代的可能性。Pialis 认为,借鉴 AMD 的履历,AI 硬件公司须要配备足够的软件工程师来支持硬件工程师的事情。只管目前关于 NVIDIA 和硬件的谈论很多,但实际上,大部分的投资都集中在软件上。
这一点得到了 NVIDIA 的 Dave Salvator 的证明。在 2023 年末了一次 MLPerf 结果简报会上,Salvator 表示,NVIDIA 拥有两倍于硬件工程师数量的软件工程师。他强调,这并非有时,而是公司计策的主要组成部分。
Pialis 认为,在推理加速器市场上,寻衅者具有更大的潜力,由于该领域的标准仍在形成中。例如,OctoML 的 Luis Ceze 分享了 vLLM、MLC-LLM、LoRAX 和 Punica 等创新办理方案,这些方案分别针对 LLM 做事、便携式支配、多路复用微调模型推理平分歧需求。事实上,推理市场的规模比演习市场更为弘大,正如 Pialis 所指出的那样。
“人们每每更关注演习、大模型和演习本钱,但我们都在推理端受益。这须要大规模支配,须要多样化的办理方案。推理端将发卖更多的芯片,我相信随着销量的增加,商业操持也会得到相应的改进。”Pialis 说道。
初创公司如 Groq 和 Tenstorrent 正在吸引大量资金,而来自英国、韩国和中国等国家的公司也在努力减少对美国公司的依赖。在超级扩展器方面,Pialis 认为亚马逊和谷歌处于领先地位,微软展现出强劲的发展势头,而 Meta 则稍显掉队,乃至有传言称他们可能会收购一家较小的初创公司来增强自身实力。
芯片组件引领技能革命据 Pialis 所述,半导体行业正经历一场重大变革,即向芯片组件的转变。过去,技能进步的标志是将更多功能集成到单一芯片中。然而,随着晶体管尺寸缩小至约 5 个原子宽度,即便是眇小的毛病也可能导致全体芯片失落效。
Pialis 通过自身经历进一步阐释了这一点。他提到,在某次访问 OpenAI 时,目睹了一群工程师跪在做事器前祈祷。他们的担忧并非源于 “对通用人工智能的敬畏”,而是害怕演习的模型因芯片毛病而崩溃。
芯片组件在中美贸易战的背景下备受关注,成为两国科技计策的核心组成部分。对付中国和美国而言,芯片组件不仅是技能进步的象征,更是掩护国家科技竞争力的关键。
Pialis 认为,“芯片组件是对抗技能极限的又一次革命性创新。”
这些寻衅并非源于超自然力量,而是由纳米尺度下物理定律的繁芜性所引发。
Pialis 阐明道:“当我们制造晶体管 —— 集成电路的基本构件时,实际上是在操控原子。随着原子数量的减少,从数百个到仅两个,概率和均匀法则不再适用。因此,我们更随意马虎碰着毛病问题。”
为了战胜这些纳米尺度带来的物理寻衅,芯片组件作为一种创新办理方案应运而生。这种设计方法将传统的单一大芯片拆分为更小的、类似乐高积木的芯片组件,并通过前辈的封装技能将它们连接起来。这种模块化设计许可制造商避免因单个组件的毛病而废弃全体设备,从而显著提高了生产效率。Pialis 表示,这种好处对制造商和买家都很主要。
Pialis 强调:“在这一变革中,硅的角色正在发生转变。它不再是领先半导体的核心,而是成为了封装技能中的一个组件。当前,关于半导体供应链的谈论风起云涌,硅的产能充足。然而,在封装方面,特殊是利用芯片组件构建的设计方面,产能仍旧捉襟见肘。”
芯片组件作为乐高积木般的构建块在浩瀚 AI 硬件公司中,Cerebras 以其独特的晶圆级硬件设计脱颖而出。只管 Pialis 认为 Cerebras 同样会面临纳米尺度上的物理寻衅和毛病问题,但他也指出,Cerebras 的方法在于其冗余性设计。
在 Cerebras 的方案中,晶圆被视为一个整体面板,而不是被切割成单独的芯片。这意味着芯片之间的连接和交互在晶圆级别上得以实现,从而通过软件处理潜在的毛病。这种方法的独特之处在于,它摒弃了传统的封装办法,而是将多个芯片在晶圆上直接连接。
然而,Pialias 也强调了切割芯片的上风。对付像英特尔这样的供应商来说,通过将硬件拆分成更小的部件,如 CPU、GPU、DPU 或网络设备,这些部件就像乐高积木一样,可以根据不同的需求进行组合和配置。
因此,你可以有一个处理器核心芯片组件,一个 PCI Express 连接性芯片组件,一个以太网网络芯片组件,一个 DDR 内存 I/O 芯片组件,一个内存 I/O 芯片组件。这些芯片组件可以稠浊搭配在一个封装中,构建出全体产品系列。Pialis 认为,从设计繁芜性和前期投资的角度来看,这是一个成功的方案。
据 Pialis 估计,采取芯片组件的方法可以将本钱降落 60% 以上,功耗降落 40%。这对付超大规模数据中央来说是一个巨大的勉励成分。只管目前苹果、AMD 和英特尔等公司在芯片组件领域处于领先地位,但 Pialias 认为,随着技能的不断进步和市场的竞争加剧,芯片组件将成为任何专注于领先硬件的公司的必备条件。
软件与芯片组件模块化、组合和可编程性在软件工程中,模块化已成为一种标准的构建办法,这不禁让人思考,为何芯片组件的模块化观点没有早些时候在硬件领域得到遍及。历史上,硬件领域的胜利者每每是那些能将最多功能集成到单片式设备中的厂商。
Pialis 指出,这背后的紧张缘故原由是本钱考量。单片集成降落了制造本钱,因此 “对集成的狂热关注” 成为了行业主流。然而,随着技能靠近原子尺度,制造本钱开始超过集成本钱,这一传统不雅观念开始受到寻衅。
与此同时,软件领域也面临着过度模块化可能带来的过度开销问题。
Pialis 估量,一些硬件供应商可能会过度采取芯片组件的方法。如果功能被过度分解为眇小的部分,整合这些部分的本钱可能会受到限定。因此,他认为终极将是一种稠浊方法获得胜利。利用芯片组件进行分解有两种紧张办法。
到目前为止,硬件领域的赢家是那些能够将最多功能集成到单片式设备中的人。但情形正在发生变革。
构建芯片组件的第一种办法是构建一种标准的、可镜像的芯片组件,这些组件具有相同的功能,并通过软件实现相互通信。这种办法在某种程度上与传统的硬件集成方法相似。然而,如何将这些相同的芯片组件积木组合在一起,则依赖于软件的设计和实现。
可以根据相同的芯片组件,利用软件为不同的需求组合不同的封装。例如,1、2、4 或 8 个芯片组件的多重。相同的硅,只因此不同的办法封装,价格不同,并且具有不同的软件来利用与这些设备干系的递增打算和内存带宽。
另一种构建芯片组件的方法是通过分割和切割,为不同类型的功能创建专门的芯片组件,类似于乐高积木。这可以创建出如打算芯片组件、演习 I/O 芯片组件、网络 I/O 芯片组件等多样化的构建块。Pialias 认为,这种方法背后的推动力更大,由于它不仅可以降落制造本钱,还可以通过重用这些乐高积木来加速其他产品的开拓。
仿照人工智能、光学打算和人工智能赞助硬件设计在当前以 GPU 等数字加速器为主导的时期,只管芯片组件供应了一种即时的提高方法,但 Pialias 强调,仍有其他根本性的技能不合值得探索。
人工智能的核心在于大规模并行的算术处理,个中二进制打算是主导方法。在二进制体系中,数字被简化为 1 和 0,而浮点算术则依赖于精度和范围的设定。
然而,仿照算术处理供应了一种不同的视角。在这种方法中,浮点数可以通过电压或电流来表示,理论上具有无限的精度。只管在现实天下的噪声滋扰下,这种方法的精度可能会受限,但对付边缘人工智能运用来说,它可能是一种有效的办理方案。眇小电流的利用使得设备能够在低功耗状态下运行。
还有另一种形式的打算,一些公司正在投资个中:光学打算也为算术运算带来了新的可能性。光学打算利用光学特性实现 MAC(乘积累加功能),这是任何算术单元的核心。这种方法有望降落功耗哀求。
Pialias 指出,仿照和光学打算正在吸引数十亿美元的投资,以知足在打算规模、能源效率和精度方面的专业需求。然而,目前尚不清楚仿照技能是否能够有效地扩展,以匹配数字打算在尖端人工智能模型中的运用。这一问题在硬件界引发了激烈的辩论。
此外,利用人工智能来设计用于驱动人工智能的硬件也成为一个新兴议题。Pialias 表示,如今最有效的硬件设计者每每是那些具备丰富软件开拓履历的专家。如果能够将他们的履历融入人工智能模型的演习中,可能会引发硬件设计领域的彻底变革。
虽然未来的道路充满寻衅和不愿定性,但 Pialias 坚信工程的基本原则是永恒的。我们期待这些新兴技能能够在不耗尽天下能源和资源的条件下,为人工智能和打算技能的发展带来新的打破。
作者简介:
George Anadiotis 在信息技能领域拥有丰富的履历。他的职业生涯涵盖了剖析师、顾问、工程师、创始人和研究员等多个角色。目前在 Linked Data Orchestration 担当研究员和作家。George 在成为“一人乐队”和“乐队指挥”的过程中,有机会学习和节制了许多技能。他曾在 Gigaom 担当剖析师,为财富 500 强企业、初创公司和非政府组织供应咨询做事,卖力培植和管理各种规模和形式的项目、产品和团队。George 热衷于研究、开拓、运用和谈论前沿观点和技能。是企业运用集成和大规模数据集成领域的先驱之一。
原文链接:
https://www.infoq.cn/article/0yeegtv0VYfQOewlXlTa