环球首颗3D封装芯片出身!
周四,总部位于英国的AI芯片公司Graphcore发布了一款IPU产品Bow,采取的是台积电7纳米的3D封装技能。

据先容,这款处理器将打算机演习神经网络的速率提升40%,同时能耗比提升了16%。

能够有如此大的提升,也是得益于台积电的3D WoW硅晶圆堆叠技能,从而实现了性能和能耗比的全面提升。
正如刚刚所提到的,与Graphcore的上一代比较,Bow IPU可以演习关键的神经网络,速率约为40%,同时,效率也提升了16%。
同时,在台积电技能加持下,Bow IPU单个封装中的晶体管数量也达到了前所未有的新高度,拥有超过600亿个晶体管。
官方先容称,Bow IPU的变革是这颗芯片采取3D封装,晶体管的规模有所增加,算力和吞吐量均得到提升,Bow每秒可以实行350万亿flop的稠浊精度AI运算,是上代的1.4倍,吞吐量从47.5TB提高到了65TB。
Knowles将其称为当现代界上性能最高的AI处理器,确实当之无愧。
Bow IPU的出身证明了芯片性能的提升并不一定要提升工艺,也可以升级封装技能,向前辈封装转移。
Graphcore 首席技能官和联合创始人Simon Knowles表示,「我们正在进入一个前辈封装的时期。在这个时期,多个硅芯片将被封装在一起,以填补在不断放缓的摩尔定律 (Moore’s Law) 道路上取得的不断进步所带来的性能上风。」
台积电真WoW!2018年4月,在美国加州圣克拉拉举行了第二十四届年度技能研讨会。在这次会上,环球最大的半导体代工企业台积电首次对外公布了名叫SoIC(System on Integrated Chips)的芯片3D封装技能。
这是一种整合芯片的封装技能,由台积电和谷歌等公司共同测试开拓。而谷歌也将成为台积电3D封装芯片的第一批客户。
什么是封装技能呢?
封装技能的紧张功能是完成电源分配、旗子暗记分配、散热和保护等任务。而随着芯片技能的不断发展,推动着封装技能也在不断改造。
而3D封装技能,大略来说,便是指在不改变封装体尺寸的条件下,在同一个封装体内,在垂直方向上叠放两个或者更多芯片的技能。
相较于传统的封装技能,3D封装缩小了尺寸、减轻了质量,还能以更快的速率运转。
台积电在年度技能研讨会上表示,SoIC是一种创新的多芯片堆叠技能,是一种晶圆对晶圆的键合技能。SoIC的实现,是基于台积电已有的晶圆基底芯片(CoWoS)封装技能和多晶圆堆叠(WoW)封装技能所开拓的新一代封装技能。
晶圆基底芯片(CoWoS),全称叫Chip-on-Wafer-on-Substrate,是一种将芯片、基底都封装在一起的技能。封装在晶圆层级上进行。这项技能从属于2.5D封装技能。
而多晶圆堆叠技能,或者堆叠晶圆(WoW,Wafer on Wafer),大略来说,便是取代此前在晶圆上水平放置事情单元的技能,改为垂直放置两个或以上的事情单元。这种做法可以使得在相同的面积下,有更多的事情单元被放到晶圆之中。
这样做还有另一个好处:每个晶片可以以极高的速率和最小的延迟相互通信。乃至,制造商还可以用多晶圆堆叠的办法将两个GPU放在一张卡上。
但也存在问题。晶圆被粘合在一起后,一荣俱荣、一损俱损。哪怕只有一个坏了,另一个没坏,也只能把两个都丢弃掉。因此,晶圆量产或成最大问题。
而为了降落本钱,台积电只在具有高成品率的生产节点利用这项技能,比如,台积电的16nm工艺。
相较于CoWoS和WoW,SoIC更倚重CoW(Chip on Wafer)设计。对付芯片业者来说,采取CoW设计的芯片,生产上会更加成熟,良率也可以提升。
值得一提的是,SoIC能对小于即是10nm的制作过程进行晶圆级的键合。键合技能无疑会大大提高台积电在这方面的竞争力。
练手怎么样?
Bow是IPU-POD人工智能打算系统的核心,称为 BOW PODs。
它可以从16个BOW芯片扩展到1024个,供应高达358.4千亿次的打算机运算速率,同时合营多达64个CPU处理器。
新的Bow-2000 IPU Machine是Bow Pod系统的构建块。
它是基于与第二代IPU-M2000 machine同样鲁棒的系统架构,但是配备了四个强大的Bow IPU处理器,可供应1.4 PetaFLOPS的人工智能打算。
这么厉害的芯片,还不赶紧拿来练练手?
近年来,措辞模型的参数量不断刷新。从惊艳四座的谷歌BERT,到OpenAI的GPT-3,再到微软英伟达推出的威震天等等。
都对演习时所需的打算性能提出了更大哀求。
根据Graphcore公布的初始数据可以看出,这些模型在最新的硬件形态上都有很大的性能提升。
MLPerf v1.1演习结果
其余,在图像方面,无论是范例的CNN网络,还是近期比较热门的Vision Transformer网络,以及深层次的文本到图片的网络。
与上一代产品比较,Bow IPU都有30%到40%的性能提升。
对付最前辈的打算机视觉模型EfficientNet,Bow Pod16能够供应可比Nvidia DGX A100系统5倍以上的性能,而价格只有它的一半,总体拥有本钱上风提升高达10倍。
下一步,超级智能AI打算机Graphcore本日还宣告了一件重大的事,正在开拓一款超级智能AI打算机,要在2024年推出,售价1.2亿美元。
我们知道,大脑是一个极其繁芜的打算设备,在一个生物神经网络系统中拥有大约1000亿个神经元和超过100万亿个参数,它供应的打算水平是任何芯片打算机都无法比拟的。
而这款超级智能AI打算机Good将超越人类大脑的参数能力。
Good打算机名字何来?因此打算机科学先驱 i.j. Jack Good 的名字命名。
Jack Good在1965年的论文《关于第一台超级智能机器的推测》中就描述了一种超越我们大脑能力的机器。
未来,它可以进行超过10 Exa-Flops的人工智能浮点打算,最高可达4PB的存储,带宽超过10PB/秒。
Graphcore的首席实行官Graphcore表示,「当我们创建 Graphcore 的时候,我们脑海中一贯有一个想法,那便是建造一台超智能打算机,它将超越人脑的能力,这便是我们现在正在努力做的事情。」
参考资料:
https://spectrum.ieee.org/graphcore-ai-processor
https://www.zdnet.com/article/ai-computer-maker-graphcore-unveils-3-d-chip-promises-500-trillion-parameter-ultra-intelligence-machine/
https://www.hpcwire.com/2022/03/03/graphcore-launches-wafer-on-wafer-bow-ipu/










