IBM NorthPole芯片测试：比常用的12nm和14nm能效高25倍_内存_芯片

文章目录 [+]

官方现在通过《科学》杂志揭橥了一组 NorthPole 的基准测试结果，堪称是一个新的里程碑。

根据对 ResNet-50 模型的测试，基于 TrueNorth 架构的 12 纳米芯片比常用的 12 纳米 GPU 和 14 纳米 CPU 功耗高 25 倍。

IBM NorthPole芯片测试：比常用的12nm和14nm能效高25倍_内存_芯片 IBM NorthPole芯片测试：比常用的12nm和14nm能效高25倍_内存_芯片科学

据 IBM 称，NorthPole 在延迟和打算所需的空间方面也表现更好，超过了所有主流架构，包括基于 4 纳米工艺的 GPU。

（图片来自网络侵删）

那么，它是如何实现这一成果的呢？由于它 256 个核心本身就集成了一块内存芯片而无需单独连接，NorthPole 用于 220 亿个晶体管，其每个核心都可以实行 2048 个运算。

该公司称，其架构肃清了冯・诺依曼瓶颈，该瓶颈环绕着大多数系统中 CPU 和 RAM 之间数据传输引起的延迟。
因此，它可以比市场上最好的 GPU（包括 Nvidia 最强 AI 显卡）运行得更快。

IBM 研究部门的 Dharmendra Modha 表示：“从架构上看，NorthPole 模糊了打算和内存之间的界线。
在单个核心层面上，NorthPole 表现为靠近内存的打算；而在芯片外部的输入输出层面上，它表现为主动内存。
”

IT之家把稳到，AMD 也探索了类似的技能，并成功将内存和打算构造集成到单个组件中。
上个月，Xilinx 便展示了其 Virtex XCVU7P 卡，个中包括八个内存加速器模块。

据先容，IBM 在其 NorthPole 芯片中为每个打算核心的添加了内存芯片，他们认为这个组件非常适宜新兴的 AI 用例，包括与打算机视觉干系的用场。
此外，它还经由了自然措辞处理和语音识别方面的测试。
NorthPole 还适用于边缘运用，这些运用可实时处理大量数据。

5nm芯片流片成功蔚来年夜胆迈出第一步但更大年夜难题在后头_芯片_中国