首页 » 科学 » 128核的大年夜芯片来了号称最通用的CPU_半导体_内核

128核的大年夜芯片来了号称最通用的CPU_半导体_内核

admin 2024-12-03 01:44:51 0

扫一扫用手机浏览

文章目录 [+]

(图片来源:Golem.de)

在性能方面,Tachyum 期待其旗舰 Prodigy T16128-AIX 处理器能为HPC 供应高达 90 FP64 TFLOPS 以及为推理和演习供应高达12 个“AI PetaFLOPS”,据推测当运行本机代码时花费高达 950W(并利用液体冷却)。
同时,Tachyum 的 Prodigy 处理器可以在 2 路和 4 路配置下事情。
详细来说,AMD 的 Instinct MI250X 在大约 560W 的 HPC 中具有 96 FP64 TFLOPS 的峰值吞吐量。
比较之下,Nvidia 的H100 SXM5 可以在 700W 时为AI供应高达20 INT8/FP8 PetaOPS/PetaFLOPS(稀疏性时高达 40 PetaOPS/PetaFLOPS)。
然而,这两种打算gpu都不能用于通用的事情负载。
这正是有趣的地方。

128核的大年夜芯片来了号称最通用的CPU_半导体_内核 科学

新CPU出身

Tachyum 的 Prodigy 是一款通用同质处理器,最多可容纳 128 个专有的 64 位 VLIW 内核,每个内核具有两个 1024 位矢量单元和每个内核一个 4096 位矩阵单元。
此外,每个内核都有一个 64KB 指令缓存、一个 64KB 数据缓存、1MB L2 缓存,并且可以利用其他内核未利用的 L2 缓存作为受害 L3 缓存。

(图片来源:Tachyum)

Tachyum 的首席实行官兼联合创始人 Radoslav Danilak 与 Golem.de交谈时表示,Tachyum 的 VLIW 内核是有序内核,但当编译器制造商进行适当优化时,它们可以支持 4 路无序问题。
(在新标签中打开). 他还再次强调,Prodigy 指令集架构可以通过利用所谓的毒位的软件实现非常高的指令级并行性。

据该公司称,这些内核运行为 Prodigy(VLIW 架构有望大放异彩)以及 x86、Arm 和 RISC-V 二进制文件编写并明确优化的本机代码,利用软件仿真并且不会降落性能。
从历史上看,所有让 VLIW 处理器实行 x86 代码的考试测验都失落败了(例如,Transmeta 的 Crusoe、Intel 的 Itanium),紧张是由于特定的 CPU 架构和仿真效率低下。
Tachyum 的卖力人承认,Qemu 二进制翻译将性能降落了 30% 到 40%(没有透露任何基线),但希望现实天下的性能仍旧足够高以具有竞争力。
同时,一些程序已经原生支持。

“我们本机支持 GCC 和 Linux,而且 FreeBSD 现在也可以在 [on Prodigy] 上运行,”Danilak 说。
“Apache、MongoDB 或 Python 已经原生运行,Pytorch 和 Tensorflow 框架也可用。

Tachyum 强调,Prodigy 不是加速器,而是真正的 CPU,将与 AMD、Intel 和其他公司竞争。
为确保处理器能够在通用和 AI 事情负载中供应具有竞争力的性能,自 2018 岁首年月次推出以来,该公司对其设计履行进行了大量变动。

“我们是 CPU 替代品,而不是 AI 加速器公司,我们的目标是云/超大规模和电信公司,”Danilak 说。
“随着韶光的推移,我们操持赢得一些超级打算机客户,因此我们将向量/MAC 单元的宽度从 512 位增加到 1,024 位 [这也为人工智能的 4,096 位矩阵运算带来了必要的数据路径]。

事实上,Tachyum 的 Prodigy 承诺的一个特殊上风是它能够实行不同类型的代码。
假设它可以在实行通用事情负载(实例)的同时以不错的功率供应不错的性能,它可能会为 AWS、Microsoft Azure 等供应一些额外的灵巧性,由于它们将能够将相同的机器用于 AI、HPC、和通用实例(如果须要)。
当然,它须要来自不同方的一些实际软件事情,但这可能会见效,至少在理论上是这样。

到2023年才能量产

该当指出的是,Tachyum 仍旧没有任何 Prodigy 芯片
因此,所有的性能预测都是仿照的产物,而该公司现在唯一拥有的是其处理器的 FPGA 原型。

(图片来源:Tachyum)

与此同时,该公司最近开始接管Tachyum 的 Prodigy 评估平台的预订,该平台将用于一些 Prodigy 芯片。
公司必须在 2022 年 7 月 31 日之前下订单,实际硬件的交付韶光约为“收到订单后的六到九个月”。

如果统统按操持进行,Tachyum 估量将在 8 月中旬流片出第一个 Prodigy 芯片(可能小于 500 mm^2)。
在那之后,该公司估量将在 12 月旁边得到其芯片的第一批样品,如果芯片事情正常,该公司操持开始供应样品(即发送评估套件)。
常日,芯片从晶圆厂返回后大约须要一年韶光。
只管如此,Tachyum 仍希望其首款处理器能够按操持事情,并能够在 2023 年上半年开始实际量产。

在未来,Danilak 设想利用台积电的 N3 节点之一制造的 Prodigy 2 处理器将在相同的功率下供应两倍的性能以及 PCIe Gen6 支持。

与30万半导体精英一起,订阅您的私家芯闻秘书!
欢迎订阅摩尔精英旗下更多公众年夜众号:摩尔精英、半导体行业不雅观察、摩尔App\公众 data-from=\"大众0\"大众>

免责声明:本文由作者原创。
文章内容系作者个人不雅观点,半导体行业不雅观察转载仅为了传达一种不同的不雅观点,不代表半导体行业不雅观察对该不雅观点赞许或支持,如果有任何异议,欢迎联系半导体行业不雅观察。

本日是《半导体行业不雅观察》为您分享的第3068内容,欢迎关注。

晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装

相关文章

手工高通CPU钥匙挂件_砂纸_粗拙

小心翼翼的拆开后,创造索尼的做工是真的好,所有零件都那么紧,拆的我手都痛,险些看不到哪里进了灰尘,密封也很严。(我想该当没有人猜得...

科学 2024-12-31 阅读0 评论0

DLL9妹妹,创新与突破的科技新星

在科技飞速发展的今天,我国涌现出一批批优秀的科技人才。DLL9妹妹作为其中一位年轻有为的科技新星,凭借其独特的创新能力和突破性成果...

科学 2024-12-31 阅读0 评论0