首页 » 智能 » FPGA与ASIC的完美结合Achronix Speedster 7t系列详解_可编程_带宽

FPGA与ASIC的完美结合Achronix Speedster 7t系列详解_可编程_带宽

少女玫瑰心 2024-12-28 07:34:22 0

扫一扫用手机浏览

文章目录 [+]

得益于近年来人工智能/机器学习的快速发展,新的算法不断的涌现,这推动了可编程的FPGA市场的快速增长。
根据市场调研公司Semico Research的预测,AI运用中FPGA的市场规模将在未来4年内增长3倍,达到52亿美元。

根据市场研究机构IP Nest近期发布的最新的IP市场剖析报告显示,Achronix是2018年环球增速最快的IP供应商,同比增长达到了250%,足见Achronix业务增长之迅速。

FPGA与ASIC的完美结合Achronix Speedster 7t系列详解_可编程_带宽 FPGA与ASIC的完美结合Achronix Speedster 7t系列详解_可编程_带宽 智能

而为了进一步知足人工智能/机器学习(AI/ML)和高带宽数据加速运用日益增长的需求,今年5月,Achronix公司推出了创新性的、全新的FPGA系列产品——Speedster 7t系列。

FPGA与ASIC的完美结合Achronix Speedster 7t系列详解_可编程_带宽 FPGA与ASIC的完美结合Achronix Speedster 7t系列详解_可编程_带宽 智能
(图片来自网络侵删)

全新架构:ASIC和FPGA的完美结合

我们都知道,对付AI加速来说,相较于我们常见的CPU、GPU等通用型芯片以及可编程的FPGA来说,ASIC芯片的打算能力和打算效率都直接根据特定的算法的须要进行定制的,以是其可以实现体积小、功耗低、高可靠性、保密性强、打算性能高、打算效率高档上风。
以是,在其所针对的特定的运用领域,ASIC芯片的能效表现要远超CPU、GPU等通用型芯片以及可编程的FPGA。

但是,正如我们前面所提及的是,目前AI算法仍旧处在一个不断的快速更新迭代的阶段,数值精度的可选择性也越来越多。
同时随着AI的运用处景快速发展演进,新的办理方案都要去应对在高性能、灵巧和上市韶光等方面的不同需求。

而AISC是针对特定的算法加速所设计的,这也使得其在灵巧性上远不如可通过编程快速适应新的软件算法的FPGA。
但是,FPGA在体积、能效、本钱上却又不如AISC。
那么是否能够有这样一款产品,能够很好的将FPGA和ASIC的优点结合在一起呢?Achronix的Speedster 7t系列或许便是这样一款产品。

Achronix称,Speedster 7t系列是基于一种高度优化的全新架构,以其所具有的犹如ASIC一样的性能、可简化设计的FPGA灵巧性和增强功能,从而远远超越传统的FPGA办理方案。

▲Achronix CEO Robert Blake

Achronix Semiconductor总裁兼首席实行官Robert Blake表示:“Speedster7t是Achronix历史上最令人激动的发布,代表了建立在四个架构代系的硬件和软件开拓根本上的创新和积淀,以及与我们领先客户之间的密切互助。
Speedster7t是灵巧的FPGA技能与ASIC核心效率的领悟,从而供应了一个全新的‘FPGA+’芯片品类,它们可以将高性能技能的极限大大提升。

Speedster7t FPGA系列详解

根据Achronix的先容来看,Speedster7t FPGA系列产品是专为高带宽运用进行设计的,其具有一个革命性的全新二维片上网络(2D NoC,Network on Chip),以及一个高密度全新机器学习处理器(MLP)模块阵列。
通过将FPGA的可编程性与ASIC的布线构造和打算引擎完美地结合在一起,Speedster7t系列产品创造了一类全新的“FPGA +”技能。

同时,Speedster7t系列产品还包括了高带宽GDDR6接口、400G以太网端口和PCI Express Gen5等接口,所有这统统单元都相互连接以供应ASIC级带宽,同时保留FPGA的完备可编程性。

而为了应对吸收来自多个高速来源的大量数据,同时还须要将那些数据分发到可编程片上算法性和处理性单元中,然后以尽可能低的延迟来供应那些结果,以是在制程工艺上,Speedster7t器件选择了采取台积电最新的7nm FinFET工艺制造。

全新机器学习处理器阵列

对付传统的带DSP模块的FPGA来说,其所能够供应的AI性能是相对有限的,由于利用DSP模块只能供应不高效的数值精度支持,利用外部LUT和内存构建AI/ML运用程序,须要肃清额外逻辑编辑和内存资源,性能也受FPGA布线限定。

比较之下,Speedster7t FPGA则采取了全新机器学习处理器(MLP)中大规模的可编程打算单元平行阵列,它们可供应业界最高的、基于FPGA的打算密度。
MLP是高度可配置的、打算密集型的单元模块,每个MAC单元支持最多32个乘法器,可驱动可变精度加法器/累加器,可支持4到24位的整点格式和高效的浮点模式,包括对TensorFlow的16位格式的支持,以及可使每个MLP的打算引擎更加的增压块浮点格式的直接支持。

其余,每个MLP当中还紧密耦合了内存区块,包括72K bits的RAM和2K bits的寄存器。
这种运算和存储级链接,使得MLP在不须要利用FPGA布线资源的情形下,实现更繁芜的AI算法。

此外,MLP还与嵌入式存储器模块紧密相邻,通过肃清传统设计中与FPGA布线干系的延迟,来确保以750 MHz的最高性能将数据传送到MLP。

这种高密度打算和高性能数据传输的结合使得处理器逻辑阵列能够供应基于FPGA的最高可用打算能力以每秒万亿次运算数量为单位(TOPS,Tera-Operations Per Second)。

超高吞吐量的内存带宽和接口

高性能打算和机器学习系统的关键之处是高片外存储器带宽,从而为多个数据流供应存储源和缓冲。
Speedster7t器件是唯一支持GDDR6存储器的FPGA,该类存储器是具有最高带宽的外部存储器件。
每个GDDR6存储掌握器都能够支持512 Gbps的带宽,Speedster7t器件中有多达8个GDDR6掌握器,可以支持4 Tbps的GDDR6累加带宽,并且以很小的本钱就可供应与基于HBM的FPGA等效存储带宽。

“美光(Micron)乐于携手Achronix去实现环球第一个面向高带宽存储需求而直接加载了GDDR6的FPGA产品,”美光打算与联网业务部营销副总裁Mal Humphrey。
“像这样的创新的和可扩展的办理方案将推动人工智能领域内的差异化,个中异构打算可选方案与高性能的存储是加速得到数据内涵的必需部分。

除了这种超高吞吐量的存储带宽,Speedster7t器件还包括业界最高性能的接口端口,以支持极高带宽的数据流。
Speedster7t器件拥有多达72个业界最高性能的SerDes,可以达到1到112 Gbps的速率。
还有带有前向纠错(FEC)的硬件400G以太网MAC,支持4x 100G和8x 50G的配置,以及每个掌握器有8个或16个通道的硬件PCI Express Gen5掌握器。

“Achronix全新的Speedster7t FPGA系列产品是创新性芯片架构实现爆发的一个卓越案例,创造该架构的目的是直接面向AI运用场置大量的数据,” Semico Research公司ASIC和SoC首席市场剖析师Rich Wawrzyniak说道。
“通过将数学函数、存储器和可编程性整合到其机器学习处理器中,再结合交叉芯片、二维NoC构造,从而形成了肃清瓶颈和确保全体器件中数据自由流动的绝佳方法。
在AI / ML运用中,内存带宽便是统统,Achronix的Speedster7t在这一领域供应了令人印象深刻的性能指标。

全新二维片上网络:供应超高效率的数据移动

来自Speedster7t高速I/O和存储器端口的数万兆比特数据量非常的大,传统的FPGA面向比特位的可编程互连逻辑阵列的路由容量已不能知足需求,因此Speedster7t架构供应了一个可横跨和垂直超过FPGA逻辑阵列的创新性的、高带宽的二维片上网络(NOC)。

这个2D NOC可连接到所有FPGA的高速数据和存储器接口。
它们就像叠加在FPGA互连这个城市街道系统上的空中高速公路网络一样,Speedster7t的NoC支持片上处理引擎之间所需的高带宽通信。
NoC中的每一行或每一列都可作为两个256位实现,单向的、行业标准的AXI通道,事情频率为2GHz,同时可为每个方向供应512 Gbps的数据流量。

通过在Speedster中实现专用2D NoC, 极大地简化了高速数据移动,并确保数据流可以轻松地定向到全体FPGA构造中的任何自定义处理引擎。
最主要的是,NOC肃清了传统FPGA利用可编程路由和逻辑查找表资源在全体FPGA中移动数据流中涌现的拥塞和性能瓶颈。
这种高性能网络不仅可以提高Speedster7t FPGA的总带宽容量,还可以在降落功耗的同时提高有效LUT容量。

以400G以太网总线带宽操作所需频率为例,传统FPGA的最佳方案是总线大小为1024 bits,但是须要的频率要达到724MHz,这在传统的FPGA中是不可能实现的。
显然,对付任何400G以太网总线带宽,传统的FPGA运行速率都不足快。

比较之下,Speedster7t FPGA则可以通过2D NOC以四个256bits的总线以506MHz的事情频率来实现。

针对安全性至上和硬件确保运用的安全防护功能

Speedster7t FPGA系列产品在面临第三方攻击的威胁时,可用最前辈的比特流安全保护功能应对,它们具有的多层防御能力可保护比特流的保密性和完全性。
密钥是基于防修改物理不可克隆技能(PUF)进行加密,比特流由256位的AES-GCM加密算法进行加密和验证。
为了防止来自旁侧信道的攻击,比特流被分段,每个数据段利用单独导出的密钥,且解密硬件采取差分功率剖析(DPA)计数器方法。
此外,2048位RSA公钥认证协议被用来激活解密和认证硬件。
用户可以确信的是当他们加载其安全比特流时,它是预期的配置,这是由于它已通过RSA公钥、AES-GCM私钥和CRC校验进行了身份验证。

四款Speedster7t FPGA系列产品

Speedster7t FPGA系列目前共有4款产品,器件的大小范围为从363K至2.6M 的6输入查找表(LUT)。

在详细的性能指标方面,Achronix透露,Speedster7t FPGA系列种最强的7t1500,在其最高频率750MHz,80%利用率,每个MLP区块支持16×Int8运算的情形下,在ResNet-50演习模型下,可以实现高达8600张/秒的图像识别能力;而在Yolov2的算法之下,7t1500亦可实现1600张/秒的图像识别能力。

据Achronix CEO Robert Blake先容,支持所有Achronix产品的ACE设计工具现已可供应,可支持包括Speedcore eFPGA和Speedchip™FPGA多晶粒封装芯片(Chiplet)。
第一批用于评估的Speedster7t FPGA系列器件和开拓板将于2019年第四季度供应。

小结:

从前面的先容,我们不丢脸出,Speedster 7t系列FPGA,紧张是通过其全新二维片上网络,以及高密度全新机器学习处理器模块阵列,实现了将FPGA的可编程性与ASIC的布线构造和打算引擎完美地结合在一起。
而这与去年赛灵思推出的全新的ACAP架构也有着异曲同工之处。

须要指出的是,Achronix是目前唯一一家既供应独立FPGA芯片又供应Speedcore™嵌入式FPGA(eFPGA)半导体知识产权( IP)的公司。
也便是说,芯片设计厂商可以通过购买授权的形式,将Achronix的Speedcore™嵌入式FPGA(eFPGA)的IP整合到自己的芯片设计当中,设计出符合自身需求的芯片。

而Achronix在Speedcore eFPGA IP中采取了与Speedster7t FPGA中利用的同一种技能,可支持从Speedster7t FPGA到ASIC的无缝转换。
这也意味着芯片设计厂商通过与Achronix互助,也可以得到最新的Speedster7t FPGA系列的技能,并可将其转换为ASIC。
Achronix CEO Robert Blake表示,该技能有望帮助客户节省高达50%的功耗并降落90%的本钱。

编辑:芯智讯-浪客剑

相关文章

宝洁IT,创新驱动的数字化转型之路

宝洁,作为全球最大的日用消费品公司之一,其成功离不开其强大的IT支持。宝洁IT部门凭借创新驱动的数字化转型策略,为宝洁的业务发展提...

智能 2024-12-29 阅读0 评论0

定语“it”的奥秘,语言表达中的关键角色

在英语语法中,定语是一个非常重要的成分,它通常用来修饰名词或代词,对名词或代词进行限定或说明。在英语中,定语可以是形容词、代词、名...

智能 2024-12-29 阅读0 评论0

宾语在现代汉语中的作用与魅力

在现代汉语中,宾语作为句子成分之一,具有举足轻重的作用。它不仅能够使句子结构更加完整,还能丰富句子的内涵,使表达更加生动形象。本文...

智能 2024-12-29 阅读0 评论0