先从三星和AMD的携手谈起
在2019年6月初,手机圈传出了一个重磅的——AMD与三星联合宣告达成多年计策互助伙伴关系,三星将得到AMD Radeon图形API授权并专注于加强移动设备(只限智好手机和平板电脑等AMD没有参与竞争的细分市场)创新至关主要的高等图形技能和解决方案。官方透露的细节不多,暂时只能确认AMD会将“高度可扩展的RDNA图形架构”对三星授权。

那么,RDNA是什么?

大略来说,RDNA(Radeon DNA)是AMD在显卡领域推出的最新GPU架构,它是史上最龟龄GPU架构“GCN”(2011年~2019年)的接班人,其在CU打算单元、缓存、流水线等方面都进行了改造,拥有更好的性能(知足当代游戏的负载需求)、能效(充分优化功耗和带宽利用率)、功能(壮大干系生态)和扩展能力(通吃移动、桌面和云端)。可以说,RDNA是一个全方位重新设计的架构,也开启了AMD显卡历史上第五个重大架构的新时期。
那么,三星未来的Exynos(猎户座)移动平台会直接集成RDNA架构的GPU吗?
答案自然是否定的。AMD长期以来都缺少ARM生态的履历(AMD曾涉足过ARM做事器,但很快就放弃了),而手机SoC集成GPU最核心的哀求便是低功耗和高能效,AMD现有的GPU技能显然不符合移动设备的基本诉求。
实际上,三星近些年一贯在进行CPU和GPU的自研(自主研发)事情,在CPU架构领域已经有了基于ARM指令集自研成功的“猫鼬”(Mongoose,如Exynos M3/M4)核心,并在通过Exynos 9810和Exynos 9820等移动平台打出了不小的声誉。
在GPU领域,有称三星早在2012年就开展了自研“S-GPU”的项目,这次三星与AMD方面互助,须要的只是在GPU中融入AMD Radeon的部分图形 IP,不可能照搬全体RDNA架构。同时,双方互助还涉及到干系的专利授权,规避将来可能的法律轇轕,毕竟联发科便是一个很好的前车之鉴。
2015年的MWC大展上,有称联发科在移动SoC图形打算领域与AMD达成互助,而这则终极也没有被官方证明。2019年初,AMD将联发科告上了法庭,称联发科的智能设备陵犯了其APU和GPU干系的多项专利。要知道,联发科旗下的SoC集成的都是ARM或Imagination旗下的GPU。
有了AMD图形IP的注入,可以让三星将更多的精力投入到对自研CPU核心“猫鼬”的打磨之中,而AMD在PC领域的有名度,也可帮助三星与高通、华为和联发科展开差异化竞争——看到没?我集成的可是AMD GPU!
与此同时,当三星Exynos CPU和集成AMD RDNA基因的GPU搭配后,大概还会对一个家当造成冲击,它便是以任天国Switch为代表的游戏掌机。三星+AMD能否取代英伟达Tegra X1和其后续芯片在掌机领域的独占?让我们拭目以待吧。
高通和AMD不得不说的故事
高通骁龙移动平台集成的Adreno GPU,该当是Android手机领域的最强音,也是唯一可以和同期苹果A系列芯片集成GPU反抗的存在。但你可曾知道,作为高通独占的“自研”GPU,Adreno原来也是AMD的“血脉”吗?
Adreno的前身实在是出身于2002年的ATI Imageon系列低功耗GPU,原来是被用于预装PalmOS系统的Zodiac掌机。ATI被AMD收购后,AMD又将干系的移动设备资产在2008年打包甩给了高通,于是后者就取得了AMD(ATI)的矢量绘图与3D绘图技能和干系知识产权,并在此根本上研发出了我们熟习的Adreno GPU。
如果AMD当年没有卖掉原ATI Imageon,英特尔当年没有出售XScale(拥有StrongARM与ARM架构的完全授权)及手持设备芯片业务,这两大X86芯片巨子大概都会在移动互联网时期取得更大的造诣。
Adreno GPU如何判断强弱
在Android手机领域,高通骁龙移动平台霸占了大半江山,Adreno也是我们熟习和最不熟习的GPU。说它熟习,是由于高通每次发布新款骁龙移动平台时,媒体总会强调它集成了Adreno xxx型号的GPU,较上代提升了多少多少,耳朵都磨出茧了;说它不熟习,是由于Adreno GPU型号太多太乱,以至于我们很难从名称上去判断同一代的Adreno GPU之间相对的性能等级。
这一点在Adreno 5系GPU期间表现得尤为明显(表1)。
比如,Adreno 506(骁龙625)从型号数字上只比Adreno 505(骁龙430)+1,但前者的性能却较后者提升了险些2倍。Adreno 508(骁龙630)比Adreno 506+2,但其性能却只提升了30%,完备没有规律可言。
为了搞明白上面的问题,我们须要理解影响Adreno GPU性能的关键参数。抛开核心架构、渲染办法和各种图形接口不谈,Adreno GPU的性能发挥紧张受制于制程工艺、ALU(打算单元,又称算数逻辑单元)的数量以及GPU频率的高低。
我们可以将Adreno GPU集成的ALUs打算单元理解为PC显卡中的“流处理器”,在架构相同时数量越多性能越强。可惜,高通官方从来没有公开过Adreno GPU的ALUs数量,本文和网上干系的数据都是用户自己检测所得,因此仅供大家参考。
对GPU而言,制程工艺越前辈,在相同的发热和功耗水平上就能以更高频率运行,对性能同样有着较大的增益效果。Adreno 506相较Adreno 505有着巨大的性能提升,便是得益于更多的ALUs数量和工艺升级带来的频率提升。同理,Adreno 512相较Adreno 508、Adreno 530相较Adreno 512也都是受上述成分的影响。
如今,Adreno GPU已经全面进化到了Adreno 6系时期,其最大的特色是支持完全的OpenCL 2.0FP、OpenGL ES3.2、DX12和Vulkan1.1等图形接口。
可惜,关于它们详细的ALUs数量和频率,笔者并没能找到准确的资料,以是本文我们只通过3DMark和GFXBench这两个专业测试软件,对Adreno 6系GPU的理论性能进行一番比拟(表2)。
我们以骁龙660集成的Adreno 512作为基准(100%),可以更加直不雅观地理解Adreno 6系GPU的差异。个中,Adreno 610和Adreno 612虽然数字序列更高,但综合性能实在和Adreno 512相差无几。从Adreno 615到Adreno 618之间的性能依次略增,在其背后便是不同ALUs单元和GPU频率组合带来的差异。
作为高通2018年度的旗舰,骁龙845(Adreno 630)之以是具备秒杀高通最新推出骁龙730(Adreno 618)的3D性能,是由于Adreno 630集成了高达512个ALUs单元,而骁龙730的ALUs该当是不敷256个(很抱歉没找到详细的参数)。
须要把稳的是,从2018年下半年开始,高通最新推出的骁龙SoC移动平台都强化了AI运算能力,它们会借助一部分GPU内的ALUs单元,再结合Hexagon内集成的HVX单元,与CPU一起组成高通特有的骁龙AI Engine人工智能平台。
换句话说,在最新的骁龙移动平台中,更多的ALUs单元并不能换来等同的性能提升。以骁龙855为例,高通曾透露这颗芯片(较骁龙845)增加了50%的算数逻辑单元,也便是ALUs单元从512个提升到了768个,但从Adreno 640和Adreno 630之间的实际性能差异来看,增加的50%的ALUs仅换来了20%旁边的性能增益,显然个中有不少被高通拿来用于AI运算了。据一些专业人士测试剖析,Adreno 630的512个ALUs中有一半(256)都用做了异构AI运算,用于填补骁龙移动平台没有独立NPU单元的毛病。
总之,骁龙移动平台中“最能打”的无非便是骁龙845和骁龙855,骁龙7系和骁龙6系的GPU之间也存在不小的差距。因此,如果你希望购买一款能以满帧运行绝大多数游戏的手机,认准骁龙8系还是很有必要的。至于骁龙6系,在骁龙710都降到千元价位之际,除非你不怎么玩游戏,否则还是敬而远之吧。
苹果和Imagination的情仇
在智好手机领域,目前能凭自己打造GPU的芯片设计厂商只有高通和苹果,高通的Adreno GPU源于AMD,而苹果设备的GPU则离不开Imagination Technologies公司的扶持。
Imagination也是很早就进军GPU市场的公司之一,只是为了避开英伟达和ATI的锋芒,该公司更加专注于对超低功耗移动GPU的打磨,2001年推出的PowerVR MBX GPU曾被集成在英特尔、飞思卡尔、德州仪器和三星的SoC上,并造诣了第一代iPhone、诺基亚N95和戴尔Axim X50v(PDA掌上电脑)这些经典设备。
Imagination的第五代PowerVR SGX系列该当是有名度最高的GPU(如SGX530、SGX535),苹果A4、三星Exynos和德仪OMAP3系列SoC都是它的客户,索尼PSV掌机上集成的也是四核心的PowerVR SGX544MP4。随后,PowerVR逐渐变成了苹果“独占”的GPU,其他品牌(如联发科、全志、瑞芯微和晶晨等)即便偶有互助,集成的PowerVR GPU也多是低端型号,报酬与“金主”苹果相差甚远。然而,也正是由于太过依赖苹果,为Imagination的没落埋下了伏笔。
Apple A10处理器该当算是苹果和Imagination的末了一次互助,其集成的PowerVR GT7600 GPU乃至可以领先同期的Adreno 540(骁龙835),让iPhone 7系列成为了当年性能最强的智好手机(实际上每一代iPhone基本都是同期最强)。
可惜,从A11芯片开始,苹果正式抛弃Imagination而改用自研GPU,该芯片的GPU配置了6个着色器核心,每2个核心共享一个Texture单元,类似的设计和PowerVR GPU很像,以是有不少玩家都称苹果GPU是脚踏Imagination上位的——苹果自研GPU的传出后,Imagination很快就陷入了运营危急,时至今日只有联发科Helio P60(PowerVR GM9446)、P35和P22(PowerVR GE8320)等极少数SoC选择与Imagination互助集成PowerVR GPU,和iOS生态圈的唯一霸主沉沦腐化到GPU领域的“其他”,Imagination的境遇令人唏嘘不已。
目前Imagination最新的GPU办理方案包括PowerVR 9XEP/9XMP/9XTP(定位依次升高),9XEP和9XMP采取了较旧的Rogue架构,紧张竞争对手是ARM旗下的Mali-G72。而9XTP则由最新的Furian架构打造,每ALU增加到40条流水线,支持4K 120FPS、HDR、Vulkan API、安卓神经打算API等前辈技能,理论上可以用来和ARM Mali-G76/G77反抗。
ARM的“亲儿子”Mali GPU
接下来就轮到ARM自己的“亲儿子”,Mali系列GPU了。作为和Cortex A系列CPU架构差错的它,也是Android手机圈市占率仅次于高通Adreno GPU的存在,海思麒麟、三星Exynos、联发科Helio,我们熟习的绝大多数非高通系SoC都直接选择了与Mali GPU联姻。
CFan曾在《麒麟990的最大遗憾!
ARM Cortex-A77架构到底好在哪?》一文中解读了ARM最新Cortex-A77 CPU 和 Mali-G77 GPU的特色,以是本文就不再赘述,只是大略先容一下Mali GPU的特殊之处。
和Adreno GPU比较,Mali更加看重GPU的核心数量,将较多的GPU核心封装成一个更大规模的GPU矩阵,便是Mali GPU拉升性能的不二法门。
Mali-G76最多可以支配20个打算核心
比如在Mali-G72时期,麒麟970就集成了12个核心的Mali-G72MP12,三星Exynos 9810更厉害,一股脑儿塞进了18个核心(Mali-G72MP18)。但是,GPU核心越多,发热量和功耗也将随之变大,此时SoC厂商的选择常日是降落GPU频率以及关掉部分核心来达到掌握功耗的目的。
换句话说,Mali-GPU的核心数量是存在一个临界值的,超过这个核心数量就必须降落GPU频率,终极导致增加GPU核心的数量和对应的性能提升不成比例(1+1<2)。
因此,如何将有限的芯片面积分配给Cortex-A CPU和Mali GPU,并合理掌握Mali GPU的规模和频率,发挥最佳的能效比,这就ARM交给SoC厂商们的期末考试了。
总之,高通Adreno和ARM Mali是当前Android手机领域的主力,Adreno GPU的规格和性能取决于骁龙移动平台的型号,比较起来相对随意马虎。ARM Mali GPU涉及Mali型号(如Mali-G52、Mali-G72、Mali-G76)、核心数量(后缀是MPx),以及与它们搭配的CPU架构和主频,无论是综合、CPU还是GPU性能都须要我们耗费更多精力比拟。
当三星带来AMD授权IP的自研GPU,Imagination得到更多SoC芯片厂商的支持,想想就头大了吧?因此,如果你想理解最新移动GPU的动态和选购建议,敬请期待CFan同期的最新宣布吧。






