【新智元导读】马云为何成立“平头哥半导体”?苹果2018 iPad Pro便是自研芯片好处的最佳例证。实测之下,A12X仿生芯片各项性能爆表,苹果芯片团队更是豪言“在给定的形状尺寸和封装设计下,没人能比我们做得更好”。A12X架构究竟如何,为什么苹果会这么做,又是如何做到的呢?
还记得名誉鹊起的“平头哥”吗?

没错,说的便是马云在此前赐名成立的阿里半导体公司。
许是名字的杀伤力太大,反而冲淡了公众对自研芯片合营自家运用强大上风的认知。不过,苹果最新发布的2018 iPad Pro及其搭载的A12X仿生芯片,无论是CPU、GPU,还是机器学习和神经引擎,各项爆表的性能指标,以及只有在A12X 仿生芯片支撑下才得以实现的浩瀚高端AI运用,不难让人看到了加上了“平头哥”的阿里动物军团升级打怪的未来。
平头哥(蜜獾)号称“天下上最无所畏惧的动物”
平头哥半导体技能卖力人骄旸在接管新智元采访时曾表示,只有自己内部的人才真正懂得内部业务的需求,从而设计并供应针对每项不同业务都能达到性能功耗比最优的硬件。
苹果的芯片团队还不止如此,统统的方案都从芯片开始,他们会不断地追问其他团队:你们到底想要什么,要实现什么功能,瓶颈在哪里,我们如何制造与你们系统完美契合的芯片?
多年来,苹果对其从底层硬件到顶层运用都采纳“in-house”的做法讳莫如深。这一次,苹果硬件技能部门的 Anand Shimpi 和市场营销高等副总裁 Phil Schiller 坐下来,与 ArsTechnica 的分享了苹果A12X仿生芯片的细节,以及苹果内部芯片团队的运作机制。
“芯片团队是其他团队的侦查。”Anand Shimpi说。
方案从芯片开始,“在给定的形状尺寸、封装设计下,没有人能做出更好、更高性能的芯片。”
A12X仿生芯片全面拆解,爆表式性能碾压在先容苹果芯片团队之前,还是让我们首先来看看他们的最新成果。
全新发布的 2018 iPad Pro 有许多亮点,但最亮眼的莫过于A12X仿生芯片。苹果在产品发布会上展示了A12X芯片的强大:图像处理性能是A10X的两倍,速率比8年前发布的iPad快1000倍,乃至用条记本电脑这种便携式PC比较,92%的市售产品都会败下阵来。
苹果最新一代的iOS设备并非完美,但哪怕是最刁钻的“果黑”,也不得不承认这家公司在移动CPU和GPU方面的领先上风——不是一点点,而是甩开一条街。
所有这些,都归功于苹果内部自研的定制芯片。实际上,包括FaceID、AR运用在内的各种2018 iPad Pro高端 AI运用,离开了A12X芯片完备没有实现可能。
但并不是每个人,乃至是iPad Pro针对的“专业”消费者,都意识到了这个差距。A12X仿生芯片的架构究竟是若何的?为什么苹果会这样做,而它又是如何做到的呢?
A12X与最贵系列苹果手机所搭载的A12芯片是密切干系的。后者采取的是第一款可在消费类设备中利用的7nm工艺制造芯片,而A12X是首次运用于平板电脑。
虽然苹果公司肯定不会透漏有关A12X非常细节的信息,但是根据Anandtech最近对A12的剖析,我们也能知道A12X的大致“轮廓”:
CPU:中心处理器;GPU:用于处理图形,从主屏幕的显示到3D游戏中的效果,再到增强现实运用程序的资源;神经引擎:处理神经网络和机器学习干系的任务;IMC(集成内存掌握器):有效地管理进出内存的数据;ISP(图像旗子暗记处理器):剖析拍摄照片时所创建的图像,并对其进行处理和改进等;Secure Enclave处理器:处理敏感数据(如生物识别标识符),使陌生人无法访问。当然还有诸如显示引擎、存储掌握器、HEVC解码器和编码器等其它组件。
众所周知,上述列表中最为核心的组件便是神经引擎、CPU和GPU。接下来,我们就对这三个组件进行详细解读。
神经引擎和机器学习
神经引擎的设计目的是加快与机器学习干系的任务能够在本地设备上实行,这种办法比在CPU或GPU上实行效率更高、性能更高。
事实上,新款iPad Pro的神经引擎与前一款完备不同,由于前一款根本没有芯片。再来看一看苹果手机,2017年的A11可以每秒处理6000亿次操作;2018年的A12 iPhone手机能够达到5万亿次。
那么问题来了,苹果为什么如此看重神经引擎的构建呢?
首先,你须要理解神经引擎所运用的场景和功能。这些场景和功能包括但不限于:通过iPad Pro中的人脸ID和TrueDepth传感器阵列来识别你的面部、扫描图像并在照片运用程序中供应搜索功能、处理语音,以及大量与增强现实干系的任务。
A12X的神经引擎有8个核心,但苹果对其架构的细节守口如瓶。根据Shimpi和Schiller的描述,它不是从苹果GPU中改编而来的。这种芯片为iPad Pro内置的许多功能供应了动力,但第三方运用程序开拓职员也可以通过一种名为CoreML的软件开拓API以各种办法利用它。
在10月30日发布新款iPad Pro时,苹果在台上谈论了A12X和神经引擎
值得把稳的是,这里的重点是在本地设备上实行机器学习任务。有一种不雅观点认为,如果某些机器学习模型能够从数百万台正在利用的设备中提取用户数据,并在弘大的云打算网络上运行,那么它们将是最强大的。
但苹果不是这样做的。它的机器学习API许可开拓者在用户容许的情形下在云中利用机器学习模型,但这种云根本举动步伐并不是苹果直接供应的。另一种方法是,苹果向运用程序开拓职员供应Create ML这种工具,可以让他们在自己的开拓机器上运行模型。
苹果表示,它并不专注于将用户数据放到云中并在云中运行模型,其缘故原由有二:首先,与竞争对手比较,苹果把自己打造成一个重视隐私的公司;其次,在本地设备上运行时,许多其他用例的效率会更高。
正如Shimpi所说:“低延迟非常主要,隐私也非常主要!
”
CPU
iPad Pro的CPU有8个核,个中4个核关注性能,4个核关注效率。与早期的一些苹果芯片不同的是,所有的核可以同时激活。
对此,苹果对外是这么声称的:“当你运行高线程事情负载时,A12X比A10性能会改进90%;对付单核性能,A12X比A10快35%。”
Ars便对iPad Pro进行了测评,验证上述“声称”是否准确的时候到了!
首先,我们亮相一下测评中各个设备情形,如下图所示:
测评所涉及的平板及规格
测评所涉及的手机及规格
测评所涉及的台式机和条记本及它们的规格
接下里便是测评结果!
单核/多核,2018iPad Pro与以往iPad及三星Tab S4比较
单核/多核,2018iPad Pro与MacBook Pro及三星Dell XPS比较
单核/多核,2018iPad Pro与iPhone及谷歌Pixel比较
从测评结果来看,单核性能方面并没有达到35%的提高(但比较靠近)。多核的性能也得到了验证。
iPad Pro的性能超过了我们测试的所有MacBook Pro,除了最近才推出的15英寸MacBook Pro和第8代英特尔酷睿i9处理器。一样平常来说,这些条记本电脑的价格是iPad Pro的三倍。
iPad Pro的性能应该说是“前所未有”的。除了能够同时利用所有内核之外,我们有情由相信A12中的缓存大小(因此很可能是A12X)是驱动这种性能的一个主要成分。
也可以说,A12X的性能总体上之以是如此强大,部分缘故原由是苹果的架构是优化异构打算中的一个主控类,即奥妙地利用架构良好的专用途理器类型来匹配专用任务。
虽然A12X与ARM的big.LITTLE架构脱不了关系,但苹果在此做了大量事情,得到了其他人无法达到的结果。
GPU
A12X中的GPU有7个核心,比A10X多了一个核心,可能是由于采取了7nm工艺。但一如既往,核的数量并不代表统统。
苹果在GPU方面是这么声称的:“这是我们自己定制设计的GPU的第一个7核实现。每一个核都比我们在A10X中的速率更快,效率更高。你可以得到2倍的图形性能提升。这种形式是前所未闻的,堪比Xbox One S的GPU!
再强调一次,它的设计完备没有风扇!
”
话不多说,上结果!
Offscreen和Compute方面,iPad Pro与以往版本性能比拟
Offscreen和Compute方面,iPad Pro与MacBook Pro性能比拟
Offscreen和Compute方面,iPad Pro与iPhone性能比拟
一样平常来说,这种GPU在移动领域有巨大的领先上风。
它并没有不像CPU那样对条记本也造成一定影响。不过,它相对付其他移动设备的上风是显著的,在以往的iPad Pro和iPhone性能比拟中,堪称无人能及。对此,Shimpi说,“内存带宽是个中的一部分”。
Shimpi指出:“这不仅会影响游戏中的3D图形,还会影响iOS本身的许多UI效果。不仅仅是关于峰值内存带宽,而是有效地供应比特。 拥有这个动态范围非常主要,由于有时为了提高效率和电池寿命,你须要在性能较低的情形下事情。”
苹果多次将新款iPad Pro的GPU性能描述得为与Xbox One S相称。
图形性能方面,手机和平板电脑常日不会靠近游戏机或游戏PC的性能。 A12X和Xbox One S至少有一个共同之处,那便是它们不适用于游戏PC,但这并不虞味着它们在架构上与其他办法相似。
A12X在GPU和CPU之间共享内存,非常类似于条记本电脑中的Xbox One或Intel集成的GPU,但与游戏PC中的独立内存不同。
苹果芯片团队:在给定的形状尺寸、封装设计下,没人能做出更好的芯片看到这里,A12X芯片的强大已无需赘言。我们更为关心的,还是这款强大芯片背后的团队。
苹果硬件技能部门的Anand Shimpi 在接管 ArsTechnica 采访时表示,“从根本上说,我们制造芯片的缘故原由,是做事于产品的无限可能(vision and its ambition)。无论设定的目标是什么,但凡须要定制芯片,我们就一定会把这样一款芯片做出来。”
“在给定的形状尺寸、封装设计下,没有人能做出更好、更高性能的芯片。”
说实话,用于iPhone的苹果A11仿生芯片和用于平板的A10X芯片已经够好了,为什么还要提高性能呢?对此,Shimpi 给出了一段激情澎湃的回答:
人们常说,你看看这家公司或那家公司。但我们不;我们真正关注的只有自己。对手想做什么就让他们做去,我们只是尽全力做出我们自己所知道的最好的东西。这样,我们在做的时候,就不用担心跟对手比较做得怎么样。比对手做得好还不足,我们要不断超越自己。我们能做什么?我们还能做什么?当你知道你能做入迷经引擎时,你就会想要做出更好的神经引擎!这只会加速,不断加快组织内部的速率。你的团队做出了一款超棒的苹果自己设计的A系列芯片,好,明年你就想要一款更好的,对吧?那便是我们的激情所在。全体苹果公司都一样,不断超越自己,不用去管别人。我们不关心别人在做什么,那些事情我们也不关心。我们也不在乎比别人掉队。掉队就掉队,掉队10倍也无所谓。由于我们的芯片是做事用户的,不是用来竞争的。
当然,苹果提升芯片性能的缘故原由肯定不止如此,很明显,最新版iOS侧重增强现实(AR)功能。如果苹果能在确保其他方面不掉队的条件下,最先建立起天下上最强大的消费者AR平台,那么未来它的强势地位就多了一重保障。
至于Mac,为了将苹果在机器学习和人工智能方面的技能用于Mac,也离不开定制芯片。看英特尔和AMD的芯片路线图,彷佛与苹果的长期目标有一些明显不同。部分缘故原由可能是,苹果的终极目标是为 Mac Platform 制作定制的条记本或台式机,以此对抗英特尔的最强芯片。
但苹果是如何做到这一点的呢?
就像你想的那样,开拓芯片的过程在发布产品前很多年就开始了,首先是团队会议,并谈论如何办理特定设备上的特定用户问题。虽然没有供应很多深入的技能细节,但 Schiller 将其定制芯片的成功归功于团队在苹果内部的互助。
芯片团队是其他团队的侦查,他们会说,“好,我们来方案吧,我们须要更多信息。你们究竟想要什么,想要如何实现这个功能?瓶颈在哪里,我们从哪里开始创建终极与你们系统完美契合的芯片?”这样的会议一周会开好几次,也不是什么年度大型会议,便是确保进度同等。芯片团队和其他团队真的每周都聚在一起,谈论的问题也越来越多。要谈论的东西是没有止尽的。多年来,苹果公司对其如何以及为何能做到这统统的回应都归结为同样的不雅观点。当你在公司内部做所有事情,从头到尾整合所有的东西,无论是技能还是组织,这样做一定有其上风。
这也可以用来阐明谷歌自研TPU,以及阿里成立平头哥半导体。
苹果的CPU在移动方面处于行业领先地位,但并不完美。苹果专注于性能,但安卓系统基本上是由高通垄断。但高通的上风在于连接性(高通的调制解调器行业领先,但CPU不是)。
有趣的是,苹果一贯避讳不谈的,是Mac的麦克风仍旧利用英特尔的芯片。这或许也是阿里投资寒武纪、深鉴和耐能的缘故原由。
鸡蛋还是不能放在一个篮子里。
参考链接:
https://arstechnica.com/gadgets/2018/11/apple-walks-ars-through-the-ipad-pros-a12x-system-on-a-chip/







