前不久,雷锋网AI掘金志撰文《海思「缺货」,安防「缺芯」》提到:在9月15日多家供应商断供华为之前,安防市场已芯荒意乱。
有人年夜骂囤货涨价无理,也有人感慨后继无人惨恻。
文章发布后,不少媒体相继跟进,大多谈到了安防市场缺芯现状及可能的替代方案。

本日,我们沿着该话题进一步聊聊:
安防为何缺芯?毕竟这并非一个高门槛运用行业,无需苛刻的芯片工艺选择。
海思缺货之前,AI安防芯片混战常被提及,弯道超车之论屡被谈起。
如今,身临海思难产之际,市场缘何又顿入无芯可选之境?制约AI安防芯片规模化运用的核心技能问题究竟是什么?
造芯,如指尖上造城
作为打算机视觉落地较快的领域之一,安防赛道有一个基本封印的现实须要承认:
海思之外,尚无一款足够精良且得当的安防前端通用芯片,也尚无一款足够适用安防后真个AI芯片涌现。
那么,做一款比肩海思产品线的芯片难在哪儿?换句话说,一款「成功」安防芯片的自我教化是什么?
首先,从运用角度出发看看这个问题。
眼下,不同玩家们大多都会基于自身资源及上风,选取业务、性能、生态等方向作为打破点。
但,造芯之难,除了稽核纸面理论、计策打法外,还需办理一道又一道的实际寻衅。
一、安防市场极度碎片化,且做到500万片以上的出货数量才有本钱上风;
二、前端、存储、产品开拓、组织培植,都须要相应韶光做充足积累。
一款好的芯片,一定需在实际场景中打磨迭代而出,缺少经年累月的正向打磨,很难沉淀AI工程化交付能力。
衡量一款芯片是否达到AI工程化交付能力,稽核最明显的算力之外,还需从端侧、云侧分开验证几个主要指标。
诚然,算力实为衡量AI芯片指标的主要成分之一。
韶光拨回2014年,人工智能落处所才兴起,端侧AI芯片算力仅有0.2Tops,云侧AI芯片算力仅有5Tops;如今端侧AI芯片算力已经达到4Tops以上,云侧AI芯片算力也已达到256Tops以上。
但仅看算力指数显然远远不足。于端侧,安防芯片稽核本身竞争力、集成办法、开拓工具成熟度与易用性、功耗与价格等。
一是安防芯片本身竞争力。
安防端侧一贯用得是安防专用芯片,并不存在通用芯片。纵然AI时期,端侧芯片首先须要的是有竞争力的安防芯片,其次才是在这根本上叠加AI算力。
譬如,OS、安防SDK、ISP、编码皆主要非常,这对芯片厂商提出的综合哀求明显提高,须要具备完全能力的芯片。
端侧芯片,虽然体积小、价格低,但系统繁芜度、技能难度丝毫也不低。
二是AI芯片与安防芯片的集成办法。
前些年,AI落地端侧,采取的是在主芯片边上加一颗AI协处理器,即两颗芯片的办法。
如今,合二为一的方案已是主流,在系统繁芜度、本钱、功耗上都更有竞争力,实现过程也更加繁芜。
三是开拓工具成熟度与易用性。
芯片的软件开拓工具非常主要。譬如,是否支持Caffe、Tensorflow、Pytorch等主流深度学习框架,干系工具是不是易用、稳定,对付AI运用开拓者来说都非常主要。
如果开拓工具不成熟或不易用,很随意马虎就会被开拓者抛弃。
四是功耗与价格。
端侧设备,对功耗和价格都非常敏感。
云侧芯片则对解码能力、大数据并发效率、开拓工具成熟度与易用性、功耗以及价格哀求较高。
一是解码能力。
云侧芯片处理的是经由编码的图片或视频,须要持续解码。
在芯片设计上,须要内嵌专门的硬解码模块,不占用AI算力;其余,解码能力上必须不能低于AI处理能力,不然解码就会成为瓶颈。
二是大数据并发效率。
现在云侧芯片的AI处理能力非常强,以是大数据并发交互的效率非常主要,大数据并发效率决定了AI算力实际能发挥多少。
三是功耗与价格。
云侧芯片在这方面虽然没有端侧芯片那么敏感,但低功耗与低价格永久都是用户的诉求。
其次,从技能角度看看这个问题。
安防领域存有大量的算法须要前置,而目前的算法演习基本还是基于后真个深度学习模型。
此外,安防行业还需实时处理大量连续图像数据流,数据处理在于两大维度:一、每秒处理帧率要越来越高;二、图像分辨率要越来越高。
两大维度之下,安防对付端侧芯片提出了一些哀求。
针对已经入场的大小玩家,剖析他们的产品形态,大致可以分为两种:一是针对特定运用的SoC;二是通用加速器做独立芯片。
运用安防市场,SoC面向专用市场,在芯片中深度学习加速打算事实上只是一部分,而其他大部分芯片面积则交给了主控处理器、视频解码等模块。
终端通用深度学习加速器芯片市场的运用则刚起步,大多公司的市场布局紧张在试错的同时,培养开拓者生态。
同时,从业者们也逐渐创造,芯片中最为关键的实在并不是纯挚提升算力,如果不进行存储优化,那么芯片实际供应的打算力会大大降落。
若想打破AI芯片的瓶颈,并不能只是大略的增加打算算力,而是一定要把数据存储管理做好。对付存储问题的办理,仍是一个探索中的新方向。
AI芯片对付传统芯片带来的寻衅,并不但是打算架构上的,更多是在存储架构间的。
传统芯片采取的是冯·诺依曼架构,其核心架构中计算模块和存储单元是分离的。CPU和内存条并不集成在一起,只在CPU中设置了容量极小的高速缓存。
也便是说,CPU在实行命令时必须先从存储单元中读取数据。每一项任务,如果有十个步骤,那么CPU会依次进行十次读取,实行,再读取,再实行…
这就造成了延时,以及大量功耗花费在数据读取上,这一问题也被称为传统芯片的内存墙问题。
而在AI运用中,冯·诺伊曼瓶颈问题显得愈发严重。
AI依赖的算法是一个弘大和繁芜的网络,包含很多参数须要存储,也须要完成大量的打算,这些打算中又会产生大量数据。
在完成大量打算的过程中,一样平常芯片的设计思路是大量增加并行的运算单元,例如上千个卷积单元,须要调用的存储资源也在增大。
不夸年夜地说,AI初创芯片公司虽然采取不同的路径打造芯片,但事实上都在努力对这一问题予以办理。大部分针对 AI,尤其是加速神经网络处理而提出的硬件架构创新,都是在与这个问题做斗争。
如何办理这一问题呢?目前办理方法有以下几种:
较为常见的方法是加大存储带宽,采取高带宽的外部存储;二是从算法入手,设计低比特权重的神经网络。
除此之外,存算一体化也被看做是未来的发展方向,在实现上也分为不同的路径。
其一是SSD中植入打算芯片或者逻辑打算单元,可以被叫做存内处理或者近数据打算,这实在是深度学习的一种运用处景,并非是AI芯片架构的创新。
另一种便是存储和打算完备结合在一起,利用存储的器件单元直接完成打算,比较适宜神经网络推理类运用。
也有人不太认同存算一体的处理办法,探境CEO鲁勇认为,这样做的本钱太高,并不符合市场需求。
“存算一体的处理办法,实在违反了芯片中的本钱构造。芯片中,之以是设计和区分片上的缓存SRAM,及片外的DRAM,便是由于如果所有存储都放入芯片内部,本钱就大幅上升,会上升几十倍到上百倍。”
就此,他们提出了SFA(Storage First Architecture,简称SFA),即存储优先架构。
与常日打算的先有打算指令然后供应数据相反,SFA架构考虑数据在搬移过程中做打算,也便是由数据带动打算而非由算子带动数据。
这一点与AI大神Lecun所流传宣传的所有的神经网络都是图打算问题不谋而合。那么冲破传统冯·诺依曼架构,自研存算一体架构的依据是什么?
这可以谈到人类大脑的存储和打算办法。从生物角度讲,大脑存储大量的知识,能够快速提取并访问,而大脑的内存和打算并不是分开的,更多的是存在一定的相容性。
因此,未来的打算机可能不是基于打算的存储,而是基于存储的打算,更多做到领悟。不过,由于当前芯片领域对付AI算法的关注还较多,针对AI的构造改进考试测验还偏少。
造芯,登高还需防跌重
过去几年,不少企业针对安防领域纷纭宣告流片之喜,但彷佛还未涌现强势的对传统芯片的替代或继任者。
从大环境来看,海内虽有不少公司关注对AI芯片的底层架构的研发,但更多只追求有、不追求好,用拼凑的办法做芯片。
乃至于,不少玩家为了顺应市场形势,将自己包装成一个AI芯片公司,给市场徒增泡沫。
同时,海内AI芯片企业,眼下普遍缺少后端设计人才,后端设计相对付前端逻辑设计,更多涉及到芯片的工艺,也相对更须要丰富的履历。
由此,很多厂商会通过外包的办法做后端做事,来完成生产。这对芯片厂商来说,实在是一个很大的竞争劣势。
针对安防缺芯之话题,此前AI掘金志也采访了多家有着不同创新路径的芯片企业,他们或从优化芯片的打算、存储架构入手,或选择做软硬一体,或着眼于摄像头中的ISP、编解码芯片。
对付AI安防芯片要办理的紧张问题和创新路径,企业家们有着共识,也有各自不同的选择和意见。
触景无限副总裁陈勇:做芯,软硬件耦合是关键
做一款AI安防芯片要从全栈办理方案出发,不仅仅只有芯片,还要有比较完善的软件生态来耦合这个芯片,这样用户才比较随意马虎、也能动态支配符合他们需求的方案。
另一个点是芯片的算力能效,芯片不能只单单供应算力,还要在知足运用算力哀求的条件下花费最少能量。
我以为,这两个方面对于AI安防芯片来说最主要。
触景无限做芯片便是为了让自己的算法和工程履历找到一个更好耦合的练兵场,达成软硬件的协同优化,更好地实现前端感知。
以前,我们创造AI加速只是前端落地运用需求的一个点,打磨很永劫光的AI加速芯片产品,用在前真个效果还是不足好。
就像一条公路,AI芯片的集成像是铺上了柏油,但车辆通畅时除了对付路面的高哀求,还有对付路牌、路标、做事区的需求,而这些在实际过程中,都没法得到很好的知足。
在芯片详细研究中,我认为,对AI 安防芯片来说,由于多层神经网络的运用,如何做到各种神经层中间的高效数据传输是一个难点。
其余,我们认为虽然在摄像头内,主控芯片很强势。但AI协处理器有它独占的灵巧性和高效性,并不能大略地被主控芯片集成。这种通用性和专用性的取舍会一贯存在,而这也是AI协处理器存在的机会。
探境科技CEO鲁勇:芯片的数据存储管理要做好
安防领域的数据特点,实在紧张在于须要实时的处理大量连续的图像数据流。
第一是每秒处理帧率要越来越高,第二是图像分辨率上要高。在这两个维度上,安防对边缘芯片提出了哀求。
原来很多安防厂商采取Movidius的芯片实现前端智能,但我们认为它并不是非常适用于安防前端。不过Movidius的火爆,恰好解释了市场对边缘端芯片的强大需求。
我的意见是,冲要破AI安防芯片的瓶颈,并不能只是大略的增加打算算力,而是一定要把数据存储管理做好。
传统芯片中,采取的是冯·诺伊曼架构,打算模块和存储单元是分开的,“内存墙”问题很严重。而AI依赖的算法是一个弘大和繁芜的网络,有很多参数要存储,也须要完成大量的打算,须要巨大存储容量,高带宽、低延时的访存能力。很多AI初创芯片公司,实际上都在努力办理这个问题。
而我们的思考是,不能采纳常日的先有打算指令然后供应数据的办法,该当从存储子系统的优化入手,让数据在存储之间的搬移过程之中完成打算。
这也可以叫做“基于memory的打算”,而不是“基于打算的memory”。
当前芯片领域对付AI算法的关注还较多,针对AI的构造改进考试测验还比较少。之后,memory与computing结合的考试测验,我相信会是一个好的方向。
中原芯CEO李科奕:提升AI芯片的易用性
现在的安防市场上,已经涌现了很多前真个AI加速器,但实际它们在运用上,还存在一些问题。
第一是价格太高。第二是可编程性不敷。原来的通用芯片CPU很随意马虎能实现编程,但AI加速模块中并没有指令集,无法编程,须要手工去调度。
在安防领域也是一样,厂商普遍反响的,不是AI芯片的性能,而是无论AI初创企业,还是传统大厂设计的加速器都很繁芜,AI加速器很难被用起来。
一样平常来说,通用芯片难以负荷对打算的高哀求,AI专用芯片则在可编程性、灵巧性上有所欠缺。目前运用较多的集成度高的Soc,将不同打算架构芯片集成在一起,须要多套编程程序,运行就随意马虎带来问题。这也是安防芯片厂商们,尤其是在安防前端运用上面临的难题。
而业内目前看好的一种办法,便是将不同的芯片架构结合在一起,这便是“异构打算”。
异构打算的长处在于,能实现比较好的适应性和灵巧性,在通用性和专用性上达成一个折衷。既能高效的处理数据,又能相对担保算法的及时更新和迭代。这也是我们在探索的一个方向。
现在在安防、自动驾驶等这些边缘真个市场,对芯片的综合哀求非常高。芯片须要处理的数据量很大,同时对付性能、性价比、性能功耗比哀求也很高。
但我们看好这些新兴市场,由于边缘真个需求量很大,而且相对付手机、云打算、PC端等这些已经很成熟的市场,给了芯片厂商更多创新,和在新市场中霸占位置的机会。
欣博电子CEO梁敏学:很多AI安防芯片是同质化的
对付AI安防芯片来说,我认为“芯片+算法”的整合是最主要的。而对付详细一款芯片,最紧张的指标该当是价格和稳定性。
芯片是“硬”的,算法是“软”的,如何能将两者更好的结合起来,这就须要加强芯片对底层运算加速算法的适应性。
现有芯片的问题,从技能角度来说,对前真个AI芯片算力的哀求,对存储问题的办理,都很主要,都须要靠算法和芯片架构一起来改进,比如说现在的算法就还比较耗带宽。
再详细运用上,我认为AI安防芯片在安防摄像头中作为协处理器,目前已经被主控芯片集成了,以是纯挚供应AI加速器并不占上风。
而我们所做的,是开拓编解码能力、加密及AI能力三合一的芯片,为摄像头供应安全加密。这也是我们相对付其他芯片厂商不同的一点。
从行业角度来说,现有AI芯片在安防行业运用落地上的紧张问题,实在是同质化。
很多AI芯片厂商产出的芯片并没有太大差别,一方面很多芯片达不到现有安防行业对前端AI芯片的哀求,一方面又随意马虎陷入芯片同质化竞争。
现在的安防芯片格局下,实在已经存在垄断的生态,有大的行业玩家存在,那么做AI安防芯片如何找到自己的代价点,并做到差异化还是最难的。
大家智能CEO王海增:芯片行业很残酷,遵照二元法则
AI芯片前两年很热,“热”的同时,也让市场很暴躁,去年一年,业内就推出了十几款AI芯片。
但在安防和芯片领域摸爬滚打多年,我们的意见是不去做纯碎的单一芯片,而是做领悟芯片、算法和系统的FaceOS视觉中间件,用在人证比对等。
在我看来,市场上可能只须要一款主流产品。芯片行业是很残酷的,有个二元法则,便是老大吃肉,老二喝汤。老三、老四可能找不到名字。
综合来说,我还是比较看好华为海思。在安防视频芯片的领域,有华为海思这样的对手存在,做视觉智能芯片险些没有太多机会,这一事实很难改变。
之前,我们比拟过这些芯片,创造芯片从高端到低端系列,海思的芯片布局很完全,渠道健全,而且功能险些比现有的几个AI芯片厂商都更加领先,上风很明显。两三年前,我们能看到这个市场很大,但不知道谁能跑出来,现在回过分来再看,我们依然以为海思跑的更靠前了。
其余,AI芯片领域虽然一贯在谈创新,但实际上,真正的创新还尚未到来。
算法的底层架构,如TensorFlow、Caffee等方面险些都是采取国外的架构。
底层的算法上面,海内险些还处于空缺。这涉及很多根本数学的问题。就像谷歌谈张量打算芯片,是发觉了卷积利用的张量打算的模型和传统模型不同,以是须要设计芯片设备,适应它的模型,这是算法型的创新。而且谷歌还发明了TensorFlow这样的紧张架构。
这些在海内还都是空缺。雷锋网雷锋网雷锋网