作者 | 张瑞
制约AI安防芯片规模化运用的核心技能问题是什么?

这是不少芯片企业面对安防场景时,不断向自己提出的疑问。在提高AI安防芯片性能,加强算力的同时,从业者们也逐渐创造,芯片中最为关键的实在并不是纯挚提升算力,如果不进行存储优化,那么芯片实际供应的打算力会大大降落。

“冲要破AI芯片的瓶颈,并不能只是大略的增加打算算力,而是一定要把数据存储管理做好。”探境科技创始人兼CEO鲁勇说道。而对付存储问题的办理,仍是一个探索中的新方向。
阻碍AI芯片的内存墙问题
AI芯片对付传统芯片带来的寻衅,并不但是打算架构上的,更多是在存储架构间的。
传统的芯片采取的是冯·诺依曼架构,其核心架构中计算模块和存储单元是分离的。CPU和内存条并不集成在一起,只在CPU中设置了容量极小的高速缓存。
也便是说,CPU在实行命令时必须先从存储单元中读取数据。每一项任务,如果有十个步骤,那么CPU会依次进行十次读取,实行,再读取,再实行……这就造成了延时,以及大量功耗花费在数据读取上。
这一问题也被称为传统芯片的“内存墙”问题。
而在AI 运用中,冯·诺伊曼“瓶颈”问题显得愈发严重。AI依赖的算法是一个弘大和繁芜的网络,有很多参数要存储,也须要完成大量的打算,这些打算中又会产生大量数据。在完成大量打算的过程中,一样平常芯片的设计思路是大量增加并行的运算单元,例如上千个卷积单元,须要调用的存储资源也在增大。
不夸年夜地说,AI初创芯片公司虽然采取不同的路径打造芯片,但事实上都在努力对这一问题予以办理。大部分针对 AI,尤其是加速神经网络处理而提出的硬件架构创新,都是在与这个问题做斗争。
而成立于2017年的AI芯片初创公司探境科技,也在这一起途上跋涉。不过不同的是,探境科技选择另辟路子,直接从存储子系统的优化入手,办理“内存墙”问题。
自研存储优先的SFA架构
而如何办理这一问题呢?
目前办理这一问题的方法有几种,较为常见的方法是加大存储带宽,采取高带宽的外部存储,以及从算法入手,设计低比特权重的神经网络。
除此之外,存算一体化也被看做是未来的发展方向,在实现上也分为不同的路径。
其一是SSD中植入打算芯片或者逻辑打算单元,可以被叫做存内处理或者近数据打算,这实在是深度学习的一种运用处景,并非是AI芯片架构的创新。
另一种便是存储和打算完备结合在一起,利用存储的器件单元直接完成打算,比较适宜神经网络推理类运用。
而探境科技则另辟路子,提出了完备不同的办理方案。
鲁勇提到,并不认同目前存算一体的处理办法,紧张缘故原由是本钱太高,并不符合市场需求。
“存算一体的处理办法,实在违反了芯片中的本钱构造。芯片中,之以是设计和区分片上的缓存SRAM,及片外的DRAM,便是由于如果所有存储都放入芯片内部,本钱就大幅上升,会上升几十倍到上百倍。”
因而,抛开将存储全部放入芯片内部的办法,探境科技自创了SFA(Storage First Architecture,简称SFA),即存储优先架构。
不同于常见的办理内存瓶颈的方法,SFA是“以存储调度为核心”的打算架构,数据在存储之间的搬移过程之中就完成了打算,打算对付数据来说只是一种演化。
“与常日打算的先有打算指令然后供应数据相反,SFA架构,存储是我们优先的出发点。考虑数据在搬移过程中做打算,也便是由数据带动打算而非由算子带动数据。”鲁勇进一步阐明。
这一点与AI大神Lecun所流传宣传的所有的神经网络都是图打算问题不谋而合。
那么冲破传统冯·诺依曼架构,自研存算一体架构的依据是什么?
这可以谈到人类大脑的存储和打算办法。从生物角度讲,大脑存储大量的知识,能够快速提取并访问,而大脑的内存和打算并不是分开的,更多的是存在一定的相容性。因而,未来的打算机可能不是基于打算的memory,而是基于memory的打算,更多做到领悟。
不过,由于当前芯片领域对付AI算法的关注还较多,针对AI的构造改进考试测验还偏少。未来,memory与computing结合的考试测验,会更可期。
鲁勇也先容道,目前专注于从存储子系统入手,着力办理AI芯片的存储打算架构问题的企业并不多,而个中很多公司从事的都是本钱构造并不合理的存算一体架构,符合合理的本钱构造并优化存储子系统的公司更是屈指可数。
安防还未有一款真正适用的AI芯片
安防作为打算机视觉较快落地的领域,也成为探境科技较为看好的场景之一。
探境科技的创始人兼CEO鲁勇,出身环球十大芯片厂商之一的Marvell半导体,是位在半导体业摸爬滚打了15年的老兵。
在成立探境科技之前,鲁勇曾是Marvell半导体的中国芯片研发总监。据鲁勇先容,在Marvell这十年里,他从零开始,一手搭建了Marvell的中国芯片研发团队。
探境科技创始人&CEO 鲁勇
在创立探境科技之前,几位在海康威视、大华股份等安防巨子中任职的朋友都陆续来找到鲁勇,咨询英特尔Movidius VPU是否能够适用于终端AI处理的需求。
鲁勇认为,目前市场上还没有足够精良的适宜安防前真个通用芯片,也没有一款很适用安防的AI芯片涌现。不过Movidius的火爆,恰好解释了市场对边缘端芯片的强大需求。
于是,2017年,鲁勇决定离开Marvell,与一群老朋友成立了探境科技。
在安防领域里面,有大量的算法须要前置。目前的算法基本都是基于深度学习。
而探境科技的芯片,如何更好适用于安防大量非构造化数据的处理需求呢?
鲁勇讲到,安防领域的数据特点,紧张在于须要实时的处理大量连续的图像数据流。“安防领域的数据处理,在于两个维度。第一是每秒处理帧率要越来越高,第二是图像分辨率上要高。在这两个维度上,安防对边缘芯片提出了哀求。”而探境科技的上风则在于,基于SFA架构,能更好优化存储和打算,从而更好办理这一问题。
安防领域,边缘真个芯片,已有不少厂家入场。个中大厂有之,明星初创公司亦有之。
目前来看,边缘终端市场有两种形态的芯片产品,一种是针对特定运用的SoC,一种是通用加速器做独立芯片。
如在安防领域,SoC面向专用市场,在芯片中深度学习加速打算事实上只是一部分,而其他大部分芯片面积则交给了主控处理器、视频解码等模块。
终端通用深度学习加速器芯片市场的运用则刚起步。许多公司的市场布局紧张一是培养开拓者生态,另一方面也探索研究哪一领域最有潜力,针对几个主要的场景推出相应的优化芯片。而探境科技的目标便是做支持所有神经网络的通用型AI处理器。不仅在安防领域,也瞄准了其他运用处景。
鲁勇认为,探境科技基于SFA架构的AI芯片,在优化了存储架构的同时,能够适用于智能家居、智能安防、智能穿着、智能车载、智能外设等更多场景,低功耗低效能的办理更多问题。
目前,探境已量产了运用这一架构的语音识别芯片音旋风611,视觉芯片今年下半年也将发布。
AI芯片,登高需防跌重
但实际上,近两年,许多AI企业的芯片纷纭宣告流片,尤其针对安防领域的芯片并不少,但彷佛还并未涌现强势的对传统芯片的替代或继任者。而作为一个芯片界的老兵,如何看待AI芯片行业的发展呢?
鲁勇认为,AI芯片确实是被公认的一个海内企业弯道超车的机会。相较于国外更看重云端场景,海内有在边缘端有大量市场,这为海内AI企业在边缘芯片的发展供应了良好的机会。
但海内虽有很多公司关注对AI芯片的底层架构的研发,也有不少AI芯片公司“只追求有,不追求好”,用拼凑的办法来做芯片。很多公司为了顺应市场形势,将自己包装为一个AI芯片公司。这样就给市场造成了很大泡沫。并且,海内AI芯片企业,也普遍缺少后端设计的人才。
后端设计相对付前真个逻辑设计,更多涉及到芯片的工艺,也相对更须要丰富的履历。海内涵后端设计人才上更为紧缺。因而,很多厂商会通过外包的办法做后端做事,来完成生产。这对芯片厂商来说,实在是一个很大的竞争劣势。
AI芯片,“登高”彷佛也面临着“跌重”的风险。
不过,大浪淘沙。在2017年就看到,并率领团队致力于办理AI芯片中的存储问题,鲁勇显然对自己和探境科技都更有信心。
“芯片,作为一个赢者通吃的行业,对技能和产品的能力哀求都非常高。行业终极会看到,技能和产品会主导AI芯片的格局。具备两者实力的AI芯片公司,会末了存活下来。”鲁勇说道。
重磅预报
环球AI芯片 · 城市智能峰会
10月27日,「环球AI芯片·城市智能峰会」将在深圳大中华喜来登酒店举办。这是继「中国人工智能安防峰会」、「CCF-GAIR视觉智能专场」后,雷锋网 & AI掘金志安防团队全力打造的第三大品牌活动。安博会前一天,我们深圳见。








