首页 » 通讯 » 人工智能芯片重大年夜打破!中国首款嵌入式神经收集处理器芯片成功量产_神经收集_人工智能

人工智能芯片重大年夜打破!中国首款嵌入式神经收集处理器芯片成功量产_神经收集_人工智能

少女玫瑰心 2025-01-04 21:19:20 0

扫一扫用手机浏览

文章目录 [+]

“星光智能一号”芯片和主板

6月20日,从中星微“数字多媒体芯片技能”国家重点实验室获悉,经由五年多的攻坚克难和不懈努力,中国首款嵌入式神经网络处理器(NPU)芯片已于今年3月6日实现量产,这标志着我国在神经网络处理器领域的研究和开拓上取得了重大打破,在基于“数据驱动并行打算”架构的人工智能深度学习领域达到国际前辈水平。

人工智能芯片重大年夜打破!中国首款嵌入式神经收集处理器芯片成功量产_神经收集_人工智能 人工智能芯片重大年夜打破!中国首款嵌入式神经收集处理器芯片成功量产_神经收集_人工智能 通讯

“目前已成功在视频监控领域实现家当化,下一步将广泛运用于智能驾驶赞助、无人机、机器人等嵌入式机器视觉领域。
”该国家重点实验室实行主任、中星微电子集团首席技能官张韵东向《中国电子报》透露,“现在的出货量已经超过了10万颗。

人工智能芯片重大年夜打破!中国首款嵌入式神经收集处理器芯片成功量产_神经收集_人工智能 人工智能芯片重大年夜打破!中国首款嵌入式神经收集处理器芯片成功量产_神经收集_人工智能 通讯
(图片来自网络侵删)

从韶光上看,几个月前的3月9日,人工智能AlphaGo与李世石的第一场围棋大战才刚刚拉开帷幕。
而在就3天前的3月6日,具有人工智能深度学习功能的中国首款嵌入式神经网络处理器(NPU)芯片“星光智能一号”已成功量产。
AlphaGo要运行在一个弘大的做事器集群上,下一盘棋仅花费的电费就高达3000美元。
而指甲盖大小的“星光智能一号”却实现了人工智能深度学习系统的低功率和小型化,并能够运用于嵌入式系统之中。

NPU颠覆冯诺依曼架构 为人工智能而生

在不久前的人机大战中,AlphaGo依赖模拟人脑生物机理的深度学习算法而击败李世石。
深度学习,是源于对生物人脑机理的仿生学研究而形成的一种人工智能算法。
作为深度学习神经网络的一种,卷积神经网络CNN (Convolutional Neural Network)算法,已成为当古人工智能机器视觉领域的研究热点。

CNN算法模型的特性可以概括为海量的输入数据、大规模的MAC运算、稀疏的权值矩阵、灵巧的数据位宽和多样的网络拓扑等特性。
对付传统冯诺依曼构造的CPU而言,其串行实行办法实在无法高效处理大量并行性运算,以是实行CNN算法的效率非常低下。

相称于CPU,GPU的高度并行化运算单元,相对更适宜神经网络的大量并走运算办法。
但是,GPU的设计初衷是为了进行3D图形处理,不仅功耗大、价格高,而且并不适宜嵌入式环境。
同理,DSP、FPGA等主流处理器也并不适宜CNN。

为此,国内外主流企业和机构也都在针对CNN算法的处理器高下很了大功夫,研制自家的CNN处理器。
如IBM公司的TrueNorth,高通公司的Zeroth,Google公司的TPU,KnuEdge公司的KnuPath和中国科学院的寒武纪等。

而中星微的NPU是针对CNN的算法模型特性专门设计的一款神经网络处理器。
据张韵东先容,NPU采取了“数据驱动并行打算”的架构,彻底颠覆了传统的冯诺依曼架构。
这种数据流(Dataflow)类型的处理器,极大地提升了打算能力与功耗的比例,特殊善于处理视频、图像类的海量多媒体数据,使得人工智能在嵌入式机器视觉运用中可以大显技艺。

据理解,每个NPU处理用具有4个内核(NPU Core),每个内核有两个数据流处理器(Dataflow Processor),每个数据流处理用具有8个长位宽或16个短位宽的SIMD(单指令多数据)运算单元。
在一个时钟周期内可同时完成64个长位宽MAC运算或者128个短位宽MAC运算。
每个NPU核具有38GOps的长位宽处理能力或者76GOps的短位宽处理能力。
NPU的处理性能可以组成多核阵列来提升,也可以通过多芯片级联的办法进一步扩展,以知足更繁芜的CNN网络运算的性能需求。

“每个NPU核还具有256KB Level-2 Cache,以及整块数据搬移(Block Data Access),片内数据共享(Data-sharing Between Processor Units),提升数据流的吞吐效率。
” 张韵东表示,“在软件方面,利用了稀疏数据优化(Optimization for Sparse Data)等特性提高打算效率。
NPU可以支持Caffe、TensorFlow等多种神经网络框架,支持AlexNet、GoogleNet等各种神经网络。

国家重点实验学术委员会主任杨晓东表示,星光智能一号芯片集成了NPU处理器内核以及国家标准的音视频编解码器(SVAC Codec),是环球首颗具备人工智能深度学习能力的嵌入式视频采集压缩编码系统级芯片。

还理解到,目前,中星微NPU芯片的代工生产在台积电进行,下一步有望转由我国大陆企业生产。

NPU只是“智能摩尔之路”的第一步

随着星光智能一号在视频监控领域的运用,监控系统可以通过高清视频的采集和编码,对职员、车辆进行基于深度学习的智能化目标识别,实现视频的构造化描述,关联视频和标签,并接入公安平台保存录像和索引信息。
在接到报案信息后,刑侦职员可以通过搜索构造化描述标签,直接定位视频,获取现场图像,从而确认嫌疑人。

说得普通些,往后我们可以直接用蓝白条纹T恤、黑裤子、男性这样的关键词对视频中的内容进行搜索。
同理,如果在商品展示橱窗中设置NPU视频智能监控系统,我们将很随意马虎得知被展示的产品吸引了多少人的目光,以及这些人的性别、外面等详细特色,合营大数据剖析,又将有多少传统行业会被颠覆?

人工智能的好戏才刚刚揭开序幕。
除了视频监控领域,NPU很快会在智能驾驶赞助、无人机、机器人等领域带给我们更多惊喜。

未来,对信息处理性能的需求还将不断提升,如何才能找到一条后摩尔定律时期的创新之路?对此,业界有两种不雅观点:一是连续推进摩尔定律(More Moore),即连续在新型材料、工艺制程和器器件构造上努力,将摩尔定律再推进一步。
二是超越摩尔定律(More than Moore),即通过SoC将数字电路、仿照存储器乃至射频电路集成在一颗芯片里以实现更多功能,或者通过SIP采取多芯片堆叠的办法,将多颗裸芯片封装在一起。

“正如业界所言,随着逐步逼近喷鼻香农定理、摩尔定律的极限,面对大流量、低延时的理论还未创造出来,大家感到出息茫茫,找不到方向。
”张韵东说,“而NPU正是一块引玉之砖。

面对摩尔定律的尽头,中星微给出了全新的技能路线——智能摩尔之路(Intelligent Moore)。
其内涵是,虽然物理层面和旗子暗记层面都受到物理规律的制约,但在信息层面的技能创新还远没有达到极限。
如何进一步借鉴人脑聪慧机制,研究新型人工智能打算方法,进一步提升信息处理的性能功耗价格比,可能是下一次信息革命的关键。

张韵东表示,中星微国家重点实验室在未来的五年中,会持续开展新型“数据驱动”并行打算架构的研究事情,采取更加靠近生物人脑的事情机理的办法,推出更低功耗更高运算性能的下一代神经网络处理器,在摩尔定律的尽头探索一条连续提升信息处理效率的前行之路。

相关文章

模块化网站,构建高效互联网时代的利器

随着互联网的快速发展,网站作为信息传播的重要载体,其建设与运营变得愈发重要。在这个信息化时代,如何高效、快速地搭建出一个满足用户需...

通讯 2025-01-06 阅读0 评论0

模拟网页协议,网络时代的信息传递桥梁

在互联网飞速发展的今天,模拟网页协议作为一种高效的信息传递方式,已经成为网络时代不可或缺的技术手段。本文将从模拟网页协议的定义、工...

通讯 2025-01-06 阅读0 评论0

横道图在现代项目管理中的应用与价值

随着我国经济的快速发展,项目管理已经成为企业提高核心竞争力、实现战略目标的重要手段。在现代项目管理中,横道图作为一种重要的工具,被...

通讯 2025-01-06 阅读0 评论0