演讲:任化龙
编辑:杜伟

近日,在 2022 WAIC AI 开拓者日上,忆海原识创始人兼 CEO 任化龙揭橥主题演讲《类脑打算的发展与关键技能》。演讲中,他夯实细致地先容了类脑智能的特点以及与传统技能的比拟,以及忆海原识自主研发的 Ocean 类脑打算平台。

以下为任化龙的演讲内容,机器之心进行了不改变原意的编辑、整理:
忆海原识专注于机动手和类脑智能,推动机器人家当赋能生活做事和工业生产,解放人类的生产力。
忆海原识团队起源于 2007 年,当时在研发机动手本体,后来创造智能才是机器人最大的瓶颈。于是任化龙选择去斯坦福深造,却创造所学传统智能技能存在明显理论短板。
人工智能的打破口在哪里?答案就在人脑,不需向外索求。
深度学习已经碰着瓶颈
不可否认,人工智能发展至今已取得瞩目造诣,在打算机视觉、打算机听觉、自然措辞处理、自动驾驶等领域都已获商业运用,但每个领域也尚存不少短板。
打算机视觉方面,目前以深度学习为主。深度学习采取数学优化作为内核,须要大量样本演习,泛化能力较弱,不能对事物、情景抽象概括理解,例如不能理解左图中奥巴马的搞笑举动。
打算机听觉方面,假设在一个非常喧华的鸡尾酒会上,很多人在说话,夹杂着觥筹交错的羽觞声。那么,你怎么主动选择听哪个声音呢?这便是主动把稳力。还有像人的说话、唱歌有音色和腔调,乃至说话过程中有语气等,这些为传统智能技能所忽略。
至于做事机器人,目前短缺机动的手,以是没办法进行机动操作。而运动方案仍须要给定轨迹或者给出精确的目标坐标(X、Y、Z)。机器人无法自己进行决策,也不具备像人一样的情景影象。
自动驾驶就更不用说了,在封闭场景还好,但是到了开放环境仍旧面临一系列寻衅,包括可阐明性和鲁棒性较弱、繁芜路况下适应能力弱、须要大量重复演习但性能提高有限等。
可见,目前人工智能感知能力有限,更不要说认知能力,深度学习确实碰着了瓶颈。
从生物脑到类脑打算
前面提到了好多次认知,那什么是认知呢?我先抛出一个问题,谁还能记得上一个演讲的全部内容、全部画面,乃至每一句话?大家该当记不得了,由于人并不是像摄像头一样把每一段情景都录下来。
但是如果让你总结概括,是不是可以呢?比如你可以用少于 10 句话去概括,乃至可以进一步精简到用一句话概括。这便是认知。学习和影象、抽象和归纳便是人有的认知,这些对付机器人以及打算机来说仍旧非常困难。
人脑的认知行为是非常灵巧的,比如下图中五官的位置关系是若何的,是不是已经错乱了,没有准确的顺序?再看它的色调和纹理,跟真实的人脸也有差异吗?那么我们把它识别成什么呢?
如果从这幅画的作者来讲,我们知道它是毕加索的一副名画;从内容上讲,我们知道这是一张扭曲的人脸。如果想要识别它扭曲在哪里,可能是鼻子和眼睛的位置是错乱的。以是,我们对任何一个确定的输入,识别理解成什么样取决于认知须要。这种多元化的解读便是人脑的认知所带来的灵巧性,这些也是目前人工智能所不具备的。
人工智能怎么打破前述瓶颈呢?天地宇宙授予我们人身,古人通过内不雅观创造人的身体有气脉,因而发展出了中医,而人的大脑是目前唯一的通用智能系统,因此大脑是最好的设计原本,我们该当向内借鉴,不需向外求索。
借鉴生物脑的智能技能可以用在视觉、听觉、措辞、理解、决策、运动掌握等各个维度,办理做事机器人和自动驾驶的关键瓶颈。从这个思路可以演化出很多具有干系性,但又有一些不同的学科和技能路线。
那么类脑打算是什么呢?它是由生物脑启示的人工智能技能,强调实用,不追求把大脑中每一个生物细节都进行仿照,具有广阔运用前景。
脑仿真便是一种风雅度较高的仿照,不一定追求实用,更多的是探求生物物理层面的机理。
神经拟态芯片,利用介于数字和仿照稠浊旗子暗记的办法来实现人工神经元,集成进芯片里,大幅度节省芯片的功耗。
打算神经科学可以看作是类脑打算的前身,它大量利用数理方法对脑机制进行理解,很多模型都是抽象的,不一定追求实用。
脑机接口也是近些年兴起的领域,紧张办理人和机器、大脑和机器之间的交互。
下图供应了一览无余的比拟:类脑打算可以通过算法、软件、硬件实现;神经拟态芯片如 IBM 的 TrueNorth;脑仿真如欧盟的人类脑操持,通过对多种生物脑中特定脑区的脑切片进行重构得到脑仿照模型;打算神经科学如经典的脉冲神经元模型和传统脉冲神经网络;脑机接口如马斯克的 Neuralink。
类脑打算如何借鉴大脑呢?它有两个关键特色,一个是技能特色,另一个是运用面。技能特色上高度借鉴了生物脑中关键的生物机制,比如不再利用深度神经元模型,而是利用脉冲神经元模型,乃至比脉冲神经元更繁芜的模型。
类脑打算的学习机制也不再依赖数学优化,无需偏差反传和梯度低落,而紧张利用可塑性进行演习,由此局部性更好,学习效率更高,合谋生物脑中分外的神经环路可以快速地实现举一反三。类脑打算也不再严格区分学习和推理这两个过程,很适宜实时在线学习。由脉冲神经元构建出微环路,再由微环路构建多脑区的脑网络,这样就可以实现类脑神经网络模型。
类脑打算面向的问题是更高等的认知任务,不再是大略的识别和分类。比如抽象与归纳、推理与决策、知识与知识都属于认知,想象与创造、情绪、同理心、道德,乃至人特有的直觉与审美属于高等认知征象。
忆海原识类脑打算体系
类脑打算详细怎么做呢?回顾忆海原识的探索进程,我们是从机器人本体开始,由于脑中包括视觉系统、影象系统、运动掌握系统在发育与演习过程中离不开人体或者说机器人本体跟外部天下的不断互动。后来逐渐积累类脑智能的理论,并在这些理论辅导下逐渐实现了一系列类脑神经网络模型。再后来创造这些模型规模比较弘大,运算效率又成为新的问题,于是研发了类脑加速平台,走了一个完全的技能链条。
回顾深度学习的发展历史,实在也是一样的。最早从理论出发,然后涌现了多层神经网络,办理了演习问题,再然后涌现了一系列关键布局(如 CNN、RNN、池化),后来又涌现了诸如 Caffe、TensorFlow 等深度学习加速平台。类脑打算的发展也一样要循规蹈矩,一步一步踏实地走。
类脑神经网络初窥
神经网络是怎么事情的呢?我们先来看人眼视网膜,它是视觉神经通路的第一关,却又每每被传统打算机视觉所忽略。
再仔细看,视网膜的内部布局非常丰富和繁芜,从第一层的感光细胞到后面的双极细胞、水平细胞、无长突细胞和神经节细胞,它们分成了多少层,每层里面还有亚层。这些细胞之间进行充分的信息沟通和互动,能够产生多种主要浸染,包括但不限于调度比拟度、图象锐化、边缘检测和形成初步色感等。
实际上,视觉的处理过程并不仅局限于视觉皮层,其实在视网膜就已开始了。下图为视网膜模型的处理效果,最左边是输入图象,中间是它提取出来的边缘,最右边形成了初步的色感(形成了三种不同的紧张色调)。
这里我们只借鉴视网膜内部的生物机制就可以实现,完备不须要数学优化、偏差反传和大量的演习,效果仍旧很好。
我们再来看更高等的部分「视觉皮层」。视觉神经系统有丰富发达的机制,它的神经通路与其他脑区高度互联,比如视觉皮层可以连接到运动皮层,和空间感有关;它还连接到颞叶,对物品进行识别;它还连接到中颞叶布局(包括海马体),形成情景影象。情景影象又可以进行抽象和归纳,再反哺视觉皮层的演习,使视觉演习效率非常高。
我们举个例子,受益于四通八达的神经通路,视觉系统可以进行丰富灵巧的信息处理。如下最左图给大家一种立体感(存在视错觉);中间图有 ABC 三个位置,尤其是 A 和 B 在通亮上是同一个色阶,但在不同的阴影照度和比拟下,就可能被人眼识别身分歧的结果;还有最右图中有几种颜色的螺旋呢?实在如果去掉背景滋扰信息,可以创造它的螺旋线只有绿色。
也便是说,人脑对立体感、通亮感、色彩感以及其他诸多种觉得都存在相对性与整体性,能够在丰富的信息空间中进行灵巧处理,处理办法和结果取决于认知须要和比拟。
不才图中,大家可以看到远山之间存在层次感,能够分辨近景与远景。在这种图像之中,你可以结合视觉把稳力选择关注的工具(即主动把稳力)。人的视觉一样平常只对中心凹的位置(即中间部分)高度关注因而分辨率较高,周边的部分是模糊的。
人眼可以选择聚焦于远山,也可以聚焦于近景,这些都是出于认知须要而定。这些在传统人工智能中没有很好地实现,以是不足灵巧,没有办法适应会纷繁变革的繁芜场景。
再如下图示例,倾向于识别问题。图中的工具到底是牛还是鲨呢?如果用深度神经网络,可能只能识别出一个确定的结果,要么分类成某种鲨鱼,要么分类成其他结果。为什么呢?由于它是端到真个单一输入输出系统。
但是对人脑而言,认知是极其灵巧的,思维存在非常多维度。头脑可以见告你如果现在关注的是前景,虽然长得像鲨鱼的轮廓,但从纹理上看,是牛的皮肤。如果看它的头部与身体关系,则是牛头鲨身(您或许已经把稳到了,这里存在履历 / 逻辑上的冲突)。如果你现在把把稳力放到远景,头脑会见告你远景是远处的山峰。
可以这么说,视觉系统具有丰富灵巧的认知机制,并不像深度学习那样是端到真个单一输入输出系统。
Ocean 类脑打算平台
问题来了,我们如何建模这样弘大繁芜的神经系统呢?
1,我们创造建模过程非常啰嗦,须要简化建模过程的工具。
2,神经系统分为非常多繁芜的层级,最顶层有系统级、往下是环路,再往下是神经元和突触,再往下可以分解到分子和蛋白质层级。每一个层级对整体的认知须要都是有贡献的,须要实现其信息处理过程。因此,须要一个能够对各个层级进行建模的工具。
3,此外,类脑神经网络每每规模很大,包括上千万乃至上亿个参数。如何在通用打算硬件上运算呢?这也须要一个运算效率很高的工具。
Ocean 类脑打算平台应运而生,最初是作为我们内部利用的工具,现在隆重地向大家先容和推广。
Ocean 类脑打算平台分为前端、核心和后端,它把建模和硬件管理进行解耦。这样一来,神经科学家和建模职员不必关心硬件底层细节,只需专注神经网络的建模。
该平台供应了丰富的根本模型和神经机制,包括有多种类型的神经元、突触、可塑性机制,以及顺馈、反馈、循环和侧抑制等常见的环路构造,简化用户建模过程,同时支持用户自定义模型、扩展功能。该平台能够支持全尺度的建模,从最小单位的神经元、突触、树突、环路、核团到脑区。
该平台还可以支持大规模类脑神经网络的运算,通过对硬件设备的调度管理,担保高运算效率。该平台可以在异构打算器件上运行,支持 CPU、GPU 以及其他的异构打算设备。该平台可支配在个人打算机、云端做事器以及嵌入式设备上,从而为其运用和推广带来了可能,知足从研发到运用支配的全链条需求。
神经系统建模有哪些特点?我们创造:第一,生物神经元特性远比传统脉冲神经元特性丰富,第二,生物脑的机制远比传统人工神经网络的机制丰富。如此看来,理论、算法、模型将会持续快速更迭,并将成为常态。
因此,Ocean 须要知足灵巧建模的需求。
如左上图为一个生物神经元,它可大致分为突触、树突、胞体、轴突等几个部分。对应到模型上,每个部分都可以发生很繁芜的机制,每一个机制对付终极表现出来的宏不雅观认知效果都有不可忽略的主要浸染。
为知足灵巧建模须要,Ocean 也相应地将神经元模型划分为突触、树突、胞体等构造(可以进一步细分和扩展)。个中,突触也可以独立建模。
再来看突触及突触可塑性,在生物学层面二者干系性很强,但又相对独立。因此 Ocean 将二者解耦,突触及突触可塑性可以分别建模,同时许可二者灵巧组合。
在前述根本上,为了运算的高效以及便于管理模型 / 代码,Ocean 将神经元、突触以群组为单位划分,并供应两种根本模型描述范式:容器模型描述范式、端口模型描述范式。
下面着重先容端口模型描述范式。一个端口模型包括模型主体和一至多个端口。个中,模型主体包括多少变量,用于表达模块 / 模型的状态(例如神经元的膜电位);端口表述了模块 / 模型与其它模块 / 模型的信息交互办法(可以用于实现突触连接)。通过端口机制,可以清晰地描述神经网络丰富而繁芜的拓扑构造。
针对根本模型供应以下端口(可以按需扩展):
Input - 输入端口,接管输入;Output - 输出端口,产生输出;Reference - 引用端口,许可模块 / 模型与其它模块 / 模型的变量相互引用;Connection - 连接端口,可用于实现联接权重矩阵等功能;如下图所示:
Ocean 供应了常用的神经元类型、突触类型、树突构造、可塑性机制等,并分别供应了对应的端口模型 / 容器群组。
进一步地,为了提高模型的组织能力,更灵巧地管理模块,Ocean 还提出了抽象模块(AbstractModule);抽象模块可以对模型进行封装,通过代理输入端口(ProxyInput)、代理输出端口(ProxyOutput)等高等端供词给统一的输入、输出接口;抽象模块之间可以进行级联、嵌套,形成扁平构造、树状构造、多层级构造等,为模型的组织供应了灵巧的管理及扩展能力,更加便于研发职员之间分工协作,将各自设计的模型组装成为更大的模型。
下面给出一些经典的神经环路拓扑构造案例:
1. 神经元 - 突触 - 神经元 - 突触可塑性(上、下贱神经元组一对一)
2. 神经元 - 突触 - 神经元 - 突触可塑性(上、下贱神经元组多对一)
3. 神经元 - 突触 - 树突 - 神经元 - 突触可塑性
4. 模块嵌套及复用
这里先容一个 Ocean 建模实例。下图为利用类脑神经网络针对 MNIST 手写字体进行识别。这个模型没有利用偏差反传、梯度低落,只利用一定神经环路拓扑构造结合可塑性进行学习,就可以取得良好的识别效果。
我们还有更多的类脑神经网络模型以及运用案例,将会在往后的发布会上陆续向大家先容。
忆海原识作为类脑打算以及机器人生态中的一份子,希望能够跟大家共同推动该领域发展,也希望大家能够持续关注。感激大家!
特殊鸣谢:天安云谷、奇绩创坛、X-man 加速营、Nvidia Inception Program







