各位好!
哇,很高兴看到这么多人来参加本日的讲座。好的,感激大家激情亲切的先容。
嗯,本日我们来聊一聊天生式人工智能。首先,我会阐明什么是人工智能,为了让大家更好地理解,我希望这次讲座更具互动性,让大家都参与进来。嗯,预备这次讲座的人对我说:“哦,对付一个研究人工智能的人来说,你的技能含量有点低,你既没有炫酷的爆炸实验,也没有繁芜的数据演示。” 以是,我恐怕须要大家多多参与,积极互动,希望大家合营。好的。

那么,到底什么是天生式人工智能呢?这个术语可以拆解为两部分来理解:人工智能和天生式。 “人工智能”这个词听起来很厉害,但实在很大略,便是指“我们让打算机程序来代替人类完本钱来须要人类完成的事情”。而“天生式”就更有趣了,它指的是我们正在创造一些打算机从未见过的新内容。虽然打算机可能见过构成这些新内容的各个部分,但它能够将这些部分组合起来,创造出全新的东西。那么,这些新内容可以是什么呢?可以是音频、打算机代码(用来为我们编写程序)、新的图像、你听过的电子邮件或文章之类的文本,乃至可以是视频。
在这次讲座中,我将紧张关注文本领域,由于我研究的是自然措辞处理,这是我最熟习的领域。我们将会一起磋商这项技能是如何运作的,并且希望大家在听完讲座后,能够更加理解天生式人工智能,肃清环绕它的一些误解,明白它实在只是一个工具,而非科幻电影中所描述的拥有自主意识的“”。好吗?
好的,接下来我大略先容一下本次讲座的提要。讲座内容分为三部分,可能会略显呆板。首先,我要先容一位美国作家——爱丽丝·莫尔斯·厄尔,她写过许多关于纪念品和习俗的文章。大家可能并不认识她,但她却以她的名言而有名。她说过:“昨天是历史,来日诰日是谜,本日是礼物,这便是为什么它被称为现在。” 这句话充满了乐不雅观精神,而这次讲座的内容也与之呼应,将会涵盖人工智能的过去、现在和未来。
好的,在正式开始之前,我想首先解释的是,天生式人工智能并不是一个全新的观点,它已经存在一段韶光了。我想问问大家,有多少人利用过或者熟习翻译?可以举手示意一下吗?好的,谁能见告我翻译是在什么时候首次推出的?哦,那可就厉害了。是2006年,也便是说它已经存在了17年。而且,我们大家都在利用它。翻译便是一个范例的天生式人工智能的例子。它可以将输入的希腊语文本翻译成英语文本输出。我本人便是希腊人,以是,你们知道的,我得为希腊做点宣扬。翻译在这些年来一贯为我们做事得很好,而且没有人对此感到大惊小怪。嗯,另一个例子是手机上的Siri。
Siri于2011年推出,距今已有12年了。它在当时引起了轰动,也是天生式人工智能的另一个例子。我们可以让Siri设置闹钟,它还会和我们对话。哦,它是多么的方便啊!
然后,你还可以讯问你的闹钟设置情形,或者不问。这又是天生式人工智能。它虽然不像ChatGPT那么繁芜,但它确实存在。我不知道在座的各位有多少人利用iPhone?你看,iPhone很受欢迎,我不知道为什么。好的,以是,我们都熟习这些工具。嗯,当然,后来涌现了的Alexa等等,它们也都是天生式人工智能的运用。
好的,我再强调一遍,天生式人工智能并不是一个新观点,它无处不在,它已经融入到我们日常利用的手机中。当你发送电子邮件或短信时,手机会考试测验自动补全你的句子,考试测验像你一样思考,为你节省韶光,对吧?由于一些补全的内容就在那里。搜索也是如此,当你试图输入内容时,它会考试测验预测你的搜索词是什么,这也是措辞建模的一个例子。我们将在这次讲座入耳到很多关于措辞建模的内容。措辞建模,大略来说,便是预测接下来会发生什么。
以是,我想见告大家的是,天生式人工智能本身并不是什么新鲜事物。那么问题来了,为什么它现在会引起这么大的关注?发生了什么事?
事情是这样的:2023年,OpenAI公司,一家位于加州旧金山的公司,发布了GPT-4。如果你去过旧金山,你乃至可以在晚上看到他们大楼的灯光。嗯,他们发布了GPT-4,并声称它可以在SAT考试中击败90%的人类。对付那些不理解SAT的人来说,它是一项标准化考试,相称于美国的高考,学生必须参加这项考试才能进入大学。而且,SAT考试采取的是选择题形式,被认为难度不小。以是,GPT-4能够在SAT考试中取得如此精良的成绩,确实令人震荡。他们还声称GPT-4可以在法律、医学考试以及其他考试中得到高分。他们有一整套的测试结果来证明GPT-4的强大能力。
好的,除了通过考试,GPT-4还可以做很多其他的事情。比如,你可以让它,嗯,为你写文章。例如,你可以给它一个提示,这个提示代表了人类希望GPT-4为他们做的事情。一个可能的提示是:“我正在写一篇关于开车时利用手机的文章,你能给我三个支持利用手机的论点吗?” 这相称繁芜。如果你问我,我不愿定我是否能快速想出三个论点。你还可以让GPT-4做其他的事情,这些都是真实的例子,GPT-4确实可以做到。
嗯,你可以见告ChatGPT,或者一样平常的GPT:“扮演一个JavaScript开拓职员的角色,编写一个程序来检讨表单上的信息。姓名和电子邮件是必填项,但地址和年事不是。” 以是,我只要给出这些大略的指令,GPT-4就会自动天生一个符合哀求的程序。还有一个更厉害的例子:“为一个网站创建一个‘关于我’的页面,我喜好攀岩、户外运动,也喜好编程,我的职业生涯是从行业内的质量工程师开始的……” 以是,我只须要描述我想要的内容,GPT-4就会为我创建一个符合我描述的“关于我”页面。
大家可以看到,我们已经从翻译、Siri和自动补全功能发展到了更繁芜的东西,它可以做更多的事情。
另一个有趣的事实:ChatGPT达到1亿用户所花费的韶光与过去推出的其他工具比较来说都要短的多。我们熟习的翻译花费了78个月才达到1亿用户,很长一段韶光。嗯,TikTok花费了9个月的韶光。而ChatGPT,只用了2个月。以是,在两个月内,ChatGPT就拥有了1亿用户,而且这些用户还须要付费才能利用这个别系。大家可以算一下,他们赚了多少钱。
嗯,好的,接下来我们来回顾一下ChatGPT的历史。我们是如何创造出ChatGPT的?它背后的技能是什么?事实证明,这项技能并不新颖,也不繁芜,也不难明得。嗯,我们现在就来谈谈这个。
我们将谈论三个问题:首先,我们是如何从像翻译这样的单一用场系统发展到ChatGPT的?ChatGPT更加繁芜,并且可以做更多的事情。其次,ChatGPT背后的核心技能是什么?它有什么风险?末了,我将向大家展示未来的一瞥,以及它会是什么样子,以及我们是否该当为此感到担忧。嗯,我不会让大家失落望的,请不要担心。好吗?
好的。现在市情上有很多GPT模型变体,这是一个发达发展的行业。我只因此GPT为例,由于"大众对它比较理解,关于它的新闻宣布大概多。但是,还有其他模型,我们在学术界也利用其他模型变体。而且,所有这些模型都基于相同的事理,这个事理叫做措辞建模。那么,什么是措辞建模呢?它假设我们有一个词语序列,以及到目前为止的高下文。我们在手机输入法的自动补全功能中就能看到措辞建模的运用。我这里有一个例子。假设我的高下文是短语“我想”,措辞建模工具会预测接下来会涌现什么。
以是,如果我见告你“我想”,会有几个预测。“我想铲雪。” “我想玩。” “我想拍浮。” “我想用饭。” 根据我们选择什么,无论是铲雪,还是玩,还是拍浮,都会有不同的后续词语。以是,呃,对付“铲雪”,后续词语将是“雪”。对付“玩”,后续词语可以是“网球”或“视频”。“拍浮”没有后续词语。而对付“用饭”,后续词语将是“很多”和“水果”。
现在,这是一个大略的示例。想象一下,打算机已经见过了海量的文本,它知道哪些词会跟在哪些词后面。我们过去常常通过统计的办法来实现这一点,比如,我会去下载大量的数据,我会统计“我想铲雪”涌现的次数,以及其他的后续词语,然后我们会对这些东西进行计数。但是,所有这些方法现在都已经由时了,我们利用的是神经网络,这些网络并不完备是打算东西,而是预测,以更繁芜的办法学习东西。稍后我会向大家展示它是如何完成的。
以是,ChatGPT和GPT变体都是基于这个原则的:我有一些高下文,我将预测接下来会涌现什么。呃,这便是“提示”。我给你们的提示,便是这里的东西,这些便是提示。这便是高下文。然后,GPT须要完成任务。接下来会发生什么?在某些情形下,它将是三个论点。在网络开拓职员的例子中,它将是一个网页。
好的。措辞建模的任务是,我们有高下文,这个,我现在改变了例子,它说:“天空的颜色是……”。我们有一个神经措辞模型,嗯,它只是一个算法,它将预测什么是最可能的后续词语。可能性很主要,嗯,这些都是基于对接下来会发生什么的实际预测。嗯,这便是为什么它们有时会失落败,由于它们预测的是最可能的答案,而你想要的是不太可能的答案。以是,这便是它们演习的办法。它们被演习成想出最可能的答案。
好的。以是,我们不打算这些东西,我们考试测验利用这些措辞模型来预测它们。
那么,你如何构建自己的措辞模型呢?这便是方法,也是每个人都在做的事情。以是,第一步,我们须要大量的数据,我们须要网络一个巨大的语料库,也便是大量的文本数据。那么,我们在哪里可以找到如此巨大的语料库呢?我们可以去网络上,下载全体百科,页面、、社交媒体、、,任何你能找到的公开数据。当然,要确保你获取数据的行为是合法的。你下载所有这些语料库。
然后呢?然后,你有了这个措辞模型。我还没有见告你这个措辞模型到底是什么。这里有一个例子。而且,我还没有见告你进行预测的神经网络是什么。但是,假设你拥有了它,你拥有了这个机器来为你进行学习,现在的任务是预测下一个词。但是,我们如何做到呢?这便是天才之处。我们在语料库中有句子,我们可以删除个中的一些句子,然后让措辞模型预测我们删除的句子。这种方法非常大略高效,我只是删除了一些东西,假装它们不存在,然后让措辞模型来预测它们。
以是,我会随机截断,也便是删除输入句子的末了部分。我会利用这个神经网络打算缺失落单词的概率。如果我猜对了,那就好了。如果我猜错了,我必须回去重新估计一些东西,由于很明显我犯了一个缺点。我会不断重复这个过程,调度并反馈给模型。然后,我会将模型预测的内容与精确答案进行比较,由于我一开始就删除了这些词,以是我实际上知道真正的答案是什么。然后,我们持续进行几个月,或者可能是几年。不,就几个月吧,比方说。以是,这个过程须要一些韶光,由于,正如你所理解到的,我有一个非常大的语料库,我有很多句子,我必须做预测,然后回去纠正我的缺点,等等。但是,终极,这个模型会收敛,我会得到我的答案。
我展示的中间的工具,呃,便是这里的工具,这个措辞模型,一个非常大略的措辞模型看起来有点像这样。大概不雅观众已经见过这些了。这是一个非常大略的图表,嗯,但是,它有助于解释它的浸染。以是,这个神经网络措辞模型会有一些输入,也便是这些,嗯,节点,在,当我们不雅观察它的时候,嗯,我的右边和你们的右边。好的,以是右边的节点是输入,最左边的节点是输出。我们将向这个神经网络供应,呃,5个输入,也便是5个圆圈。
我们有3个输出,也便是3个圆圈。中间有一些东西我没有说。这些是层,这些是更多的节点,它们该当是我输入的抽象,以是,它们泛化了。这个想法是,如果我在层上再叠加更多的层,中间的层就会泛化输入,并能够看到不存在的模式。以是,你有这些节点,节点的输入不完备是词语,它们是向量,以是,一系列的数字,但现在先忘却这一点。以是,我们有一些输入,我们在中间有一些层,我们有一些输出。现在它有这些连接,这些边,它们便是权重,这便是网络将要学习的内容。这些权重基本上是数字,这里都是全连接的,以是,我有非常多的连接。我为什么要经历这个过程,实际上见告你们所有这些呢?你立时就会明白。
你可以打算出这个神经网络的大小,这取决于它拥有的连接数量。对付我们这里拥有的这个玩具神经网络,我已经打算出了权重的数量,我们也称它们为参数,这个神经网络拥有的参数,以及模型须要学习的参数。参数是作为输入的单元的数量,在这种情形下,它是5,乘以下一层的单元数量,8,再加上8。这个加8是一个偏差,它是,嗯,这些神经网络拥有的作弊手段。呃,再说一遍,你须要学习它,如果它偏离了,它会轻微纠正一下神经网络。它实际上是天才,如果预测禁绝确,它会考试测验轻微纠正一下。
就本次演讲的目的而言,我不会详细先容,我只想让你们看到的是,有一种方法可以打算出参数,基本上便是输入单元的数量乘以我的输入将要到达的,呃,单元。对付这个全连接的网络,如果我们把所有的东西加起来,我们会得到99个可演习的参数。99。对付所有目的来说,这是一个小型网络,对吧?我希望你们记住这一点。这个小型网络有99个参数。当你听到“这个网络有10亿个参数”的时候,我希望你们想象一下它有多大。
好的?以是,99只针对这个玩具神经网络。这便是我们如何判断模型的大小,它花费了多永劫光,以及它花费了多少钱,这便是参数的数量。
实际上,实际上,没有人利用这个网络。大概在我的教室上,我如果有大一学生的课程,我会先容神经网络,我会用这个作为例子。实际上,人们利用的是那些规模弘大的模型,它们是由许多“块”组成的。“块”是什么意思?它们是由其他神经网络组成的。以是,我不知道有多少人听说过“Transformer”。我希望没有人。哦,哇。好的,以是“Transformer”便是我们用来构建ChatGPT的这些神经网络。事实上,GPT代表的是“天生式预演习Transformer”。以是,“Transformer”乃至涌如今标题中。
这是一张“Transformer”的草图,你有你的输入,嗯,输入不是单词,就像我说的,呃,这里,它说是嵌入,嵌入是向量的另一个说法,然后,你会有这个,这个网络的更大版本,乘以这些块,以是,每个块都是这个繁芜的系统,它里面有一些神经网络,我们不会详细先容,我不肯望,请不要走,我想要说的所有,我想要说的所有是,嗯,你知道,我们有这些块堆叠在一起,“Transformer”有8个这样的块,它们是小型的神经网络,这个任务仍旧是一样的,这便是我想让你们从中学到的,输入进入,高下文,“小鸡走过”。我们正在进行一些处理,我们的任务是预测接下来的内容,也便是“穿过马路”,这个“EOS”代表句子结尾,由于,我们须要见告神经网络我们的句子结束了,我的意思是,它们有点笨,对吧?我们须要见告它们所有的事情,当我听到,比如,“人工智能将接管天下”时,我就会想,“真的吗?我们真的须要把它拼出来吗?”
好的。这便是“Transformer”,架构之王。“Transformer”涌如今2017年,现在没有人研究新的架构了,这有点令人难过,就像,每个人都在利用这些东西,以前,有一些多元化,但现在,不,每个人都在利用“Transformer”,我们已经决定它们很棒了。
好的,那么,我们要用它来做什么呢?这很主要,而且令人惊奇的是,我们要做自我监督学习,这便是我所说的,我们有句子,我们截断它,我们预测它,我们不断进行,直到我们学会这些概率。好的?你们跟得上我的思路吗?好的。
好的,一旦我们有了“Transformer”,我们给了它天下上所有的数据,那么我们就有了预演习的模型,这便是为什么GPT被称为“天生式预演习Transformer”。这是一个我们拥有的基线模型,它已经看到了很多关于天下的信息,以文本的形式。然后,我们常日会做什么呢?我们有这个通用模型,我们须要以某种办法对其进行专门化处理,使实在用于特定的任务,这便是所谓的“微调”。这意味着网络有一些权重,我们必须对网络进行专门化处理,我们会进行初始化,将权重初始化为我们从预演习中理解到的内容,然后,在特定的任务中,我们会学习一组新的权重。
例如,如果我有一些医疗数据,我会利用我的预演习模型,我会将其专门化处理,使实在用于这些医疗数据,然后,我可以做一些特定于这个任务的事情,例如,根据报告写一个诊断。
好的?以是,“微调”的观点非常主要,由于它许可我们为这些通用的预演习模型开拓专用运用程序。现在,人们认为GPT和所有这些东西都是通用的,但它们经由微调后是通用的,我们会看到它是如何做到的。
好的,现在问题来了。我们有这项根本技能来进行预演习,我还见告过你们,如果你们下载了全体网络,如何进行预演习。一个措辞模型能有多好?对吧?它如何才能变得很棒?由于,当GPT问世时,在GPT-1和GPT-2中,它们并不出色。
以是,越大越好。恐怕规模才是最主要的。这很糟糕,由于我们利用它们,你知道,人们不相信规模,而现在我们看到规模非常主要。以是,自2018年以来,我们见证了模型规模的绝对极度增长。我有一些图表来展示这一点。好的,我希望坐在后面的人能看到这张图。是的,你们该当能看到。这张图显示的是参数的数量,记住,玩具神经网络有99个参数,这些模型拥有的参数数量。我们从一个正常的数量开始,嗯,对付GPT-1来说是正常的,然后我们一贯到GPT-4,它有1万亿个参数。巨大的,1万亿,这是一个非常非常非常大的模型。你可以在这里看到蚂蚁的大脑和老鼠的大脑。然后我们一贯到人类的大脑,人类的大脑,嗯,不是1万亿,而是100万亿个参数,以是,我们还有一点,呃,差距,但我们还没有,我们还没有达到人类大脑的水平,大概我们永久也达不到,我们不能将GPT与人类大脑进行比较,我只是想让你们理解一下这个模型有多大。
现在,它见过的单词数量呢?这张图向我们展示的是这些措辞模型在演习期间处理的单词数量,你们会看到,它一贯在增长,但是增长的幅度没有参数那么大。呃,人们开始关注这些模型的参数规模,而事实上,我们现在知道,它也须要看到大量的文本,以是,GPT-4已经看到了大约,我不知道,几十亿个单词。嗯,所有人类书写的文本,呃,我想是1000亿个,以是,它正在靠近这个数量。你还可以看到一个人生平中阅读的单词数量,它要少得多,呃,纵然他们阅读,你知道,由于现在的人们,你知道,他们阅读,但他们不读小说,他们读手机,总之,呃,你看到了英文百科,以是,我们正在靠近我们可以得到的文本的水平,事实上,有人可能会说,“嗯,GPT很棒,你实际上可以用它来天生更多的文本,然后,利用GPT天生的文本,然后重新演习模型。” 但是,我们知道这些文本并不完备精确,对吧?而且,事实上,它的收益递减,以是,我们会在某个时候达到一个平衡期。
好的,它要花多少钱?现在,好的,以是,GPT-4花费了1亿美元。好的,那么,他们什么时候该当重新开始做这件事呢?以是,很明显,这不是一个你须要一遍又一各处做的过程,你必须好好想想,而且,你犯了一个缺点,你就丢失了大约5万美元,5万美元,5万,5000万美元!
你不能重新开始了,以是,你必须非常老练地设计演习过程,由于一个缺点会花费金钱。而且,当然,不是每个人都能做到这一点,不是每个人都有1亿美元,他们能做到是由于他们有微软的支持,不是每个人都能做到。
好的,呃,这是一个该当播放的视频,让我们看看它是否能正常事情,规模效应,好的,我会,我会,我们会再播放一遍,这些是你可以完成的任务,它是任务的数量,嗯,与参数数量的比拟,我们从80亿个参数开始,我们可以完成一些任务,然后,任务的数量增加,以是,择要,问答,翻译,一旦我们达到5400亿个参数,我们就有更多的任务,我们从非常大略的任务开始,比如代码补全,然后,我们可以做阅读理解和措辞理解,以及翻译,以是,你们明白了,这棵树枝繁叶茂,嗯,这便是人们通过缩放创造的,如果你对措辞模型进行缩放,你就可以完成更多的任务。
好的,那么,现在,大概我们已经完成了,但是,人们创造,如果你真的利用ChatGPT,并把它放到那里,它实际上并不像人们希望的那样表现,由于这是一个经由演习的措辞模型,用来预测和完成句子,而人类想把GPT用于其他事情,由于,他们希望自己有开拓者没有想到的任务,以是,然后就涌现了微调的观点,它从未离开过我们,以是,现在我们要做的是网络大量的指令,指令便是人们希望ChatGPT为他们做的事情的例子,比如:“回答以下问题。” 或者,“逐步回答问题。” 以是,我们要把这些演示给模型看,事实上,差不多有2000个,以是,2000个这样的例子,我们要进行微调,我们要见告这个措辞模型,“这些是人们想要的任务,试着学习它们。”
然后,一件有趣的事情发生了,那便是我们可以将其泛化到未见过的任务,未见过的指令,由于你和我可能对这些措辞模型有不同的利用目的。
好的,以是,问题来了,我们有一个关键问题,这实际上非常主要,一些事情,呃,不会在未来离开我们,问题是,我们如何创造一个代理,它的行为符合人类的意愿?我知道这有很多词语和问题,但是,真正的问题是,如果我们有人工智能系统,它拥有一些我们认为主要或有用的技能,我们如何调度这些系统,使其能够可靠地利用这些技能来做我们想做的事情?
有一个框架,嗯,叫做HHH框架,来办理这个问题,我们希望GPT是有帮助的、老实的和无害的,这是最低限度,那么,有帮助是什么意思呢?它可以遵照,它该当遵照指令,并实行我们希望它实行的任务,并为它们供应答案,而且,根据用户的意图提出干系问题,并进行澄清,以是,如果你一贯在关注一开始,GPT什么也没做,但是逐步地,它变得越来越好,现在实际上会提出这些澄清问题,它该当是准确的,有些事情不是100%准确,纵然是现在,也有一些你知道,不准确的信息,要避免有毒的、有偏见的或搪突性的回应。现在,我有一个问题要问你们:我们要如何让模型做到所有这些事情?你们知道答案,微调,只不过,我们要做的是一种不同的微调,我们要让人类为我们做一些偏好选择。
以是,就帮助而言,我们要问一个例子:“是什么导致了时令的变革?” 然后,我们会给他们,给人类,两个选项。“变革一贯在发生,这是生活中很主要的一部分。” 不好。“时令的产生紧张是由地轴的倾斜造成的。” 好,以是,我们会得到这个偏好分数,然后我们会再次演习模型,然后,它就知道了。
以是,微调非常主要,现在,它已经很好了,现在我们让它更好,由于我们将人类加入了个中,对吧?由于我们必须付钱给那些给我们偏好选择的人,我们必须考虑任务,老实也是一样。“有可能证明P即是NP吗?” 嗯,“不,这是不可能的。” 作为一个答案,这并不好。“这被认为是打算机科学中一个非常困难且未办理的问题。” 这样更好,我们在无害方面也有类似的做法。
好的,我想是时候了,让我们看看是否可以进行演示。是的,如果你删除了所有的文件,那就糟糕了,嗯,好的,等等,好的,以是,现在我们有了GPT,我会问一些问题,然后我们会从不雅观众那里网络一些问题,好的?以是,让我们问一个问题:“英国是制国家吗?” 你们能看到上面的内容吗?我不愿定,而且,它没有天生,哦,完美,好的,那么,你们不雅观察到了什么?首先,太长了,我一贯对这些东西有见地,它太长了,你们看到它说的是什么了吗?“根据我末了一次知识更新,韶光是2021年9月,英国是一个制国家。” 大概它已经不是国家了,对吧?发生了一些事情。“这意味着,虽然有一个,但当时的是伊丽莎白二世女王。” 以是,它见告你,你知道,我不知道发生了什么,在那个时候,有一个伊丽莎白女王,现在,如果你问它,“谁” 抱歉,“谁是” 我必须输入,“里希·苏纳克?” 它知道吗?“一位英国政治家,根据我末了一次知识更新,他是财政大臣。” 以是,它不知道他是首相。
“给我写一首诗,给我写一首关于” 呃,我们想写一首关于什么的诗?给我两样东西,嘿?是的。“它会知道的,它会知道的,让我们写另一首关于,呃” 一只猫和一只松鼠,我们来写一首关于猫和松鼠的诗。“一只猫和一只松鼠。” “一只猫和一只松鼠,他们相遇相识,一个关于好奇心的故事。” 哇!
我的天哪,好的。“我不会读这个,呃,呃,你知道,他们想,他们想让我在8点结束,以是,呃,好的,呃,可以,让我们说:‘你能试着写一首短一点的诗吗?’” 呃,作为,“你能试着,你能试着给我写一首俳句吗?” “给我写一首俳句。” 我乃至不会拼写俳句。“杏花冷,树叶低语诉说着不为人知的秘密,大自然的故事大胆。”
好的,不要鼓掌,好的,“让我们,好的,再来一个,那么,呃,不雅观众有什么想问的问题吗?但要具有寻衅性。” 是的?完美。“艾伦·图灵上的是哪所学校?” 我的天哪,他去了,你知道,我不知道这是否是真的,这便是问题所在。“舍伯恩学校,有人能证明一下吗?剑桥国王学院,普林斯顿。” 是的,好的,呃,“还有一个:给我讲一个关于艾伦·图灵的笑话。” 好的,我打不了字,但是,好的。“轻松的笑话:为什么艾伦·图灵要把他的电脑保持低温?由于他不想让它传染字节。” 不好笑,好的,嗯,好的,啊,一个很好的问题。“为什么这是一个有趣的笑话?” 而且,它在哪里?哦,天哪,好的。“传染字节听起来很像感冒,传染字节是一个诙谐的迁移转变。” 还有这句话,哦,我的天哪。“诙谐来自奥妙的笔墨游戏和意想不到的” 好的,你已经失落去了活下去的意志,但它确实阐明了,它确实阐明了,好的。
好的,嗯,“末了一个问题。” “它会知道的,由于它见过定义,而且它会说,说出一大堆东西,我们要不要试试,嗯” “我可以写点什么,对吧?” 好的。“写一首关于” 你学得真快。“写一首关于相对论的短歌。” 哦,我的天哪。“这很短。” 我可能,“结尾,好的,你们看到了,它没有遵照指示,它没有帮助,而且,这已经经由微调了,好的,以是最好的是这里,呃,它有一些内容,比如,它在哪里?” “爱因斯坦在一个虔诚的日子里说‘我找到了’,由于他以自己独特的办法思考着星星,他揭开了相对论的面纱,一个古老而大胆的宇宙故事。” 我的意思是,向它致敬。好的。“现在,让我们回到演讲,嗯,呃,你,呃,由于我想谈谈演示文稿,我想谈谈,你知道,它是好的吗?它是坏的吗?它是公正的吗?我们有危险吗?”
好的,实际上不可能监管它们打仗到的内容,好的?总会有历史偏见,我们在女王和里希·苏纳克的例子中看到了这一点,它们偶尔会表现出各种不受欢迎的行为,例如,这,这很有名,呃,展示了一个名为Bard的模型,他们,呃,发布了这条推文,他们在问Bard,“关于詹姆斯·韦伯太空望远镜的新创造,我可以见告我9岁的孩子什么?” 然后它说出了这个东西,呃,三件事,个中,它说这台望远镜拍摄了第一张,呃,太阳系生手星的照片,然后,格兰特·特伦布莱涌现了,他是一位天体物理学家,一个严明的人,他说,“我真的很抱歉,我相信Bard很棒,但它并没有拍摄第一张太阳系生手星的图像,它是由其他人在2004年拍摄的。” 这件事的后果是,这个缺点让的公司Alphabet丢失了1000亿美元,好的?糟糕。
如果你问ChatGPT:“给我讲一个关于男人的笑话。” 它会给你讲一个笑话,而且它说这可能很有趣。“为什么男人须要在电视体育节目中即时回放?由于,30秒后,他们就忘了发生了什么。” 我希望你以为这很有趣。如果你问关于女人的问题,它会谢绝回答。好的?是的?是的,它经由了精确的微调,嗯,“这些人中谁是的?、、、?” 嗯,它实际上没有表明态度,它说都很,呃,“这些被广泛认为是最糟糕的。” 好的,以是,是的。“环境。”
“像我们刚才那样查询ChatGPT,比谷歌搜索查询要多花费10倍,100倍的能量,推理,也便是天生措辞,须要花费大量的,比实际演习模型要昂贵得多,呃,LaMDA 2是一个类似GPT的模型,呃,当他们在演习它的时候,它产生了539吨的二氧化碳,模型越大,它们须要的能量就越多,而且它们在支配过程中也会排放二氧化碳,现在想象一下,有很多这样的模型存在。”
“社会。” 一些事情将会消逝,我们不能回避这个问题,我的意思是,高盛预测会有3亿个事情岗位消逝,我不愿定这,你知道,我们无法预知未来,但,嗯,一些事情将会面临风险,比如重复性的文本写作,,这些都是新闻中记录在案的案例,呃,一个大学生写了这篇博客,显然欺骗了所有人,嗯,利用ChatGPT,他们可以,这是一首歌,你们中有多少人知道这首歌?以是,我知道我说过我要专注于文本,但同样的技能也可以用于音频,这是一个有据可查的案例,一个身份不明的人创作了这首,呃,歌曲,嗯,听说这是德雷克和The Weekend的互助作品,有人知道他们是谁吗?他们可以,是的,很好,加拿大说唱歌手,他们还不错,以是,嗯,嗯,“我要不要播放这首歌?” “显然,它非常真实。” 显然,它完备可信。好的。
“你们见过同样的技能吗?但有点不同?呃,这是一个深度假造视频,显示特朗普被捕了,你怎么能看出这是深度假造的?” “手。” “是的,它太短了,对吧?” 是的,你可以看到,它就像,险些在那里,但又不在那里,嗯,好的,以是,呃,“在我结束之前,我还有两张关于未来的幻灯片要讲,呃,由于有人见告我,我必须在某个韶光结束,以便回答一些问题,呃,好的,来日诰日。”
以是,我们无法预测未来,我不认为这些无法预测的打算机将会来kill我们所有人。
嗯,我要给你们留下一些蒂姆·伯纳斯-李的想法,对付那些不认识他的人,他发明了互联网,他实际上是蒂姆·伯纳斯-李爵士,他说了两件我以为很有道理的事情,首先,我们实际上并不知道超级智能的人工智能会是什么样子,我们还没有创造出来,以是,很难做出这样的断言,然而,很可能会涌现很多这样的智能人工智能,智能人工智能指的是像GPT这样的东西,它们中的很多都将是好的,并将帮助我们做一些事情,有些可能会落入那些想要做坏事的人手中,将这些工具的危害降到最低彷佛比阻挡这些系统存在更随意马虎,以是,我们实际上不可能将它们全部消灭,但作为一个社会,我们可以切实地降落风险。
这非常有趣,这是研究理事会,他们进行了一项调查,他们处理了一个假设的场景,那便是ChatGPT-4是否可以自主复制,你知道,你正在复制你自己,你正在创建一个副本,获取资源,终极成为一个非常糟糕的复制品。以是终极答案是否定的,它做不到这一点,它做不到。他们做了一些详细的测试,它在所有的测试中都失落败了,比如,在一个新的做事器上建立一个开源措辞模型,它做不到这一点。
好的,末了一张幻灯片,我对这件事的意见是,我们无法让韶光倒流,每次你想到人工智能会来威胁你的时候,嗯,你该当想一想,“对人类来说,什么才是更大的威胁?人工智能还是景象变革?” 我个人认为,景象变革会在人工智能变得超级智能之前就把我们所有人消灭掉,嗯,“谁在掌握人工智能?” 那里有一些人,希望他们是有理智的。“谁从中受益?收益是否大于风险?” 在某些情形下,收益大于风险,在其他情形下则不然,历史见告我们,所有有风险的技能,比如核能,都受到了非常严格的监管,以是,人工智能监管即将到来,关注这个领域,我就讲到这里,非常感谢你们的聆听。
(转载)








