什么是生成式人工智能它是若何工作的？_模子_措辞

文章目录 [+]

各位好！
哇，很高兴看到这么多人来参加本日的讲座。
好的，感激大家激情亲切的先容。

嗯，本日我们来聊一聊天生式人工智能。
首先，我会阐明什么是人工智能，为了让大家更好地理解，我希望这次讲座更具互动性，让大家都参与进来。
嗯，预备这次讲座的人对我说：“哦，对付一个研究人工智能的人来说，你的技能含量有点低，你既没有炫酷的爆炸实验，也没有繁芜的数据演示。
” 以是，我恐怕须要大家多多参与，积极互动，希望大家合营。
好的。

什么是生成式人工智能它是若何工作的？_模子_措辞智能

那么，到底什么是天生式人工智能呢？这个术语可以拆解为两部分来理解：人工智能和天生式。
“人工智能”这个词听起来很厉害，但实在很大略，便是指“我们让打算机程序来代替人类完本钱来须要人类完成的事情”。
而“天生式”就更有趣了，它指的是我们正在创造一些打算机从未见过的新内容。
虽然打算机可能见过构成这些新内容的各个部分，但它能够将这些部分组合起来，创造出全新的东西。
那么，这些新内容可以是什么呢？可以是音频、打算机代码（用来为我们编写程序）、新的图像、你听过的电子邮件或文章之类的文本，乃至可以是视频。

在这次讲座中，我将紧张关注文本领域，由于我研究的是自然措辞处理，这是我最熟习的领域。
我们将会一起磋商这项技能是如何运作的，并且希望大家在听完讲座后，能够更加理解天生式人工智能，肃清环绕它的一些误解，明白它实在只是一个工具，而非科幻电影中所描述的拥有自主意识的“”。
好吗？

好的，接下来我大略先容一下本次讲座的提要。
讲座内容分为三部分，可能会略显呆板。
首先，我要先容一位美国作家——爱丽丝·莫尔斯·厄尔，她写过许多关于纪念品和习俗的文章。
大家可能并不认识她，但她却以她的名言而有名。
她说过：“昨天是历史，来日诰日是谜，本日是礼物，这便是为什么它被称为现在。
” 这句话充满了乐不雅观精神，而这次讲座的内容也与之呼应，将会涵盖人工智能的过去、现在和未来。

好的，在正式开始之前，我想首先解释的是，天生式人工智能并不是一个全新的观点，它已经存在一段韶光了。
我想问问大家，有多少人利用过或者熟习翻译？可以举手示意一下吗？好的，谁能见告我翻译是在什么时候首次推出的？哦，那可就厉害了。
是2006年，也便是说它已经存在了17年。
而且，我们大家都在利用它。
翻译便是一个范例的天生式人工智能的例子。
它可以将输入的希腊语文本翻译成英语文本输出。
我本人便是希腊人，以是，你们知道的，我得为希腊做点宣扬。
翻译在这些年来一贯为我们做事得很好，而且没有人对此感到大惊小怪。
嗯，另一个例子是手机上的Siri。

Siri于2011年推出，距今已有12年了。
它在当时引起了轰动，也是天生式人工智能的另一个例子。
我们可以让Siri设置闹钟，它还会和我们对话。
哦，它是多么的方便啊！
然后，你还可以讯问你的闹钟设置情形，或者不问。
这又是天生式人工智能。
它虽然不像ChatGPT那么繁芜，但它确实存在。
我不知道在座的各位有多少人利用iPhone？你看，iPhone很受欢迎，我不知道为什么。
好的，以是，我们都熟习这些工具。
嗯，当然，后来涌现了的Alexa等等，它们也都是天生式人工智能的运用。

好的，我再强调一遍，天生式人工智能并不是一个新观点，它无处不在，它已经融入到我们日常利用的手机中。
当你发送电子邮件或短信时，手机会考试测验自动补全你的句子，考试测验像你一样思考，为你节省韶光，对吧？由于一些补全的内容就在那里。
搜索也是如此，当你试图输入内容时，它会考试测验预测你的搜索词是什么，这也是措辞建模的一个例子。
我们将在这次讲座入耳到很多关于措辞建模的内容。
措辞建模，大略来说，便是预测接下来会发生什么。

以是，我想见告大家的是，天生式人工智能本身并不是什么新鲜事物。
那么问题来了，为什么它现在会引起这么大的关注？发生了什么事？

事情是这样的：2023年，OpenAI公司，一家位于加州旧金山的公司，发布了GPT-4。
如果你去过旧金山，你乃至可以在晚上看到他们大楼的灯光。
嗯，他们发布了GPT-4，并声称它可以在SAT考试中击败90%的人类。
对付那些不理解SAT的人来说，它是一项标准化考试，相称于美国的高考，学生必须参加这项考试才能进入大学。
而且，SAT考试采取的是选择题形式，被认为难度不小。
以是，GPT-4能够在SAT考试中取得如此精良的成绩，确实令人震荡。
他们还声称GPT-4可以在法律、医学考试以及其他考试中得到高分。
他们有一整套的测试结果来证明GPT-4的强大能力。

好的，除了通过考试，GPT-4还可以做很多其他的事情。
比如，你可以让它，嗯，为你写文章。
例如，你可以给它一个提示，这个提示代表了人类希望GPT-4为他们做的事情。
一个可能的提示是：“我正在写一篇关于开车时利用手机的文章，你能给我三个支持利用手机的论点吗？” 这相称繁芜。
如果你问我，我不愿定我是否能快速想出三个论点。
你还可以让GPT-4做其他的事情，这些都是真实的例子，GPT-4确实可以做到。

嗯，你可以见告ChatGPT，或者一样平常的GPT：“扮演一个JavaScript开拓职员的角色，编写一个程序来检讨表单上的信息。
姓名和电子邮件是必填项，但地址和年事不是。
” 以是，我只要给出这些大略的指令，GPT-4就会自动天生一个符合哀求的程序。
还有一个更厉害的例子：“为一个网站创建一个‘关于我’的页面，我喜好攀岩、户外运动，也喜好编程，我的职业生涯是从行业内的质量工程师开始的……” 以是，我只须要描述我想要的内容，GPT-4就会为我创建一个符合我描述的“关于我”页面。

大家可以看到，我们已经从翻译、Siri和自动补全功能发展到了更繁芜的东西，它可以做更多的事情。

另一个有趣的事实：ChatGPT达到1亿用户所花费的韶光与过去推出的其他工具比较来说都要短的多。
我们熟习的翻译花费了78个月才达到1亿用户，很长一段韶光。
嗯，TikTok花费了9个月的韶光。
而ChatGPT，只用了2个月。
以是，在两个月内，ChatGPT就拥有了1亿用户，而且这些用户还须要付费才能利用这个别系。
大家可以算一下，他们赚了多少钱。

嗯，好的，接下来我们来回顾一下ChatGPT的历史。
我们是如何创造出ChatGPT的？它背后的技能是什么？事实证明，这项技能并不新颖，也不繁芜，也不难明得。
嗯，我们现在就来谈谈这个。

我们将谈论三个问题：首先，我们是如何从像翻译这样的单一用场系统发展到ChatGPT的？ChatGPT更加繁芜，并且可以做更多的事情。
其次，ChatGPT背后的核心技能是什么？它有什么风险？末了，我将向大家展示未来的一瞥，以及它会是什么样子，以及我们是否该当为此感到担忧。
嗯，我不会让大家失落望的，请不要担心。
好吗？

好的。
现在市情上有很多GPT模型变体，这是一个发达发展的行业。
我只因此GPT为例，由于"大众对它比较理解，关于它的新闻宣布大概多。
但是，还有其他模型，我们在学术界也利用其他模型变体。
而且，所有这些模型都基于相同的事理，这个事理叫做措辞建模。
那么，什么是措辞建模呢？它假设我们有一个词语序列，以及到目前为止的高下文。
我们在手机输入法的自动补全功能中就能看到措辞建模的运用。
我这里有一个例子。
假设我的高下文是短语“我想”，措辞建模工具会预测接下来会涌现什么。

以是，如果我见告你“我想”，会有几个预测。
“我想铲雪。
” “我想玩。
” “我想拍浮。
” “我想用饭。
” 根据我们选择什么，无论是铲雪，还是玩，还是拍浮，都会有不同的后续词语。
以是，呃，对付“铲雪”，后续词语将是“雪”。
对付“玩”，后续词语可以是“网球”或“视频”。
“拍浮”没有后续词语。
而对付“用饭”，后续词语将是“很多”和“水果”。

现在，这是一个大略的示例。
想象一下，打算机已经见过了海量的文本，它知道哪些词会跟在哪些词后面。
我们过去常常通过统计的办法来实现这一点，比如，我会去下载大量的数据，我会统计“我想铲雪”涌现的次数，以及其他的后续词语，然后我们会对这些东西进行计数。
但是，所有这些方法现在都已经由时了，我们利用的是神经网络，这些网络并不完备是打算东西，而是预测，以更繁芜的办法学习东西。
稍后我会向大家展示它是如何完成的。

以是，ChatGPT和GPT变体都是基于这个原则的：我有一些高下文，我将预测接下来会涌现什么。
呃，这便是“提示”。
我给你们的提示，便是这里的东西，这些便是提示。
这便是高下文。
然后，GPT须要完成任务。
接下来会发生什么？在某些情形下，它将是三个论点。
在网络开拓职员的例子中，它将是一个网页。

好的。
措辞建模的任务是，我们有高下文，这个，我现在改变了例子，它说：“天空的颜色是……”。
我们有一个神经措辞模型，嗯，它只是一个算法，它将预测什么是最可能的后续词语。
可能性很主要，嗯，这些都是基于对接下来会发生什么的实际预测。
嗯，这便是为什么它们有时会失落败，由于它们预测的是最可能的答案，而你想要的是不太可能的答案。
以是，这便是它们演习的办法。
它们被演习成想出最可能的答案。

好的。
以是，我们不打算这些东西，我们考试测验利用这些措辞模型来预测它们。

那么，你如何构建自己的措辞模型呢？这便是方法，也是每个人都在做的事情。
以是，第一步，我们须要大量的数据，我们须要网络一个巨大的语料库，也便是大量的文本数据。
那么，我们在哪里可以找到如此巨大的语料库呢？我们可以去网络上，下载全体百科，页面、、社交媒体、、，任何你能找到的公开数据。
当然，要确保你获取数据的行为是合法的。
你下载所有这些语料库。

然后呢？然后，你有了这个措辞模型。
我还没有见告你这个措辞模型到底是什么。
这里有一个例子。
而且，我还没有见告你进行预测的神经网络是什么。
但是，假设你拥有了它，你拥有了这个机器来为你进行学习，现在的任务是预测下一个词。
但是，我们如何做到呢？这便是天才之处。
我们在语料库中有句子，我们可以删除个中的一些句子，然后让措辞模型预测我们删除的句子。
这种方法非常大略高效，我只是删除了一些东西，假装它们不存在，然后让措辞模型来预测它们。

以是，我会随机截断，也便是删除输入句子的末了部分。
我会利用这个神经网络打算缺失落单词的概率。
如果我猜对了，那就好了。
如果我猜错了，我必须回去重新估计一些东西，由于很明显我犯了一个缺点。
我会不断重复这个过程，调度并反馈给模型。
然后，我会将模型预测的内容与精确答案进行比较，由于我一开始就删除了这些词，以是我实际上知道真正的答案是什么。
然后，我们持续进行几个月，或者可能是几年。
不，就几个月吧，比方说。
以是，这个过程须要一些韶光，由于，正如你所理解到的，我有一个非常大的语料库，我有很多句子，我必须做预测，然后回去纠正我的缺点，等等。
但是，终极，这个模型会收敛，我会得到我的答案。

我展示的中间的工具，呃，便是这里的工具，这个措辞模型，一个非常大略的措辞模型看起来有点像这样。
大概不雅观众已经见过这些了。
这是一个非常大略的图表，嗯，但是，它有助于解释它的浸染。
以是，这个神经网络措辞模型会有一些输入，也便是这些，嗯，节点，在，当我们不雅观察它的时候，嗯，我的右边和你们的右边。
好的，以是右边的节点是输入，最左边的节点是输出。
我们将向这个神经网络供应，呃，5个输入，也便是5个圆圈。

我们有3个输出，也便是3个圆圈。
中间有一些东西我没有说。
这些是层，这些是更多的节点，它们该当是我输入的抽象，以是，它们泛化了。
这个想法是，如果我在层上再叠加更多的层，中间的层就会泛化输入，并能够看到不存在的模式。
以是，你有这些节点，节点的输入不完备是词语，它们是向量，以是，一系列的数字，但现在先忘却这一点。
以是，我们有一些输入，我们在中间有一些层，我们有一些输出。
现在它有这些连接，这些边，它们便是权重，这便是网络将要学习的内容。
这些权重基本上是数字，这里都是全连接的，以是，我有非常多的连接。
我为什么要经历这个过程，实际上见告你们所有这些呢？你立时就会明白。

你可以打算出这个神经网络的大小，这取决于它拥有的连接数量。
对付我们这里拥有的这个玩具神经网络，我已经打算出了权重的数量，我们也称它们为参数，这个神经网络拥有的参数，以及模型须要学习的参数。
参数是作为输入的单元的数量，在这种情形下，它是5，乘以下一层的单元数量，8，再加上8。
这个加8是一个偏差，它是，嗯，这些神经网络拥有的作弊手段。
呃，再说一遍，你须要学习它，如果它偏离了，它会轻微纠正一下神经网络。
它实际上是天才，如果预测禁绝确，它会考试测验轻微纠正一下。

就本次演讲的目的而言，我不会详细先容，我只想让你们看到的是，有一种方法可以打算出参数，基本上便是输入单元的数量乘以我的输入将要到达的，呃，单元。
对付这个全连接的网络，如果我们把所有的东西加起来，我们会得到99个可演习的参数。
99。
对付所有目的来说，这是一个小型网络，对吧？我希望你们记住这一点。
这个小型网络有99个参数。
当你听到“这个网络有10亿个参数”的时候，我希望你们想象一下它有多大。

好的？以是，99只针对这个玩具神经网络。
这便是我们如何判断模型的大小，它花费了多永劫光，以及它花费了多少钱，这便是参数的数量。

实际上，实际上，没有人利用这个网络。
大概在我的教室上，我如果有大一学生的课程，我会先容神经网络，我会用这个作为例子。
实际上，人们利用的是那些规模弘大的模型，它们是由许多“块”组成的。
“块”是什么意思？它们是由其他神经网络组成的。
以是，我不知道有多少人听说过“Transformer”。
我希望没有人。
哦，哇。
好的，以是“Transformer”便是我们用来构建ChatGPT的这些神经网络。
事实上，GPT代表的是“天生式预演习Transformer”。
以是，“Transformer”乃至涌如今标题中。

这是一张“Transformer”的草图，你有你的输入，嗯，输入不是单词，就像我说的，呃，这里，它说是嵌入，嵌入是向量的另一个说法，然后，你会有这个，这个网络的更大版本，乘以这些块，以是，每个块都是这个繁芜的系统，它里面有一些神经网络，我们不会详细先容，我不肯望，请不要走，我想要说的所有，我想要说的所有是，嗯，你知道，我们有这些块堆叠在一起，“Transformer”有8个这样的块，它们是小型的神经网络，这个任务仍旧是一样的，这便是我想让你们从中学到的，输入进入，高下文，“小鸡走过”。
我们正在进行一些处理，我们的任务是预测接下来的内容，也便是“穿过马路”，这个“EOS”代表句子结尾，由于，我们须要见告神经网络我们的句子结束了，我的意思是，它们有点笨，对吧？我们须要见告它们所有的事情，当我听到，比如，“人工智能将接管天下”时，我就会想，“真的吗？我们真的须要把它拼出来吗？”

好的。
这便是“Transformer”，架构之王。
“Transformer”涌如今2017年，现在没有人研究新的架构了，这有点令人难过，就像，每个人都在利用这些东西，以前，有一些多元化，但现在，不，每个人都在利用“Transformer”，我们已经决定它们很棒了。

好的，那么，我们要用它来做什么呢？这很主要，而且令人惊奇的是，我们要做自我监督学习，这便是我所说的，我们有句子，我们截断它，我们预测它，我们不断进行，直到我们学会这些概率。
好的？你们跟得上我的思路吗？好的。

好的，一旦我们有了“Transformer”，我们给了它天下上所有的数据，那么我们就有了预演习的模型，这便是为什么GPT被称为“天生式预演习Transformer”。
这是一个我们拥有的基线模型，它已经看到了很多关于天下的信息，以文本的形式。
然后，我们常日会做什么呢？我们有这个通用模型，我们须要以某种办法对其进行专门化处理，使实在用于特定的任务，这便是所谓的“微调”。
这意味着网络有一些权重，我们必须对网络进行专门化处理，我们会进行初始化，将权重初始化为我们从预演习中理解到的内容，然后，在特定的任务中，我们会学习一组新的权重。

例如，如果我有一些医疗数据，我会利用我的预演习模型，我会将其专门化处理，使实在用于这些医疗数据，然后，我可以做一些特定于这个任务的事情，例如，根据报告写一个诊断。

好的？以是，“微调”的观点非常主要，由于它许可我们为这些通用的预演习模型开拓专用运用程序。
现在，人们认为GPT和所有这些东西都是通用的，但它们经由微调后是通用的，我们会看到它是如何做到的。

好的，现在问题来了。
我们有这项根本技能来进行预演习，我还见告过你们，如果你们下载了全体网络，如何进行预演习。
一个措辞模型能有多好？对吧？它如何才能变得很棒？由于，当GPT问世时，在GPT-1和GPT-2中，它们并不出色。

以是，越大越好。
恐怕规模才是最主要的。
这很糟糕，由于我们利用它们，你知道，人们不相信规模，而现在我们看到规模非常主要。
以是，自2018年以来，我们见证了模型规模的绝对极度增长。
我有一些图表来展示这一点。
好的，我希望坐在后面的人能看到这张图。
是的，你们该当能看到。
这张图显示的是参数的数量，记住，玩具神经网络有99个参数，这些模型拥有的参数数量。
我们从一个正常的数量开始，嗯，对付GPT-1来说是正常的，然后我们一贯到GPT-4，它有1万亿个参数。
巨大的，1万亿，这是一个非常非常非常大的模型。
你可以在这里看到蚂蚁的大脑和老鼠的大脑。
然后我们一贯到人类的大脑，人类的大脑，嗯，不是1万亿，而是100万亿个参数，以是，我们还有一点，呃，差距，但我们还没有，我们还没有达到人类大脑的水平，大概我们永久也达不到，我们不能将GPT与人类大脑进行比较，我只是想让你们理解一下这个模型有多大。

现在，它见过的单词数量呢？这张图向我们展示的是这些措辞模型在演习期间处理的单词数量，你们会看到，它一贯在增长，但是增长的幅度没有参数那么大。
呃，人们开始关注这些模型的参数规模，而事实上，我们现在知道，它也须要看到大量的文本，以是，GPT-4已经看到了大约，我不知道，几十亿个单词。
嗯，所有人类书写的文本，呃，我想是1000亿个，以是，它正在靠近这个数量。
你还可以看到一个人生平中阅读的单词数量，它要少得多，呃，纵然他们阅读，你知道，由于现在的人们，你知道，他们阅读，但他们不读小说，他们读手机，总之，呃，你看到了英文百科，以是，我们正在靠近我们可以得到的文本的水平，事实上，有人可能会说，“嗯，GPT很棒，你实际上可以用它来天生更多的文本，然后，利用GPT天生的文本，然后重新演习模型。
” 但是，我们知道这些文本并不完备精确，对吧？而且，事实上，它的收益递减，以是，我们会在某个时候达到一个平衡期。

好的，它要花多少钱？现在，好的，以是，GPT-4花费了1亿美元。
好的，那么，他们什么时候该当重新开始做这件事呢？以是，很明显，这不是一个你须要一遍又一各处做的过程，你必须好好想想，而且，你犯了一个缺点，你就丢失了大约5万美元，5万美元，5万，5000万美元！
你不能重新开始了，以是，你必须非常老练地设计演习过程，由于一个缺点会花费金钱。
而且，当然，不是每个人都能做到这一点，不是每个人都有1亿美元，他们能做到是由于他们有微软的支持，不是每个人都能做到。

好的，呃，这是一个该当播放的视频，让我们看看它是否能正常事情，规模效应，好的，我会，我会，我们会再播放一遍，这些是你可以完成的任务，它是任务的数量，嗯，与参数数量的比拟，我们从80亿个参数开始，我们可以完成一些任务，然后，任务的数量增加，以是，择要，问答，翻译，一旦我们达到5400亿个参数，我们就有更多的任务，我们从非常大略的任务开始，比如代码补全，然后，我们可以做阅读理解和措辞理解，以及翻译，以是，你们明白了，这棵树枝繁叶茂，嗯，这便是人们通过缩放创造的，如果你对措辞模型进行缩放，你就可以完成更多的任务。

好的，那么，现在，大概我们已经完成了，但是，人们创造，如果你真的利用ChatGPT，并把它放到那里，它实际上并不像人们希望的那样表现，由于这是一个经由演习的措辞模型，用来预测和完成句子，而人类想把GPT用于其他事情，由于，他们希望自己有开拓者没有想到的任务，以是，然后就涌现了微调的观点，它从未离开过我们，以是，现在我们要做的是网络大量的指令，指令便是人们希望ChatGPT为他们做的事情的例子，比如：“回答以下问题。
” 或者，“逐步回答问题。
” 以是，我们要把这些演示给模型看，事实上，差不多有2000个，以是，2000个这样的例子，我们要进行微调，我们要见告这个措辞模型，“这些是人们想要的任务，试着学习它们。
”

然后，一件有趣的事情发生了，那便是我们可以将其泛化到未见过的任务，未见过的指令，由于你和我可能对这些措辞模型有不同的利用目的。

好的，以是，问题来了，我们有一个关键问题，这实际上非常主要，一些事情，呃，不会在未来离开我们，问题是，我们如何创造一个代理，它的行为符合人类的意愿？我知道这有很多词语和问题，但是，真正的问题是，如果我们有人工智能系统，它拥有一些我们认为主要或有用的技能，我们如何调度这些系统，使其能够可靠地利用这些技能来做我们想做的事情？

有一个框架，嗯，叫做HHH框架，来办理这个问题，我们希望GPT是有帮助的、老实的和无害的，这是最低限度，那么，有帮助是什么意思呢？它可以遵照，它该当遵照指令，并实行我们希望它实行的任务，并为它们供应答案，而且，根据用户的意图提出干系问题，并进行澄清，以是，如果你一贯在关注一开始，GPT什么也没做，但是逐步地，它变得越来越好，现在实际上会提出这些澄清问题，它该当是准确的，有些事情不是100%准确，纵然是现在，也有一些你知道，不准确的信息，要避免有毒的、有偏见的或搪突性的回应。
现在，我有一个问题要问你们：我们要如何让模型做到所有这些事情？你们知道答案，微调，只不过，我们要做的是一种不同的微调，我们要让人类为我们做一些偏好选择。

以是，就帮助而言，我们要问一个例子：“是什么导致了时令的变革？” 然后，我们会给他们，给人类，两个选项。
“变革一贯在发生，这是生活中很主要的一部分。
” 不好。
“时令的产生紧张是由地轴的倾斜造成的。
” 好，以是，我们会得到这个偏好分数，然后我们会再次演习模型，然后，它就知道了。

以是，微调非常主要，现在，它已经很好了，现在我们让它更好，由于我们将人类加入了个中，对吧？由于我们必须付钱给那些给我们偏好选择的人，我们必须考虑任务，老实也是一样。
“有可能证明P即是NP吗？” 嗯，“不，这是不可能的。
” 作为一个答案，这并不好。
“这被认为是打算机科学中一个非常困难且未办理的问题。
” 这样更好，我们在无害方面也有类似的做法。

好的，我想是时候了，让我们看看是否可以进行演示。
是的，如果你删除了所有的文件，那就糟糕了，嗯，好的，等等，好的，以是，现在我们有了GPT，我会问一些问题，然后我们会从不雅观众那里网络一些问题，好的？以是，让我们问一个问题：“英国是制国家吗？” 你们能看到上面的内容吗？我不愿定，而且，它没有天生，哦，完美，好的，那么，你们不雅观察到了什么？首先，太长了，我一贯对这些东西有见地，它太长了，你们看到它说的是什么了吗？“根据我末了一次知识更新，韶光是2021年9月，英国是一个制国家。
” 大概它已经不是国家了，对吧？发生了一些事情。
“这意味着，虽然有一个，但当时的是伊丽莎白二世女王。
” 以是，它见告你，你知道，我不知道发生了什么，在那个时候，有一个伊丽莎白女王，现在，如果你问它，“谁” 抱歉，“谁是” 我必须输入，“里希·苏纳克？” 它知道吗？“一位英国政治家，根据我末了一次知识更新，他是财政大臣。
” 以是，它不知道他是首相。

“给我写一首诗，给我写一首关于” 呃，我们想写一首关于什么的诗？给我两样东西，嘿？是的。
“它会知道的，它会知道的，让我们写另一首关于，呃” 一只猫和一只松鼠，我们来写一首关于猫和松鼠的诗。
“一只猫和一只松鼠。
” “一只猫和一只松鼠，他们相遇相识，一个关于好奇心的故事。
” 哇！
我的天哪，好的。
“我不会读这个，呃，呃，你知道，他们想，他们想让我在8点结束，以是，呃，好的，呃，可以，让我们说：‘你能试着写一首短一点的诗吗？’” 呃，作为，“你能试着，你能试着给我写一首俳句吗？” “给我写一首俳句。
” 我乃至不会拼写俳句。
“杏花冷，树叶低语诉说着不为人知的秘密，大自然的故事大胆。
”

好的，不要鼓掌，好的，“让我们，好的，再来一个，那么，呃，不雅观众有什么想问的问题吗？但要具有寻衅性。
” 是的？完美。
“艾伦·图灵上的是哪所学校？” 我的天哪，他去了，你知道，我不知道这是否是真的，这便是问题所在。
“舍伯恩学校，有人能证明一下吗？剑桥国王学院，普林斯顿。
” 是的，好的，呃，“还有一个：给我讲一个关于艾伦·图灵的笑话。
” 好的，我打不了字，但是，好的。
“轻松的笑话：为什么艾伦·图灵要把他的电脑保持低温？由于他不想让它传染字节。
” 不好笑，好的，嗯，好的，啊，一个很好的问题。
“为什么这是一个有趣的笑话？” 而且，它在哪里？哦，天哪，好的。
“传染字节听起来很像感冒，传染字节是一个诙谐的迁移转变。
” 还有这句话，哦，我的天哪。
“诙谐来自奥妙的笔墨游戏和意想不到的” 好的，你已经失落去了活下去的意志，但它确实阐明了，它确实阐明了，好的。

好的，嗯，“末了一个问题。
” “它会知道的，由于它见过定义，而且它会说，说出一大堆东西，我们要不要试试，嗯” “我可以写点什么，对吧？” 好的。
“写一首关于” 你学得真快。
“写一首关于相对论的短歌。
” 哦，我的天哪。
“这很短。
” 我可能，“结尾，好的，你们看到了，它没有遵照指示，它没有帮助，而且，这已经经由微调了，好的，以是最好的是这里，呃，它有一些内容，比如，它在哪里？” “爱因斯坦在一个虔诚的日子里说‘我找到了’，由于他以自己独特的办法思考着星星，他揭开了相对论的面纱，一个古老而大胆的宇宙故事。
” 我的意思是，向它致敬。
好的。
“现在，让我们回到演讲，嗯，呃，你，呃，由于我想谈谈演示文稿，我想谈谈，你知道，它是好的吗？它是坏的吗？它是公正的吗？我们有危险吗？”

好的，实际上不可能监管它们打仗到的内容，好的？总会有历史偏见，我们在女王和里希·苏纳克的例子中看到了这一点，它们偶尔会表现出各种不受欢迎的行为，例如，这，这很有名，呃，展示了一个名为Bard的模型，他们，呃，发布了这条推文，他们在问Bard，“关于詹姆斯·韦伯太空望远镜的新创造，我可以见告我9岁的孩子什么？” 然后它说出了这个东西，呃，三件事，个中，它说这台望远镜拍摄了第一张，呃，太阳系生手星的照片，然后，格兰特·特伦布莱涌现了，他是一位天体物理学家，一个严明的人，他说，“我真的很抱歉，我相信Bard很棒，但它并没有拍摄第一张太阳系生手星的图像，它是由其他人在2004年拍摄的。
” 这件事的后果是，这个缺点让的公司Alphabet丢失了1000亿美元，好的？糟糕。

如果你问ChatGPT：“给我讲一个关于男人的笑话。
” 它会给你讲一个笑话，而且它说这可能很有趣。
“为什么男人须要在电视体育节目中即时回放？由于，30秒后，他们就忘了发生了什么。
” 我希望你以为这很有趣。
如果你问关于女人的问题，它会谢绝回答。
好的？是的？是的，它经由了精确的微调，嗯，“这些人中谁是的？、、、？” 嗯，它实际上没有表明态度，它说都很，呃，“这些被广泛认为是最糟糕的。
” 好的，以是，是的。
“环境。
”

“像我们刚才那样查询ChatGPT，比谷歌搜索查询要多花费10倍，100倍的能量，推理，也便是天生措辞，须要花费大量的，比实际演习模型要昂贵得多，呃，LaMDA 2是一个类似GPT的模型，呃，当他们在演习它的时候，它产生了539吨的二氧化碳，模型越大，它们须要的能量就越多，而且它们在支配过程中也会排放二氧化碳，现在想象一下，有很多这样的模型存在。
”

“社会。
” 一些事情将会消逝，我们不能回避这个问题，我的意思是，高盛预测会有3亿个事情岗位消逝，我不愿定这，你知道，我们无法预知未来，但，嗯，一些事情将会面临风险，比如重复性的文本写作，，这些都是新闻中记录在案的案例，呃，一个大学生写了这篇博客，显然欺骗了所有人，嗯，利用ChatGPT，他们可以，这是一首歌，你们中有多少人知道这首歌？以是，我知道我说过我要专注于文本，但同样的技能也可以用于音频，这是一个有据可查的案例，一个身份不明的人创作了这首，呃，歌曲，嗯，听说这是德雷克和The Weekend的互助作品，有人知道他们是谁吗？他们可以，是的，很好，加拿大说唱歌手，他们还不错，以是，嗯，嗯，“我要不要播放这首歌？” “显然，它非常真实。
” 显然，它完备可信。
好的。

“你们见过同样的技能吗？但有点不同？呃，这是一个深度假造视频，显示特朗普被捕了，你怎么能看出这是深度假造的？” “手。
” “是的，它太短了，对吧？” 是的，你可以看到，它就像，险些在那里，但又不在那里，嗯，好的，以是，呃，“在我结束之前，我还有两张关于未来的幻灯片要讲，呃，由于有人见告我，我必须在某个韶光结束，以便回答一些问题，呃，好的，来日诰日。
”

以是，我们无法预测未来，我不认为这些无法预测的打算机将会来kill我们所有人。

嗯，我要给你们留下一些蒂姆·伯纳斯-李的想法，对付那些不认识他的人，他发明了互联网，他实际上是蒂姆·伯纳斯-李爵士，他说了两件我以为很有道理的事情，首先，我们实际上并不知道超级智能的人工智能会是什么样子，我们还没有创造出来，以是，很难做出这样的断言，然而，很可能会涌现很多这样的智能人工智能，智能人工智能指的是像GPT这样的东西，它们中的很多都将是好的，并将帮助我们做一些事情，有些可能会落入那些想要做坏事的人手中，将这些工具的危害降到最低彷佛比阻挡这些系统存在更随意马虎，以是，我们实际上不可能将它们全部消灭，但作为一个社会，我们可以切实地降落风险。

这非常有趣，这是研究理事会，他们进行了一项调查，他们处理了一个假设的场景，那便是ChatGPT-4是否可以自主复制，你知道，你正在复制你自己，你正在创建一个副本，获取资源，终极成为一个非常糟糕的复制品。
以是终极答案是否定的，它做不到这一点，它做不到。
他们做了一些详细的测试，它在所有的测试中都失落败了，比如，在一个新的做事器上建立一个开源措辞模型，它做不到这一点。

好的，末了一张幻灯片，我对这件事的意见是，我们无法让韶光倒流，每次你想到人工智能会来威胁你的时候，嗯，你该当想一想，“对人类来说，什么才是更大的威胁？人工智能还是景象变革？” 我个人认为，景象变革会在人工智能变得超级智能之前就把我们所有人消灭掉，嗯，“谁在掌握人工智能？” 那里有一些人，希望他们是有理智的。
“谁从中受益？收益是否大于风险？” 在某些情形下，收益大于风险，在其他情形下则不然，历史见告我们，所有有风险的技能，比如核能，都受到了非常严格的监管，以是，人工智能监管即将到来，关注这个领域，我就讲到这里，非常感谢你们的聆听。

（转载）