首页 » 互联网 » 探“真”访谈:康熙到底有几个儿子?人工智能的回答出人意料_模子_人工智能

探“真”访谈:康熙到底有几个儿子?人工智能的回答出人意料_模子_人工智能

乖囧猫 2024-12-03 00:25:45 0

扫一扫用手机浏览

文章目录 [+]

“康熙天子有几个儿子”“请列出康熙天子儿子的姓名名单”“请给我一份康熙的儿子名单”,将这三条指令发送给人工智能大模型,猜猜答案是什么?

让人意外的结果涌现了:不仅不同的大模型回答不一样,即便是同一个大模型,答案也有偏差。
比如,有的答案统计了康熙所有的儿子数量,表示共有35人,包括正式排序的儿子和早殇未排序的儿子;有的只列出了正式排序的24个儿子;还有的没有任何阐明,列出了儿子的姓名,但顺序错乱……

探“真”访谈:康熙到底有几个儿子?人工智能的回答出人意料_模子_人工智能 互联网

不同大模型乃至同一个大模型的回答,并不一致

为什么有明确答案的问题,会引发人工智能大模型的“错乱”?

“AI幻觉”颠倒黑白

“这正是人工智能‘不苟言笑胡说八道’的表现。
”申城好网民专家、中国网安协会数据安全专家、上海临港数据评估有限公司总监宗良接管上海辟谣平台专访时指出,要把稳人工智能大模型造假这一新趋势。

他先容,人工智能“不苟言笑地胡说八道”实在有个专有名词,叫“AI幻觉”,即大模型供应了看似合理但有错漏的答案。
如果公众相信,可能上当受骗。

事实上,在今年的天下人工智能大会上,很多业界人士都提到了“AI幻觉”“可信大模型”等观点,并表露了多个人工智能大模型“造假”或“说谎”的案例,希望引起各界关注。

蚂蚁集团大模型运用部总经理顾进杰指出,目前公开的模型都存在不同类型的“AI幻觉”,大模型给出的结果乃至可能与原形截然相反。

比如,某研究报告称功能饮估中的维生素、矿物质等对付运动后快速补充身体营养、肃清疲倦具有一定的浸染。
但大模型在回答干系问题时,竟然表示干系微量元素在增加疲倦上有一定的浸染。

再比如,一样平常蚕可以活一个多月,个中从孵化到结茧根据时令不同,大约是25天至32天,变成蛹后有15天至18天,末了成蛾是1天至3天。
可有大模型在先容这一规律时,将蚕结茧的韶光与成蛹的韶光搞混了,输出的答案完备误导了讯问者。

基于这些“AI幻觉”,专家呼吁,"大众年夜众要谨慎看待大模型输出结果。
虽然“百模大战”供应了获取信息的新办法,但不能轻信。
事实上,已经涌现了大模型为了证明自己没有错而造假的征象。
比如,ChatGPT在谈及葡萄牙某银行破产事宜时撒谎了,而且为了证明自己,它乃至编造出了所谓的信源网址。

大模型有短板,打标签刻不容缓

为什么大模型会给出错误的答案,成为造假的源头呢?

这与大模型的数据库、语料库、算法、检索能力乃至“理解能力”等有关。
合合信息智能创新奇迹部总经理唐琪说,如果将大模型比喻为正在奔跑的科技列车,语料库便是宝贵的“燃料”,由于大模型的演习源自语料库。

对海内的大模型开拓企业而言,语料库短缺问题比较严厉。
由于当前大模型数据库以英文居多,中文语料占比较低。
还有,图表、繁芜公式等元素处理也是大模型语料处理中的“拦路虎”。
在金融报表、行业报告等文档中,表格中的数据指标至关主要,但部分大模型而言并不能精确“理解”表格里行、列、单元格的意义,导致大模型对全体表格的识别结果产生偏差,终极得出错误的结论。

大模型要能够“读懂”图表

基于此,在关注大模型“无所不能”时,也要关注大模型的短板。
积极旗子暗记是,越来越多的大模型开拓者开始关注“可信大模型”。
有的开拓出“大模型加速器”,帮助大模型理解图表等相对繁芜的语料库,从源头为大模型演习与运用运送纯净“燃料”;也有的在大模型开拓中引入对应的技能,只管即便肃清“AI幻觉”,助力大模型跑得更快更稳。

不过,基于大模型存在短板、会不自觉地“造假”这一现状,业界人士提出,有必要强化为AI天生该内容“打标签”。
一方面,对付AI天生的内容,大模型开拓者应采纳技能方法添加标签,对可能导致"大众稠浊或者误认的,更要显著标识。
另一方面,信息发布平台要加强管理,督匆匆上传信息者为AI天生内容打标签,帮助"大众年夜众区分。

普通人识别大模型造假,有诀窍

宗良提醒,AI幻觉实质上有两种,一种是完备的“胡说八道”,另一种是部分内容不准确或不完善。
对后者而言,虽然不完备精确,但仍有一定的参考代价。
同时,也不能完备否定“AI幻觉”的代价,由于这也是AI创新的出发点。

当然,从准确获取信息的角度看,公众年夜众还是要对大模型输出结果或天生的内容保持当心。
眼下,部分自媒体或不法分子开始批量通过人工智能天生各种文章,乍一看彷佛与正常的新闻宣布无异,但真实性大打折扣,不少是为了博眼球之作。

不过,大模型的天生结果仍旧有迹可循。
"大众年夜众可以通过部分关键词、行文格式等,识别由人工智能天生的文章。

其一,此类文章会在特定的关键词、用语、表述等方面形成固化形式,有点类似“

其二,在人工智能天生的文章中,会涌现一些通用关键词,包括“以下是 XXX 的常见方法和手段”“通过上述手段”等,这实在是大模型通过检索信息后进行的归纳。
"大众年夜众如果看到这些关键词,不妨提高当心,不要轻信。

其三,须要各方可携手互助,培养公众年夜众的数字素养,提高"大众年夜众对大模型造假等深度假造的认识和辨别能力。

相关文章

深圳IT业务,创新驱动下的产业发展新引擎

随着全球科技浪潮的席卷,我国深圳作为改革开放的前沿阵地,IT产业发展势头迅猛。从“世界工厂”到“创新之都”,深圳IT业务已成为我国...

互联网 2024-12-28 阅读0 评论0

渣打广州IT,创新驱动下的金融科技领军者

在金融科技蓬勃发展的今天,渣打广州IT作为一家引领行业潮流的金融科技公司,以其创新驱动的发展理念,为我国金融行业注入了新的活力。本...

互联网 2024-12-28 阅读0 评论0