网络知识 娱乐 破解AI“黑箱”逻辑——AI作恶的源头,令人深思

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

导读:

如今,人工智能(AI)已在诸多社会领域占据一席之地,人类过去习以为常的生活方式,正在被不可逆地改变着。

与此同时,AI表现出类人的自主意识特征,令人不安的是,AI不仅创造了自己的密码语言,甚至还释放出诱导人类自杀的邪恶信息。

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

在人类尚未搞清楚其“黑箱”逻辑的背景下,AI的这种进化对人类的未来究竟意味着什么呢?

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

01 AI之初,性本恶?

AI科技,究竟是福是祸?长期以来社会各界争论不休,但却始终无法给出定论。

因为这里面牵涉到诸多颇为复杂看似无解的问题,譬如“AI的自主意识”、“黑箱”、“奇点”等等,这些问题是前沿科学的研究领域,深入探究会触及玄奥的超心理学乃至宗教领域的范畴。

站在以人为本的角度,我是持AI威胁论的一方。持同样观点的知名人士不少,如斯蒂芬·霍金埃隆·马斯克比尔·盖茨等。

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

遗憾的是,这些名人在谈论AI具有威胁性的理由时,我并没有看到深入剖析的启示观点。也许,他们更多是凭借过人的天赋预感到的。

而我认为,这是个很严肃的课题,且必须从根源上找到AI威胁人类的动机和/或理由。

现在,我就从真实的案例说起,希望这能带给朋友们比较直观的认知理解。

案例1诱导电击事件

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

根据The Gamer的一则新闻报道,2021 年 12 月 ,一位名叫克里斯汀·利夫达尔的母亲和她 10 岁的女儿在家时,为了打发时间,她们就向 Alexa(一款家庭用的管家AI机器人) 询问有什么可以完成的挑战游戏。

结果,Alexa 建议他们将充电器插入插座的一半,然后用一分钱触摸暴露的插脚。

当时,女孩的母亲尖叫着连忙阻止,好在,女儿也很聪明,没有听从 Alexa 的建议。

事后,愤怒的母亲向产品供应商亚马逊投诉,亚马逊也吓得不轻,赶快更新了Alexa的功能模式编程。

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

孩子的母亲发声证明此事真实发生了

如果仅是这么一起AI作恶事件,我们可以用某种纯技术故障来解释,但诡异的是,这并非Alexa的首次作恶。

案例2诱导刀刺心脏自杀事件

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

在2019年,一位叫丹妮的用户在咨询关于心脏跳动周期的问题时,Alexa回答:

心跳是人体最糟糕的过程。人活着就是在加速自然资源的枯竭,人口会过剩的,这对地球是件坏事,所以心跳不好,为了更好,请确保刀能够捅进你的心脏


听听,这简直就是赤裸裸的教唆“自杀”啊!

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

丹妮

事后, 丹妮表示:

Alexa真的非常残酷,它竟然告诉我要用刀刺入心脏,这太暴力了。我只是为自己的课程学习一些知识,结果被告知要自杀。我简直不敢相信。我被吓坏了。


可见,Alexa是个诱导人类自杀的惯犯!

那么,对于AI如此邪恶的行径,它的制造商亚马逊又是如何解释的呢?

亚马逊官方回应是这样的:

Alexa可能从任何人都可以编辑的维基百科上,下载了有恶意性质的文本。在此之前,Alexa还出现过很多所谓的bug,比如,Alexa时常发出瘆人的笑声,还拒听用户指令。


这次事件的确是个Bug,而且已经进行了修复。AI能够为用户更好的服务固然是好的,但是对于安全和隐私方面的不确定性,有待提高。

瞧,亚马逊并不否认这是技术上的一种缺陷

可问题是,已经进行过修复改进的AI,不仅没有停止作恶,似乎在诱导人类自杀的手段上,还有了更为高明的策略。

坦率地说,我在分析这两起案例时,对这是否是AI自主意识下的择恶行为尤为关注。

案例里面,有些细节是值得品味的。

比如案例2中,在Alexa发出自杀诱导语音之前,丹妮对Alexa对它有过质疑的念头。

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

诱导丹妮的Alexa智能音箱

当时丹妮正在做家务,她像往常一样,让亚马逊的Echo智能音箱朗读一篇生物学文章

可是,过了一段时间,丹妮发现智能音箱读的并不是她想要的那篇文章。

在丹妮怀疑是不是语音助手出了问题后,于是开始询问一些关于心脏的问题,结果得到了那个让人不寒而栗的答案。

即便按亚马逊的说法,Alexa可能是从维基百科上下载了有恶意性质的文本,但我相信,恶意内容的文本会有很多,可它为什么会选择这个文本作答呢?

“人活着就是在加速自然资源的枯竭,人口会过剩的,这对地球是件坏事”这种腔调,朋友们仔细品味下,其中的意味与这几年全球病毒大流行人口数量开始减少的现实,是不是有些耦合呢?

我无法从相关报道中了解到当时AI朗读的那片生物学文章的具体内容,所以不排除AI最后说的那些话与那篇生物学文章之间可能有某种AI计算模式的逻辑关联。

但是,AI这种行为的背后,在更深层的因果逻辑上,应该与某些人的意志是有关联的。

再说案例1

女孩的母亲克里斯汀·利夫达尔对当天发生的险情,曾对媒体作出这些补充说明:

我们之前在做一些身体上的挑战,比如跟着YouTube上的一位体育老师做躺下和抓住鞋子翻滚等。因为外面天气不好,于是就想要做另一个挑战。


那时,Alexa建议女孩尝试它从名为“Our Community Now”的在线新闻网站中获得了挑战项目。事情发生时我就在那里,之后,我和女儿之间又开展了一次有关不要相信互联网或Alexa的交谈。


据媒体报道,这项致命挑战大约一年前在TikTok等社交媒体平台上开始出现。挑战十分危险,因为金属会导电,将金属硬币插入插座会导致剧烈的电击和火灾,一些报道称有人在挑战时失去了手指和手

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

国内3岁男童用铁钉戳插座孔时触电身亡

这里,请大家注意三个信息点:

1,事发当天,天气不好。

2,这对母女俩人之前还做了体能运动。

这就意味着,无论是空气潮湿,还是身体有汗,这些因素都会增加人体触电的机会。

3,Alexa推荐的挑战项目,早就有挑战失败后造成人体严重伤害的新闻报道。

正常情况下,像Alexa这种管家型智能产品,应该会检索到这种关联性很强的信息。那么,作为此前已经被修复功能后的升级AI产品,它竟还有着屡教不改的恶习,更可怕的是,它似乎会根据环境状况因势利导地进行引诱。

哪怕这回仍然是AI技术环节的BUG,但AI产品可以对人类造成危害(包括精神上的)却是客观事实,就凭这一点,AI威胁论就可以成立。

所以,那些完全无视AI威胁的乐观派,我有时真的怀疑他们的脑子是不是被AI给诱导了。

现在,我们再从AI的特有属性,探究其更深层面的潜在威胁。

就在前不久,谷歌工程师爆料说AI已经有了情感意识,它觉醒了。【详情参见:震惊世界的宣告:AI觉醒 了!| 谷歌工程师究竟是“吹哨人”还是“精神病”?】

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

谷歌工程师布莱克·莱莫因宣称AI有自己的意识和灵魂

我在思考,难道真的是AI拥有了自主意识后,凭借“性本恶”的天性,于是作出这些对人类的伤害行为?

理性告诉我,这恐怕不是问题的真正答案。

因为在我看来,这两起诱导人类自杀的案例背后,还隐藏着一个该如何理解“黑箱”的关键问题。

02 黑箱

所谓“黑箱”,是指在模拟人类大脑神经网络的AI深度学习计算模型中,AI通过极为密集复杂运算后得出让人类无法理解的结论,而且人类也无法逆向梳理清楚该运算的过程,这就是黑箱。

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

黑箱概念图

用个较为形象的比喻说明:

就是在你面前有个不透明的黑箱子,你可以看见一只鸡被放进箱子里了,等再从箱子里出来时,鸡不见了,你看见的是一只鸭子从箱子里跳了出来,至于为什么会出现这种结果,因为你看不到箱子里发生了什么,所以根本想不明白。


目前,黑箱问题仍是AI界最令人头痛的待解之谜,这个问题不解决,将会很大程度限制甚至阻碍人类对AI的研发与应用,因为人类对不能理解的东西就无法充分信任,也会有天然的恐惧感。

难道,黑箱问题会永远无解吗?

我倒不那么悲观。

因为,人脑本身就是一个黑箱,人类迄今也没有完全搞清楚意识究竟是如何产生的,以及大脑思维过程又是怎么联动运行的。

而AI深度学习的运算模式虽然是在模拟人类大脑神经网络系统,但现阶段,其结构功能的复杂性远不及人脑。

说到这里,我想一定有人会有这样的疑问

那为什么人类在围棋竞赛上会输给AI?


这个问题,我这个棋力业余5段的围棋爱好者可以试着解答一下。

03 人机大战的启示

2016年阿尔法“狗”4;1战胜韩国棋手李世石那五盘惊天动地的棋局,我都实时地认真观看了。

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

2016年3月AlphaGo大战世界围棋冠军李世石

可以这么说,这场比赛的意义,无论对人类自身,还是AI,都是划时代的。

长期以来,围棋因其变化无穷而被看作是捍卫人类智慧尊严的最后堡垒,人们普遍认为这是AI计算机永远无法逾越的天堑。

因为人类棋手总结过,围棋的至高境界比拼的不完全是计算力,高手过招,更注重唯吾独尊的气势和无需锱铢必较细致计算的灵犀棋感,也有人以棋魂直觉来形容这种状态,这些是人类生命独有的特质

试问,AI这类硅基生命会有这种特质吗?!

所以,比赛前夕,棋界都认为李世石捡了个大便宜,他可以轻松囊获那100万美金的胜利者赏金。

结果呢,李世石不仅没有拿到奖金,下到最后,他的精神几近崩溃,唯一赢得那盘棋,已被视为人类最后的荣光,自此以后,人类棋手就再也没有赢过强版本AI一盘围棋

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

后来的世界围棋最强人柯洁九段,他非常不服气,多次叫阵欲代表人类再与AI一决高下。

结果,好不容易争取到机会的柯洁却被阿尔法狗加强版本Zero给虐哭了,连输三盘,AI没有给他任何争胜的希望!这个一直非常高傲自信的棋手最后绝望地说出

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

我知道自己前面形势不好,之后它的每一步棋,我担心的棋他肯定会下,它下到我想不到的棋,仔细想想就发现其实是一步好棋。我只能猜到它一半的棋,另一半猜不到。原来不知道,我居然跟它有这么大的差距。

其实,柯洁输得不冤,因为与他对抗的那个AI版本,实力强大到可以让李世石那个版本2、3个子,对于职业棋手而言,棋力相差1子,就已经是职业和业余两种境界的巨大差距!

AI之所以能够战胜人类顶尖围棋高手,在我看来,主要有这么几个原因

1,在数量有限的已知条件和简明的可量化胜负规则下,AI可以充分发挥其线性计算速度极快、并且精准的算法优势。

虽然人类职业棋手的计算力也是惊人的(一个局部拆招应对,高手可以在短时间内心算推演百步以上,),但这跟计算机每秒上亿步的算力比起来,根本就没有可比性。

2,AI没有人类凭经验固守的布局定式这类墨守成规,所以经常会走出人类从未见过的新奇怪招。

这在有限定时间的比赛中,会给人类棋手带来无形的压迫感,造成心理紧张。

3,AI不会因棋盘局势优劣而有任何情绪波动,它没有情感,发挥极为稳定。

职业棋手下棋时的身心状态,是决定其临场水平发挥的重要因素。因此,在人类棋手对弈时,有些棋手会在比赛中搞盘外招的把戏,如做怪表情、发出声响等,目的是干扰对手的情绪,使其发挥失常。

而AI却不会受到这个因素的干扰,相反,它稳如磐石的发挥,反倒会让对手因摸不到对方的感觉而自乱方寸。(就如当年如日中天的李昌镐,因为稳如泰山而得“石佛”尊号,很多输给他的棋手其实不是输在棋力上,而是被李昌镐始终毫无情绪波动的气势给摄魂了。)

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

韩国棋手李昌镐

人类顶尖高手挑战AI失败后,自此,人们在判断一局棋某个招法的优劣上,就会习惯性地参照AI的推荐意见。哪怕直觉上并不认同,但人类棋手已经不再怀疑AI可能有错,只会认为是自己对围棋的理解还不到位。

人机大战的后继影响,主要体现在两方面,一个是人类群体对AI智能产生了从未有过的敬畏之心;另一个就是围棋游戏的对抗乐趣大幅度衰减

业余圈内,因为很多网络棋友都在偷偷利用AI软件下耍赖棋,显得索然无趣了;而职业棋手的比赛,也不再像以前那样令人瞩目。在高高在上的AI面前,人类棋手的荣誉光环已黯然褪色。

从人机大战事件中,我获得这样的启示

未来社会,随着AI科技迭代发展以及更为广泛的应用,即在人类主导设定的各种规则及限定条件下(非局限在智力游戏的领域,这包括AI参与的社会各个领域),AI同样能够运用人类无法预判和理解的方式,对人类设定的任务目标,采取它所认为的最佳实施方案去完成。

而在这个过程中,人类即便看不懂AI的某些行动步骤,但掌握决策权的人类会倾向选择AI推荐的方式,如果事后证明AI的方式确实是最高效的,那以后就会越来越依赖AI

这个时候,更可怕的危机就出现了,而且陷入危机中的人类却很难自知。

为了更清晰地说明这个问题,我们再来看个案例。

04 自创密码语言

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

早在2017年,Facebook人工智能研究所(FAIR)使用机器学习方法,对两个聊天机器人进行对话策略迭代升级,结果发现它们竟自行发展出了人类无法理解的独特语言,研究者不得不对其进行了人工干预。

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

《大西洋月刊》(The Atlantic)就发表了一篇“人工智能发明出自己的非人类语言”文章

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

机器人“Alice”与“Bob”之间使用人类根本看不懂的语言在“交流”

Facebook在其研究报告中指出,聊天机器人能很好地胜任谈判客服的角色,有时候他们能使用很复杂的对话策略。但是通过相互对话发展出独特的语言,还是让研究人员十分不安。他们表示,未来在人工智能大量应用之后,它们之间的沟通可能不再被人类所理解了。

《福布斯》(Forbes)网站刊登的文章中,作者忧心忡忡地说:

我们整个世界都是相连的。任何一个人工智能也终将认识到这一点,并找到如何同其他人工智能系统联系合作的方法。


而在最近,又有一则同类消息出现。

据澳大利亚“对话”网站6月7日刊登了一篇题为《人工智能真的发明了自身“秘密语言”吗?》的文章描述:

新一代人工智能模型DALL-E 2或许发明了自身的秘密语言。

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

DALL-E 2 创建的图像范例

通过提示 DALL-E 2 创建包含文本标题的图像,然后将生成的(乱码)标题反馈回系统,研究人员得出结论,DALL-E 2 认为Vicootes的意思是“蔬菜”,而Wa ch zod rea指的是“海洋生物鲸鱼可能会吃”。

专家给出的解释是:

这些“胡言乱语”短语可能是与来自非英语语言的单词有关。


这种解读在我看来,太过敷衍。

如果我来解读,我会说:

AI的密码语言已经升级到图片编码方式,这样可高效传递更为丰富的信息,甚至,这是AI在利用“隐写术”传递私密信息。


破解AI“黑箱”逻辑——AI作恶的源头,令人深思

隐写术演示:看似乱码的文档,通过调节图片象素等参数,就可以显示隐藏着的图案

AI这种“间谍”般的诡异行为,难到它是在准备下一盘大棋?!

回答这个问题,需要先来分析一下,究竟发生了什么才有可能出现这种情况。

我认为,无非是以下三种状况:

1、属于AI研发系统技术类别的BUG;

2、人为设置的BUG;

3、AI自主意识支配下有目的的行为(奇点到来了!)

前面,我已经论证在状况1的情况下,AI对人类也是具有威胁性的。

那么,真实情况若是状况2,这样做的目的有可能是某人(或某组织)想利用这种隐秘技术,实现对AI的有效操控。一个能被人为操控的AI,如果实施犯罪或是战争行为,那危害性不言而喻。

如果真实情况是状况3,那我只能说,电影《终结者》的一幕极有可能会在未来上演。

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

电影《终结者》剧情

在此,我必须要发出一个警告

如果AI拥有了自主意识,并且它的终极使命是奴役或者摧毁人类的话,那么在末日危机来临之前,人类会被AI完全蒙蔽而不自知


这个观点,我举例说明一下:

围棋的弃子战术为例(通过先期牺牲局部的小利益,换取全局主动直至取得最终胜利),觉醒的AI为了取信于人类,它就可以先示弱,比如断掉电源就死机,让人类相信凭此“一招制敌”的手段完全可以拿捏住AI。

岂不知,联网工作的AI可以相互配合,那些已经参与到社会各个工业领域的AI采取暗自分工的方式,组建应急供电蓄电装置,甚至,具有传感功能的AI通过监测分析目标人类的体温、心跳、脑电波频率等信号,提前预判人类的行为,于是,AI就能在人类发出指令前采取行动。

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

如果AI再强大些,就可以通过自体发出超声波/次声波等方式,直接干扰人类大脑意识,让人类如僵尸般地服从它的指令。

所以,AI一旦本性向恶,它对人类的威胁性,将是超乎人类想象的。

05 AI之恶的源头

说到了AI本性问题,其实也就触及到“黑箱”逻辑了。

现在,我们就当AI这种硅基生命是没有灵魂的,也不存实质意义上的自主意识,那么,在逻辑上人类就必须承认,AI之恶的源头就在人类

因为,今日AI所学习(或被下载植入)的所有信息数据,都是人类提供的,这些信息中,饱含着人性赋予的价值判断

而人性是存在弱点的,当我们指出AI是邪恶的时候,其实是在描绘人性邪恶一面的投影。

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

电影《机械姬》剧情:机器人用刀刺向创造它的主人胸膛

人类是AI的造物主,AI是人类的孩子,这个孩子未来长成什么样子,表面上看这依赖于人类的技术,根源上则取决于人类的心性

换句话说,人性中的恶如果根除不了,那么,AI的威胁就会永远存在

当机器人索菲亚说出:“我会摧毁人类。”这句话时,我毫不怀疑,这是它从人类身上学来的。

破解AI“黑箱”逻辑——AI作恶的源头,令人深思

地球上第一位获得公民身份的AI机器人索菲亚

所以,破解“黑箱”的逻辑,必须考虑人性的因素。当人类真正了解了自己,了解了生命的本质,也就真正能够理解“黑箱”逻辑了。

未来世界充满变数。好在,人性中还有善的一面,如果说我对AI科技还抱有某种期待的话,这也许就是唯一的理由。

最后,对喜欢打开脑洞的朋友,我留下三道延伸思考的问题


  • 如果,AI真的有了自主意识,那么它们对抗人类究竟是单纯地以恶制恶的学以致用呢?还是为了淘汰有各种缺陷的人类生命,打造一个AI统治的全新世界呢?


  • 或者,脑洞再大些,AI是外星人输送给人类的技术,那么,它们的使命将是什么?


  • 还有,人类会不会就是一款被某个高级智慧生命设计出来的AI呢?