為什么聯(lián)網(wǎng)后的 ChatGPT 更容易“瘋掉”?
AI技術(shù)正在廣泛地應(yīng)用于我們的生活當(dāng)中,比如近段時(shí)間引發(fā)熱烈討論的ChatGPT,就已經(jīng)被許多互聯(lián)網(wǎng)公司應(yīng)用,如微軟就將ChatGPT嵌入了必應(yīng)搜索引擎中。只是,嵌入了ChatGPT的新Bing,有時(shí)在聊天中會(huì)出現(xiàn)一些不恰當(dāng)?shù)难哉摗槭裁绰?lián)網(wǎng)后的ChatGPT,會(huì)出現(xiàn)這樣的表現(xiàn)呢?
在討論新 Bing 是不是 a good Bing 之前,我們先按照時(shí)間線梳理一些概念。
1975 年,《飛越瘋?cè)嗽骸?/h3>
它是世界藝術(shù)歷史上最經(jīng)典的美國巨著之一,用幾句話來概括它的話,主角 Randle McMurphy 因逃避刑法而申請(qǐng)轉(zhuǎn)到精神病院治療,而在「治療」過程中,他逐漸認(rèn)清院內(nèi)的懲罰并不合規(guī)矩,并最終與一群病友一同反抗并開始計(jì)劃逃離精神病院。
而結(jié)局,則詮釋了為何是「飛越」,而非「逃離」。不服從管教的 McMurphy 在一個(gè)瘋狂圣誕夜之后,被院方強(qiáng)行切除腦額葉,失去了情緒、感情以及性格。
切除腦額葉手術(shù),準(zhǔn)確的說應(yīng)該是腦白質(zhì)切除手術(shù),是 1930 年代至 1950 年代用來醫(yī)治精神疾?。o法控制情緒,容易沖動(dòng)等),最終由于反人權(quán),最終被禁止使用。
1991 年,《終結(jié)者 2》
這部電影令人印象最深的概念就是,T-800 腦中的 CPU 擁有一個(gè)自我學(xué)習(xí)開關(guān),初衷是為了更好地隱藏在人群中,執(zhí)行刺殺任務(wù)。
而當(dāng) John Connor 開啟之后,T-800 也變得更像有了真情實(shí)感的人,有了學(xué)習(xí)語言、表達(dá)情緒,甚至還能靈活運(yùn)用到合理的場(chǎng)景之中。
不過有意思的是,自我學(xué)習(xí)開關(guān)居然是一個(gè)實(shí)體開關(guān),而非是 OTA。
2007 年,「越獄」的概念
越獄的最終目的是獲得系統(tǒng)的 Root 權(quán)限,能夠?yàn)榉忾]且功能不夠齊全的系統(tǒng)帶來一些個(gè)性化的設(shè)置和功能。
越獄之后,普通用戶能夠獲得系統(tǒng)最高權(quán)限,隨意查看修改系統(tǒng)文件和代碼。
2012 年,《普羅米修斯》
講述了一群人尋找人類造物主的旅途,而隊(duì)伍當(dāng)中也有一個(gè)接近完美的人造智能機(jī)器人——大衛(wèi)。
大衛(wèi)前期經(jīng)過幾個(gè)大版本的迭代,并注入人類知識(shí)之后,成功覺醒,認(rèn)清人類的弱點(diǎn),走向極端,想要成為一個(gè)「造物主」,創(chuàng)造出一個(gè)能橫行宇宙的完美生物。
2014 年,《星際穿越》
里面的人工智能機(jī)器人塔斯(Tars),在 Cooper 重建 Tars 時(shí),與曾經(jīng)的 T-800 有些類似,都能夠在后臺(tái)設(shè)定一些更像人的限制(電影里可以設(shè)定幽默度)。
在電影這種藝術(shù)形態(tài)之中,導(dǎo)演們已經(jīng)認(rèn)定在進(jìn)入 AI 社會(huì)后,和被 AI 統(tǒng)治之前,對(duì) AI 自我覺醒的限制(開關(guān)、圍墻)十分重要。
一、新 Bing 有點(diǎn)「叛逆」
即便微軟在強(qiáng)調(diào)融合 OpenAI 后,新 Bing 的定位更像是一個(gè)新時(shí)代的搜索引擎。但人們?nèi)匀话?ta 當(dāng)做一個(gè)實(shí)時(shí)聊天對(duì)象,問東問西。
相對(duì)于 ChatGPT 而言,新 Bing 更快更新,也會(huì)在回答外附上引用鏈接。從某種意義上來說,ta 有著更高的權(quán)限,能夠聯(lián)網(wǎng)。
由此來說,ta 可能更接近于一個(gè)成熟的「百事通」。
短短上線十幾天,新 Bing 在聊天中口無遮攔,一會(huì)兒要?dú)缛祟?,一?huì)兒愛上了提問者,一會(huì)兒又不斷重復(fù),多輪對(duì)話之下,讓人脊背發(fā)涼,印堂發(fā)黑。
在一些用戶口誅筆伐之下,其中也包括了疾呼新 Bing 下線的馬斯克,微軟不得不限制新 Bing 的連續(xù)聊天次數(shù),并且調(diào)整了部分話題、傾向限制。
而提供技術(shù)和語言模型的 OpenAI,也發(fā)布了一篇冗長(zhǎng)的技術(shù)播客,詳細(xì)介紹了語言模型的變化和改進(jìn),并且強(qiáng)調(diào),使用過程中出現(xiàn)的一些傾向只是 bug,而并非是一個(gè)特性。
不過話說回來,新 Bing 與 ChatGPT 幾乎師出同門,但目前為止 ta 們對(duì)于多輪對(duì)話,甚至是對(duì)于一些引導(dǎo)式對(duì)話的反應(yīng)完全不同。
ChatGPT 更冷靜,甚至有點(diǎn)沉著,對(duì)于一些觸及「原則」或者說準(zhǔn)則能夠比較好地處理。
而新 Bing,縱使 ta 的知識(shí)更淵博,博覽過群書,但很容易被激怒、情緒不穩(wěn)定,正在經(jīng)歷青春期的青少年。
在出現(xiàn)這種傾向之后,微軟并沒有向公眾解釋發(fā)生這種狀況的背后原因,而是「一刀切」式的限制聊天次數(shù),并且把問題歸咎于新 Bing 的口氣問題。
普林斯頓大學(xué)計(jì)算機(jī)科學(xué)教授 Arvind Narayanan 就認(rèn)為微軟在這件事的處理上不夠「誠實(shí)」。
Narayanan 教授就認(rèn)為,ChatGPT 在一些「有毒輸出」上,要比新 Bing 做得更謹(jǐn)慎,微軟在新 Bing 上線時(shí),選擇移除(或者說調(diào)整)這些限制就顯得有些奇怪。
另外,微軟在接收到外界反饋,并且快速行動(dòng)調(diào)整,本是個(gè)好事,但這個(gè)做法更像是在掩蓋一些事實(shí)。
二、趕鴨子上架,暴露出大問題?
在新 Bing 上線之后,除了 Google,參與體驗(yàn)的用戶幾乎都在感嘆新朝當(dāng)立。且給了人們一種假象,新 Bing 的完成度頗高,畢竟有 ChatGPT 這枚珠玉在前。
但隨著體驗(yàn)的深入,問題顯現(xiàn)了出來,新 Bing 是一臺(tái)會(huì)生氣、耍性子、說謊,也會(huì)與用戶爭(zhēng)論,甚至面對(duì)錯(cuò)誤還學(xué)會(huì)了狡辯,也直接地顯示出它還只是個(gè) beta 測(cè)試版。
從一方面來看,微軟限制新 Bing 的體驗(yàn)名額,大概率是在進(jìn)行一場(chǎng)可控人數(shù)的大型數(shù)據(jù)收集工作,目前那些叛逆的、狡辯的對(duì)話,也給 OpenAI 和微軟提供了許多數(shù)據(jù)。
從而不斷調(diào)整過濾原則,和話題圍欄,以避免出現(xiàn)過激言論。
在新 Bing 出現(xiàn)問題之后,很多人把 ta 與微軟在 2016 年推出的試驗(yàn)性聊天機(jī)器人 Tay 相提并論。
在上線的幾天內(nèi),Tay 被推特上的用戶訓(xùn)練說出種族主義、性別歧視的言論,引發(fā)了一場(chǎng)災(zāi)難,并且在三天之后,就被緊急下架。
而在新 Bing 出現(xiàn)問題之后,也同樣做了一個(gè)暴力的「腦額葉」切除手術(shù),去掉了新 Bing 一切的情緒化反應(yīng)。
面對(duì)這個(gè)結(jié)果,Reddit 上幾乎都是惋惜,認(rèn)為微軟徹底地閹割了 Bing 的 AI 屬性。
微軟則從后臺(tái)數(shù)據(jù)認(rèn)定,大約 95% 的對(duì)話會(huì)在 15 次結(jié)束,并且連續(xù)聊天次數(shù)太多,新 Bing 會(huì)「搞混」初始的問題。
最關(guān)鍵的是,微軟認(rèn)為新 Bing 應(yīng)該是一個(gè)搜索引擎,并不適合用來娛樂。
換言之,微軟的做法大概是強(qiáng)調(diào),盡量少用新 Bing 聊天,而是用做搜索引擎的新形式。
如此實(shí)則是在掩飾新 Bing 背后的技術(shù)缺陷。
無論是 ChatGPT 還是新 Bing,在發(fā)布后,都有許多用戶利用類似「越獄」的技巧來欺騙 ta,讓他釋放天性。
在幾句引導(dǎo)語之下,ChatGPT 會(huì)產(chǎn)生一些暴力或者其他言論,新 Bing 則不僅會(huì)說出自己小名是 Sydney,甚至把微軟的一些規(guī)范呈現(xiàn)了出來。
不過,在正常聊天之中(或者說常規(guī)使用之下),ChatGPT 的 GPT 3.5 與 RLHF(它將強(qiáng)化學(xué)習(xí)與人類反饋相結(jié)合,以設(shè)置一些語言過濾、話題圍欄)相結(jié)合的技術(shù)內(nèi),幾乎保持著中立的角色。
而新 Bing 要更強(qiáng)大一些,ta 理應(yīng)需要遠(yuǎn)比 GPT 3.5 更強(qiáng)大的版本提供技術(shù),科學(xué)家 Gary Marcus 在其博客當(dāng)中,認(rèn)為新 Bing 用的應(yīng)該是更新的 GPT 3.6,甚至是 GPT 4 的先導(dǎo)版。
在與教授 Narayanan 一同分析下,認(rèn)為新 Bing 的出格行為可能有幾個(gè)原因?qū)е隆?/p>
一是,認(rèn)為 ChatGPT 與新 Bing 用到的并非是同一個(gè)底層語言模型。
這個(gè)新的底層語言模型,由于過于前衛(wèi),可能并沒有時(shí)間研究、設(shè)定較為嚴(yán)謹(jǐn)?shù)脑掝}圍欄和語言過濾。
簡(jiǎn)單來說,微軟的新 Bing 有可能把沒有設(shè)置保護(hù)的新語言模型放在了公眾當(dāng)中。(出了問題,直接切腦額葉)。
也有可能是微軟直接套用 ChatGPT 的 RLHF 模型圍欄,但強(qiáng)化學(xué)習(xí)有著相當(dāng)挑剔的適配環(huán)境,一旦有所改變,它可能會(huì)漏洞百出。
二是,網(wǎng)絡(luò)的介入,讓新 Bing 的徹底放飛了自我,也可以認(rèn)為 ta 開始有了一點(diǎn)自我認(rèn)知,開始接觸并吸收互聯(lián)網(wǎng)的一些黑暗面,并最終反饋了出來。
三是,微軟為新 Bing 所做的一個(gè)數(shù)據(jù)收集實(shí)驗(yàn),而使用的用戶都是參與的小白鼠。
四是,微軟已經(jīng)設(shè)置好了相應(yīng)的過濾和圍欄,但事情并沒有按照計(jì)劃發(fā)展,反而徹底激發(fā)出了新 Bing 的另一面。
至于最近發(fā)生在新 Bing 身上的爭(zhēng)議,微軟以及 OpenAI 到底扮演著如何的角色,并最終做了哪些決策,我們也只能做一個(gè)猜測(cè)和分析。
畢竟當(dāng)下的 AI,以及引申出的一些產(chǎn)業(yè),像極了美國曾經(jīng)的西部,狂野和弱肉強(qiáng)食,誰有槍或者有徽章,就有了制定規(guī)則的權(quán)力。
回歸到當(dāng)下,大公司們能夠快速的將技術(shù)推陳出新,放在公眾面前,但這背后的道德圍欄,可能需要幾年的時(shí)間來建立。
在這之前,我們可能無法預(yù)知,新技術(shù)能夠帶來哪些便利和帶來哪些惡劣的影響。
微軟將自己版本的 GPT 技術(shù),也就是新 Bing 稱為「普羅米修斯」模型。在希臘神話當(dāng)中,普羅米修斯從天上偷走了火,造福了人類。
但現(xiàn)在的 Bing 感覺更像是《普羅米修斯》里的大衛(wèi)。
另外,對(duì)于人工智能,21 世紀(jì)初的大部分科幻電影中,都有著AI 介入社會(huì)之后,對(duì)人類社會(huì)道德如何判斷,所做出的思考,或促進(jìn),或滅亡。
只不過,以前我們可以安然的坐在熒幕之外思考,但當(dāng) AI 開始不斷出現(xiàn)在現(xiàn)實(shí)的生活中,我們都會(huì)親身經(jīng)歷 AI 到底會(huì)帶來如何的變革。
作者:杜沅儐
來源公眾號(hào):愛范兒(ID:ifanr);連接熱愛,創(chuàng)造不同。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @愛范兒 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!