用ChatGPT剽竊的罪,OpenAI要親手洗刷
ChatGPT 的推出讓我們對 AI 人工智能的能力有了進一步的認知,也有不少人動起了腦筋,想用 ChatGPT 來幫自己“作弊”。而現在,OpenAI 推出了 AI 文本檢測器,用來辨別文本的實際編寫主體。如何解讀這一動作?一起來看作者的分析。
聊天機器人ChatGPT的利用價值迅速被人類發掘:學生用它寫作業、程序員讓它幫忙寫代碼、新聞網站用它“水”文章……于是,學校不高興了,公司不高興了,創作者也不高興了。
如今,ChatGPT的“造物主”OpenAI親自出馬,要解決各方人士利用這個工具“作弊”的問題。
2月1日,OpenAI宣布推出名為AI文本檢測器(AI Text Classifier)的新工具,來輔助辨別文本到底是人類編寫的,還是AI編寫的。
目前,該工具已經可以免費試用。提交文本后,分類器會生成評估結果,包括以下5種:非常不可能、不太可能、不確定、可能、非??赡埽ㄊ茿I生成的)。
不過,這個AI文本分類器離成熟還很遠。不僅只能識別1000字符以下的文本,而且可靠性還有待提高。
一名AI研究員Sebastian Raschka用莎士比亞《麥克白》的第一章測試該工具,得到的評估結果是“非??赡堋笔茿I創作的。Sebastian 在推特有14萬粉絲,他貼出截圖后評論區有人戲謔道:“電影靈感:ChatGPT是一個時空穿越者,實際上人類的創作語言從一開始就是由它影響?!?/p>
OpenAI其實對該工具的“不完美”也開誠布公,在網頁的說明部分明確寫著,根據他們的測試,只有約26%的AI生成文本識別為“非常可能”,還有9%的人類創作會被誤判。OpenAI表示:“它仍然存在一些局限性,因此它應該被作為確定文本來源的輔助工具,而非主要判定工具?!?/p>
與其說“不完美”,不如說這個工具還很初級。但即便如此OpenAI也迫不及待地將之發布,一方面是需要各方反饋完善工具,另一方面也是對ChatGPT引發的主要爭議的一種回應。
我的罪,我自己先治了,姿態有時候比結果還重要。
01
ChatGPT已經在美國教育界引起了廣泛的擔憂。
美國的在線課程網站Study.com向1萬名18歲以上的學生發起調查,詢問他們使用ChatGPT的情況,結果竟然有89%的學生表示自己會使用ChatGPT完成作業,還有48%的學生用它完成測驗,53%的學生用它寫論文,22%的學生用它生成論文大綱。
即便是考慮到調查規模不大、樣本代表性不佳等問題,這樣的比例依然令人震驚。
《紐約時報》曾報道一個例子。美國北密歇根大學教授安東尼·奧曼(Antony Aumann)在批改學生的世界宗教課作業的時候,看到一篇文章以罩袍禁令的道德影響為題,行文段落簡潔,例子準確,邏輯嚴密,在一眾作業中很出挑。
但是安東尼教授沒有直接給高分,他起了疑心。在教授的質問下,該學生向他承認,這篇文章其實是用ChatGPT生成的。
雖然教育界也有一種聲音,認為應當將ChatGPT這樣的新工具納入到教學當中,而不是千方百計抵制它。也的確有一些大學開始這么做,支持的教育者認為這就像是在數學課上使用計算器,如果能減輕學生負擔,用用也沒問題,這可以使他們有更多時間思考深層次的問題。
但反對的聲音似乎更加響亮。
1月3日,以“擔心對學生學習的負面影響”以及“對內容的安全性和準確性的擔憂”為由,紐約市頒布了ChatGPT禁令,不管是老師和學生,都不能通過公立學校的網絡和設備使用ChatGPT。
紐約市教育局發言人稱:雖然該工具能夠為問題提供快速簡單的答案,但并不能培養批判性思維和解決問題的能力,而這對學術成就和終生發展都至關重要。
這是一個強有力的信號:紐約市擁有全美最大的公立學校系統。
OpenAI也察覺到了爭議的嚴重性,該公司CEO山姆·阿爾特曼(Sam Altman)曾提出要嘗試用水印標記ChatGPT生成的內容。即將信號嵌入到生成的文本中,人類不能一眼看出,但是機器一驗便知。
但在OpenAI還在提議時,外界早已開始行動,例如馬里蘭大學的幾位研究者已經對語言模型輸出的水印進行了深入研究。而如OpenAI新推出的工具那樣直接判斷文本是否為AI創作的第三方檢測工具也已經流行多時。
02
一些大學已經行動起來,包括斯坦福大學在內的一些機構,聯合推出名為DetectGPT的工具,來辨別AI生成的文本。
而要說第三方檢測工具中,最受歡迎是GPTZero。這個工具出自一位22歲的普林斯頓大學華裔學生愛德華(Edward Tian)之手,今年1月3日上線,一周內就有超過3萬人使用,一度導致程序崩潰。而推特上的演示視頻,更是吸引了超過700萬人次的觀看。
近日,愛德華又發布了迭代版本GPTZeroX,升級的最大特點是可以識別“人類+AI”混寫的文本,檢測出來后由ChatGPT生成的內容會被黃色高亮標記出來。
而且GPTZeroX還可以批量導入文件,支持word、PDF和TXT等格式。這對于教師來說是一個很實用的功能,畢竟學生的作業動輒就是幾十份。
GPTZero上線一天之內,已經涌進了40萬訪問量,收到了220萬次服務請求。
愛德華表達了對教育工作者的支持,他曾在推特上表示:我承諾,本網站對個體教師和教育工作者保持免費。
除了教育領域以外,ChatGPT還帶來了其他的困擾。和“學術欺詐”類似的,已經有不少程序員利用ChatGPT寫代碼。
此前已經有人在網上發帖稱,作為初級程序員經常使用ChatGPT,但是近期突然發現在公司無法訪問該工具了。
除此之外,早在去年12月,IT技術問答網站Stack Overflow就已經推出新政策,禁止用ChatGPT生成的內容在該社區回答問題。
“由于 GPT 足以讓網站用戶相信答案有價值,社區通常用來確定其同行貢獻合法性的信號經常無法檢測到 GPT 生成的答案存在嚴重問題。結果,客觀上錯誤的信息進入了網站。在目前的狀態下,GPT 可能會破壞讀者對我們網站提供由主題專家撰寫的答案的信任?!盨tack Overflow如是說明。
可以說,OpenAI在2月的第一天發布AI文本輔助檢測工具,不是一個令人驚訝的消息,甚至顯得有些姍姍來遲。
03
根據OpenAI的說法,ChatGPT的走紅實屬意料之外的事情,這也可以解釋為什么如今的爭議OpenAI看起來毫無準備。
《財富》雜志近期的一篇深度報道稱,OpenAI發布ChatGPT是抱著“孤注一擲”的態度,公司聯合創始人兼現任總裁格雷戈·布羅克曼表示:“我承認,我當時的立場是,不知道它能否成功?!?/p>
OpenAI此前已經擁有全世界最強大的大預言模型之一GPT-3,以約三分之二的互聯網、整個百科和兩個大型圖書數據進行集中訓練,但是給出的結果總是差強人意。于是有團隊提出了“強化學習”的方案,也就是讓它直接與人類對話,在試錯中學習。
而ChatGPT就是在這樣的背景之下被推出的。
相比之下,谷歌的自然語言平臺LaMDA早在2021年5月的開發者大會上初次亮相,2022年谷歌又發布了LaMDA2。在演示中,LaMDA也表現出了極其強悍的能力。甚至在去年中旬,“LaMDA已經具備意識”的都市傳說曾經鬧得沸沸揚揚。
但是谷歌一直不愿向公眾發布LaMDA。谷歌表示,部分原因在于LaMDA存在較高的誤差,且容易對用戶造成傷害。此類瑕疵被谷歌稱為“有毒性的”,谷歌擔心貿然推出LaMDA會對公司的聲譽造成影響。
而ChatGPT爆火后引發的一連串混亂,也恰恰印證了谷歌的擔憂。
ChatGPT已經成為OpenAI重要的一款產品,盡管公司稱走紅不在計劃內,這個工具還引發了各種爭議,ChatGPT依然進一步使得AIGC(人工智能自動生成內容)成為當今最熱門的賽道,也加速了OpenAI向商業世界的邁進。
微軟和OpenAI的合作關系快速升溫。在2019年就首次向OpenAI投資10億美元的微軟,在1月24日宣布已經擴大雙方的合作:微軟將向OpenAI進行一項為期多年、價值數十億美元的投資,并將OpenAI的模型納入微軟的消費級和企業級產品中。
有知情人士稱,投資數額將高達100億美元。
此外,有消息稱微軟計劃在3月將ChatGPT融入到搜索引擎必應中。谷歌也已經坐不住了,也已經發出“紅色警報”,要重新思考人工智能策略,計劃發布20款支持人工智能的新產品,并將在今年發布搜索聊天界面的演示版本。
2月1日,CNBC報道稱谷歌正在測試一款名為“學徒巴德(Apprentice Bard)”的聊天機器人,該產品基于LaMDA,將直接與ChatGPT抗衡。最關鍵的是,它的回答可以包括最近的事件,而ChatGPT對2021年之后幾乎一無所知。
OpenAI看起來在用一款產品去打擊另一款產品,實際上是在為ChatGPT的多領域應用鋪平道路。
在可以預見的將來,這個賽道將硝煙四起。ChatGPT將只是“拋磚引玉”的里程碑式印跡,還是一款長青的商業產品,還有待時間的檢驗。
參考資料:
- 財聯社:《加碼豪賭人工智能!微軟官宣向大火的OpenAI追加數十億投資》
- 硅星人:《用魔法打敗魔法:抓住AI槍手 ChatGPT檢測器“千呼萬喚始出來”》
- 量子位:《“ChatGPT克星”升級:老師可以把全班作業丟進去檢測了》
- 新智元:《學校封殺,大廠禁用,ChatGPT引發大面積恐慌!》
- 澎湃新聞:《聊天機器人ChatGPT成作弊工具,教育如何應對科技挑戰》
作者:畢安娣;編輯:王靖
來源公眾號:字母榜(ID:wujicaijing),讓未來不止于大。
本文由人人都是產品經理合作媒體@字母榜 授權發布,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!