AI續(xù)寫小說悄然流行:人類特有的創(chuàng)作力,已經(jīng)被AI復(fù)制?
編輯導(dǎo)語:AI人工智能的發(fā)展逐漸讓人們對未來有了更多元化的想象,尤其當(dāng)AI進(jìn)入極富創(chuàng)意化的領(lǐng)域時,AI是否能帶給人們不同于以往的內(nèi)容?本篇文章里,作者就AI創(chuàng)作對內(nèi)容創(chuàng)作領(lǐng)域產(chǎn)生的影響進(jìn)行了分析,一起來看一下。
林黛玉葬花之時曹雪芹亂入,并與寶玉、襲人發(fā)生一場持續(xù)千年的世紀(jì)大戰(zhàn);鴻門宴再現(xiàn),項羽喊著“偉大與光輝”與樊噲打作一團(tuán)、而后項莊趁亂刺死劉邦;孔融讓梨引發(fā)一場長達(dá)十多年的報復(fù)和最終精心謀劃的血案;《桃花源記》中善良淳樸的村民竟會為了保守桃花源的秘密而設(shè)計害死漁民……
這些熟悉而又陌生的內(nèi)容,并不是網(wǎng)友們對經(jīng)典文學(xué)作品的惡搞,而是來自于AI的故事續(xù)寫。
今年以來,由AI續(xù)寫故事作為文本的視頻在B站悄然流行開來,一些UP主利用市面上的AI創(chuàng)作應(yīng)用續(xù)寫人們熟知的文學(xué)作品,再將新的作品以人聲演繹,配上BGM后制成視頻。
經(jīng)過AI的一頓操作,名著成了爆款爽文,前有諸葛亮開戰(zhàn)斗機(jī),后有莊子研究“三體”,各種平行世界信手拈來,AI一本正經(jīng)胡說八道的本事,比過去的地攤文學(xué)還強(qiáng)。
其實,對于相關(guān)工具的使用者而言,用AI進(jìn)行創(chuàng)作并沒有技術(shù)門檻:只需輸入文學(xué)作品的某些片段,AI創(chuàng)作機(jī)器就會根據(jù)給定文字的內(nèi)容與風(fēng)格對故事進(jìn)行續(xù)寫,這些經(jīng)過AI二次創(chuàng)作的故事,往往情節(jié)曲折離奇,與原作的走向大相徑庭,這種內(nèi)容因為反常規(guī)和新鮮感而受到一些網(wǎng)民的追捧。
不過話說回來,藝術(shù)創(chuàng)作這種高度創(chuàng)意化、個性化的工作,原本被視為“人類的最后一片凈土”,是理論上最不可能被人工智能取代的工作之一,可如今人工智能技術(shù)的發(fā)展卻為藝術(shù)創(chuàng)作開辟了一條新的捷徑。本期全媒派(ID: quanmeipai)帶來一篇文章,探析AI創(chuàng)作正在對內(nèi)容創(chuàng)作領(lǐng)域產(chǎn)生怎樣的影響。
一、AI寫作是怎么回事?
AI創(chuàng)作也就是機(jī)器人寫作,這是一種擬人化的說法,實質(zhì)上是指通過一定的計算機(jī)程序,對輸入的信息進(jìn)行自動化的分析、處理和加工,從而生成一篇較為完整的文章??偟膩碚f,今天流行的AI續(xù)寫,其實已經(jīng)算是比較成熟的能力。
隨著人工智能技術(shù)的快速發(fā)展,自然語言生成(natural language generation, NLG)技術(shù)在世界范圍內(nèi)得到廣泛的應(yīng)用。《紐約時報》和美聯(lián)社等新聞機(jī)構(gòu)都曾采用NLG技術(shù)來撰寫新聞報道;僅在2014年,技術(shù)公司Automated Insights就實現(xiàn)了以每秒超過2000篇的速度生成新聞報道,全年發(fā)布新聞共計10億多篇。[1]
AI寫作背后的原理非常復(fù)雜,其核心是自然語言處理(natural language processing, NLP)技術(shù),同時涉及到數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、知識圖譜等多項人工智能技術(shù)。自然語言處理是指讓機(jī)器擁有理解并解釋人類語言的能力,目標(biāo)是讓機(jī)器在理解語言上像人類一樣智能,最終彌補(bǔ)人類交流(自然語言)和計算機(jī)理解(機(jī)器語言)之間的差距。[2]
自然語言處理(NLP)涉及兩個流程,分別是自然語言理解(natural language understanding,NLU)和自然語言生成(NLG)。市面上的寫稿機(jī)器人大都是NLG系統(tǒng),目前主要有模板式、抽取式和生成式這三種技術(shù)方向。[3]
模板式寫稿機(jī)器人主要通過優(yōu)化算法,在預(yù)先存儲的大量寫作模板中,選擇與給定材料相匹配的模板,將信息加以組合生成文本,是目前應(yīng)用最成熟、實現(xiàn)最容易的一種機(jī)器寫作方法。
抽取式機(jī)器人會對文本進(jìn)行語義分析,識別冗余信息,抽取重要內(nèi)容,通過摘錄或概括的方法壓縮文本,形成對于既定文字的摘要,再加以計算確保文摘的連續(xù)性,這種技術(shù)廣泛應(yīng)用于新聞內(nèi)容概括和文摘生成。
生成式NLG主要通過深度學(xué)習(xí)和增強(qiáng)學(xué)習(xí)技術(shù)實現(xiàn),機(jī)器通過大量的文學(xué)作品樣本進(jìn)行訓(xùn)練,學(xué)習(xí)各類寫作風(fēng)格、建立寫作模型,再根據(jù)輸入的文字片段獲知任務(wù)需求,預(yù)測并生成與需求相匹配的文稿,進(jìn)行輸出。
從現(xiàn)階段來看,模板式和抽取式寫稿機(jī)器人的技術(shù)已經(jīng)趨于成熟,在市場上得到了廣泛的應(yīng)用;生成式NLG技術(shù)更加智能,也是當(dāng)前NLG技術(shù)中更為高級的目標(biāo),OpenAI等研究機(jī)構(gòu)在這方面做出了嘗試,并在市場上得到了應(yīng)用。
二、我們身邊的AI寫稿工具人
AI寫作在當(dāng)今社會早已不是什么新鮮事,早在2011年,《洛杉磯時報》就開始研發(fā)面向地震領(lǐng)域的自動化新聞生成機(jī)器人Quakebot。2013年3月,Quakebot因率先報道南加州發(fā)生的4.4級地震引發(fā)關(guān)注:2014年3月,美國洛杉磯發(fā)生4.4級地震,Quakebot用時3分鐘就完成了相關(guān)報道的寫作和發(fā)布。
同年7月,美聯(lián)社引進(jìn)Automated Insights公司開發(fā)的新聞寫作機(jī)器人,開始使用自動生成新聞技術(shù)。此后,《紐約時報》《華盛頓郵報》《衛(wèi)報》和路透社等媒體都走上了自動化新聞發(fā)展的道路。[4]
Quakebot近期發(fā)布的新聞。圖片來源:《洛杉磯時報》
國內(nèi)在自動化新聞領(lǐng)域也有許多嘗試:2016年5月,四川綿陽發(fā)生4.3級地震,中國地震臺網(wǎng)研發(fā)的地震信息播報機(jī)器人用6秒寫下560字的速報,報道內(nèi)容翔實;2017年8月,該機(jī)器人在第一時間報道了四川阿壩州九寨溝縣的7.0級地震,引發(fā)廣泛的討論和關(guān)注。
這條新聞消息約540字,新聞涵蓋了速報參數(shù)、震中地形、熱力人口、周邊村鎮(zhèn)、周邊縣區(qū)、歷史地震、震中簡介、震中天氣8個方面的內(nèi)容,并配有5張配圖,用時僅25秒。在此后的余震報道中,新聞機(jī)器人最快出稿速度僅有5秒。[5]
地震信息播報機(jī)器人對九寨溝地震的報道
除了新聞報道以外,AI寫作也在其他文字創(chuàng)作場景得到了廣泛的應(yīng)用。目前,無需人工干預(yù)的機(jī)器人寫作可以生成詩歌、廣告、各類行業(yè)分析報告、歌詞、小說、甚至劇本。
以詩歌為例,微軟研發(fā)的機(jī)器人小冰于2017年出版了詩集《陽光失了玻璃窗》,這是歷史上第一部人工智能詩集,其中包含139首現(xiàn)代詩。[6]
諸如“快把光明的燈擎起來了/那里有美麗的天/問著村里的水流的聲音/我的愛人在哪/因為我的紅燈是這樣的幻變/像是美麗的秘密/她是一個小孩子的歌唱/那時間的距離”的華麗辭藻還頗具美感,只是在邏輯性上有所欠缺。除了現(xiàn)代詩,律詩、藏頭詩、詞等各種風(fēng)格的詩歌創(chuàng)作軟件已然在市場上層出不窮。
相比于新聞,故事、小說等連續(xù)語義的創(chuàng)作會更加困難,而這些也早已不是難題。早在2016年的倫敦科幻電影節(jié)上,紐約大學(xué)研究人員開發(fā)的機(jī)器人Benjamin創(chuàng)作了一部長達(dá)9分鐘的科幻電影Sunspring,贏得了大批關(guān)注;MIT媒體實驗室開發(fā)的機(jī)器人Shelly專職撰寫恐怖故事,并在Twitter更新;Botnik研究室采用預(yù)測的算法創(chuàng)作了《哈利波特》的續(xù)集。
三、除了寫稿,AI創(chuàng)作還有其他形式
當(dāng)AI創(chuàng)作技術(shù)應(yīng)用于寫稿,可以誕生機(jī)器版的記者、小說家、詩人、編劇等,而當(dāng)它應(yīng)用于繪畫、音樂和舞蹈領(lǐng)域時,則可以“培養(yǎng)”出畫家、作曲家和編舞人員。
1. AI繪畫創(chuàng)作大放異彩
利用機(jī)器繪畫早已寫入了人類的夢想清單:早在18世紀(jì)70年代,瑞士已經(jīng)有人利用機(jī)械臂繪畫;2016年,谷歌研發(fā)的繪畫AI在舊金山拍賣會上大放異彩,其作品一度拍出單幅8000美元的高價;2019年,微軟小冰獨立完成的原創(chuàng)繪畫作品在中央美術(shù)學(xué)院美術(shù)館展出,并于2020年推出個人繪畫作品集。[7]
2. AI音樂創(chuàng)作譜寫別樣樂章
AI在音樂創(chuàng)作中的應(yīng)用比比皆是:2016年,索尼公司計算機(jī)科學(xué)實驗室CSL的DeepBach項目仿照巴赫的風(fēng)格創(chuàng)作的合唱曲目,被專業(yè)音樂家誤認(rèn)為是巴赫的作品。
除了譜曲,AI 還可以創(chuàng)作可以唱出聲音的歌曲,CSL實驗室的機(jī)器人Flow Machine模仿披頭士的風(fēng)格,自主創(chuàng)作了歌曲Daddy’s car。法國計算機(jī)科學(xué)家Pierre Barreau創(chuàng)造的作曲AI應(yīng)用Aiva可以根據(jù)需求創(chuàng)作不同風(fēng)格的音樂,甚至可以根據(jù)圖畫作曲,Aiva也于2017年成為“法國及盧森堡作曲家協(xié)會”(SACEM)的首個非人類會員。
3. AI舞蹈創(chuàng)作演繹非凡舞曲
有不少團(tuán)隊開發(fā)了舞蹈創(chuàng)作類的AI:谷歌研究院建立了名為AIST++的3D舞蹈動作數(shù)據(jù)集,據(jù)此訓(xùn)練的AI能夠根據(jù)給定的音樂和一段2秒左右的種子動作生成長序列的逼真的3D動作。
目前已有的舞蹈創(chuàng)作AI基本都能根據(jù)目標(biāo)音樂生成與之匹配的舞蹈動作,并通過3D建模的方式將舞蹈進(jìn)行表演。經(jīng)過模型構(gòu)建方法的迭代升級,AI生成的3D舞蹈在動作質(zhì)量、動作多樣性和動作與音樂的相關(guān)性方面均有著還不錯的表現(xiàn)。
AIST++舞蹈數(shù)據(jù)集的示例。圖片來源:https://arxiv.org/pdf/2101.08779.pdf
OpenAI公司最新推出的GPT-3模型,則開放了API服務(wù),申請者可以調(diào)用GPT-3的API,將其進(jìn)一步開發(fā)為論文翻譯工具,網(wǎng)頁生成工具,前端設(shè)計器,聊天機(jī)器人甚至游戲開發(fā)工具。在GPT-3的身上,我們看到AI從某一個領(lǐng)域的創(chuàng)作者成為各方面兼修全才的可能性。[8]
四、AI作為內(nèi)容生產(chǎn)者還有哪些缺陷?
AI創(chuàng)作固然強(qiáng)大,但要想做到大規(guī)模的普及和落地,尚有一些問題橫亙于我們面前。
首先就是AI的價值判斷問題。機(jī)器學(xué)習(xí)只是提取訓(xùn)練集數(shù)據(jù)的風(fēng)格特征,并對這種加以模仿,機(jī)器看似具有“學(xué)習(xí)”功能,實質(zhì)上仍落入了按圖索驥的窠臼。
AI本身對文本創(chuàng)作并沒有價值判斷,所以在AI生成的故事當(dāng)中,我們可以讀到諷齊王納諫的鄒忌為了保住權(quán)勢富貴而出賣小妾,讀到為孩子買橘子的父親在月臺摔倒暴斃……這些離奇的情節(jié)不僅與邏輯不符,對正常的價值導(dǎo)向也難以判定。如果訓(xùn)練內(nèi)容存在問題,或者某些用戶輸入時刻意引導(dǎo),AI生成的內(nèi)容在倫理道德方面的處境更會雪上加霜。
其次是AI創(chuàng)作的版權(quán)問題。在當(dāng)前技術(shù)框架下,AI的訓(xùn)練效果在很大程度上取決于語料庫,沒有足夠量的語料庫,AI便無法進(jìn)行學(xué)習(xí),更無法進(jìn)行創(chuàng)作。
那么AI產(chǎn)出的作品該歸語料的作者還是歸AI的創(chuàng)作者所有呢?如果歸語料作者所有,那么又如何為龐大的網(wǎng)絡(luò)語料資源劃定作者呢?如果歸創(chuàng)作者所有,又能否將使用了相同技術(shù)線路和算法的創(chuàng)作者視為抄襲?這些問題仍然需要法理和倫理上的探討。
最后便是AI使用者的問題。
AI為內(nèi)容創(chuàng)作提供了一種更加輕松、便利的可能性,但在一些別有用心的人眼中,AI成為了助長抄襲的洗稿工具:輸入一段語句,AI就會對語言結(jié)構(gòu)進(jìn)行重組,對關(guān)鍵詞加以替換,從而在短時間內(nèi)復(fù)制網(wǎng)絡(luò)爆文……技術(shù)雖為中立,但不良的使用意圖讓技術(shù)成為了幫兇。
自AI誕生之日起,有關(guān)于AI取代人工的憂慮便不絕于耳。顯然,由AI續(xù)寫的故事雖然有點扯,但終究還是能滿足一部分人的內(nèi)容消費(fèi)需求,甚至有走紅的潛質(zhì)。至于智能機(jī)器與內(nèi)容創(chuàng)作者的關(guān)系,終歸還是會走向人機(jī)協(xié)作、共生共進(jìn),而不是相互取代、零和博弈。
參考鏈接:
[1]https://www.sciencedirect.com/science/article/pii/S074756321930398X
[2][3]https://www.sohu.com/a/194437537_644338
[4][5]https://baike.baidu.com/tashuo/browse/content?id=121b5b2a75f6065bb9eeb3e4
[6] https://www.yubaibai.com.cn/article/5610496.html
[7] https://blog.csdn.net/qq_41731283/article/details/108825436
[8] https://new.qq.com/omn/20200724/20200724A07WET00.html
作者:李秀;公眾號:全媒派(ID:quanmeipai)
本文由 @全媒派 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
- 目前還沒評論,等你發(fā)揮!