一文看懂 AIGC 的版權(quán)問題

1 評論 6449 瀏覽 18 收藏 16 分鐘

隨著AIGC技術(shù)的出現(xiàn),相關(guān)的版權(quán)問題也被擺上了臺面,并引發(fā)了不少行業(yè)的關(guān)注。那么我們要如何理解當(dāng)前的AIGC作品版權(quán)問題?我們要如何更合理地使用AIGC技術(shù),降低并避免侵權(quán)風(fēng)險的發(fā)生?一起來看看作者的解讀。

伴隨著 AIGC 技術(shù)的強勢出圈,大家在驚嘆 AI 技術(shù)強大的同時,也有越來越多的人開始討論關(guān)于由此帶來的版權(quán)問題:我們通過 AI 生成的圖像屬于平臺還是個人?目前 AI 作品版權(quán)在法律上是如何界定的?又該如何避免引起 AI 版權(quán)的糾紛?

今天我想和大家聊聊關(guān)于當(dāng)前 AIGC 作品版權(quán)的問題,希望能給大家?guī)硪稽c思考。

一、AI作品的版權(quán)如何界定?

目前關(guān)于 AI 版權(quán)歸屬問題主要有2 種看法:持保守觀點的認(rèn)為 AIGC 只是從海量數(shù)據(jù)庫中選擇元素進(jìn)行拼接,初始的創(chuàng)意和付出都源自原藝術(shù)家,因此版權(quán)應(yīng)該屬于數(shù)據(jù)庫中的原作者和開發(fā) AI 技術(shù)的平臺。而另一種觀點認(rèn)為,在 AI 作品生成過程中創(chuàng)作者也經(jīng)過調(diào)試編輯,通過多次迭代才生成最終圖像,所以AI 創(chuàng)作者同樣持有作品的版權(quán)。

實際情況是怎樣的呢?我們再來看看平臺方在這方面的規(guī)定。根據(jù) Midjourney 在平臺規(guī)則手冊中標(biāo)注的信息中,明確標(biāo)注了除非是高收入的公司用戶,正常情況下付費會員制作的 AI 圖像是擁有完全所有權(quán)的,可以自由使用創(chuàng)作的圖片。這表明了Midjourney作為開發(fā)者方自主放棄了生成圖像的所有權(quán)。

一文看懂 AIGC 的版權(quán)問題

圖像來源:Midjourney 服務(wù)條款-用戶權(quán)益

從平臺聲明來看,似乎創(chuàng)作者可以完全放心的使用 Midjourney 生成的 AI 作品,但是事實真的如此嗎?

近期就有 3 位藝術(shù)家代表美國加州藝術(shù)家群體起訴Stability AI、Midjourney及DeviantArt公司的 AIGC 技術(shù),控訴他們未經(jīng)原創(chuàng)作家許可,便貿(mào)然使用網(wǎng)絡(luò)上的 50 億張圖像進(jìn)行 AI 訓(xùn)練。

藝術(shù)家 Karla Ortiz 在評論中說到:我很自豪能成為這起集體訴訟的原告之一。我很自豪能與同行一起做這件事,我們將為可能受到影響的數(shù)千名藝術(shù)家發(fā)聲。我很自豪在公共領(lǐng)域而且在法庭上為我們的權(quán)利而戰(zhàn)!

二、AI可能導(dǎo)致的侵權(quán)風(fēng)險

想要真正理解事情的發(fā)展緣由,需要了解 AI 繪圖創(chuàng)作過程中可能會產(chǎn)生侵權(quán)問題的行為,目前主要有 2 個階段會引起版權(quán)爭議的問題:分別是模型訓(xùn)練階段和圖像輸出階段。

首先,AI 技術(shù)想要發(fā)展和提升必須有體量極度龐大的數(shù)據(jù)庫進(jìn)行模型訓(xùn)練,這個過程中數(shù)據(jù)庫會不可避免的包含很多受版權(quán)保護(hù)的作品。可能大家對數(shù)據(jù)在 AI 領(lǐng)域的重要性并不太清楚?可以這么說,數(shù)據(jù)是一切人工智能的基礎(chǔ)。體現(xiàn)在很多行業(yè)中,數(shù)據(jù)都是影響企業(yè)競爭的重要壁壘之一,比如特斯拉在自動駕駛領(lǐng)域的數(shù)據(jù)積累和科大訊飛在智慧教育領(lǐng)域的題庫積累等。

以 ChatGPT 為例,根據(jù) OpenAI 公司的透露,他們在訓(xùn)練過程中使用45TB的數(shù)據(jù),包含近1萬億個單詞,這個數(shù)字差不多抵得上牛津詞典單詞量的 1300 倍。根據(jù)麻省理工大學(xué)的Pablo Villalobos等6位計算機(jī)科學(xué)家就預(yù)測,到2026年,ChatGPT等大型語言模型的訓(xùn)練就將耗盡互聯(lián)網(wǎng)上的可用文本數(shù)據(jù),屆時將沒有新的訓(xùn)練數(shù)據(jù)可供使用。

一文看懂 AIGC 的版權(quán)問題

圖片來源:OpenAI 官網(wǎng) ChatGPT訓(xùn)練模型

目前AI模型的數(shù)據(jù)來源包括以下幾類:公共數(shù)據(jù)集、公共網(wǎng)站、自有數(shù)據(jù)、眾包數(shù)據(jù)、合成數(shù)據(jù)等。除了合成數(shù)據(jù)沒有版權(quán)爭議外,其他數(shù)據(jù)都是通過采集互聯(lián)網(wǎng)獲得,而合成數(shù)據(jù)目前還處于初步發(fā)展階段,沒辦法大規(guī)模應(yīng)用到當(dāng)前市場中。

比如著名的 AI繪圖工具Stable Diffusion,它的模型訓(xùn)練數(shù)據(jù)源是包含了上億圖像的LAION-5B數(shù)據(jù)庫,該數(shù)據(jù)庫本身并不儲存網(wǎng)絡(luò)圖像本體,而是作為各類版權(quán)作品的在線索引,在訓(xùn)練模型時需要先將作品下載到本地儲存為副本,那這個下載過程本身就包含了對版權(quán)作品的使用。

一文看懂 AIGC 的版權(quán)問題

圖像來源:LAION-5B 官網(wǎng)《開放大規(guī)模多模態(tài)數(shù)據(jù)集的新時代》,作者 Romain Beaumont

接著在圖像輸出階段, AI 模型會將數(shù)據(jù)庫中的資源進(jìn)行算法解析,組合生成新的圖像。目前 AI生成繪畫圖像 主要有 3 種方式:圖片濾鏡、筆觸臨摹和關(guān)鍵詞模態(tài)轉(zhuǎn)化。

  1. 圖片濾鏡:將參考畫作和目標(biāo)圖片進(jìn)行分層比對,并不斷的疊加融合,最終得到帶有參考畫作風(fēng)格的目標(biāo)圖片。
  2. 筆觸臨?。?/strong>通過算法模擬參考畫作的筆觸,和真人作畫過程類似,將其分解為一系列真實的筆觸序列,再組合成新的目標(biāo)畫像。
  3. 關(guān)鍵詞模態(tài)轉(zhuǎn)化:將文本關(guān)鍵詞和數(shù)據(jù)庫中的圖像進(jìn)行關(guān)聯(lián),組合生成最符合的圖像。

但是不管是通過哪種方式生成的 AI 圖像,必然會包含數(shù)據(jù)庫中版權(quán)作品的部分特征,考慮到最終生成圖像和原版權(quán)作品的相似性,是有可能對原創(chuàng)作品產(chǎn)生抄襲嫌疑的。

這時候有人可能會說,AI 的訓(xùn)練數(shù)據(jù)數(shù)以億計,擔(dān)心最終生成的圖像和其中幾張相似也太過于杞人憂天了。然而在最新一項以Stable Diffusion等AI擴(kuò)散生成模型為研究對象的實驗中,馬里蘭大學(xué)和紐約大學(xué)的聯(lián)合研究團(tuán)隊指出:利用Stable Diffusion模型生成的內(nèi)容與數(shù)據(jù)集作品相似度超過50%的可能性達(dá)到了1.88%。此外,考慮到實驗中樣本量只使用了 1200 萬張圖片和全世界龐大的用戶使用量,AIGC 作品的侵權(quán)行為很可能比我們想象中要大得多。(信息來源:騰訊研究院)

去年年底,國外藝術(shù)作品平臺 ArtStation 上的畫師們發(fā)起了聯(lián)合抵制 AI作品的活動,集體在官網(wǎng)打出“NO TO AI GENERATED IMAGES” 的標(biāo)語。作為職業(yè)畫師社交網(wǎng)站,它的存在本身就是為了展示繪畫創(chuàng)作者的創(chuàng)意和技法,提升自己的行業(yè)影響力,但是 AI 作品的出現(xiàn)打破了這種行業(yè)平衡。

三、AI侵權(quán)行為的判定標(biāo)準(zhǔn)

去年,紐約藝術(shù)家 Kashtanova 利用 Midjourney 創(chuàng)作了一份有 18 頁組成的漫畫書《Zarya of the Dawn》,并在 9 月為此申請了版權(quán)。然而到今年 2 月份的時候,美國版權(quán)局在了解到 K女士詳細(xì)的制作過程后進(jìn)行了回信并進(jìn)行了詳細(xì)說明,回信中的內(nèi)容總結(jié)來說就是:由 Midjourney 生成的作品并不由人類直接創(chuàng)作,所以不受版權(quán)保護(hù)。但是創(chuàng)作過程中的文字、收集的素材、元素排版、整理等工作內(nèi)容受版權(quán)的保護(hù)。

在回信中,美國版權(quán)局為此還進(jìn)行了詳細(xì)說明:首先 AI 生成圖像是隨機(jī)的,整個過程不像傳統(tǒng)創(chuàng)作那樣完全被創(chuàng)作者掌控。在創(chuàng)作過程中人類只是從AI生成的圖像中選擇了一個最合適的,期間并沒有人類主體創(chuàng)作的過程,雖然最后 K 女士有使用 Phootoshop 進(jìn)行修正,但是修改的內(nèi)容太少,也不屬于版權(quán)保護(hù)的范圍。此外用來生成圖像的關(guān)鍵詞本身也不具備版權(quán)保護(hù)。

在這個案例中我們可以發(fā)現(xiàn)目前來看國外官方對于 AI 版權(quán)的態(tài)度并不是全盤否定的,對于人類參與創(chuàng)作的部分還是保持肯定的。那我國目前在 AI 作品上是如何判定版權(quán)的呢?

根據(jù)李宗輝老師(南京航空航天大學(xué)網(wǎng)絡(luò)與人工智能法治研究院副院長)刊登在2022年第3期《版權(quán)理論與實務(wù)》的雜志文章《論人工智能繪畫中版權(quán)侵權(quán)的法律規(guī)制》中所述,目前我國版權(quán)法采用的是“思想與表達(dá)二分法”的基本原則,來作為判斷 AI 繪畫是否構(gòu)成侵權(quán)的指導(dǎo)依據(jù)。

打個比方,前面我們提到 AI 繪畫的 3 種方式時,其中對繪畫特征的提取、筆觸序列的提煉或者作品表達(dá)的情感這些還未落實成圖像的算法內(nèi)容,還是屬于作品的思想階段,并不會被判定為歸原作者版權(quán)所有。但是當(dāng)實際的圖像生成時,如果判斷AI 畫作是否與某一部作品構(gòu)成實質(zhì)性相似適宜采用部分比對法,與多部作品進(jìn)行判斷時則應(yīng)當(dāng)采納整體觀感法。而一旦比對結(jié)果構(gòu)成實質(zhì)性相似,即應(yīng)被認(rèn)為構(gòu)成復(fù)制侵權(quán)行為。

此外在生成圖像的使用用途上,也會檢測是否造成侵權(quán)。比如是完全商用還是適度飲用,是否會和原作品正常使用造成沖突,有沒有損害原作者的合法權(quán)益等。

我們綜合國內(nèi)外的解釋來看,目前的法律條文對于 AI 作品的版權(quán)界定主要停留在對創(chuàng)作者參與創(chuàng)作的比例以及相似度的主觀判斷上,對于參與多少可以受版權(quán)保護(hù)、相似度差異達(dá)到多少閾值的時候會判定為不侵權(quán)等問題還沒有非常具體的判斷條例。

這種情況也很正常,畢竟 AI 技術(shù)的發(fā)展過于迅速,當(dāng)前的法律條文還未來得及覆蓋人工智能領(lǐng)域的作品。但是我們作為 AIGC 技術(shù)的使用者需要意識到,在未來這段時間內(nèi)通過 AIGC 生產(chǎn)的內(nèi)容都存在對其他作品侵權(quán)的可能,同時自己的 AI 作品也不受版權(quán)保護(hù),隨時可能被其他人拿去使用。

不過我們也大可不必忽視 AIGC 的價值,完全抵制 AI 技術(shù)帶來的生產(chǎn)力革新,我們更應(yīng)該思考的是如何避免自己的 AI 作品產(chǎn)生侵權(quán)風(fēng)險,以及保障自己作品的合法權(quán)益。

四、如何合理使用AIGC

考慮到前面對侵權(quán)行為的判定標(biāo)準(zhǔn),未來我們在使用 AIGC 的過程中可以注意以下幾點:在工作中如果需要對 AI 作品商業(yè)化,需提前了解AI 工具平臺方相關(guān)的使用手冊或用戶協(xié)議等文件,明確產(chǎn)出內(nèi)容的所有權(quán)范圍和用途,避免后期產(chǎn)生法律糾紛。

此外不要直接的將 AI作品 作為自己的最終成果,而是將 AIGC 技術(shù)作為實現(xiàn)目的工具,在其中盡可能增加自己的創(chuàng)作痕跡和想法,比如先用Midjourney 等 AI 工具生成眾多風(fēng)格的效果圖,快速驗證自己的靈感和產(chǎn)品方向,再以此為參考進(jìn)行設(shè)計。這樣既保證了作品的原創(chuàng)比例,同時也是體現(xiàn)設(shè)計師作為設(shè)計主體的核心價值。

此外,如果想徹底杜絕被原作者舉證 AI 創(chuàng)作侵權(quán)的可能性,可以提前了解創(chuàng)作AI 模型的采集數(shù)據(jù)源,在使用參考圖創(chuàng)作后標(biāo)注原作來源或提前獲得原作者的授權(quán)。

以上是我們作為 AI 技術(shù)的使用者需要了解的一些事項。而 AI 技術(shù)的開發(fā)者和平臺方作為 AIGC 的最大受益者,更是需要擔(dān)負(fù)起人工智能侵權(quán)行為的主要責(zé)任。他們是 AI 技術(shù)控制權(quán)的主體,應(yīng)該主動公開說明使用過程中可能產(chǎn)生侵權(quán)風(fēng)險的行為,并對產(chǎn)生侵權(quán)行為的算法漏洞及時維護(hù)和修補,只有這樣才能真正保證 AIGC 技術(shù)做到互惠互利,持久發(fā)展。

五、總結(jié)

以上就是關(guān)于 AI 作品版權(quán)問題的現(xiàn)狀和給大家的一些建議。雖然目前 AI 侵權(quán)相關(guān)的法律條文還不成熟,需要經(jīng)過多方考量和求證,但是未來針對 AIGC 作品的具體規(guī)范文件出臺是大勢所趨。我們既要肯定 AIGC 技術(shù)帶來生產(chǎn)效率上的巨大提升,同時我們也要保證創(chuàng)作者的合法權(quán)益,畢竟版權(quán)保護(hù)的是每一位原創(chuàng)作者的勞動成果和智慧結(jié)晶,而不是人工智能本身。

本文由 @樂伊ROY 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于 CC0 協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 留言支持一下,感謝分享。

    來自廣東 回復(fù)