實(shí)測(cè)多家AI作畫(huà)平臺(tái),“五彩斑斕的黑”什么樣?如何助力內(nèi)容創(chuàng)作者?
AI繪畫(huà)在今年可謂是大火,而前段時(shí)間AI作畫(huà)平臺(tái)生成的作品獲得大獎(jiǎng)一事,則更是將AI繪畫(huà)這件事擺在了眾人面前,不少人也因此擔(dān)心AI繪畫(huà)是否會(huì)對(duì)創(chuàng)作者們帶來(lái)不好的影響。那么,現(xiàn)在的AI作畫(huà)平臺(tái)是否可以完全地替代創(chuàng)作者?不如來(lái)看看本文的測(cè)評(píng)分析吧。
今年AI作畫(huà)在人工智能領(lǐng)域大放異彩,徹底火了。
Midjourney、DALL·E 2、Imagen和Stable Diffusion等四大代表性的AI作畫(huà)平臺(tái)都誕生于今年。
事實(shí)上,AI作畫(huà)在幾年前就已經(jīng)出現(xiàn),也有不少科技巨頭參與其中。而今年爆火出圈,可能與Stable Diffusion有很大關(guān)系。
不同于其他平臺(tái),今年8月份Stable Diffusion正式發(fā)布,它對(duì)用戶免費(fèi)、開(kāi)源,上手也幾乎沒(méi)有門(mén)檻,引發(fā)了AI作畫(huà)的熱潮。
9月份,由AI作畫(huà)平臺(tái)Midjourney生成AI作品《太空歌劇院》獲得了比賽一等獎(jiǎng),又在國(guó)內(nèi)外掀起了對(duì)AI的大討論。
在資本市場(chǎng),多家AI生成內(nèi)容企業(yè)上個(gè)月宣布獲得過(guò)億美元融資。
比如Stable Diffusion背后公司的Stability AI宣布獲得1.01億美元融資,投后估值達(dá)10億美元。AI內(nèi)容創(chuàng)作平臺(tái)Jasper也宣布獲得1.25億美元首輪融資,估值達(dá)15億美元 。
那么,AI創(chuàng)作那么火,對(duì)于內(nèi)容創(chuàng)作者,又能有怎樣的幫助呢?
一、AI作畫(huà)效果如何?實(shí)測(cè)國(guó)內(nèi)外AI作畫(huà)平臺(tái)
AI作畫(huà)雖然火,但是這畢竟還是一個(gè)小眾應(yīng)用。它是如何生成的,操作難度大,效果如何,這些問(wèn)題都擺在眼前。
另外對(duì)于自媒體來(lái)說(shuō),這些圖片能不能用,能不能免費(fèi)使用更值得關(guān)注。
為了測(cè)試更加全面,筆者選取了國(guó)內(nèi)外4個(gè)平臺(tái)測(cè)試,其中國(guó)內(nèi)2個(gè),國(guó)外2個(gè),它們都是免費(fèi)使用。
其中國(guó)外的平臺(tái)就包括大火的stable-diffusion,以及另一個(gè)平臺(tái)dreamstudio。
其實(shí)筆者也嘗試過(guò)Midjourney、DALL·E 2等平臺(tái),但這些國(guó)外平臺(tái)有不少限制,使用起來(lái)比較麻煩。
國(guó)內(nèi)的平臺(tái)選擇的是百度的文心一格,和另一個(gè)名為draft的平臺(tái)。
相比而言,中文平臺(tái)的便利那就不用多說(shuō)了。在可玩性方面,國(guó)內(nèi)平臺(tái)顯然更勝一籌。
筆者測(cè)試的這兩個(gè)國(guó)外平臺(tái)在可定制化方面只有最基礎(chǔ)的設(shè)置。一般是圖像的寬度、高度、匹配精度和生成圖像的步數(shù)。
而國(guó)內(nèi)的平臺(tái)則提供了更多風(fēng)格化的設(shè)置選項(xiàng),可以進(jìn)行多種風(fēng)格圖片的生成。
比如文心可以提供多達(dá)13種風(fēng)格,包括平面類、原畫(huà)類、傳統(tǒng)類等,每種風(fēng)格生產(chǎn)的效果差別還是比較明顯的。
筆者用關(guān)鍵詞“宇宙中扭曲的空間與黑洞”試了一組,風(fēng)格分別為原畫(huà)概念插畫(huà)、傳統(tǒng)中國(guó)風(fēng)、趣味梵高。結(jié)果如下:
另外百度文心還有高級(jí)自定義設(shè)置,能夠?qū)ι蓞?shù)進(jìn)一步做出細(xì)化設(shè)置,比如畫(huà)面風(fēng)格、修飾詞、藝術(shù)家風(fēng)格等等。
另外一家國(guó)內(nèi)平臺(tái)也有較為豐富的風(fēng)格選擇,另外還可以選擇參考底圖。
AI作畫(huà)平臺(tái)的操作邏輯一般都是用戶給出文字內(nèi)容,然后AI根據(jù)內(nèi)容自動(dòng)生成圖像。所以操作上還是比較簡(jiǎn)單的。
為了有一定的樣本量,筆者選取了15組詞句,其中有單詞,也有詞組和句子。國(guó)外平臺(tái)使用英文測(cè)試。
每個(gè)文字內(nèi)容在4個(gè)平臺(tái)各生成1張圖片,4張圖片為一組,共計(jì)16組。具體的測(cè)試結(jié)果如下:
1)五彩斑斕的黑
2)佛跳墻
3)割韭菜
4)寶馬奔馳
5)天使般的微笑,女孩
6)冬天的湖邊,跑步,陽(yáng)光
7)樹(shù)葉在風(fēng)中飛舞,秋天
8)櫥窗里的高跟鞋
9)天上掉下蘋(píng)果,牛頓
10)天堂,云,飛機(jī)
11)騎馬,草原,男人
12)深海,停車場(chǎng),燈光
13)圣誕老人的自畫(huà)像
14)棉花糖,從天而降
15)睡醒,寶寶,哭泣
16)我想和家人一起環(huán)游世界
總體來(lái)看,4個(gè)平臺(tái)輸出的圖片都還算正常,基本沒(méi)有那種特別奇怪的。但是具體的風(fēng)格卻有很大不同。
能夠看出國(guó)外的兩個(gè)平臺(tái)更追求真實(shí)感,畫(huà)面風(fēng)格偏寫(xiě)實(shí),色彩比較豐富。而百度文心一格和draft的藝術(shù)感和創(chuàng)造性更強(qiáng),更偏設(shè)計(jì)。
從畫(huà)面和文字的相關(guān)性上看,國(guó)外那兩家以及百度文心基本都能完整展現(xiàn)文字主要元素。而draft的相關(guān)性則相比要低很多,不過(guò)也在可接受的范圍內(nèi)。
國(guó)外兩個(gè)平臺(tái)勝在真實(shí)感上,而國(guó)內(nèi)平臺(tái)則有更加多變、風(fēng)格的效果,可玩性較強(qiáng)。
如果站在自媒體的角度來(lái)看,國(guó)外的兩個(gè)平臺(tái)的作品可能更適合文章配圖。而國(guó)內(nèi)的兩家的更偏藝術(shù)創(chuàng)作。
但寫(xiě)實(shí)也僅僅是更有真實(shí)感而已,其還是拼湊而成的圖像,很難復(fù)刻真實(shí)世界的圖像。
另外就是,國(guó)內(nèi)平臺(tái)有本土化優(yōu)勢(shì),對(duì)于外語(yǔ)水平不高的人比較友好。但實(shí)際上,一些國(guó)外平臺(tái)也很容易操作。
另外需要注意的是,每個(gè)平臺(tái)的圖像生成都具有隨機(jī)性。即使是同樣的關(guān)鍵詞,重新生成的結(jié)果也會(huì)不同。
所以如果想要具有相同特征的系列作品,可能就要看運(yùn)氣了。
如果對(duì)生成的圖不滿意,并不能實(shí)時(shí)修改,只能再次生成,但保不準(zhǔn)下次的圖就完全另一個(gè)樣了。
或許是國(guó)內(nèi)平臺(tái)更偏重創(chuàng)作,需要更多計(jì)算,所以出圖速度沒(méi)有國(guó)外的兩個(gè)平臺(tái)快。具體來(lái)說(shuō),百度文心和draft差不多在一分鐘以上,具體速度還要看實(shí)際情況。而國(guó)外兩個(gè)平臺(tái)基本都是10S以內(nèi)出圖。
總體而言,幾個(gè)平臺(tái)使用下來(lái),都挺簡(jiǎn)單的,初期也不收費(fèi)。但是一些平臺(tái)的免費(fèi)額度是有限的,這點(diǎn)要注意。
至于效果,筆者個(gè)人認(rèn)為還不錯(cuò)。別管是寫(xiě)實(shí)風(fēng)格,還是各種藝術(shù)風(fēng)格,都滿足最基礎(chǔ)的要求,關(guān)鍵看具體的用途。
不過(guò),還有一個(gè)問(wèn)題也讓人困擾,那就是AI作畫(huà)的作品版權(quán)到底屬于誰(shuí)?屬于平臺(tái)還是個(gè)人?自媒體人用在了內(nèi)容中,會(huì)不會(huì)被找?
二、AI作畫(huà)作品屬于誰(shuí)?版權(quán)風(fēng)險(xiǎn)難忽視
別看AI作畫(huà)操作起來(lái)還是比較容易,但是背后的算法其實(shí)比較復(fù)雜。
AI作畫(huà)簡(jiǎn)單理解就是,機(jī)器通過(guò)對(duì)”語(yǔ)言描述”的理解自動(dòng)生成圖像。也就是計(jì)算機(jī)經(jīng)過(guò)大量分類、識(shí)別已有圖像,再根據(jù)關(guān)鍵詞匹配和“縫合”,最終生成一幅隨機(jī)的、世界上獨(dú)一無(wú)二的AI畫(huà)作。
也就是AI作畫(huà)的背后是對(duì)大量真實(shí)圖像的學(xué)習(xí),需要龐大的圖像庫(kù)進(jìn)行積累。而我們看到所謂的不同的風(fēng)格,則是由于圖像庫(kù)的不同而產(chǎn)生的。
在這個(gè)基礎(chǔ)上,我們?cè)偃タ碅I作畫(huà)的版權(quán)問(wèn)題會(huì)比較全面。
用AI生成一張不存在的畫(huà),按照人直覺(jué)去看,這張機(jī)器生成的圖應(yīng)該沒(méi)有版權(quán)。因?yàn)榇蠹叶伎梢陨?,并沒(méi)有獨(dú)創(chuàng)性,一切都是AI完成的。
事實(shí)上,目前主流的觀點(diǎn)的是用戶對(duì)自己生成的圖片可以在合法合規(guī)的前提下自由使用,可以復(fù)制、二次創(chuàng)作,也可以用作商業(yè)用途。
筆者測(cè)試的4個(gè)平臺(tái),對(duì)于作品的版權(quán)問(wèn)題,都有明確的聲明。
百度文心一格指出,用戶消耗電量(電量是一種消耗憑證,可以免費(fèi)或付費(fèi)獲得),使用平臺(tái)AI創(chuàng)作生成的圖片,經(jīng)過(guò)審核支持下載,允許個(gè)人使用和合法合規(guī)范圍內(nèi)商用用途。
draft是基于stable diffusion開(kāi)源平臺(tái)開(kāi)發(fā)的,兩者的版權(quán)規(guī)定一致。即用戶對(duì)生成的素材也可以進(jìn)行任何形式的復(fù)制、分發(fā)、引用,或者商業(yè)用途,但必須在使用或公開(kāi)時(shí)進(jìn)行署名并標(biāo)明是否對(duì)原作品進(jìn)行過(guò)修改。
另外一個(gè)國(guó)外平臺(tái)dreamstudio版權(quán)協(xié)議也指出,用戶創(chuàng)建的圖像是完全開(kāi)源的,默認(rèn)將作品貢獻(xiàn)至公共領(lǐng)域,也就是放棄所謂的版權(quán),任何人都可以使用,甚至商用。
從各個(gè)平臺(tái)的規(guī)定,我們能夠看出,目前AI作畫(huà)的版權(quán)歸屬問(wèn)題并不明確。創(chuàng)作者在合法合規(guī)范圍內(nèi)可以使用,甚至商用,但是否有獨(dú)一性,也就是其他人是否可用并不清晰。
而且事實(shí)上,因?yàn)槠脚_(tái)是基于大量的圖像庫(kù)進(jìn)行訓(xùn)練,其實(shí)有一定侵權(quán)的隱患。
比如圖像庫(kù)中涉及到有版權(quán)的圖像,而用戶生成的圖片恰好顯示了上述圖像的顯著部分,這可能涉及到侵權(quán)。
比如有報(bào)道指出,Stable Diffusion生成的一些圖像似乎帶有水印,這表明它的原始訓(xùn)練數(shù)據(jù)集中可能有一部分圖像是受版權(quán)保護(hù)的。
為了避免版權(quán)問(wèn)題,Getty Images、Shutterstock等知名付費(fèi)圖庫(kù)紛紛封禁AI生成圖片,停止接收所有由Stable Diffusion、DALL·E 2、Midjourney等AI模型生成的畫(huà)作。
付費(fèi)圖庫(kù)封禁AI生成圖片,一是因?yàn)锳I生成圖片的版權(quán)唯一性很難確定。二是AI作畫(huà)可以模仿藝術(shù)家風(fēng)格,這極可能涉嫌侵權(quán),也可能產(chǎn)生造假或抄襲行為。
別人用數(shù)十年形成的獨(dú)特風(fēng)格,被AI輕松模仿,這其實(shí)很可能涉嫌侵權(quán)。另外,也可能滋生造假行為。
還有種比較特殊的情況,比如藝術(shù)家正在創(chuàng)作一幅作品,已經(jīng)完成了其中的一半,而有人利用這一半生成完整的AI作品,這又算不算剽竊呢?
可以說(shuō),AI作畫(huà)目前的版權(quán)問(wèn)題還比較模糊,更多只能停留在科學(xué)研究或自?shī)首詷?lè)的范疇,如果商用就很可能有版權(quán)風(fēng)險(xiǎn)。
而隨著AI作畫(huà)商業(yè)化平臺(tái)的不斷發(fā)展,相信版權(quán)問(wèn)題逐漸會(huì)有比較清晰的答案。
三、AI內(nèi)容創(chuàng)作道阻且長(zhǎng)
AI作畫(huà)是一種AI創(chuàng)作,但從廣泛意義上講,AI創(chuàng)作早已遍布我們生活工作的方方面面。
比如一些媒體的自動(dòng)寫(xiě)稿機(jī)器人,一些資訊平臺(tái)的自動(dòng)視頻生成,還有虛擬主播和數(shù)字人,以及各種大型活動(dòng)的在線實(shí)時(shí)機(jī)器翻譯。
AI創(chuàng)作就是AI+內(nèi)容,這個(gè)內(nèi)容可以是圖像、文本、視頻,也可以是音頻,甚至是交互。
幾乎所有的內(nèi)容平臺(tái)都少不了AI創(chuàng)作的身影,這背后反映了內(nèi)容生產(chǎn)智能化的大趨勢(shì)。
從PC互聯(lián)網(wǎng)的PGC(專業(yè)內(nèi)容生產(chǎn)),到移動(dòng)互聯(lián)網(wǎng)的UGC(用戶生產(chǎn)內(nèi)容),內(nèi)容生產(chǎn)方式正在向新的AIGC(AI內(nèi)容生產(chǎn))發(fā)展。
對(duì)于AIGC發(fā)展階段,李彥宏判斷AIGC將迎來(lái)三個(gè)發(fā)展階段:“助手階段”,AIGC輔助人類進(jìn)行內(nèi)容生產(chǎn);“協(xié)作階段”,AIGC以虛實(shí)并存的虛擬人形態(tài)出現(xiàn),形成人機(jī)共生的局面;“原創(chuàng)階段”,AIGC將獨(dú)立完成內(nèi)容創(chuàng)作。
隨著Web3.0時(shí)代和元宇宙的火熱,對(duì)內(nèi)容產(chǎn)生方式和效率都有了新的要求,未來(lái)AIGC將在元宇宙內(nèi)容生成中起到重要作用。
目前來(lái)說(shuō),AIGC更多是在前兩個(gè)階段。以AI作畫(huà)為例,現(xiàn)在除了一部分畫(huà)師利用AI協(xié)同創(chuàng)作作品,更多還是作為內(nèi)容創(chuàng)作者的一種靈感補(bǔ)充,或者為文字工作者快速提供配圖需求。
而隨著AI內(nèi)容創(chuàng)作的不斷進(jìn)化,未來(lái)創(chuàng)作者和AI又該是怎樣一種關(guān)系?
其實(shí)關(guān)于AI的討論中,人是否能被AI替代一直是一個(gè)重要議題。目前來(lái)看,AI在很多領(lǐng)域都只是人的輔助工具,在內(nèi)容創(chuàng)作上AI還像個(gè)剛剛學(xué)會(huì)走路的孩子。
AI創(chuàng)作如何更好的服務(wù)于創(chuàng)作,這是很長(zhǎng)一段時(shí)間需要探索的方向。
首先,內(nèi)容創(chuàng)作者面臨的棘手問(wèn)題便是AI創(chuàng)作的版權(quán)歸屬問(wèn)題。
其次,AI工具存在被濫用的風(fēng)險(xiǎn),如何規(guī)范創(chuàng)作者使用,哪些領(lǐng)域可以用,哪些場(chǎng)合不能用,都還需要慢慢探索。
而站在更長(zhǎng)遠(yuǎn)的視角看,AI與人又該是怎樣的關(guān)系?百度李彥宏曾提出AI倫理四原則:安全可控;促進(jìn)公平公正,增進(jìn)人類福祉;讓人成長(zhǎng)而不是取代人;為人類帶來(lái)更多自由和可能。
作者:三言
來(lái)源公眾號(hào):三言Pro(ID:sycaijing),提供新科技、新消費(fèi)、新未來(lái)的前沿資訊。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @三言財(cái)經(jīng) 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
使用門(mén)檻還是比較高,需要花不少時(shí)間訓(xùn)練自己提示詞能力
雖然AI繪畫(huà)很厲害,但是他是沒(méi)有意識(shí)的,人之所以能將一件作品做好,是因?yàn)槿耸怯懈星楹鸵庾R(shí)的
不得不說(shuō)ai作畫(huà)做得很厲害,雖然我不懂藝術(shù),但是也能人們方便不少吧,希望推廣起來(lái)