AI繪畫正在逐漸取代中底層畫師?
在過去的幾年里,人工智能取得了極快的發展,其中包括基于機器學習和深度學習的「圖像生成技術」。運用該技術,只需輸入文本語句就可輸出具有獨特風格和想象力的圖像。面對AI繪圖這個勢不可擋的趨勢,設計從業者們,是否做好準備了呢?
在過去的幾年里,人工智能(AI)取得了極快的發展。
ChatGPT和GPT-4對話上的智能程度在不斷刷新常人的認知,給大眾帶來了驚人的體驗與驚嘆。
同期發展的AI技術,還有基于機器學習和深度學習的「圖像生成技術」。
該技術能夠讓計算機在一定程度上模擬人類進行繪畫,用戶只需輸入文本語句(prompt提示)就可輸出具有獨特風格和想象力的圖像。
文本->圖像,AI繪畫,指的就是這個過程。
隨著大眾對于AI繪畫關注度的升溫,相關的爭議不斷,有人開始提出「AI取代畫師」的觀點。
面對AI繪畫這個勢不可擋的趨勢,設計從業者們,是否做好了準備?
一、AI繪畫,高效無情的出圖機器
2022年8月,在美國科羅拉多州藝術博覽會上一幅名為《太空歌劇院》的畫作在數字藝術類別比賽中獲得了第一。
由AI繪制的《太空歌劇院》
人們也很快得知,這個畫作并非真人繪制,而是由游戲設計師使用一個叫Midjourney的AI工具生成而來。
隨著這則新聞的傳播,AI繪畫也開始進入更多人的視野。
1. 國外知名的AI繪畫工具
下面先介紹幾個國外具有代表性的AI繪畫工具:
1)DALL·E2
DALL·E2 是一個由 OpenAI 公司開發的模型,也是一個在線服務。它通過輸入一個文本描述(prompt提示)生成多個精準匹配文本的圖像。
DALL·E2 結合“CLIP 預訓練模型”和“Diffusion擴散模型”來實現了文本->圖像(text-to-image)的生成。
擴散模型運行時的成像過程,就是一個“Diffusion 擴散”的過程——
從有噪聲開始->逐漸改善圖像->直到完全沒有噪聲->圖像越來越接近所提供的文本描述。
DALL·E2 還有一個的特別的功能是“AI編輯”,可以在生成的圖片上涂抹某些部分再讓 AI 直接修改。
DALL·E2 只使用了已獲授權的圖片集來進行訓練。
2)Stable Diffusion
Stable Diffusion 模型,前身是谷歌開源的 Disco Diffusion 模型。
Stable Diffusion 模型也結合了CLIP技術(OpenAI發布的技術)和Diffusion擴散模型,同樣是通過輸入文本(prompt提示)來生成圖像。
比較特別的是, Stable Diffusion 是一個開源的模型,很多開發者基于這個開源模型開發訓練出了更多不同的生成模型。
Stable Diffusion 的母公司Stability AI 在2022年10月宣布獲得1.01億美元融資,投后估值達10億美元。
3)Midjourney
Midjourney由同名實驗室開發,和大部分市面上的AI繪畫應用采用的是同一個模型,但是模型使用了大量圖像數據來訓練。
Midjourney在生成圖片的一致性和連貫性上做了很多努力,它生成的圖像風格十分獨特。
Midjourney幾乎所有的生成和交互都發生在Discord社區里,使用其Discord機器人來接收請求和發送生成結果。
3種繪畫工具的對比:我們進行測試,對于同樣一句文本(其他參數默認的情況下),這3種繪圖工具的圖片生成效果。
輸入文本:
An old man rowing a boat on a lake.
AI生成的圖片:
收費標準:
3種繪畫工具的體驗地址:
①Stable Diffusion
Dream Studio:https://beta.dreamstudio.ai/dream
Hugging Face(免費): https://huggingface.co/spaces/stabilityai/stable-diffusion
②DALL·E2
https://openai.com/dall-e-2/
CLIP:https://openai.com/blog/clip/
③Midjourney
https://www.midjourney.com/home/
(注:某些服務只對部分國家開放)
Midjourney的效果更具藝術感:
對比生成效果可以明顯看出,Midjourney生成的圖像不太像照片,似乎更像一幅藝術畫作。
在Discord社區里運作的Midjourney社區 ,因為其具有藝術感且畫面注重細節的生成效果,收獲了全球近千萬用戶,在線用戶也是百萬等級。
在社區頻道里,用戶僅僅需要使用/喚起命令行操作,在/imagine命令下輸入prompt文本發送即可。
以下是輸入簡單文本后,Midjourney生成的圖像:
效果如此驚艷的生成圖片,只需幾十秒內就能得到。
2. 國內的AI繪畫產品
國內也相繼出現了類似的AI繪畫產品,幾乎都有免費嘗試的額度,通常支持多種風格/藝術家/模型。
以下是國內提供AI繪畫服務的一些產品:
隨著技術的逐漸普及和越來越高的熱度,AIGC似乎就不再是大眾試水畫圖畫著玩兒的一個小工具。
這個“高效無情的出圖機器”,似乎已經開始在影響和撬動設計行業的變革。
二、設計行業 X AIGC
1. 游戲制作× AIGC
很多游戲項目,開始利用AIGC生產游戲相關素材。
1)國外游戲工作室 Lost Lore《Bearverse》游戲
國外游戲工作室 Lost Lore 出品的主打 NFT 集換概念的F2P游戲《Bearverse》包含了大量的角色設計。
游戲工作室直言:采用AI畫圖節省了80%美術成本!
①17名角色的調整:
開發成本:從5萬美元壓縮至1萬美元;
工時耗費:從6個月大幅減少至1個月。
②創作一張場景概念圖:
工時耗費:從1-2周壓縮至1天以內。
設計總監最后也坦言:
95%的效果和概念圖呈現仍是由團隊真人創作。
2. 商業設計 ×AIGC
大廠團隊已經不甘觀望,開始了AIGC在商業設計工作流中的實踐。
1)騰訊-ISUX團隊
騰訊的ISUX團隊2023年3月1日剛剛發表在其官網的文章《運用AIGC人工智能生產內容》。
https://isux.tencent.com/articles/aigc-design.html
文中提到了騰訊的ISUX團隊運用AIGC進行商業設計的好幾個案例,并進行了結合使用AIGC后設計團隊的全新工作流的方法總結。
2)百度-AIGC營銷賦能業務
百度也在試圖利用AIGC滿足商業設計上的需求。
百度發布了AIGC方向的產品負責人崗位,負責比如“商業廣告平臺部的內容生產相關工具的規劃和落地”。
3. 個人頭像設計× AIGC
1)國外的AI美圖軟件Lensa「魔法頭像」功能
「魔法頭像」是Lensa基于Stable Diffusion技術開發的頭像生成功能,用戶上傳10-20張自拍照,能生成50~200張不同風格的AI自畫像/頭像。
生成50/100/200張的價格分別是:3.99/5.99/7.99 美元。
因為這項新功能的加入,2022年12月的前5天,Lensa下載量達到400多萬次,“日收入”也一度達到了300萬美元。
2)美圖秀秀「百變 AI 頭像 」功能
同樣是美圖軟件的國內團隊——美圖秀秀,也隨機發布了相似的功能。
從產品定位來看,也是輸入真人頭像就能批量地獲得多種風格的頭像。
和國外的AI美圖軟件Lensa相比,美圖秀秀對于用戶的輸入門檻要求更低一些,只需要提供3張正臉無遮擋自拍照即可。
3)抖音「AI繪畫」特效
繼2021年的「漫畫臉」特效(基于GAN技術)后,2022年抖音又上線了特效玩法「AI繪畫」(基于Stable Diffusion技術)。
用戶只要輸入一張圖片,AI就會根據圖片生成一張動漫風格的圖片。
抖音「AI繪畫」功能的的峰值QPS(每秒請求量)一度達到1.4w。
4)QQ小世界AI畫匠
騰訊QQ上線了“QQ小世界AI畫匠”活動,主題為“異次元的我”。
用戶上傳1張個人照片,即可一鍵生成專屬異次元形象。
4. 動畫背景× AIGC
1)國產志怪類動畫《神弦曲:貓兒與時光鈴鐺》
由十九號動漫出品的國產志怪類動畫《神弦曲:貓兒與時光鈴鐺》將于明年上映。官方在2022年12月發布了預告片。
主創團隊稱,預告片三分之二的背景都是結合AI制作完成的。
制作預告片中的30多個背景,工時耗費從3個月降到2個月,效率上提升了至少30%。
主創在采訪中提到:“有了這樣的一個技術,把我們的預算從一個標準動畫電影預算直接減半,我們就快速地獲得了一些投資機會。”
5. 視頻制作× AIGC
除了繪畫領域外,AIGC也在動態的視頻生成上有了很多突破。
1)Runway 新功能:視頻轉風格生成器 GEN 1
Runway AI 是一家圖片和視頻AI編輯軟件提供商,為設計師、藝術家和開發人員提供一系列工具的平臺,幫助他們利用人工智能技術創建作品。
Runway 平臺推出了新功能 —— 把視頻轉換成任意風格的生成器 GEN 1。
GEN 1 這個能力和圖生圖功能(image-to-image)類似,只是變成了從視頻到視頻(video-to-video)的生成。
https://research.runwayml.com/gen1
看起來, GEN 1 是一個支持用戶可訂制化的視頻濾鏡的能力。
而定制化的方式極為簡單,只需一張具有風格的圖片。
2)Wonder Studio:一鍵替換真人為CG角色
這款由一家人工智能初創公司Wonder Dynamics推出的AI工具Wonder Studio,聲稱可以實現「一鍵把視頻中的真人替換為CG角色」,簡化電影制作流程。
https://wonderdynamics.com/
整個工具的使用流程大概是:
- 真人先替代CG機器人進行表演
- 視頻拍攝完成,導入進軟件
- 選擇想要的CG角色,安裝在實拍的真人身上
目前官方網站上開放了內測申請。
三、AI繪畫的爭議
在設計行業中,很多人的對于AI繪畫的態度,都是不怎么正面的,主要集中在幾點:
- 從業者的擔憂
- 版權
- 學習信心的打擊
爭議1:從業者的擔憂
在AIGC生成繪畫能力效率和質量皆可的前提下,中底層畫師好像確實慢慢就不需要那么多了……
- 論出圖速度:人趕不上機器的出圖速度;
- 論出圖創意:AI 可以生成出關鍵元素外的細節,似乎更為驚喜;
- 論風格效果:AI 能訓練出不同的繪畫模型,對應不同畫風;
輸入相同的一段prompt文本后,不同的模型可以生成出不同風格的圖片,且速度極快,通常是幾秒~20秒內不等:
除了想要的關鍵元素外,生成圖片中還包含更多精彩的細節描繪。
結合AI批量生成的能力,很多繪畫需求,似乎只靠AI就都被高效地滿足了。
隨著AI作畫的部署成本逐漸降低,一些中小企業和初創團隊,也開始有能力在通用大模型的基礎上進行模型的調教、設計師崗位的精減。
令從業者最擔心的事情就是:
當AI繪畫工具具備了一定繪畫能力,也就同時具備了“搶人類設計師飯碗”的能力。
爭議2:版權
我們在AI繪畫出的作品中能看到很多有明顯風格的影子。
也可以直白地說,一些AI繪畫模型的訓練數據中,有著很多未經明確授權的畫師作品。
AI繪畫侵犯了畫師的版權,也開始遭到畫師們的集體抵制。
2022年8月29日,一個名叫mimic的AI繪畫網站上線了測試版,主攻日系二次元畫風頭像,允許用戶上傳15-200張圖像讓AI學習并輸出相同畫風的AI畫作。沒想到剛發布便遭到大量日本畫師的抵制,畫師們集體發表了“禁止將我的作品用于AI作畫”的聲明。有的畫師為了防范于未然,甚至刪除了發在推特上的畫作,怕有心之人盜用上傳至平臺使用。
2022年12月,全球知名CG視覺藝術網站 Art Station也被上千名畫師發起了聯合抵制,畫師們認為,任由系統學習模仿自己的畫作是在侵犯版權。網站畫師紛紛上傳一張名為“NO TO AI GENERATED IMAGES(拒絕AI繪畫)”的圖片表明態度,首頁一度被此圖片占領。
對于畫師們來說:
自己的畫風,是獨屬于自己的獨特標志和可貴財產。如果讓AI簡單地模仿自己畫風來作畫,那無疑是對獨有藝術的糟蹋。
即便有的畫師愿意提供自己的繪畫作為模型的訓練數據,但似乎他/她們也沒有收到任何版權上的收益。
AIGC產出的畫作的版權歸屬于誰,成了關注和爭議的話題。
爭議3:打擊小白學繪畫的信心
AI 繪畫的強勢碾壓的能力,似乎也打擊到了不少繪畫小白從零開始學繪畫的信心。
有的人會感嘆:
既然AI幾天就能學到做到那么好的效果了,自己再花費數年去學習,還有沒有必要…
四、AI 繪畫的短板
AI繪畫當然不是全能的,也永遠不會是。至今的AI繪畫也還存在著眾多短板。
短板1:AI 無法準確還原想象中的創意
AI繪畫的確具有非常強大的創造力和想象力。但這樣的創造力和想象力,其實是一種「快速隨機」的結果。
效果既受限于算法、數據的質量和數量,也受限于用戶對于prompt的運用。
人類的創造力和想象力仍然具有獨特的價值,想要AI生成還原出來十分貼合人腦想象中的創意,是很有難度的。
不少嘗試了MidJourney進行AI繪畫的人表示:
AI生成的圖片效果確實是不錯,但都并不是我腦海中想象的那個樣子。
甚至,AI會理解失誤,生成“離譜圖片”:
輸入的文本是:一個小女孩,一手拿著冰淇淋,一手牽著氣球,走在公園里。
AI生成出的卻是——“冰淇淋氣球”。
短板2:AI 繪圖還不足夠滿足個性化需求
AI 繪圖是很強,但是還不足以滿足個性化需求。比如:
- 針對不同場景類型進行統一且又獨具個性的設計;
- 穩定一個主體使之在每一次生成結果中都保持成套效果;
以上能力的欠缺,使得AI無法高效地完成“成系列的商業設計”。
五、AI繪畫的未來
盡管很多設計從業者對于AI繪畫表示焦慮,但作者判斷:未來很長一段時間內,大部分行業可能只會把AI繪畫當成一個「輔助工具」來用。
前期,大家在拼AI的效率;后期,則是拼人工優化AI的能力。
人工優化AI能力,可以從以下3個方向出發。
優化AI方向1:AI 模型的定制
想要模型更穩定地產出特定風格的繪畫圖片,可以定制出一個AI模型。
但AI模型的定制的門檻比較高,通常至少需要一個設計師搭配一個算法工程師來實現,而涉及到模型訓練的過程,則需要工程部署能力、硬件顯卡的支持。
模型訓練出的效果也取決于多個因素,比如:訓練素材、模型選型、參數設置、訓練方法等。
優化AI方向2:會用 prompt “咒語”
我們可以把“prompt”理解為“送給AI模型的文本指令”。
輸入高質量有效的prompt,可以大幅度提升AI繪圖的穩定度,讓成圖更加接近我們的描述。
prompt輸入的格式通??梢允且韵聝热莸囊粋€組合:
prompt文本輸入=[形容詞+主語 / 主語+狀語],[背景],[畫面類型],[風格/藝術家],[燈光/色調],[視角/修飾詞],[細節],[畫面質量]
因為這一體驗過于神奇,很多人不禁將prompt形容為“咒語”。
在市場上,還出現了買賣prompt詞的平臺:一家初創公司PromptBase,允許用戶在該平臺買賣提示詞(Prompt),售價約為1.99美元~9.99美元不等。PromptBase將向賣家抽成20%。
平臺上目前已上架不少提示詞,適合不同模型、不同種類。
而在學術上,也有所謂“prompt engineering” 即“ prompt 工程”的說法。
提示工程(prompt engineering):如何同人工智能交流,并得到你要的結果。
https://learnprompting.org/docs/intro
優化AI方向3:靈活組合模型,優化工作流
因為AI繪畫工具的介入,現有設計的工作流程將隨之而改變,整合誕生了全新的工作流:
AI繪畫先進行生成-> 再從AI生成的十幾張結果中挑選用作局部素材->再利用PS或其他工具精修處理
隨著AI繪畫相關的新技術不斷出現,其AI繪畫的工作流也需要隨著新的技術來優化,進化為更適合的工作流。
比如,當發現了「根據圖片提取prompt」的新技術后,可結合這個新技術優化設計工作流。
結合了「提取prompt」的設計工作流,也許就變成了這樣:
再比如,當發現了出現「ControlNet插件」的新技術后,可結合這個新技術再次優化設計工作流。
ControlNet插件:可以完成對人物骨骼走勢、形態、動作、姿勢的精確控制。
結合了「ControlNet插件」OpenPose模塊的設計工作流,也許就變成了這樣:
以上提到的“人工優化AI能力”,第1點“AI模型定制”門檻較高,需要一定技術和硬件。
但“prompt實踐”、“設計流程優化”,都是現今設計從業者可以探索和實踐的方式。
六、畫師的命運:等著被取代,還是轉型?
我們經??吹揭恍┬碌腁I技術應用的效果出現后,很多人立馬開始感嘆:AI搶飯碗了、AI取代設計師、失業倒計時+1……
AI繪畫的能力不容忽視,但它也不是萬能的。
AI解決了生成效率,能在一定流程上減少一部分工作量。但又因為AI繪畫引入了新的工作流,同時會創造新的工作量。
相應地,一些新的就業崗位也會增加,比如現在就有俗稱為“AI調教師”的一種存在。
在某些繪畫領域中,也已經有了“AI插圖繪制師”、“AI繪圖師”的人力需求:
以下,也許是“AI繪圖師”可以貢獻的能力:
- 繪制優質的訓練素材供模型學習
- 高效地使用prompt,測試出穩定的生成效果
- 將“生成結果的質量好壞”準確地反饋給算法(人類反饋強化學習RLHF)
- 結合AI技術,優化設計工作流
AIGC勢不可擋,那些率先學習如何用AI進行美術工作的人,將會發現自己處于行業的頂端。
畢竟,差異化競爭的關鍵,就是讓自己掌握“差異化的優勢”。
截圖源自Aisocia.com平臺的AI對話
結語
借用一段“騰訊ISUX團隊”文章中的結語:
隨著AI模型能力的飛速迭代升級,現有的短板能力也會不斷補齊,因此我們可以相信在不遠的將來,設計師利用AI模型來開腦洞并輔助出圖是趨勢所向,但并不是說我們需要完全依賴AI,因為設計本身是理性而浪漫的工作,僅靠隨機性做設計是完全不可取且不靠譜的。更合適的思路應該是,設計師首先定義好規則與框架,從AI模型提供的成百上千個結果中尋找到最匹配我們訴求的結果,從而輔助我們更快更好的達成目標。另外面對日新月異的的智能工具,我們應該保持終生學習的心態,做好時刻接受新事物的挑戰,才能在越來越激烈的競爭中立于不敗之地。——《運用AIGC人工智能生產內容》
AI繪畫,還僅僅是AI技術應用的其中一環。未來,AI將涉足3D模型生成、AI視頻創作、AI作曲等領域。
更多AI能力也會發展,就像現在的AI繪畫一樣,影響和撬動相關行業的變革。
AI繪畫會取代所有畫師嗎?不可能。
AI繪畫會逐漸取代中底層畫師嗎?不無可能。
留給從業者的忠告,還是那句話:保持終生學習的心態,做好時刻接受新事物的挑戰。
最后,送給所有打工人的心聲:
參考文章:
https://www.marktechpost.com/2022/11/14/how-do-dall%C2%B7e-2-stable-diffusion-and-midjourney-work/ How Do DALL·E 2, Stable Diffusion, and Midjourney Work?
https://isux.tencent.com/articles/aigc-design.html
https://www.thepaper.cn/newsDetail_forward_21420325
https://finance.sina.com.cn/blockchain/2023-03-03/doc-imyiqhat7670720.shtml
https://learnprompting.org/docs/intro
https://baijiahao.baidu.com/s?id=1759154697131925527
https://mp.weixin.qq.com/s/pkzXaW_-77zXLKQqx2nlcA
作者:葛曉玲,一個互聯網重度依賴者。微信公眾號:產品零感(feelingPM)
本文由 @葛零零 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!