別鬧了,AIGC殺不“死”藝術家
AICG 爆紅之后,不少人都發出了疑惑,比如 AICG 生成內容未來是否會替代真人創作,又是否會顛覆藝術繪畫領域。而關于這類問題的解答,也許我們需要從 AICG 這項技術本身與實際應用等方面進行解讀。本篇文章里,作者便結合從業者們的視角,發表了一定看法。
AIGC生成內容能取代插畫師、設計師的工作嗎?或者更瘋狂一點,AI 能批量生產藝術作品,乃至從根本上顛覆藝術市場嗎?
關于AIGC的爆紅我們已經和科技界探討的足夠多,今天我們把目光轉向從業者——AI能否取代他們的工作?
下面是他們的回答。
一、畫家自己下筆之前都不知道會發生什么,AI如何能知道?又如何計算出來?
AI不能繪制的東西
當我詢問能否清楚地辨認AI和人類繪畫作品的時候,建筑系大四的吳佳佑給出了非常明快的肯定答案。
吳佳佑正在申請英國倫敦皇家藝術學院的研究生,而他提交的申請作品之一即是一個由AI輔助創作的交互式網站,訪問的人可以在圖像搭建而成的互動頁面中探索由他設計的故事,而組成網站的所有圖像都由 Disco diffusion 和 MidJourney 這兩個2022年大火的AIGC人工智能生成工具制作。
圖源:吳佳佑提供,基于AIGC模型生成后微調
“AI生成圖像在整體光影、結構以及色彩上的表現在我看來無可挑剔,但很多細節經不起推敲。”對擁有繪畫功底,又經常使用AI工具的吳佳佑來說(他的交互式網站制作花費了四個月的時間,期間用AI生成了數千張圖),目前AI生成圖片迥異于人類的風格是顯而易見的。
“細節上經常出現色塊堆積,過度不自然和線條粗細變化不均勻這樣的問題?!眳羌延幽弥医o的幾張在推特上頗受好評的AI生成圖像逐字句的點評起來,雖然只有大四,但他的口吻很自信。
圖源:吳佳佑提供,基于AIGC模型生成后微調
對一個美術門外漢來說,這樣的細節(尤其你很多時候需要放大作品觀察)可能并不重要,但對專業人士來說,差別是顯著的。“我給同學說了竅門后,大家不管有沒有美術功底,基本上都能看出來。AI生成的圖像看不出繪制的前后順序,因為它背后沒有人類繪畫的基本邏輯支撐。”吳佳佑說。
問題的根源可能來自算法本身。目前的主流AIGC工具都采用了diffusion model 擴散模型,它的訓練基于有文字描述的圖片數據,通過對圖片反復降噪,AI學習如何生成符合文字描述的圖片。由于文字描述往往是整個圖片的內容,因此AI深度學習的結果會對整體圖片結構和光影的把握比較良好,而相對的在細節上就會失準,因為這些細節往往缺乏文字描述,又相當復雜多變。
這可能是在日漫界最近熱炒的AI三大畫圖難題的來歷。所謂三大難題,指的是目前的AI模型不能完成的三種主題創作:薩菲羅斯游泳、樋口円香吃拉面和哭泣的美少女吃蛋糕。AI模型在輸入相關指令后往往會生成讓人啼笑皆非的圖片。
圖源:Neil Shen 使用 MidJourney 生成
其實AI 不能完成的創作遠不止這三種,比如如果你讓AI生成游泳的三文魚,那它大概率給你的圖片將會是三文魚片而不是活蹦亂跳的魚。
圖源:Neil Shen 使用 MidJourney 生成
AIGC這些人類看來非常匪夷所思的錯誤同樣要歸因于算法,一旦給出的指令過于偏狹,比如日漫中較少表現的水中游泳動作,或者其畫面內容存在較為復雜多變的物理交互邏輯,比如“吃拉面”圖像意味著同時處理人物、手指、面條和筷子這幾個在AI看來都屬于線條的內容時,AI大概率會存在翻車的現象,因為訓練算法所用的樣本集可能較少涵蓋相關內容,而擴散模型對復雜細節線條交互變化的理解還相當初級。
但細節往往是決定畫家藝術風格和水平的決定性因素之一。插畫師元元是少見的迄今仍然堅持純手繪作圖的職業畫師,研究生畢業于清華美院的元元講述了科班美術生的結構、線條色彩和細節是如何被訓練的——因循著與AI生成完全不同的邏輯。
圖源:百科 《萬壑松風圖》 宋朝 李唐繪
“老師會讓你以操場為主題畫十幅同樣的畫,一開始你會想要把每一條跑道線,按照透視、光影結構完整的畫出來,但到某一個時刻,你會想要去若隱若現地處理某些跑道線,有些留白,有些加重,有些干脆去掉。”元元說,“很多時候畫家追尋的是這種主觀感受,作品生動不是說要畫的和真實世界一模一樣。”
繪畫的過程不僅考驗畫家個人的技巧(這部分AI很好達到),畫家作為個人,他的感受,心境乃至成長歷程、教育背景等都發揮了影響,這些數據量之龐大都是AI所無法計算的。更何況,對元元來說,真正的創作過程在于打破某些規則和邏輯,“國畫中很多時候松弛的閑閑一筆就是遠山,層云。此處留白,彼處著墨,很多時候畫家自己下筆之前都不知道會發生什么,AI如何能知道?又如何計算出來?”
二、剝離所謂“低效率工作”意味著什么?
AI可以模仿的東西
就像對人工智能倫理的討論一樣,科技界對AIGC內容對藝術性的沖擊的討論也經常是模棱兩可的。技術至上主義者(硅谷的一大部分人)幾乎回避了有關藝術性的討論,對他們來說不斷而持續的精進深度學習算法才是重要的事情。隨著數據集和算法的優化,藝術性似乎同樣能被01的字符所表達。
圖源:Google Imagen video 論文 顯示AIGC已經能夠制作梵高風格的圖像
https://imagen.research.Google/video/paper.pdf
某種意義上他們成功了,甚至連谷歌最新推出的基于擴散算法的 imagen video 模型在生成視頻方面都能夠模仿藝術家風格(比如一只以梵高風格繪就的貓咪在吃東西),而使用AI 輔助創作在許多游戲美術師的工作中已經是通行慣例。
在多家大廠有過游戲制作經驗的阿丁在談到AIGC時頻繁提到一個詞——“喂圖”,意思是在游戲人物形象設計的最初——尤其針對一閃而過的NPC人物,美術設計會給AIGC工具輸入很多參考圖學習,進而快速生成符合游戲要求的結果。
“雖然還要經過后期的調整,但AI現在確實已經取代人力開始承擔這部分的工作量了?!卑⒍≌f,他們目前使用較多的工具是較為側重二次元風格訓練的novel AI ,它基于目前最火的 stable diffusion 模型,數據集由500多萬張帶有文本標記的圖片組成。
然而通過“喂圖”訓練的AIGC模型充滿了爭議。10月7日,推特用戶@BG_5you 基于剛過世的韓國著名漫畫家金政基作品使用 Stable Diffusion訓練出了金政基風格的繪畫模型,此舉引來的網友的如潮惡評,而緊接著10月底,工程師Ogbogu Kalu 因為把迪士尼簽約畫師Hollie Mengert的作品未經同意后抓取訓練出可以批量生成 Mengert畫風的模型再度沖上熱搜。
圖源:@BG_5you 使用模型生成的“金政基”風格作品
如果說前者網友一邊倒的批評尚主要基于對死者的尊重,后者則將AIGC快速發展對現行插畫市場的沖擊鮮明地點了出來。要知道由于 Hollie Mengert簽約了迪士尼,甚至她本人都不能隨意發布自己的作品,而從畢業開始算起,她的畫風形成至少花費了十多年的時間,相比之下Ogbogu Kalu訓練新模型的時間只有幾個小時,且成本幾乎為零。
圖源:左圖為Hollie Mengert 原創,右圖為Ogbogu Kalu訓練的模型生成
https://waxy.org/2022/11/invasive-diffusion-how-one-unwilling-illustrator-found-herself-turned-into-an-AI-model/
如果風格模仿是如此的輕而易舉,那么畫家十數年的繪畫訓練有什么意義?他們的商業價值又該被如何衡量?這樣的叩問出現在許多插畫師的心中。
坦率地說,機器學習并不能準確模仿所有風格,但AIGC目前的進化程度已經強到開始對許多領域產生沖擊。阿丁就直言,既然AIGC已經能夠介入游戲原畫和人物設計(“很多效果圖生成的精度比一般畫師高多了?!卑⒍⊙a充說),現在網上流行的美術外包中很多基礎工作很快就將被AI替代。
畫師們對此不是沒有警惕,許多人在給自己作品標注“未經許可不得使用”的版權聲明之外,還會加上“禁止AI學習”聲明,有些人則干脆從公開平臺撤掉自己的作品以防被抓取成為AI學習的數據。在二次元繪畫發育最成熟的日本,“AI 學習禁止”已經成為了一個流行詞。
然而,對硅谷來說AI風格遷移造成的爭議并不是他們考慮的首要問題,技術中立,更時髦的詞叫做 AI 的民主化 democratization of AI是他們的信仰,AIGC技術潛在的巨大商業前景才是真正重要的。根據彭博社的報道,投資了 stability AI 的 Lightspeed 合伙人Gaurav Gupta 直言不諱地表示,AIGC技術根本性地賦予了人們更多的權力,同時讓“低效率 inefficiency”工作從內容創作中剝離。
三、“只要 AIGC生成內容滿足質量要求,我不介意全面使用它?!?/h2>
AI將替代誰?
AI將替代誰?
Gaurav Gupta的表態幾乎是在明示AIGC生成技術對現有繪畫市場的顛覆性沖擊。如果我們把繪畫市場簡單分為商業繪畫和藝術繪畫兩部分的話,前者顯然會更直接受到影響。
對于這個問題,在某游戲工作室擔任原畫師的劉紀揚表現的很輕松,“許多人說它做出來的東西冰冷,我沒那么矯情,我就覺得它弄得挺好的,構圖顏色都好。更深的內容AI目前還做不了,但我覺得它給我們設計師和美術師的前期工作提供了許多思路參考。”劉紀揚說到。
圖源:受訪者劉紀揚提供
在劉紀揚看來,盡管AIGC內容在游戲策劃的最初階段能夠輔佐策劃更好的表達想要的游戲效果,但它尚不能介入游戲原畫師更高階和精確的工作。“我們的設計,越到后期要求越精確、細致,AI 只能粗疏的在需求非常模糊的時候一次性生成許多選擇,但當方向明確的時候,AI還無法勝任規模化的游戲設計場景?!?/p>
圖源:受訪者劉紀揚提供
相比之下阿丁的看法有所不同:“AIGC生成的高精度的圖片不僅可以應用于前期策劃,在游戲的人物設計和場景設計中都將擁有廣泛的前景,與之相伴的就是大量腰部以下插畫師會失去工作,目前阻擋大規模使用的其實是潛在的法律風險,而不是生成內容的質量本身?!?/p>
不只是游戲的前期策劃,泛化的商業繪畫領域,從影視美術、網站設計乃至圖書制作,現有的AIGC技術在描繪大場景、特定繪畫風格和精細度效果上均有優勢,更不必說其成本低、速度快,且不會被題材、風格乃至數量局限的特點。盡管存在類似“游泳三文魚”這樣的問題,但毋庸諱言商業繪畫這個過去只能依靠人力的創意市場迎來了最強勁競爭者,首當其沖受沖擊的將是對精度和創意要求不那么高的細分領域。
“說實話,只要 AIGC生成內容滿足質量要求,我是不介意全面使用它,因為真的會節省許多成本?!蹦骋痪€時尚雜志的執行主編在被問及對AIGC內容看法時說到。
對時尚雜志來說,拍攝大片時產生的置景、燈光、場地成本是一筆不菲的開支,而大片的制作過程往往還受到時間、空間以及人員因素的限制。AIGC生成技術從根本上解決這些困難,同時還能極大拓展視覺語言的豐富程度——“要是AI足夠強大,我一個人就能制作一本雜志了不是嗎?”實際上,今年美國版《Cosmopolitan》已經使用 MidJourney制作了一期封面。
圖源:Cosmopolitan
官方網站 https://www.cosmopolitan.com/lifestyle/a40314356/dall-e-2-artificial-intelligence-cover/
四、中國人說“興之所至”,可AI根本無法“起興”,又能“至”去何處?
AI有創造性嗎?
如果說對商業繪畫領域AIGC的潛在顛覆性毋庸置疑,那么在藝術繪畫領域這個問題就充滿了爭議。
“如果你水平好的話是永遠不可能被替代的?!边@是許多人強調的論點。盡管AI可以惟妙惟肖的模仿風格,但它不理解圖像背后所代表的含義,換言之,AI不具備真正的創造力。
這不是說AIGC完全沒有任何創造力,Deepmind的創始人,當代人工智能領軍人物Demis Hassabis 曾在Lex Fridman 的訪談中表示,AI的創造力可以讓它通過看數百萬張貓的照片來“創造”一只普通的貓,但人類目前還不能把高層次的抽象概念(比如發明象棋規則,而不是教AI學會下象棋)用算法準確地表示。
從這個意義上說,探討 AIGC 的藝術性甚至顯得有些滑稽。被問及AI的藝術性時,藝術留學機構創始人Evan 迅速就給出否定回答,他所在的藝術留學機構每年向全世界頂尖藝術學府輸送大批學生,AIGC領域是他們關注的重點之一。
“我們學生提交的申請作品主體是不建議過度使用有AIGC創作內容的?!盓van說到。在他看來,藝術品的價值來自于背后的感染力,這種感染力只能來自人,相比之下,AI 作品太過“冷靜”、“匠氣”?!拔铱梢愿惺艿剿總€部分的精巧,但它的靈魂是不統一的,它不夠動人?!?/p>
圖源:百科 蘇軾《寒食帖》被譽為天下第三行書 無論線條、留白或造型變化均極富風格韻味。
藝術創作的立意和技法都服務于人本身的思緒脈絡,“只要是稍微成熟點的藝術家,他的創作都是精準的。” 對Evan 來說,真正突破和創造性的偉大藝術作品,永遠不會拘泥于既有數據的窠臼,沒有人的主觀能動,AI作品精巧而平庸。
在自己專欄中大量使用生成圖片配圖的自由撰稿人小溫對此有個精妙比喻:有一類作品創作出來不用寫注釋,因為作品本身足夠牛;另一類則必須要寫注釋,否則大家不知道看的是什么;但最糟糕的作品就是有沒有注釋都無所謂,因為作品本身不夠好,而文字注釋也不夠重要。AI生成作品正屬于此類。
“AI依靠算法以結果生成結果,但人的創造過程最革命性的東西,嘗試和試錯,打破規則和重塑規則在這個過程中被根本忽略掉了,中國人說‘興之所至’,可AI根本無法‘起興’,又能‘至’去何處?”小溫補充道。
總的來說,AIGC在藝術領域的實踐目前來看更像是一件精準執行的工具,它可以產出精確的結果,前提是人本身已經有了創意的框架。正如文章一開頭提到的吳佳佑,很難想象如果沒有AIGC工具的幫助,他的交互網站所需要的幾千張圖片該如何獲得。而在國外,資深的AI生成愛好者已經開始運營AI制作電影——除了主創本人的配音,從語言腳本、鏡頭畫面到音效都將運用AIGC模型來完成。
圖源:吳佳佑提供,基于AIGC模型生成后微調
AIGC的確實極大降低了人們的創作門檻,沒有經過技法訓練的人現在僅憑自己的想法就能方便創造屬于自己的作品,在未來這將重塑人們認知藝術的維度,它的革命性就好像照相機之于油畫,在央美藝術史博士小楊看來,這同樣有一個漸進的過程?!靶鹿ぞ叩某霈F總會帶來對藝術本質理解的新思考,這在歷史上已經發生了不止一次,相比于藝術技術的革新,藝術理論總是相對滯后的?!?/p>
話雖如此,小楊之前并沒有親自嘗試過AIGC工具,對于網絡上充斥著的 AIGC生成圖片內容,她從專業角度以“不和諧”三個字概括。在推薦下小楊第一次使用MidJourney,選擇 Gothic letters (哥特式字母)和她名字拼音的縮寫作為關鍵詞,由于服務器不穩定,MidJourney一口氣返回了三組共12張圖片,小楊看了之后說,這種水平還不如我從隨便哪個中世紀手抄本里剪切來的方便和好看呢。
圖源:MidJourney 生成圖片
這段話仿佛可以當做對目前 AIGC與藝術關系的注腳。
隨著算法的發展,AIGC進化速度只會加速而不會減慢,它不僅將對繪畫相關領域產生重大影響,在交互設計、實驗藝術乃至未來的元宇宙社交場景中,AIGC可預見的都將扮演重要角色。
在介紹完自己的交互式網站后吳佳佑告訴我,剛和英國皇家藝術學院的老師聊完他的作品,錄取的可能性很大,而他的專業 information experience design 細分方向之一就叫 moving image design 動態圖像設計,這聽上去就像是專門為AIGC準備的一條賽道。
而這究竟是AIGC技術的勝利,還是人的勝利呢?
作者:Neil Shen
來源公眾號:品玩(ID:pinwancool),有品好玩的科技,一切與你有關。
本文由人人都是產品經理合作媒體 @品玩 授權發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
MJ目前的能力已經脫離了第一點所說的,如果親眼看到過,原本認為人類必勝的信心會產生動搖
ai繪畫確實很火,但是那又怎么樣,人類能完成很多ai做不到的東西,藝術家更是有著充分的情感
AI繪畫還是有一定的弊端,像人所獨特擁有的感情是AI所不能畫出來的