別慌,AI 繪畫殺不死藝術
AI 繪畫這件事兒在近一段時間以來已經引起了業內人士的廣泛討論,與此同時,與 AI 繪畫相關的作圖產品也漸漸涌上臺面,并接受用戶評判。那么就目前已經出現的 AI 繪圖產品,以及人工智能藝術本身的特性來說,AI 繪畫的存在是否真的會取代人類繪畫?不如來看看作者的解讀。
AI 繪畫一日,人間一年。
上半年走紅的 Dall-E 2、Midjourney,下半年風頭完全被 Stable Diffusion 蓋過。
近期火熱的繪圖產品,名字里都有「diffusion」,它們均得益于人工智能「擴散」算法。該算法突破了 AI 繪畫的應用臨界點,更易上手,效果更好。
機器作畫已經有半個世紀的歷史,而兩年之內,AI 繪畫忽然成了「進擊的巨人」,不僅質量肉眼可見的提升,生成圖片的速度也從年初的幾個小時縮短到十幾秒鐘。
AI 繪畫技術的大幅度進步,激發了人們對「創意 AI」的興趣——從美術到詩歌,一系列 AI 工具正在模仿人類的創造力。但沒有什么人真正覺得惶恐。
前一陣子,有不少人猜測生物學家顏寧離美歸國,是因為 AlphaFold 人工智能系統能夠預測蛋白質結構,被搶了飯碗。
實際上,能寫新聞資訊的軟件早就存在,并沒有記者為此失業。AI 連寫豆腐塊的人都無法替代,更不用說能替代頂尖科學家了。
一、擴散算法是什么?
當下的人工智能模型,使用的都是深度學習神經網絡。自學習模型,比如 GPT-3 是其中最著名的模型,它會在大約 45 TB 文本數據的神經網絡上「學習」,生成和人類產出相差無幾的作品。
Stable Diffusion 是深度學習家族的一部分。具體來說,Stable Diffusion 通過潛在的擴散模型,學習圖像和文本之間的聯系。它的工作原理是,獲取圖像數據,并對其添加「噪點」。
噪點,也叫噪聲,是指數碼攝影器材拍攝的圖像中,存在的粗糙點,一般受電子干擾產生。
一幅畫面被逐步加入噪點,一直到整個畫面都變成白噪點。該模型記錄這一過程,進行逆轉,給 AI 學習。
從 AI 的角度,先看到的是一幅布滿噪點的畫面,再看到畫面一點點變清晰,最后成為畫作。AI 學的是整個去噪點的過程,特別是如何處理高斯噪聲,最后生成畫作。
高斯噪聲指的是概率密度函數服從高斯分布(即正態分布)的一類噪聲,擴散算法添加高斯噪聲,一是為了驗證「實際」圖像的有效性,因為使用環境里的圖像都是帶噪點的;一是為了方便學習,只要噪點不符合標準正態分布,就算失效。
Stable Diffusion 的基礎數據庫叫 LAION-Aesthetics,包含了帶圖說的圖像,還根據「審美風格」進行過濾。
其他經訓練的人工智能模型也對數據庫進行「修正」,來預測人們如何回答「你有多喜歡這幅畫」時的打分評級,以便消除一些黃暴內容。
二、和「前輩」有何差別?
Stable Diffusion 和 Dall-E 2、Midjourney 類似,都要靠「文字描述」生成圖像。
不過,Stable Diffusion 是開源的,其基礎代碼也是公開的。而 Open AI 和 Google 都沒有開放自己的人工智能模型。
Stability AI 由 4000 多個英偉達 A100 GPU 組成,在亞馬遜云(AWS)中運行。據報道,Stability AI 公司的運營和云支出成本,超過 5000 萬美元。
該公司聲稱可以提供「速度和質量的突破」,內存低于 10G 的 GPU 也能跑。他們還會提供運行在 AMD、蘋果 M1/M2 芯片的版本——普通消費者也玩得起。
目前,Stable Diffusion 的功能是,可以在幾秒內將文本轉換為 512×512 像素的圖像;圖像可以轉換、放大、修改和替換;使用 GFP-GAN 建模,允許用戶上傳模糊的面部圖像,進行放大或恢復原貌。
上個月,Stability AI 公司融資 1.01 億美元。首席執行官 Emad Mostaque 畢業于牛津大學,獲數學和計算機科學碩士學位,此前曾在多家對沖基金擔任分析師。
目前,該公司估值 10 億美元,除了 Stable Diffusion,還有 Dance Diffusion——可以進行音樂剪輯。
Stability AI 的賺錢計劃是,為客戶訓練「私有」模型和通用基礎設施平臺。它有一個平臺 DreamStudio,個人用戶也能訪問?,F在 DreamStudio 擁有超過 150 萬用戶,創建了 2 億張左右的圖像。算上所有渠道,Stable Diffusion 用戶超過 1000 萬。
該公司還高調聘請了 Google 科學家、未來學家 Daniel Jeffries。
三、這算藝術嗎?
隨著各種各樣的人工智能公布,相關的道德法律問題也在增多。Stable Diffusion 允許生成真人圖像,問題就愈發顯得「嚴重」。
Stable Diffusion 已經被用戶拿來創作了不少敏感內容,偽造的名人照片滿天飛。Getty Images 已經禁止上傳 Stable Diffusion 生成的圖片,原因是擔心知識產權糾紛。
美國眾議院眾議員 Anna G. Eshooo 最近公開發信,敦促美國國家安全顧問和科學技術政策辦公室解決這些「不安全的模型」。
Stability AI 在公告中,公布了一份「允許商業和非商業用途的寬松許可證」,實際上就是和用戶之間的協議。它指望用戶自我規范行為,做「正確的事」,也沒什么效力處罰不遵守規則的用戶。
除了法律問題,人工智能生成作品的藝術性,也飽受懷疑。
反正美國版權局認為這些圖像「不是藝術」。今年 2 月,版權局的審查委員會就駁回了由人工智能生成的圖片的索賠申請。
審查委員會強調,「人類作者身份是版權保護的先決條件」,并且需要「人類思想與創造性表達之間的關系」。美國聯邦法院也在近期的判決中認為人工智能不能算專利「發明人」。
人工智能藝術吸引力很大,雖然法律不承認,但市場承認。2018 年,佳士得就以 43.5 萬美元的價格出售人工智能繪畫作品。而且,絕大多數消費者,都分辨不出 AI 繪畫和人類畫家的作品。
最具爭議的是今年 9 月的科羅拉多州博覽會(Colorado State Fair)的美術比賽,人工智能的作品《空間歌劇院(Théatre D’opéra Spatial)》獲得頭獎,由 Midjourney 制作,操作者 Jason Allen 說「藝術已經死了,人工智能贏了,人類輸了」。
其實倒不用一概而論,對人工智能的創作,既無需樂觀過頭,也不用夸大悲觀。
人工智能的藝術創作,是按人類的「邏輯」產生的,自然比不上人類精英,但超過其中的庸才,當然是綽綽有余了。
作者:榮智慧
來源公眾號:愛范兒(ID:ifanr);連接熱愛,創造不同。
本文由人人都是產品經理合作媒體 @愛范兒 授權發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
AI繪畫更多的作用是提供靈感
AI繪畫可以滿足大眾的需求,如果要用再商業化應該還是不太可能,