尋星者的筆觸:AI設計與未來想象

0 評論 1238 瀏覽 4 收藏 19 分鐘

本期U享會很榮幸邀請到Jovi,高級產品設計專家,AICC創始人,UX Lib用戶體驗社區創始人,Jovi老師,為大家帶來《尋星者的筆觸:AI設計與未來想象》主題分享。與我們分享AI設計興起、動向及未來的可能。

一、點燃AI之火

1)AI 興趣的初燃

首先先從AICC的開始說起,起初ChatGPT、Midjourney相繼發布之后,很快在我們建立的體驗社群里大家討論、開始學習淺償,試著應用,了解Midjourney的能力限制。隨著發展,大家開始關注如何把AI很好的利用在自己工作上,甚至投資新技術的探索上面。

2)技術應用與創新擴散

隨著AI的火熱,一部分人的探索與嘗試,放在整個市場中還是屬于少數的,停留在早期探索,存在著認知的差異性。但未來全面的普及時代也不會太遠。

3)早期采用者的機會和現狀

根據美國知名媒體The Verge的調查報告,大約三分之一的人嘗試過AI工具,主要是80、90年輕一代用戶更傾向于使用。調研的工作者中大部分會認為AI可以讓工作變的更好。

于此同時AI也正在展現跨行業能力,廣泛的應用場景:其中則蘊含巨大的機會和行業基礎的變革。在AI的發展中需要更多的領悟,也需要內心平靜下來做事,不必過度焦慮。

4)MS工作趨勢指數年度報告

在工作趨勢指數年度報告中體現出更多企業傾向提升員工生產力, 而非裁員。而“分析判斷力”、“靈活性”和“情感智能”則是必備的關鍵技能,是新的工作方式,現在的時代,需要我們對整個工作能力結構做一次增強能力的調整。

二、AI在畫布上的奇跡

ChatGPT經歷了大語言模型到對話式交互、數字人等最終回歸行業和細分應用上,AI設計也經歷異曲同工的探索路徑,下面從我們共創人的幾個項目中來了解AI繪畫的探索及方向趨勢。

1)AICC — AI SOUP 電商項目(共創人:Rsky 杭州玩轉互動 & AI Soup CEO)

1、AICC和 AI SOUP共同舉辦了一場設計比賽,是一個行業級別的項目,主題是為某博物館文物進行二創,設計文創產品。主辦方提供了10個文物,耗時14天,參與設計師90人,參賽作品共計410份。我們在參加這個比賽中,使用Midjourney生成作品,最終落地10件,并且已經在生產制作出實體產品。相比來說,從選品或是創意來說是都比傳統設計的效率高很多,出圖成功率4.1% 大幅度降了嘗試風格成本。

2、SD生產實例-AI SOUP

這個項目是利用GPT和AI圖片融合生成商家需要的圖文并茂的產品圖,從拍照——摳圖——擺拍—自動融合——成品,只需2步,等待10秒即可生成讓普通商家也能玩得起的品牌級的圖。

3、AICC — 靈光石珠寶(共創人:卷兒 靈光石Virtual stone CEO)

這個項目是一個探索AI在垂直市場的應用。主要針對的是珠寶行業, 因行業的獨特性,內行人才能了解比較多的專業知識,實際是已有一些行業壁壘。再看AI如何去給它賦能探索。

1)可以提供虛擬在線珠寶定制服務。利用AI技術,包括虛擬導購、stable diffusion 生成的圖像和文生圖、圖生圖等能力,為客戶提供一站式虛擬定制體驗。比如選擇自己想要的首飾珠寶,元素,實時預覽生成效果圖,虛擬試戴,通過設計師跟進和優化交付工廠加工制作,完成首飾定制。珠寶的定制能力都可以完全由AI提供。

2)利用Checkpoint進行一鍵替換寶石的測試??梢钥焖偬鎿Q珠寶材質,寶石替換,可以直觀查看效果,定制自己喜歡的樣式。(如圖)右側圖片中的首飾為Ai產出設計稿,進行加工后,最終做出的成品展示。整體過程可行性都很強。由于stable diffusion 模型的多樣性,客戶還可以根據自己的喜好選擇風格化程度,滿足各類人群的設計需求。

通過利用AI在珠寶行業的探索,及項目的應用,總結出3個點:1)利用 AI可以節省不少的運營成本 2)客戶也可以實現“自助式”設計體驗,讓用戶感受前所未有的被重視的感覺 3)可以使流程更加高效。

3)AICC — 電商展臺 Checkpoint(共創人:HL 電商 ckpt 訓練)

在這個項目中AI是更深入到工作流程中去,用時也遇到更多有難度的問題需要克服。這是電商展臺 Checkpoint 訓練,通過 stable diffusion 訓練 Checkpoint 批量產出電商設計優質素材,AI大大提高工作效率。

在訓練過程中也得到一些經驗:1、在訓練比較垂類的模型之前,先了解相關基礎知識,提高標注的準確性和效率 2、善用工具,如 chatgpt,幫助自己學習新知識 3、模型訓練不是一蹴而就的,需要不斷的迭代優化 4、模型想要商業落地,那么一定要增強可控性。

4)AICC — SD 3D 模型(共創人:忠忠 前端UI框架 Element Plus 設計負責人)

共創者忠忠更多探索的是一些模型能力的邊界,探索細節多一些,使用 AI設計工具進行了非常多的嘗試,這些項目是他的一些項目總結。其中 BDicon模型和微軟風Lora可能是大家見過比較多的。

在過程中需要不斷拆解,再拼,根據模型上色,調色,這些都是對設計師的挑戰,如果堅持選擇這個方向,不斷學習,探索,將會收獲很多。

5)AICC — AI 建筑設計應用(共創人:吾皇 AI 自媒體)

吾皇同學和她的團隊同樣在探索垂直市場中的應用,曾經在建筑裝飾行業的我也表示出極大的興趣。7月的線下活動中阿嘵老師也分享了他在實際工作中應用AI技術,在各個環節引入AI生產力,實際的發展,可能比我們想象中還要快。例如在家裝或者工裝過程中,提供一張草圖或者毛坯照片。通過AI設計的能力,很快有了一大批的設計創意,這些以前都要靠人來完成,也不會有那么多的探索空間和意向的選擇機會。同樣可以應用在景觀設計,建筑設計等領域。依托行業自身壁壘 AI+ 賦能市場規模、想像空間巨大的。

通過以上5位共創人,我們了解了他們的項目,和AI繪畫探索幾個典型方向。

三、AI設計背后的科學

接下來和大家一起交流一下AI背后的科學,談到AI圖像,這個圖是繞不開的:2021 年發布的潛空間擴散模型框架圖。這里是AI生成圖像的核心,可貴在它是開源的,后來 AUTOMATIC1111 做了SD模型的開源 Web UI的界面,讓它可以被大家廣泛的應用起來,通過 Web 界面來方便的應用 SD 模型。

這張圖是用公式和圖表的形式直觀的表達了文字、圖片怎么通過在潛空間對神經卷積網絡的一系列操作把文本,圖片降維到潛空間進行噪點操作,再升維到高維像素空間得到我們看到的圖片的過程。

在擴散模型的架構還包含一些必要的組件:

比如我們輸入的提示詞,關于圖像的描述需要經過文本編碼:分詞,令牌化也就是 token 然后嵌入模型,進行擴散操作然后編碼后的張量用圖像編碼器生成圖片。

說完原理,通過一個例子來給大家更通俗的解釋一下,比如 1、唐伯虎看到的景象,這個鷹或者一個條件,是一個高維的,或者是提示。

2 唐伯虎要先想清楚重點,要畫什么:像 CLIP Text,降維開始構思繪畫的細節,比如布局,雄鷹的特點什么神態等等這些特征類的思維 這里是潛空間操作的過程,基于他學過的繪畫技法,表現能力,和作畫要求 :像擴散的過程。

3 想好了以后用瀟灑的筆法把這些抽象的想法,特征,構思畫出來 :像降噪,圖像編碼的過程,完成升維。

通過對原理的了解,會在無形中對事物的應用、探索、判斷和預測都會產生影響,比如你在做產品時,對未來市場的預測也都會受到影響。

四、AI設計的雙刃劍

了解前面的內容之后, 我們一起再交流一下AI設計的優勢和痛點,說到AI設計工具會提到主流的AI設計生產工具——Midjourney和stable diffusion。這兩個工具都有著不同的特點:Midjourney 定制性差,上手容易,stable diffusion定制性強,上手更難?;?AI 設計的基礎,做為創業者、投資或者是普通的學習,我思考總結了一些機會:

  1. 先發平臺,早接觸,可能會建立起強大的市場地位,從中獲益。
  2. 如果在細分或已有市場有變現資源或是個人,利用AI就可以成為行業獨角獸。
  3. 隨AI藝術技術的普及,大眾對學習的AI的需求就會增加, 提供教育和學習資源就會成為一個新的中長期機會。
  4. 本身擁有強大資源的先行者可能快速改變市場格局,但在AI增強之前,他們都將是這個資源中的黑馬。

同時AI設計有這些機會,也擁有著風險:

  1. 初期市場可能會面臨一些風險,如技術尚未成熟,成本過高等,這可能阻礙 AI 藝術的發展。
  2. AI藝術需要一定的時間來被市場接受,如果破壁時間過長,可能會對投入回報產生負面影響。比如細分市場的測試或早期產品的研發、前期投入。
  3. AI 技術的發展有可能會帶來新的、未預見的技術架構或模式,會在其他領域找到新的應用,語言是文明的基礎,所以AI有很強的跨域能力,這既是機會也是風險。
  4. 用三體中黑森林法則比喻現在的市場,現在市場情況在某種程度上很相似,創業者需要面對一個充滿競爭和不確定的市場環境,他們要在有限的資源和時間內,開發和推出具有創新性和競爭力的產品,同時也要防止被其他創業者或大公司搶占市場或模仿抄襲。所以這種賭注風險是很高的。

五、一次探索的啟航

分享到這里也要接近尾聲了,通過分享AI的原理,分享一些項目,來窺探未來的可能性。由于現在技術的特殊性,現在大部分情況就是科學家把基礎技術研究好,技術專家解決了落地的技術問題,市場應用專家把故事講好,最終獲得收益。說到技術,我們下面可以一起看幾個關于技術的案例。

1、Segment Anything這個模型被設計為可接受提示(prompt),這意味著它能夠根據具體的指示來識別圖像中的對象,提供了更大的靈活性,給圖像(視頻)帶來了很大的操作空間。

2、Rerender A Video

RAV是提出了新的一種翻譯框架,該框架包括兩個部分:關鍵幀翻譯和全視頻翻譯。給初代 AI 視頻帶來了更佳觀感體驗的可能性。

3、MetaHuman

可以僅使用從iPhone拍攝的視頻就能創建逼真的面部動畫。

上面的這幾個案例又能說明AI設計的領域和相對于的傳統領域,已經可以基本覆蓋多形態內容領域。

剛剛講到這些,其實就是一個知識進化的過程,從開始的零散的點,各種信息,到后面串聯起來,形成知識,最終形成一個完成的畫面。同樣科技也有類似的過程。

六、3個方向與大家共勉

  1. 時刻關注 AI 技術。
  2. 要基于LLM重構個人能力的結構,需要自己完善深入的去思考,做專門的研究。
  3. 實踐出真知,應用是關鍵。

以上是本次分享的全部內容,希望對大家有所幫助~

再次感謝Jovi老師,為我們帶來這么多優秀的作品分享和經驗之談。小伙伴們有任何問題或者對U享會的建議,歡迎在下方留言,期待下次再見。

另外感謝U享會所有成員的辛勤付出:

趙德馨、張俊楓、康盼盼、馬亞薈、伍思晟、連盟

分享者:Jovi老師,整理:佟佳昕

來源公眾號:58UXD(ID:i58UXD),58UXD,全稱58同城用戶體驗設計中心。

本文由人人都是產品經理合作媒體 @58UXD 授權發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!