讓一讓,全球最鮮活的AI小貓來了

0 評論 478 瀏覽 1 收藏 18 分鐘

近年來,AI生圖技術取得了飛速進展,其中Recraft AI憑借其獨特的“Hard Flash”風格在社交平臺上引發熱議。本文將探討Recraft AI的起源、技術特點及其在AI生圖領域的創新應用,分析這一工具如何通過鮮明的視覺風格和用戶友好的設計功能,贏得廣泛的關注和應用。

2012年,計算機科學家吳恩達和Jeff Dean進行了一場試驗。

他們用1.6萬個CPU、1000萬張貓咪圖片以及當時全球最大的深度學習網絡,訓練了3天,生成了世界上第一張AI貓臉圖像。這是人們基于深度學習模型自動生成圖片的開端,受限于當時的技術能力,圖片中的小貓稱得上是“面目全非”。

12年后,當網友第一次看到背著白色翅膀的黑貓圖片時,幾乎所有人都以為,那是一張真實的照片。

畢竟,寵物博主用翅膀飾品裝扮自家貓咪后,再用膠片機拍照記錄,不算是什么稀奇事。直到看見帖子下方的“AIGC”標簽,人們才驚奇地發現:“這竟然是AI生成的?”

12年前的AI小貓 vs 12年后的AI小貓

懷揣著巨大的好奇心,越來越多網友順著網線,前往一個名為“Recraft AI”的應用,嘗試生成自己心目中的理想小貓。

情況一發不可收拾。

最近幾天,各式各樣的“小貓膠片照”填滿了小紅書、抖音等社交平臺的信息流。無論是舉著紅酒杯的小貓、在鍵盤上打字的小貓,還是舉著魔棒正在施法的小貓,全是Recraft AI的杰作。

近年來,AI領域的所有進展中,離普通用戶最近的非AI生圖莫屬。

自2021年年初,OpenAI發布DALL-E大模型,AI得以通過文字生圖起,三年內誕生的AI生圖工具已經進化、迭代了一波又一波。專攻技術能力突破的有Stable Diffusion、Midjourney、FLUX等等,專攻C端應用的也有妙鴨相機、Remini等等。

從最初追求極致的“像”,到如今逐漸厭倦AI味兒,開始追求風格與審美,這屆網友正在將Recraft AI捧上新的“神壇”。

一、沒有AI味的“造夢AI”

這次火起來的,其實是Recraft AI內置的一種預設風格“Hard Flash”。

該模式可以模擬膠片攝影時,開啟閃光燈之后的拍攝效果,生成的圖片主體突出,對比度高,彩色飽滿濃郁。目前,該AI網站支持免費用戶每天獲得50個積分,生成50張圖片,雖然中文提示詞的生成效果仍不如英文,但Recraft支持中文口令直接輸入。

如果說,ChatGPT的出現讓作者焦慮,Midjourney的出現讓畫家憂愁,這一次,慌的是攝影師。

小紅書,是Recraft最初被國內用戶關注到的地方,目前相關話題下已經有超過1萬條筆記。

其中不乏有攝影愛好者哀嚎“我宣布,攝影不存在了”;也有專業的膠片攝影博主在看完Recraft生成的圖片后,認為該AI的構圖和色彩、審美極佳,開始思索還有什么是人類攝影師能夠抓住的東西;甚至有人開始研究Recraft的調色與構圖,試圖進行“反向學習”。

圖源:小紅書

盡管其他AI工具的畫風更加細膩,生成的圖片更為精美,但看久了難免會有一種“AI味兒”。

無論是不和諧的色彩過渡、結構上的不自然;還是過度平滑、整齊的勾線,毫無瑕疵的質感,總之,早期“一眼假”的是AI味兒,如今過于逼真無瑕的,也是一種AI味兒。

在一眾追求細節、力爭真實的AI繪畫工具面前,強烈、鮮明的視覺風格是Recraft出圈的關鍵。

刺猬公社(ID:ciweigongshe)嘗試用幾個不同的模型,輸入相同的口令“many animals”。從最終生成的結果來看,Recraft內置的Hard Flash模式,一眼望去的確有種不一樣的feel。

Recraft并沒有像FLUX或是DALL·E 3那樣進行常規構圖,而是將不同的動物一字排開,畫面中土地與天空的大面積留白,似乎給圖像增添了別樣的情緒:這是一頭孤獨的獅子。

從左至右分別由Recraft、FLUX、DALL·E 3生成

當AI生成的畫面能夠傳達情緒,Recraft AI也被貼上了“夢核”“怪誕”的標簽,越來越多網友的創作欲開始被激發。

有人將自己喜歡的電影臺詞或是歌詞當做口令輸入Recraft,期待著會生成什么畫面。

在一條有著1.6萬點贊的小紅書筆記中,博主“帆”將《宇宙探索編輯部》的臺詞輸入了Recraft,生成的圖片雖然并不能百分百復刻臺詞內容,但整體的畫面風格簡直“比宇宙探索編輯部還宇宙探索”。

也有人試圖用Recraft記錄自己的夢境,或是表達難以言喻的情緒,有熱心網友專門整理出了,能讓Recraft生成更空靈、更夢幻感圖片的常用提示詞。甚至也有網友從中發現了新商機,幫助無法使用Recraft的用戶,生成他們心目的夢核圖片,一張幾塊錢。

圖源:小紅書

網友們的熱情參與下,繼妙鴨相機、Remini黏土特效之后,又一場AI狂歡的浪潮掀起。大家似乎都想親自試一試,給AI輸入“咒語”,生成一張天馬行空的圖片,實現一種“魔法成真”的奇妙感受。

于是,近期的小紅書、抖音等社交媒體似乎被“魔法”包圍了:HelloKitty站在窗邊看煙花、小狗在雪地里吃蛋糕、金魚在藍色天空中飛過……

11月25日,小紅書官方科技薯還專門發起了一項活動,用戶使用Recraft生圖,帶相關話題發布筆記,將有機會被推流。

在社媒的推動下,據點點數據顯示,過去一周Recraft在國內App Store的下載量已經躍升至“圖形和設計榜單”第二。

二、AI黑馬,什么來頭?

盡管Recraft AI已經俘獲了國內大量網友的芳心,但實際上,該模式既不能體現、也不能代表Recraft AI的技術實力。

在很多經常使用AI生圖工具的用戶看來,此前已有的許多AI繪畫大模型均能通過口令輸入,實現類似的膠片效果。

真正能夠證明Recraft AI實力的,是其今年發布的Recraft V3模型。

正式官宣Recraft V3模型前,Recraft AI曾用“red-panda”的化名參與Artificial Analysis網站中AI圖像競技場的投票,并一舉超過FLUX、Midjourney、Ideogram、Stable Diffusion 3.5排名第一,成為AI生成圖像賽道的一匹黑馬。

因為“red-panda”(小熊貓)這個名字,最初還有很多人猜測該模型背后站著的是不是一家中國公司,直到今年10月,Recraft AI在推特上認領該模型,人們才開始關注這家已經成立了兩年的AI企業。

Recraft AI成立于2022年,是一家總部位于英國的初創公司。

創始人兼首席執行官安娜?維羅尼卡?多羅古什(Anna Veronika Dorogush),此前曾在谷歌和微軟從事軟件工程相關工作,后來加入了俄羅斯最大的搜索引擎平臺Yandex,是CatBoost開源梯度提升庫的創造者。

今年1月,Recraft AI獲得了一筆由美國風投機構Khosla Ventures領投的1100萬美元A輪融資,GitHub 前首席執行官納特?弗里德曼(Nat Friedman)也參與其中,該筆融資主要用于加速技術研發以及市場拓展。

由于國內大多用戶是通過社交媒體上傳播的“Hard Flash”模式,了解到的Recraft AI,所以人們通常會誤以為這是一家像Midjourney那樣的AI圖像生成公司。

但了解之后便會發現,Recraft AI成立的初衷一直是“專注于為平面設計師提供AI輔助工具”。因此,比起Midjourney,它其實更像是AI版的Cavan或者Photoshop。

就連排名第一的Recraft V3模型,某種程度上也是Recraft AI為了方便設計師生成海報而訓練的。

在Recraft V3模型官方介紹的博客中,該公司聲稱此模型是“圖像生成領域里,唯一可以生成帶有長文本內容的AI圖像模型”。

舉個例子,如果一名設計師需要在海報上展現大量文字內容,以往的AI生圖模型很容易在文字內容上出現拼寫錯誤,所以設計師的常規做法可能是先借助AI生圖生成海報背景圖,再用其他工具將文字內容P上去。

而Recraft V3模型的邏輯則是,通過提升AI直接在圖像中渲染文字內容的準確性,精簡設計師利用AI生成海報的流程。AI媒體“新智元”曾在文章中解釋該模型的運作機制:

在構建文本信息的過程中,Recraft團隊采用的是TextDiffuser-2的表征方式,每一行文本首先記錄了文本的內容,隨后通過坐標來指明文本的具體區域。但是與TextDiffuser-2不同的是,Recraft用了三個坐標點表示文本,使得模型能夠支持渲染傾斜的文本。

總之,結果就是借助Recraft V3,設計師對于海報中文字內容的生成效果與把控力,大大提升了。

除了AI生成漫畫風、寫實風、膠片風,矢量圖、插圖、圖標和3D圖像外,Recraft還提供套索、局部重繪、摳圖、mockup等設計工具。

體驗過后,最令刺猬公社的設計同事驚艷的是其中的mockup功能。借助AI能力,Recraft AI能夠實現圖樣或圖標自動貼合產品圖片,直接生成產品樣圖,省去了設計師手動調整參數的麻煩。此外,Recraft還引入了實時協作功能,同一項目的設計師可在無限畫布上對生成的內容進行評論,并及時修改。

三、懂模型不夠,還要懂內容

雖然似乎有80%的國內用戶,并沒有像Recraft AI創始人設想的那樣,把它當成AI設計工具使用,但憑借Hard Flash走紅對其而言也并非壞事。

從AI生成圖像領域的歷史來看,最近3年絕對是賽道內各大玩家競爭最激烈的時期,大家都在爭先恐后地更新大模型,生怕一不小心就被甩在身后。

2021年年初,OpenAI發布了DALL-E大模型,AI得以通過文字生圖;

2022年3月,Midjourney上線,能根據用戶輸入的文字快速生成高質量圖像;

2022年8月,Stable Diffusion正式開源,通過將隨機噪點轉化為高保真圖像,實現從文本到圖像的生成;

2024年8月,Black Forest Labs推出FLUX模型,其圖像質量、文本理解和細節表現均超越了Stable Diffusion 3以及Midjourney,成為了該領域新的領頭羊……

而到了10月,人們討論的主角又迅速變成了Recraft。

根據Recraft AI的官方數據顯示,在Recraft V3模型發布20天后,該應用在全球的累計注冊用戶已經超過了200萬。每次注冊登錄時,Recraft都會詢問用戶“通過什么途徑得知的該應用”,據創始人多羅古什透露:“幾乎所有的增長都來自于社交媒體,以及用戶之間的口口相傳。”

Recraft AI生成

這背后暗含的變化是,隨著AI生成圖像工具逐漸走進普羅大眾的生活,AI企業們要想出圈,僅憑模型實力也許還不夠。就像多羅古什在采訪時說的那樣:“僅僅靠生成高質量的AI圖像是不夠的,(產品)還需要建立一些能夠吸引人們注意力的東西。

”以往一些主要面向C端的AI產品,其實早已證明了這點。

比如去年火爆網絡的妙鴨相機和今年上半年火了一陣的Remini,這兩款產品一個瞄準了“AI寫真”,一個創建了“黏土特效”,兩者都是憑借極具代表性的產品功能,才在用戶心中留下了不可替代的產品標簽。

對于Recraft AI來說,Hard Flash所帶來的膠片感,就是它在社媒出圈、在更多用戶心中形成認知的“抓手”。

Recraft AI生成在一眾力爭畫面細節與真實感的AI模型中,Recraft出人意料地切入了允許不合常理的“想象力”賽道。

一方面,風格統一的濾鏡畫風,加深了普通用戶對于該應用的記憶,讓Recraft的名字在人們腦海中扎下了根。另一方面,這也十分巧妙了掩蓋了AI模型在部分能力上的欠缺,就算是生成的人物充滿塑料感、畫面總是以彩色幕布作為背景,但在“夢核”“怪誕”的風格標簽下,一切都變得合理。

AI企業不斷追求技術能力的層層突破,自然仍是當下AI發展階段的重中之重。但若想帶領更多的普通用戶走進AI時代,也許除了突破性的AI技術,同樣也需要進一步降低使用門檻、選擇適宜的產品定位以及營銷策略,唯有如此,才能有越來越多的AI產品“飛入尋常百姓家”。

文|啊游
編|陳梅希

本文由人人都是產品經理作者【刺猬公社】,微信公眾號:【刺猬公社】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!