AI 如何顛覆社交互動?兩位 Snap 工程師做了這款表情包產(chǎn)品
生成式 AI 技術(shù)正引領(lǐng)一場社交媒體自我表達的革命。從 Remini 的黏土濾鏡到 Easel 的表情包,圖像生成領(lǐng)域的創(chuàng)新產(chǎn)品不斷涌現(xiàn)。生成式技術(shù)、社交媒體與自拍照的結(jié)合,為用戶提供了前所未有的個性化和創(chuàng)意表達空間。
Sense 思考:
我們嘗試基于文章內(nèi)容,提出更多發(fā)散性的推演和深思,歡迎交流。
個人天生就有尋求和表達真實自我的傾向,而社交媒體 App 提供了一個舞臺,讓人們通過圖像進行自我意識形態(tài)的表達。
在傳統(tǒng)濾鏡時代,圖像的表義能力是被攝像頭所限制的。而生成式 AI 的出現(xiàn),讓用戶的表達力從「現(xiàn)實增強」升級為了「想象增強」,并催生出更多新形式的內(nèi)容和全新的內(nèi)容載體。
妙鴨、Remini 和 Easel 只是圖像社交革命的前菜,讓我們拭目以待。
AI Native 產(chǎn)品分析——Easel
1. 產(chǎn)品:Easel
2. 產(chǎn)品上線時間:2023 年 12 月 8 日
3.創(chuàng)始團隊:
Rajan Vaish:CEO,聯(lián)合創(chuàng)始人。前 Snap 高級研究工程師。
Sven Kratz:聯(lián)合創(chuàng)始人。前 Snap 高級研究工程師。
4. 產(chǎn)品簡介:
Easel 是一款圖像社交產(chǎn)品,它巧妙地利用自拍表情包作為切入點,利用生成式 AI 技術(shù),為用戶提供了將自拍轉(zhuǎn)化為有趣、個性化的表情包的功能。Easel 目前只能用于 iOS 平臺,需要與 iMessage 一起配合使用。
5. 融資情況:
265 萬美元天使輪融資。投資者包括 Unusual Ventures、f7 Ventures 和 Corazon Capital 以及各種天使投資者(包括斯坦福大學(xué)的幾位教授)。
一、、從 Remini 的爆火講起
社交媒體上的人像照,早已成為流行的風(fēng)向標。從 iPhone 4 引領(lǐng)的前置攝像頭革命,到移動互聯(lián)網(wǎng)創(chuàng)業(yè)公司們利用光學(xué)傳感器、手機算力和圖像算法的“黃金三角”組合,社交網(wǎng)絡(luò)的每一次變革都伴隨著人像照的流行文化更迭。
從 Instagram 的照片濾鏡,到 SnapChat 的 AR 濾鏡,再到去年爆火的妙鴨相機,每一次技術(shù)的躍進都為人像照賦予了新的生命。
(圖片來自網(wǎng)絡(luò))
在 2024 年的五一勞動節(jié)期間,一款名為 Remini 的 App 異軍突起,迅速風(fēng)靡小紅書、抖音等社交媒體。這種濾鏡將用戶的形象轉(zhuǎn)化為粗糙、笨拙的黏土動畫片風(fēng)格,與主流的美顏文化形成鮮明對比。這種「蠢萌」的黏土風(fēng)格,為用戶帶來了一種自嘲式的幽默感和心理慰藉。
(圖片來自網(wǎng)絡(luò))
在 Remini 于內(nèi)網(wǎng)大熱的同時,另一家美國西海岸的初創(chuàng)公司正在探索另一條商業(yè)化道路。它們將圖像生成與自拍表情包加以結(jié)合,基于 Apple 平臺推出了 Easel,這是一款可在 iMessage 上通過圖像生成即時制作表情包的 App。
(圖片來自 Easel 官網(wǎng))
二、Easel + iMessage = 下一個 SnapChat?
Easel,這款由 Snap 兩名前員工創(chuàng)立的 App,似乎正在醞釀一場新的社交革命。其聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Rajan Vaish,曾在 Snap 任職五年,親眼見證了人臉濾鏡如何掀起流行文化的巨浪。而今,Rajan 意欲借助生成式 AI 再度掀起新一輪的流行文化熱潮。
他選取了表情包這一高頻用圖場景作為突破點。與妙鴨相機的體驗相仿,當用戶首次使用 Easel 時,它會抓拍數(shù)秒鐘的用戶面部照片,以構(gòu)建一個定制化的個人形象模型——不出所料,其背后運用的正是 Stable Diffusion 的開源生態(tài)的技術(shù)。
Easel 的創(chuàng)新之處在于,它將表情包與敘事相結(jié)合,使得圖像不僅僅停留在「美照」層面,更是用戶溝通、表達和情感傳遞的媒介。
在 Easel 的玩法中,用戶可以通過簡單的場景描述詞,為 @ 的人生成包含其形象的場景畫面。這不僅激發(fā)了用戶的創(chuàng)作欲望,也促進了社交互動的裂變。當對方看到這張圖后,很可能會產(chǎn)生回應(yīng)的動機,進而下載 Easel App 并使用「Remix」功能進行二次創(chuàng)作,形成病毒式的互動循環(huán)。
(圖片來自 Easel 官網(wǎng))
為了降低創(chuàng)作門檻,Easel 也準許用戶將生成的圖像發(fā)布到應(yīng)用內(nèi)的社區(qū)中,如此一來,特定的節(jié)日或事件或許會引發(fā)特定的內(nèi)容主題,從而提升用戶的參與熱度。
在 App Store 上,Easel 獲得了 5.0 的滿分好評,盡管僅有 21 個用戶參與了評分。其中一條評論興奮地寫道“歡迎來到社交媒體的未來”,并表示自己已經(jīng)生成了 500 張圖來與所愛的人分享。
(圖片來自 Easel 的 App Store 主頁)
那么,問題來了,Easel + iMessage 會成為下一個 SnapChat 嗎?
三、社交媒體與自我表達的心理學(xué)
社交媒體已經(jīng)成為現(xiàn)代人表達自我、展示個性的重要平臺。在這個過程中,「自我決定理論」(Self-Determination Theory,SDT)為我們提供了一個深入理解社交媒體自我表達心理的視角。
該理論指出,人類天生具有追求和表達真實自我的內(nèi)在動機,而當個體的基本心理需求——自主性(Autonomy)、能力性(Competence)、和關(guān)聯(lián)性(Relatedness)——得到滿足時,這種動機將得到加強。社交媒體應(yīng)用程序正是通過提供一個展示和交流的舞臺,來滿足這些基本心理需求,而人像照則成為用戶自我表達的重要載體。
在傳統(tǒng)濾鏡時期,圖像的表意能力被攝像頭所局限。用戶僅能通過濾鏡、AR 人臉貼紙等方式來實現(xiàn)「現(xiàn)實增強式」的自我表達。然而即便如此,上一輪以人臉關(guān)鍵點為核心的 AI 技術(shù)浪潮依然催生出了如抖音、美圖、FaceU 等現(xiàn)象級產(chǎn)品。
而生成式 AI 的出現(xiàn),為用戶的自我表達安上了想象的翅膀,圖像的「表意能力」得到進一步釋放。用戶的表達力從「現(xiàn)實增強」升級為了「想象增強」——用戶能夠利用文字來描述其最為天馬行空的場景想象,再讓擴散模型將其繪制出來?,F(xiàn)實的次元壁被打破,用戶首次看到了自己在吉卜力漫畫、皮克斯動畫、水彩、素描,甚至是文藝復(fù)興時代的油畫大師筆下的模樣。
(圖片來自本文作者的小紅書主頁)
與上一代以「美顏」為代表的應(yīng)用相比,生成式 AI 圖像生成應(yīng)用具有更強的內(nèi)容屬性、更多的互動玩法和更廣的美學(xué)風(fēng)格。這不僅能夠滿足用戶對于美的追求,更能夠激發(fā)用戶的創(chuàng)造力和想象力,讓他們能夠更加自由地表達自我。
四、技術(shù)與需求的雙向奔赴
生成式AI在商業(yè)領(lǐng)域成功落地的關(guān)鍵之一在于消弭幻覺、提高可控性。這條技術(shù)優(yōu)化路徑不僅適用于大型語言模型(LLM),也同樣適用于擴散模型(Diffusion Model)?;仡檲D像生成技術(shù)的發(fā)展歷程,早期模型由于可控性較差,其應(yīng)用場景主要局限于「文生圖」形式。這導(dǎo)致市場上的產(chǎn)品同質(zhì)化嚴重,用戶難以對圖像生成過程進行有效控制。
然而,伴隨 Lora、ControlNet、IPAdapter、InstantID,乃至最新的 PuLID 等一系列新技術(shù)的出現(xiàn),被生成的圖像有機會和用戶給定的參考圖,尤其是 IP(個人形象)構(gòu)建語義關(guān)聯(lián),使得圖像在生成的同時能夠保留人物的高維度面部特征,進而更進一步強化了用戶表達自我的能力。
歷史再一次表明,在圖像產(chǎn)品領(lǐng)域,技術(shù)和需求的雙向奔赴,往往首先會在人像照的應(yīng)用場景得以實現(xiàn)。圖像生成類的產(chǎn)品開始逐漸加入面部控制能力,催生出換臉、保 ID 生圖等新的玩法。這里面也包含了筆者上一次創(chuàng)業(yè)所做的 Stylar.ai 這款產(chǎn)品。
然而,由于大模型的技術(shù)特性,目前的圖像生成還很難做到「百發(fā)百中」,用戶往往需要在幾張、幾十張的生成結(jié)果中才能挑中他所滿意的那一張。這是因為在圖像生成領(lǐng)域仍然有很多可控性問題有待解決,而可控性勢必帶來交互體驗上的復(fù)雜性。
作為 C 端消費級產(chǎn)品來說,如何平衡技術(shù)、商業(yè)和用戶體驗,仍然是一個很考驗產(chǎn)品智慧的問題。
Easel 很巧妙地采取了「自拍表情包」這個視角,一方面它的傳播限制在少數(shù)親密關(guān)系鏈的對話場景中,另一方面它的表義性大于美顏性,因此從一定程度上做到了「揚長避短」,具有更大的技術(shù)容錯空間。
五、生成式 AI 與圖像社交的未來
隨著大型模型技術(shù)的不斷進步,我們正處于一個快速演變的時代,每天都有新的研究論文和技術(shù)突破涌現(xiàn)。在這樣的背景下,我們可以預(yù)見,將會有更多類似Remini和Easel這樣的創(chuàng)新產(chǎn)品和流行應(yīng)用不斷涌現(xiàn),為圖像社交領(lǐng)域帶來新的活力。
作為深度參與這一變革的觀察者,筆者認為以下幾個技術(shù)趨勢值得特別關(guān)注,它們有潛力催生出顛覆性的新產(chǎn)品:
1. 移動端端側(cè)的實時計算技術(shù)
隨著模型壓縮技術(shù)的發(fā)展和端側(cè) NPU 芯片的成熟,加之新一代 iPhone 的推出,移動端市場將迎來新的機遇。端上計算將重塑圖像生成產(chǎn)品的市場格局,推動更多以娛樂為導(dǎo)向而非僅僅定位于效率工具的圖像社交產(chǎn)品問世,同時提升類似 Easel 這樣的應(yīng)用的用戶體驗。
2. 文字生成與自動排版技術(shù)
文字生成能為圖像賦予表意能力,自動排版則可為圖像增添平面設(shè)計能力。這兩者的結(jié)合將推動圖像生成產(chǎn)品超越單一素材生成的局限,向更全面的商業(yè)級應(yīng)用發(fā)展,催生出海報設(shè)計、漫畫創(chuàng)作、廣告制作等垂直領(lǐng)域的應(yīng)用。
3. 數(shù)字人與角色動態(tài)驅(qū)動技術(shù)
隨著虛擬人技術(shù)的不斷進步,圖像和個人IP形象將被賦予更加豐富的情感、智慧和表達力。這種技術(shù)不僅可以應(yīng)用于短視頻和直播,還將促進全新的陌生人社交場景的誕生。
4. 新的圖像格式和內(nèi)容裂變
傳統(tǒng)的位圖格式以像素作為存儲單元,但生成式圖像包含了大量的「元信息」,這些元信息如同圖像的DNA,將引領(lǐng)新的圖像格式和內(nèi)容裂變玩法。在這個過程中,每一個創(chuàng)作者都將作為版權(quán)鏈條的一部分被記錄下來,這將促進創(chuàng)作生態(tài)的健康發(fā)展。
5. 空間計算與 3D 生成
眾多創(chuàng)業(yè)公司如Luma AI、Spline、Genmo 等正在積極探索 3D 內(nèi)容生成的解決方案。隨著 Vision Pro 等設(shè)備的普及,將為 3D 內(nèi)容生成提供更多的訓(xùn)練數(shù)據(jù)和商業(yè)化場景。3D 內(nèi)容非常契合生成式 AI 所擅長的虛構(gòu)內(nèi)容創(chuàng)作場景。生成式技術(shù)將為虛構(gòu)內(nèi)容創(chuàng)作提供更廣闊的舞臺。
展望未來,我們將見證一個更加多元化、個性化、互動式和沉浸式的圖像社交新紀元。讓我們拭目以待,看看未來將如何展開,而我們又將如何在這個充滿創(chuàng)意和想象的世界中找到自己的位置。
參考材料:
https://techcrunch.com/2024/04/23/with-easel-ex-snap-researchers-are-building-the-next-generation-bitmoji-thanks-to-ai/
https://apps.apple.com/us/app/easel-ai/id6448734086
本文由人人都是產(chǎn)品經(jīng)理作者【深思SenseAI】,微信公眾號:【深思SenseAI】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!