幾乎所有創(chuàng)企都在用的Stable Diffusion,真的可能要甩賣(mài)了
最近,有消息稱(chēng)Stability AI可能要把自己“甩賣(mài)”了,那么在這一消息背后,顯露出了Stability AI的哪些問(wèn)題?一起來(lái)看看本文的解讀。
最近 Twitter 上大家在傳 The Information 報(bào)道的 Stability AI 打算把自己賣(mài)了的消息。從 2022 年 8 月推出 Stable Diffusion 以來(lái),不到兩年的時(shí)間,淪落到出售公司的程度。甚至據(jù)很多業(yè)內(nèi)人士分析,Stability AI 真的放到市場(chǎng)上,可能賣(mài)不出多少錢(qián)。
The Information 報(bào)道該消息的文章|圖片來(lái)源:The Information
進(jìn)入 2024 年,Stability AI 風(fēng)波不斷。3 月 21 日,開(kāi)發(fā) Stable Diffusion 的幾名核心研究人員離職。過(guò)了沒(méi)有兩天,Stability AI 的 CEO Emad Mostaque 宣布離任,并退出董事會(huì)。又過(guò)了沒(méi)到一個(gè)月,4 月 19 日,Stability AI 又宣布裁員 20 人,約占全體員工的 10%。
Stability AI 到底挖了多大的坑?根據(jù) The Information 的說(shuō)法,Stability AI 私下表示 2023 年的營(yíng)收只有 800 萬(wàn)美金左右,這個(gè)數(shù)字比之前網(wǎng)傳的 1100 萬(wàn)美金還低了不少。而根據(jù)彭博社在 2023 年 10 月的報(bào)道,Stability AI 一個(gè)月就要在員工工資和云計(jì)算等領(lǐng)域支出 800 萬(wàn)美金,其他不算,公司利潤(rùn)率怒達(dá)-1100%。
而 2024 年第一季度,Stability AI 收入不到 500 萬(wàn)美元,貌似賺得多了點(diǎn),但虧損超過(guò) 3000 萬(wàn)美元,利潤(rùn)率稍微好看了些,也就是-600%。
公司經(jīng)營(yíng)結(jié)果一塌糊涂,還欠了不少外債,據(jù)傳 Stability AI 欠云計(jì)算供應(yīng)商和其他公司 1 億美元。相比之下,隔壁 Midjourney 只有十幾名員工,就能拿下 3 億美金左右年?duì)I收。
如此糟糕的財(cái)務(wù)狀況,幾乎所有生圖類(lèi)產(chǎn)品都會(huì)用其底層模型的 Stability AI,到底問(wèn)題出在哪?
一、開(kāi)源+API 的商業(yè)模式陷阱
經(jīng)過(guò)一番資料的搜索,對(duì)于這個(gè)問(wèn)題,筆者主要總結(jié)出了兩個(gè)方面的原因,一是公司的管理出現(xiàn)了問(wèn)題,二是 Stability AI 的商業(yè)模式一直沒(méi)有跑通。
Stable Diffusion 其實(shí)并不是 Stability AI 開(kāi)發(fā)的產(chǎn)品,這款模型最初是由項(xiàng)目負(fù)責(zé)人 Robin Rombach 攻讀博士學(xué)位的慕尼黑大學(xué)和另一個(gè) AI 視頻創(chuàng)企 runway 共同開(kāi)發(fā)的開(kāi)源模型項(xiàng)目 Latent Diffusion。
而 Stability AI 最初只是為項(xiàng)目提供了計(jì)算資源,才取得了冠名權(quán)。而 2022 年,Stability AI 說(shuō)服了負(fù)責(zé)人 Robin Rombach 和其他核心成員加入公司,這才“名正言順”地獲得了 Stable Diffusion 的所有權(quán)。
雖然獲得了所有權(quán),但是 Stability AI 的管理卻一地雞毛。有離職員工透露,CEO Mostaque 幾乎不懂研究,也不會(huì)為研發(fā)團(tuán)隊(duì)制定計(jì)劃、分配資源,加上他個(gè)人的學(xué)歷、經(jīng)歷造假、欺騙投資人、欠薪等丑聞,造成 Stability AI 管理混亂,負(fù)面新聞纏身。如果說(shuō)管理層混亂是一個(gè)例外,Stability AI 選擇的商業(yè)化路徑在為很多做開(kāi)源模型、API 收費(fèi)的企業(yè)敲響警鐘。
Stability AI 商業(yè)模式圖解|圖片來(lái)源:FourWeekMBA
眾所周知,Stable Diffusion 是一款開(kāi)源模型,所有人都可以免費(fèi)下載和修改模型。
而 Stability AI 本身則是靠 API、企業(yè)服務(wù)、AI 相關(guān)的咨詢(xún)來(lái)賺錢(qián)。這個(gè)開(kāi)源商業(yè)化模式,模仿的是 Linux 的提供商 RedHat,即靠開(kāi)源打出知名度,再靠 API 和企業(yè)定制產(chǎn)品在 B 端賺錢(qián)。Stable Diffusion 在推出伊始就上線(xiàn)了 API。
目前來(lái)看,市面上絕大多數(shù)的生圖產(chǎn)品,使用的都是 SD 和它的衍生模型,受眾遠(yuǎn)比 Midjourney 和 DALL-E 等閉源模型要大很多,而為什么 Stable Diffusion 被那么多創(chuàng)企采用,官方做 API 卻不賺錢(qián)呢?
第一個(gè)原因其實(shí)是模型本身的設(shè)計(jì),由于 SD 從一開(kāi)始就是開(kāi)源模型,所以在設(shè)計(jì)時(shí)就比閉源模型參數(shù)更少,更輕量,以滿(mǎn)足離線(xiàn)部署的需求,因此,SD 原模型的生圖效果其實(shí)是不如閉源模型的。
但是 SD 作為開(kāi)源模型,本身設(shè)計(jì)上,留下了很大的“可調(diào)整空間”,例如對(duì) SD 模型進(jìn)行微調(diào)可以得到 Checkpoint,可以?xún)?yōu)化某種特定風(fēng)格的生圖質(zhì)量,進(jìn)一步還能在 Checkpoint 的基礎(chǔ)上對(duì) cross-attention layer 進(jìn)行調(diào)整形成 LoRa 模型,來(lái)添加特定對(duì)象或?qū)崿F(xiàn)人物、風(fēng)格一致的效果。這些都給了用戶(hù)和開(kāi)發(fā)者按需求/場(chǎng)景,實(shí)現(xiàn)更佳效果的可能。而在實(shí)際落地中,絕大多數(shù)開(kāi)發(fā)者都會(huì)對(duì) SD 模型進(jìn)行重新訓(xùn)練,來(lái)適應(yīng)電商、廣告、或者漫畫(huà)臉等場(chǎng)景。
而直接調(diào)用 API,單純做套殼產(chǎn)品,其實(shí)競(jìng)爭(zhēng)力不大,無(wú)法滿(mǎn)足多數(shù)廠(chǎng)商的業(yè)務(wù)落地需求。
第二個(gè)原因成本問(wèn)題。
信息來(lái)源:各公司官方網(wǎng)站
其實(shí)單看 API 費(fèi)用的話(huà),除了最新推出的 SD3 比較昂貴之外,SDXL 和 SD1.6 等已開(kāi)源的模型的 API 可以說(shuō)比 OpenAI 便宜不少了,與騰訊混元的文生圖 API 價(jià)格相當(dāng)。
用戶(hù)云上部署 SD 的成本核算分享|圖片來(lái)源:AI魔法學(xué)院
但是如上所述,很多廠(chǎng)商為了落地,會(huì)選擇自行部署。而 SDXL 和 SD1.6 都是完全開(kāi)源模型,任何用戶(hù)都可以自行下載和部署這兩款模型。甚至,一些云廠(chǎng)商也會(huì)將 SD 這種完全開(kāi)源的模型做成即插即用的插件放在自己的解決方案里。
AWS SD 插件概述|圖片來(lái)源:AWS官網(wǎng)
根據(jù)網(wǎng)絡(luò)上的分享,使用騰訊云部署 SD 1.5 的話(huà),平均單張圖片花費(fèi) 0.1-0.01 元人民幣,合 1 美金能生成 70-710 張圖片;而上面提到的 AWS 的云服務(wù),1 美金大約可生成 240 張圖片。而如果選用更便宜的云服務(wù)提供商的話(huà),這個(gè)價(jià)格能做到更低。
那我們把云部署的費(fèi)用更新到表格中,就會(huì)變成下面這樣:
這么一比,雖然 SD 在 API 價(jià)格對(duì)比層面,費(fèi)用確實(shí)不高,但和其他一些方式比沒(méi)有成本優(yōu)勢(shì)。
谷歌搜索“SD API”結(jié)果(上),第三方 API 的價(jià)格(下)
最后,依然是因?yàn)橥耆_(kāi)源,在 Stable Diffusion 出來(lái)不久,就已經(jīng)各路有三方 API 出現(xiàn)了,目前在谷歌搜索“Stable Diffusion API”第一條是官網(wǎng),第二條就是一個(gè)第三方 API 的網(wǎng)站,甚至這個(gè)網(wǎng)站提供無(wú)限次使用 API 的服務(wù),價(jià)格為 147 美金/月。
SD 使用的 Creative ML OpenRAIL-M license 協(xié)議關(guān)于“分發(fā)模型”的條款,注:SD 使用的協(xié)議是專(zhuān)為 AI 開(kāi)源產(chǎn)品設(shè)計(jì),而類(lèi)似 DeepSeek 等國(guó)內(nèi)出海產(chǎn)品會(huì)使用針對(duì)一般開(kāi)源軟件的 MIT 協(xié)議,兩者商業(yè)化條款的規(guī)定基本相同,前者在道德等層面上會(huì)做了更多的規(guī)定,促使人們安全地使用 AI。
對(duì)于其他企業(yè)使用開(kāi)源模型做三方 API 的法律問(wèn)題,我咨詢(xún)了法律專(zhuān)業(yè)人士。他表示能否提供三方 API 服務(wù)需要參考產(chǎn)品協(xié)議中列示的商用條款,如果違反條款,原開(kāi)發(fā)者就有權(quán)進(jìn)行索賠。而 Stable Diffusion 所使用的協(xié)議,完全允許向第三方分發(fā)模型,包括銷(xiāo)售付費(fèi) API,這讓 SD 官方的 API 無(wú)形中又多了無(wú)數(shù)競(jìng)爭(zhēng)對(duì)手。
目前,很多國(guó)內(nèi)大模型都在走開(kāi)源+API 的路徑,但是在開(kāi)源的基礎(chǔ)上,都會(huì)擁有能力更強(qiáng)的閉源模型,或干脆將開(kāi)源閉源分成兩個(gè)系列(比如 Google 的 Gemini 和 Gemma),為自己的 API 保留一些差異,在開(kāi)源和商業(yè)化方面找到平衡。
看下來(lái),Stablity AI 陷入“瘋狂燒錢(qián),但營(yíng)收不利”的局面,其實(shí)就是沒(méi)有在開(kāi)源的同時(shí)推出能夠區(qū)別于開(kāi)源模型的差異化產(chǎn)品,在價(jià)格上也無(wú)法與自行部署模型來(lái)競(jìng)爭(zhēng)。在價(jià)格更低、部署也并不麻煩的情況下,B 端用戶(hù)們自然會(huì)更傾向自行部署大模型、甚至直接使用部署了開(kāi)源模型的云服務(wù),而不是調(diào)用 API,Stablity AI 自己的模型開(kāi)源把自己的商業(yè)化路徑堵死了。
二、從開(kāi)源轉(zhuǎn)向閉源,Stablity AI 的自救能成功嗎?
這樣的商業(yè)化困境,造成 Stablity AI 一直要靠融資維持,早在去年 11 月份,就有消息爆出,投資者對(duì)公司業(yè)績(jī)不滿(mǎn)而要求 CEO 辭職的新聞。
為此,Stability AI 開(kāi)始密集進(jìn)行商業(yè)化嘗試,涵蓋 API、限制自行部署模型商用、ToC 訂閱付費(fèi)等多種模式。
評(píng)論 Stablity AI 會(huì)員訂閱的X帖文|圖片來(lái)源:X
去年 12 月底 Stablity AI 針對(duì)自行部署模型用戶(hù),變更了政策,簡(jiǎn)單說(shuō)就是不商用還可以免費(fèi)用,但如果商用,就要買(mǎi)會(huì)員了。
這個(gè)政策變更覆蓋的模型有 SDXL Turbo、視頻生成模型 SVD 等(未來(lái)還會(huì)有 SD3)。與之前堅(jiān)持的不限制商用的開(kāi)源協(xié)議不同,Stablity AI 想通過(guò)限制“自部署”模型的商用權(quán)限獲得收入。
Stablity AI 宣布在 API 中推出 SD3 的 X 帖文|圖片來(lái)源:X
而且 SD3 宣布了很久,一直沒(méi)上線(xiàn)模型,只提供了 API 調(diào)用,Stablity AI 似乎有轉(zhuǎn)向閉源的趨勢(shì)。
4 月 17 日,Stablity AI 宣布 SD3 和SD3 Turbo 可以通過(guò)調(diào)用 API 中訪(fǎng)問(wèn)模型,而且在 X 帖文中還提到,為了實(shí)踐開(kāi)源的承諾,未來(lái)將在 Stablity AI 會(huì)員的權(quán)益中添加這兩款模型,但絕口不提完全開(kāi)源的事情。
Stable Artisan 訂閱價(jià)格
除了收模型的會(huì)員費(fèi),在 5 月 9 日,Stablity AI 又宣布開(kāi)始做 C 端生意了,推出基于 Discord 的 AI 圖像工具 Stable Artisan。
用戶(hù)可以在 Discord 中輸入提示詞,用 SD3、Stable Video 和 Stable Image Core 等最新模型進(jìn)行生圖、修圖、生成視頻等操作。商業(yè)化方面,Stable Artisan 采取訂閱制,用戶(hù)可以根據(jù)生圖數(shù)量的需求按月或年付費(fèi)?!癉iscord 平臺(tái)+4 檔訂閱付費(fèi)”,這幾乎已經(jīng)是照抄 Midjourney 的模式了,只不過(guò)訂閱價(jià)格略便宜一些。
但問(wèn)題是,面對(duì)各路生圖模型的競(jìng)爭(zhēng),Stablity AI 還能收到 C 端用戶(hù)的錢(qián)嗎?
測(cè)試方式:用各生圖模型生成多組圖片,由人類(lèi)進(jìn)行打分|圖片來(lái)源:數(shù)字生命卡茲克
CSDN 上另一個(gè)測(cè)評(píng)的結(jié)果|圖片來(lái)源:CSDN
要想探究這個(gè)問(wèn)題,我們首先要看,Stablity AI 的模型能力是否有優(yōu)勢(shì),這個(gè)答案是“似乎沒(méi)有”。我們以最新推出的 SD3 為例,雖然 Stablity AI 在論文中表示經(jīng)過(guò)測(cè)試,SD3 比市面上所有模型都要強(qiáng)。
但是根據(jù)國(guó)內(nèi)媒體進(jìn)行的測(cè)評(píng),在細(xì)節(jié)質(zhì)量、語(yǔ)義理解和審美三個(gè)點(diǎn)的評(píng)分上,SD3 基本都低于 MidjourneyV6,雖然這個(gè)測(cè)評(píng)帶有不小的主觀(guān)性,但是綜合筆者看到的其他測(cè)評(píng)結(jié)果,至少可以得出結(jié)論,SD3 并沒(méi)有碾壓 Midjourney、DALL-E 的實(shí)力,不同模型在不同的維度上各有優(yōu)劣。
分別為負(fù)面提示詞、種子值、長(zhǎng)寬比、模型(只有 SD3 和 Coreke xuan)、圖片數(shù)量
而且,與 API 有同樣的問(wèn)題,Stable Artisan 也不能像市面上的其他生圖產(chǎn)品那樣調(diào)節(jié)更多的參數(shù)或使用 Lora,可控性上可能還不如那些使用了開(kāi)源 SD 模型的產(chǎn)品。
此外,目前 Stable Artisan 只支持在 Discord 聊天框里輸入 Prompt,但是筆者看下來(lái),幾乎沒(méi)有對(duì)用戶(hù)的指引,用戶(hù)雖然可以二次創(chuàng)作其他人生成的圖片,但只能像“原始版 Midjourney”那樣,在 Discord 中一頁(yè)一頁(yè)的翻找。更不要說(shuō),像很多生圖產(chǎn)品那樣有讓用戶(hù)點(diǎn)標(biāo)簽生成提示詞,或者像 SeaArt 一鍵做同款等方便用戶(hù)操作的設(shè)計(jì)了。
Discord 中用戶(hù)使用去背景功能后的效果|圖片來(lái)源:Stable Diffusion Discord
此外,筆者瀏覽了一下 Discord 中其他用戶(hù)的生圖記錄,絕大多數(shù)用戶(hù)都是在使用文生圖工具,使用線(xiàn)稿生圖或去背景/對(duì)象等其他功能的用戶(hù)并不太多,而且這個(gè)去背景的效果,似乎也不怎么好。
Discord 邀請(qǐng)頁(yè)面顯示的在線(xiàn)人數(shù)
從人氣來(lái)看,Stable Diffusion Discord 的在線(xiàn)人數(shù)只有 Midjourney 一個(gè)零頭。而目前,Midjourney 網(wǎng)站端的生圖功能已經(jīng)向生圖超過(guò) 100 張的用戶(hù)開(kāi)放了,其他生圖產(chǎn)品基本都在網(wǎng)站端使用了。而 Stable Diffusion 才剛剛走上 Midjourney 等產(chǎn)品一年半前走的路。
寫(xiě)在最后
作為一個(gè) AI 時(shí)代的明星,Stable Diffusion 和 Stablity AI 已經(jīng)寫(xiě)下濃墨重彩的一筆,但是不到 2 年的時(shí)間,就淪落到出售公司的程度,也令人唏噓不已。未來(lái)開(kāi)源 AI 這條路能否走出“瘋狂燒錢(qián),卻不掙錢(qián)”的死路,找到可行的商業(yè)模型,可能還要未來(lái)的 AI 創(chuàng)企們給出答案了。
參考文獻(xiàn):
- Stable Diffusion | SD 騰訊云 3 步部署,全程五分鐘,附價(jià)格費(fèi)用清單
- Stability AI Facing Cash Crunch,Discusses Sale
- 曾經(jīng)爆紅的AI獨(dú)角獸,走到了樹(shù)倒猢猻散的邊緣
- 瘋狂燒錢(qián)、管理混亂,Stable Diffusion 背后企業(yè)瀕臨倒閉
- How does Stability AI make money? Stability AI business model analysis
作者:張凱然,編輯:殷觀(guān)曉;出品:白鯨出海編輯部
來(lái)源公眾號(hào):白鯨出海(ID:baijingAPP),泛互聯(lián)網(wǎng)出海服務(wù)平臺(tái)。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @白鯨出海 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于CC0協(xié)議。
該文觀(guān)點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!