A16Z:生成式AI平臺,誰主沉???

0 評論 2413 瀏覽 5 收藏 30 分鐘

生成式AI正在創造用戶增長的歷史記錄,一些應用在發布不到一年的時間里就實現了高達1億美元的年營收,我們相信生成式AI,將對軟件行業和其他行業產生巨大的影響。這篇文章旨在分析出市場的驅動力,并嘗試回答和生成式AI的商業模式相關的更廣泛的問題。感興趣的童鞋一起來看看吧。

編者按

美國著名投資機構A16Z發表了一篇文章題為《Who Owns the Generative AI Platform?(生成式AI平臺,誰主沉???)》,里面包含幾個月以來對AIGC領域內大廠與初創公司的訪談調研和數據分析,可能是我最近看到對此類話題最客觀且詳實的討論。

從去年Midjourney火爆出圈,我便很快寫下第一篇對這個話題的討論《“早期”的AIGC,已在“中途”》。隨后一系列相關公司如Stability.AI、Runway、Jasper.AI等相繼得到資本的青睞,年底ChatGPT更是讓普通大眾看到了下一代AI技術可能帶來的“魔法”,背后的技術平臺OpenAI更傳言估值高達290億美金。

熱鬧之下,這篇文章給出了非常多公開整理和實際調研獲得的數據,并結合對上百家公司的真實訪談,得出的階段性結論——“目前,生成式AI領域似乎不存在任何系統性的護城河”,這一定程度上給大家“潑了冷水”,但似乎又與很多投資人和從業者的困惑相符。

且看A16Z是如何將這個話題層層剖析,由淺入深,并在最后給出誠實也充滿希望的答案的,Enjoy!

我們已開始見證生成式AI(AIGC)技術棧的興起。數以百計的初創公司正在涌入市場,開發基礎模型,構建人工智能原生的應用程序,并建立基礎設施和開發工具。

不像許多熱門的技術趨勢在市場跟上其步伐前就被過度炒作了,生成式AI的熱潮卻伴隨著極高的市場歡迎度以及真實的市場收益。如Stable Diffusion和ChatGPT的模型們正在創造用戶增長的歷史記錄,一些應用在發布不到一年的時間里就實現了1億美元的年營收。

對照表明,AI模型在某些任務上的表現優于人類好幾個數量級。已有足夠的早期數據表明范式轉移正在發生。而我們尚未明確的關鍵問題是:

這個市場中的價值將在哪里積累?

過去一年里,我們會見了幾十位生成式AI的從業者,他們有些是初創公司的創始人,有些在大公司中負責與生成式AI相關的工作。據我們觀察:

  • 基礎設施提供商可能是迄今為止市場上的最大贏家,他們賺取了流經技術棧的大部分資金;
  • 應用類公司的營收增長得非???,但在留存率、產品差異化和毛利率上卻容易遇到瓶頸;
  • 模型提供商雖然對這個市場而言不可或缺,但絕大多數都還沒有實現大規模的商業化。

換言之,創造最大價值的公司——即訓練生成式AI模型并將其應用在新的應用程序中的那些公司——尚未獲取最大的價值。我們很難預測接下來將發生什么,但我們認為,核心是理解技術棧的哪些部分真正具有差異化和壁壘。

這將對市場結構(公司的橫向或縱向發展)和其長期價值的驅動因素(利潤率和留存)產生重大影響。至今,除了經典的護城河之外,我們很難在技術棧中找到堅實的壁壘。

我們非??春蒙墒紸I,相信它將對軟件行業和其他行業產生巨大的影響。這篇文章的目標是描繪出市場的驅動力,并嘗試回答和生成式AI的商業模式相關的更廣泛的問題。

一、高級技術棧:基礎設施、模型和應用

為了理解生成式AI市場是如何形成的,我們首先需要定義當前的技術棧是如何構成的的。以下是我們的初步觀點:

A16Z:生成式AI平臺,誰主沉???| AIGC 101

該棧(自上而下)可分為三個層級:

  • 應用層:將生成式AI模型集成進面向用戶的應用軟件,它們或運行著自己的模型(端到端應用),或依賴于三方模型的API;
  • 模型層:驅動AI產品的模型,它們要么以專有API的形式提供,要么開源提供(這種情況需要一個對應的托管解決方案);
  • 基礎設施:基礎設施供應商(如云廠商或硬件制造商),它們負載著生成式AI模型的訓練和推理。

值得注意的是:這并非一幅市場全景圖,而是一個分析該市場的框架。在每個類別中,我們列出了部分知名的供應商,沒有試圖窮舉所有已發布的生成式AI應用。關于MLOps(機器學習運維)或LLMOps(大語言模型運維)工具的深入探討也將在后續的文章中展開,目前它們尚未高度標準化。

二、第一波生成式AI應用正邁向規?;?,但在留存率和差異化上仍面臨困難

在之前的技術周期中,人們普遍認為要建立一個獨立的大企業,公司必須擁有終端客戶——無論是個人消費者還是企業買家。因此人們更容易相信,生成式AI領域的最終贏家也會是面向終端的應用程序。

而目前,生成式AI的探索之旅依然迷霧重重??梢钥隙ǖ氖?,生成式AI應用程序的增速是驚人的,這得益于產品的新穎性和豐富的用戶用例。

我們了解到至少有三類產品年營收已經超過了1億美元,即圖像生成、文案寫作和代碼編寫。

然而,僅靠高增長還不足以建立經久不衰的軟件公司。關鍵之處在于增長的背后必須有利可圖——從某種意義上說,用戶一旦注冊,就會產生收益(高毛利),并長期留在應用中(高留存)。在技術缺乏差異化的情況下,B2B和B2C應用多數通過網絡效應、數據沉淀和日益復雜的工作流來推動長期客戶價值。

在生成式AI中,這些假設并不一定成立。那些與我們交談過的應用軟件公司,毛利率落在一個很大的區間——少數情況下可高達90%,但更多數情況僅有50-60%,主要受限于模型推理成本。雖然用戶漏斗頂端的增長十分驚人,但鑒于我們已經看見付費轉化和留存的開始下降,現有的獲客策略是否可規?;形纯芍?。

由于依賴類似的數據模型,許多應用軟件在產品層面相差無幾,并且它們均尚未找到友商難以復制的顯著網絡效應、數據積累或獨特工作流。因此,目前還無法明確直接銷售終端應用是否是構建生成式AI可持續商業模式的唯一甚至是最佳途徑。

隨著語言模型的競爭加劇和效率提升,應用的利潤空間將會提高(下文將詳述),而后面“白嫖黨”會逐漸離場,產品的留存也可能有所提升。一個強有力但仍待驗證的觀點是,縱向整合的應用(如上圖里的Midjourney)將在差異化上具有優勢。展望未來,生成式AI應用公司將面臨的主要問題包括:

  • 縱向整合(應用+模型):將AI模型視作一種服務,小型應用開發團隊可以快速迭代并隨著技術的演進替換模型供應商。另一方面,部分開發者認為模型就是產品本身,只有從頭開始訓練才能建立壁壘——即不斷對產品積累下來的專有數據進行訓練。這么做的代價是燒更多的錢并犧牲部分產品團隊的靈活性。
  • 構建功能還是應用:生成式AI的產品形態五花八門:桌面應用程序、移動應用程序、Figma/Photoshop插件、Chrome瀏覽器擴展應用甚至Discord機器人…在用戶已經習慣的工作界面中集成AI通常比較容易,因為交互界面往往只是一個文本框。這些公司中的哪些將成長為獨立的公司,哪些又將被已有AI產品線的大廠(如微軟或谷歌)收入麾下,值得拭目以待。
  • 設法穿越炒作周期(Hype cycle):用戶流失究竟是因為產品自身的產品力不足還是早期市場的人為表現目前尚無定論,對生成式AI的濃厚興趣是否會隨著炒作的消退而淡去也暫時沒有答案——何時加速融資?如何激進地獲客?優先考慮哪些用戶群體?何時宣告PMF成功?這些問題對于應用程序類公司而言意義重大。

三、模型提供商發明了生成式AI,但尚未實現大規模商業化

如果沒有谷歌、OpenAI和Stability.AI等公司奠定了杰出的研究和工程基礎,我們現在所說的生成式AI將無從存在。創新的模型架構和不斷擴展的訓練管道使我們均受益于大語言模型(LLMs)和圖像生成模型的“超能力”。

然而,這些公司的收入規模在其用量和熱度面前似乎不值一提。在圖像生成方面,得益于其用戶界面、托管產品和微調方法組成的操作生態,Stable Diffusion已經見證了爆炸性的社區增長。但Stability仍將免費提供其主要檢查點作為核心業務宗旨(愿景是開源)。

在自然語言模型中,OpenAI以GPT-3/3.5和ChatGPT占據主導地位,但到目前為止,基于OpenAI構建的殺手級應用仍相對較少,而且其API定價已經下調過一次。

這可能只是一個暫時的現象。Stability.AI仍是一家尚未專注于商業化的新興公司,隨著越來越多殺手級應用的構建——尤其當它們被順利整合進微軟的產品矩陣,OpenAI也有成長為龐然大物的潛力,屆時將吃走NLP領域一塊很大的蛋糕。當模型被大量使用,大規模的商業化自然水到渠成。

但阻力依然存在。開源模型可以由任何人托管,包括不承擔大模型訓練成本(高達數千萬或數億美元)的外部公司。是否有閉源模型可以長久地保持其優勢目前還是未知數。

我們看見由Anthropic、Cohere和Character.ai等公司自行構建的大語言模型開始嶄露頭角,這些模型和OpenAI基于類似的數據集和模型架構進行訓練,在性能上已經逼近OpenAI。

但Stable Diffusion的例子表明,如果開源模型擁有足夠高的性能水平和充分的社區支持,那么閉源的替代方案將難以與其競爭。如今,對專有API(如OpenAI)的需求正在迅速增長,托管可能是目前對模型提供商而言最明確的商業化路徑。

開源模型托管服務(如Hugging Face和Replicate)正在成為便捷地分享和集成模型的有效樞紐——甚至在模型提供者和消費者之間產生了間接的網絡效應。模型提供商通過模型微調和與企業客戶簽訂托管協議來變現,看上去是十分可行的。除此之外,模型提供商將面臨的主要問題還包括:

  • 商品化:人們普遍認為,AI模型的性能將隨時間推移趨于一致。在與應用開發者的交談中,我們可以確定這種情況尚未發生,在文本和圖像模型領域都還存在實力強勁的領跑者。它們的優勢并非基于獨特的模型架構,而是源自大量的資本投入、專有的交互數據沉淀和稀缺的AI人才。但這些會是持久的優勢嗎?
  • 客戶流失:依賴模型提供商是應用類公司起步甚至(早期)發展業務的絕佳方法。但當業務達到一定體量,這些公司就有動力構建或托管它們自己的模型。許多模型提供商的客戶分布高度不均衡,少數應用貢獻了絕大多數收入。一旦這些客戶轉向自研AI,對模型提供商將意味著什么?
  • 錢重要嗎:生成式AI的未來是把雙刃劍,前景無比光明卻也潛在巨大危害,以至于許多模型供應商以共益企業(B corps)的模式組織成立,它們或發行有上限的利潤份額,或以其他方式明確地將公共利益納入公司使命。這些舉措絲毫不影響它們融資。但此處有一個合理的爭議——即多數模型提供商是否真的想要獲取價值,以及它們是否應該這么做?

四、基礎設施供應商觸及一切并采摘了果實

生成式AI中的近乎一切都會在某個時刻通過云托管的GPU(或TPU)。無論是對于訓練模型的模型提供商和科研實驗室、執行推理和微調任務的托管公司或是兩者兼顧的應用程序公司,每秒浮點運算(FLOPS)都是生成式AI的命脈。這是很長時間以來第一次,最具顛覆性的計算技術的進步嚴重受限于計算量。

因此,生成式AI市場里的大量資金最終流向了基礎設施公司。

可以用一些粗算數字加以說明:我們估計,應用程序公司平均將約20-40%的年收入用于推理和定制化的微調,這部分通常直接支付給云服務提供商以獲取實例或支付給第三方模型提供商——相應地,這些模型提供商將大約一半的收入投入于云基礎設施。

據此我們有理由推測,生成式AI總營收的10-20%將流向云服務提供商。

除此之外,訓練著自有模型的初創公司們已經籌集了數十億美元的風險投資——其中大部分(早期階段高達80-90%)通常也花在云服務提供商身上。許多上市科技公司每年在模型訓練上花費數億美元,它們要么與外部的云服務提供商合作,要么直接與硬件制造商合作。

這就是我們常說的“一大筆錢”——尤其是對于一個新興市場而言。其中大部分的錢都花在了三大云上:AWS、谷歌云(GCP)和微軟Azure。三朵云每年花費超千億美元的資本支出以確保它們擁有最全面、最可靠、最具成本優勢的云平臺。

尤其在生成式AI領域,三朵云還受益于有限的供給,因為它們可以優先使用稀缺的硬件(如英偉達的A100和H100 GPU)。眼下,我們看見該領域的競爭也開始出現。

甲骨文等挑戰者已經通過巨額的資本支出和銷售激勵進軍市場;一些提供針對大模型開發人員提供解決方案的初創公司,如Coreweave和Lambda Labs也正在快速發展,它們在成本、可用性和個性化支持上展開角逐。

此外,初創公司還公開更細粒度的資源抽象(即容器),而受限于GPU虛擬化,大型云廠商只提供虛擬機實例。

迄今為止,生成式AI領域最大的幕后贏家,可能是運行了絕大多數AI工作負載的英偉達(NVIDIA)。該公司報告稱,2023財年第三季度,其數據中心GPU的收入為38億美元,其中相當一部分用于生成式AI用例。

通過數十年對GPU架構的投資、產學研深入合作以及軟硬件生態系統的構建,英偉達已圍繞該業務建立了堅固的護城河。最近一項分析發現,研究文獻中引用英偉達GPU的次數是頂級AI芯片初創公司總和的90倍。

其他硬件選項確實存在,包括谷歌張量處理單元(TPU)、AMD Instinct GPU、AWS Inferentia和Trainium芯片,以及來自Cerebras、Sambanova和Graphcore等初創公司的AI加速器。后發者英特爾(Intel)也帶著高端的Havana芯片和Ponte Vecchio GPU 進入了這個市場。

但到目前為止,仍然鮮有新芯片能夠占據可觀的市場份額。有兩個例外值得關注,一個是谷歌,其TPU在Stable Diffusion社區和谷歌云平臺的一些大型案例中表現出了巨大吸引力,另一個是臺積電,據說它生產了以上所列舉的所有芯片,包括英偉達的GPU(英特爾的芯片則由自有晶圓廠和臺積電共同生產)。

換句話說,基礎設施可能是整個技術棧中可持續獲利且有壁壘的一層?;A設施供應商需要回答的主要問題包括:

  • 保持無狀態工作負載:無論在哪里租用英偉達的GPU都是一樣的。大多數AI工作負載是無狀態的,從某種意義上說,模型推理無需附加的數據庫或存儲(除模型權重本身外)。這意味著AI工作負載可能比傳統應用程序的工作負載更易于跨云遷移。在這種情況下,云服務提供商應如何創造用戶粘性,防止客戶轉向便宜的選擇?
  • 芯片荒終結后的較量:云服務提供商和英偉達產品的定價都是基于最理想的GPU目前供給稀缺。一位供應商告訴我們,A100的售價自發布以來有所上漲,這對于計算硬件而言是極不尋常的。若通過增加產量和/或采用新的硬件平臺可最終消除芯片的供給限制,云服務提供商將受何影響?
  • 挑戰者能否破局:我們堅信,垂直云將通過提供更加專業的服務從三朵云手中奪取市場份額。到目前為止,在AI領域,部分挑戰者通過適度的技術差異化和英偉達的支持已經獲得了一定的市場吸引力——對英偉達而言,現有的云服務提供商既是最大的客戶,也是新興的競爭對手。但長期的問題是,這些助力是否足以幫助新興云廠商攻克三朵云的規模優勢?

五、那么……價值最終將在哪里積累?

顯然,我們還不知道答案。但結合生成式AI的早期數據和我們關于AI/ML初創公司的經驗,我們有以下直覺:如今,生成式AI領域似乎不存在任何系統性的護城河。由于基于相似的模型構建應用,應用程序提供商缺乏顯著的的產品差異。

其次,由于模型基于相似架構和相似的數據集訓練而來,模型提供商長期可能會趨于一致。最后,由于運行同樣的GPU,甚至硬件公司在相同的晶圓廠生產芯片,云服務提供商缺乏深度的技術差異。

當然,老生常談的護城河依然存在,比如:規模護城河(“我能比你融到更多的錢!”),供應鏈護城河(“我擁有你所沒有的GPU!”),生態護城河(“所有人都已經在使用我的軟件”),算法護城河(“我們比你更聰明!”),分發護城河(“我已經組建了銷售團隊并且客戶數比你多!”)以及數據管道護城河(“我在互聯網上爬取了比你更多的信息!”)。

但長期而言,這些護城河并不可持續。強大的網絡效應是否會在生成式AI技術棧中的任何一層占據上風?現在下定論,一切還為時過早。根據現有數據,我們很難判斷,生成式AI長期是否會形成贏者通吃的局面。這很不尋常,但對我們而言是個好消息。

這個市場的潛在規模難以把握——它介于所有軟件和所有人類的努力之間——因此我們預計將有許多玩家參與到技術棧各個層級的有序競爭中。我們也希望公司無論橫向延展或是縱向深耕都能取得成功,為終端市場和終端用戶提供最佳解決方案。舉例來說:

  • 如果終端產品的差異化源自AI本身,那么縱向深耕(即緊密耦合面向用戶的應用和自研模型)可能會取勝;
  • 如果AI屬于一個更大的長尾功能組合,那么橫向延展將更可能發生。隨著時間的推移,我們將看見更多典型護城河的建立——甚至可能見證新型護城河的誕生。

無論如何,有一件事我們可以確定,生成式AI正在改變這場游戲,而我們都在與時俱進地學習著游戲規則。大量價值將被AI釋放,科技領域終將發生翻天覆地的變化。此刻,我們正在這浪潮之上,擁抱生成式的新未來!

文中提及的初創公司/產品

  • Midjourney:基于Stable Diffusion的AI圖像生成平臺,產品于2022年7月公測,據相關資料表明以實現盈利。https://midjourney.com/home/
  • Runway:基于Stable Diffusion的AI內容生成平臺,目前核心功能為text to image和text to vide,公司成立于2018年,2022年12月宣布完成5000萬美元C輪融資,估值達5億美元,預計年營收為500萬美元。https://runwayml.com/
  • Jasper.AI:基于GPT-3的AI文案生成平臺,公司成立于2021年,2022年10月宣布完成1.25億美元的A輪融資,估值達15億美元,預計2022年全年營收將達9000萬美元。https://www.jasper.ai/
  • GitHub Copilot:基于OpenAI Codex的AI代碼編寫平臺,產品發布于2021年7月,據Growjo預計其年營收為150萬美元。https://github.com/features/copilot
  • GPT-3(OpenAI):由OpenAI創建的語言預訓練模型,擁有1750億參數,2020年5月發布,迄今已有超300款應用基于GPT-3構建;OpenAI成立于2015年,是一家人工智能研究實驗室,擁有包括GPT系列、DALL-E、Codex等覆蓋多應用領域的基礎模型,據推測公司目前的年營收在5000-8000萬美元之間,繼2019年獲微軟10億投資后,于今年1月在此獲得微軟的多年期100億美元投資。https://openai.com/
  • Stable Diffusion(StabilityAI):由Stability創建的深度學習文字轉圖像模型,2022年8月發布,該模型為開源模型,參數量在10億級別,https://stablediffusionweb.com/;與Open AI類似,Stability AI是一家人工智能研究實驗室,致力于為內容創作者提供多樣化的開源模型,2022年10月,公司宣布完成1億美元融資,估值達10億美元。https://stability.ai/
  • Anthropic:研究型AI公司,目標是創建一個可解釋、更強大的AI系統,2021年由OpenAI前研究副總裁達里奧·阿莫代帶頭成立,2022年4月宣布完成5.8億美元A輪融資。https://www.anthropic.com/
  • Cohere:自然語言模型處理平臺,旨在提升NLP模型的易用性,其核心模型為谷歌的Transformer,公司成立于2019年,2022年2月宣布完成1.25億美元B輪融資。https://cohere.ai/
  • Character.ai:提供神經語言模型和基于此構建的Chatbot,2022年9月發布beta版本。https://beta.character.ai/
  • Hugging Face:機器學習模型和數據集托管平臺,向客戶交付可用模型,公司成立于2016年,迄今已開放10萬個預訓練模型和1萬個數據集,2022年5月宣布完成1億美元C輪融資,估值達20億美元。https://huggingface.co/
  • Replicate:機器學習模型托管平臺,幫助模型實現快速交付,公司成立于2019年,并于2020年獲得Y Combinator的種子輪投資。https://replicate.com/
  • CoreWeave:為大規模GPU加速工作負載的云服務提供商,公司成立于2017年,累計融資額達1.5億美元。https://www.coreweave.com/
  • Lambda Labs:為深度學習打造的云GPU,公司成立于2012年,累計融資額近7000萬美元。https://lambdalabs.com/
  • Cerebras:AI芯片研發商,為深度學習構建計算系統,公司成立于2015年,2021年11月宣布完成2.5億美元F輪融資,估值超40億美元。https://www.cerebras.net/
  • Sambanova:AI芯片研發商,設計和構建集成的硬件和軟件解決方案,公司成立于2017年,2021年4月宣布完成6.76億美元D輪融資,估值超50億美元。https://sambanova.ai/
  • Graphcore:AI芯片研發,設計和研發智能處理器單元(IPU)硬件和相應軟件,公司成立于2016年,2020年12月宣布完成2.22億美元E輪融資,估值達27.7億美元。https://www.graphcore.ai

參考文章

  • Art Isn’t Dead, It’s Just Machine-Generated | Andreessen Horowitz
  • September 2022 – OpenAI API Pricing Update FAQ
  • Follow the CAPEX: Cloud Table Stakes 2021 Retrospective
  • SEC Filings Details
  • State of AI Report 2022 – ONLINE
  • Verticals clouds are on the rise, as traditional clouds give way to specialization.
  • The New Business of AI (and How It’s Different From Traditional Software) | Andreessen Horowitz

原作者:Matt Bornstein,Guido Appenzeller,Martin Casado

原文地址:https://a16z.com/2023/01/19/who-owns-the-generative-ai-platform/。

譯者:KZ、GN ;微信公眾號:我思鍋我在(ID:thinkxcloud)

本文由 @我思鍋我在 翻譯發布于人人都是產品經理,未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!