開源大模型和閉源大模型,打法有何區別?

0 評論 3128 瀏覽 6 收藏 11 分鐘

現階段,各個公司都有自己的大模型產品,有的甚至不止一個。除了小部分開源外,大部分都選擇了閉源。那么,頭部開源模型廠商選擇開源是出于怎樣的初衷和考慮?未來大模型將如何發展?我們來看看本文的分享。

在對人工智能發展史的觀察中,我們發現了AIGC以及它背后的大語言模型在近年高速發展的諸多偶然與必然(可回顧歷史文章《關于AIGC崛起與行業發展,我有幾點小觀察…

但近兩年,大批大語言模型應用的涌現以及“百模大戰”的興起,卻與“模型開源”這個動作密不可分。

除了開放性,現階段的開源和閉源大模型在盈利模式、商業打法、發展策略等方面有何區別?頭部開源模型廠商選擇開源又是出于怎樣的初衷和考慮?未來開源和閉源大模型將如何發展?下文揭曉。

一、開源和閉源大模型的差異化打法

在大眾的認知中,開源軟件往往指向完整共享源代碼,任何人都能使用、檢查、修改和分發其源代碼的產品。

在計算機科學與技術發展進程中,Linux(操作系統)、Python、JavaScript(編程語言和框架)、MySQL(數據庫)、Transformer(深度學習框架)等產品的開源都顯得意義非凡。

開源大模型雖屬開源陣營中的一員,但現階段大多數開源的大模型并不像開源軟件那樣共享完整的源代碼、數據集、訓練過程等細節,更多屬于權重方面的有限開源。

這里面有大模型開發的數據量級、訓練復雜度等方面的原因。因為這層緣故,大多數開源模型更多依靠開源方來推動產品研發和迭代,社區貢獻度有限。

但即便如此,它讓大批開發者能在較低使用成本的基礎上,根據自身實際需求進行靈活調整,并解鎖更多商業場景和收益,也足以極大刺激整個產業的發展與繁榮。

閉源大模型和大多數閉源軟件差異不大,通常指不對外分享源代碼,僅所有者能合法訪問、修改和分發,經封裝后對外進行商業化變現的大模型產品。用戶一般只能在付費后按既定方式使用。

區別于開源產品經常采用的“開源方主導+社區共建”的開發模式,閉源大模型高度依賴開發方的自主研發和長線運營,主要通過知識產權的價值貨幣化快速獲取收益。

因為閉源大模型較之開源大模型存在更高的使用門檻,開發方會傾向于將大模型封裝成各種標準化的產品,方便各類開發商在此基礎上創建應用,并按實際消耗的tokens量、專有許可費等收費。

為了豐富業務線,目前主流的閉源大模型廠商也有基于底層模型推出AI應用,收取相應的產品訂閱、調用、定制化等費用,以擴大整體營收。

兩者迥異的開發形態和商業模式,決定了開源大模型前期更多通過免費/低價獲客和生態合作,壯大基本盤,實現對關聯業務的加持或業務場景及客源的拓展,服務于未來的財務增長。

而閉源大模型則更多采用“模型即服務”和應用拓展,直接進行商業變現,服務于當下的業績增長。

當兩者結合,共同推動了大語言模型的發展,加速著通用人工智能時代的來臨。

二、主流玩家開源大模型的幾點思考

就在最近,業內對開源和閉源大模型的討論聲不絕于耳。

孰是孰非這里不論,不過個人比較認同“我們都是受益于開源成長起來的個人和公司”這句話(摘自360創始人周鴻祎的公開發言)。

而且,在整理媒體對當下主流開源大模型掌舵人的采訪時,我們發現:各家選擇開源自家大模型產品,背后的商業考慮與決策依據其實挺耐人尋味。總結起來,主要包含以下幾點:

1)保障技術安全與良性發展。

比如包括Meta CEO扎克伯格、Mistral創始人Arthur Mensch等在內的頭部開源大模型廠商leader都有提到:模型的開源會是保障大模型技術安全,解決安全漏洞的有效措施。

而且伴隨用戶使用的增加,能更好地集思廣益,改善模型適用性與標準性,實現良性發展。這點與以往的開源軟件宗旨算是一脈相承。

2)實現產業賦能。

鑒于當前基于全棧國產化基礎軟硬件的平臺不多,已開源的多模態本土大模型產品也少,以中國科學院自動化研究所為代表的“國家隊”選擇開源自研的紫東太初大模型,則更多是想通過“大模型+小數據”的形式,推動大模型對產業帶來的賦能。

3)促成生態合作共贏。

作為開源大模型賽道的代表性廠商,Meta堅持開源Llama系列大模型,則很大程度上源于對未來發展的考慮。

在公開采訪中,Meta CEO扎克伯格曾表示:開源對Meta AI的未來發展有利。對于整個科技領域來說,大模型的開源也顯得意義深刻,能創造更多贏家。

國內方面,以智譜為代表的本土大模型廠商,通過開源ChatGLM-6B,在加速全球下載量的同時,催生了600+優秀大模型應用開源項目,此舉進一步推動了產業融合和AI生態建設。

4)為商業化做準備。

雖然開源意味著很難直接大規模商業變現,但作為獲客或打開知名度的手段,卻效果斐然。

比如2023年成立的Mistral AI ,因發布Mistral 7B、Mistral 8X7B兩大開源模型一舉成名,之后再推商業化模型,已能在業內快速打開局面,近期官宣獲得6.4億美元B輪融資。

而Llama系列的開源讓Meta保持在AI領域的獨特優勢,反哺社交、廣告等業務的同時,也打開了和云服務商、AI硬件平臺等合作的另一種可能。

除此之外,出于提升行業地位、擴大商業機會等考慮,也推動著不少大模型開發商選擇了開源,以爭取在商業生態中的競爭優勢或長遠發展。

三、未來開源和閉源大模型將如何共處?

目前,有人認為開源大模型和閉源大模型處在對立面,未來必將像零和博弈一般,你輸我贏,此消彼長。

不過在個人看來,兩者的關系未來很可能像開源軟件與閉源軟件一樣,長期共存,各自發展。

在這其中,開源產品能達到閉源產品很難企及的用戶覆蓋面與創新自由度,而閉源產品能更快、直接轉化為商業利益,進一步提升產品迭代速度和服務質量。

兩者就像Linux與Windows,Android與iOS,雖然有競爭,但互為補充,各自在擅長的領域開疆拓土。

只是在入局者越來越多、產品越來越卷的當下,未來市場難免會經歷洗牌,只保留少數頭部、更具有競爭優勢的選手。

這也是眼下國內外大模型廠商熱心于競爭生態位或出于商業化考慮,反復切換開源和閉源賽道,或豐富業務線以保持自身優勢的一大原因。

比如谷歌在推出閉源大模型Gemini Ultra的同時,發布了Gemma 2B 和7B兩款開源模型產品。Mistral在推出Mistral 7B、Mistral 8X7B兩大開源模型后一炮而紅,新推出的旗艦版大模型Large 則為閉源產品。

出于成本壓力和商業化考慮,目前開源大模型廠商和閉源大模型廠商的界限正逐漸模糊。

不過拋開這些,就整個行業來說,開源和閉源大模型的百花齊放,推動了AI上層應用生態乃至整個行業的繁榮,也為人們以較低門檻使用人工智能產品帶來了便利。

備注:本文原創,首發司普科技,第三方首發人人都是產品經理。有參考segmentfault、鈦媒體、智東西等,僅做分享。

本文由 @iseeworld 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Pixabay,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!