最后一公里不解決,大模型開閉源都一文不值

0 評論 1329 瀏覽 1 收藏 20 分鐘

隨著人工智能技術的飛速發展,大模型技術已成為行業焦點。行業領袖們關于開源與閉源的激烈辯論,映射出科技發展的多樣化途徑與思維碰撞。本文將揭示大模型背后的路線之爭,并展現開源與閉源如何在實際應用中尋找平衡點,共同推動科技進步。

對所有大模型而言,其真正考驗如同科大訊飛創始人劉慶峰所說,在最后一公里的應用和商業化落地上。

恐怕誰也不會想到,百模大戰進入商業化下半場,圍繞大模型大規模、曠日持久的戰爭,竟是開源和閉源路線的交鋒。

最近,在2024世界人工智能大會(WAIC)上,劉慶峰、李彥宏、王堅、朱嘯虎、傅盛等行業大佬,發表的截然不同觀點,再次引發外界對大模型路線的關注。

比如,持續輸出“開源落后于閉源”“大模型場景下,開源是最貴的”觀點的百度創始人李彥宏,再次直言不諱認為,開源是一種智商稅。獵豹移動董事長兼CEO傅盛,則繼王小川、周鴻祎之后,直接不客氣反駁李彥宏,稱“付費閉源大模型才是智商稅”。谷歌前董事長施密特甚至在近日表示,中國AI發展基本靠西方開源,因此必須限制開源模型。

大模型賽道的開源閉源,主要是指模型源代碼、模型權重、訓練數據是否公開。這場AI浪潮下科學界的戰爭,并非僅發生在中國企業身上——相比中國企業家的“文明交鋒”,國外企業和大佬更是采用直接短兵相接的肉搏戰方式。

去年2月以來,馬斯克屢屢發難,稱轉向閉源的OpenAI應改名為“Close AI”。今年2月,馬斯克在舊金山法院對OpenAI及CEO阿爾特提起訴訟,要求OpenAI恢復開源并給予賠償。市場方面,去年7月Meta將Llama2(羊駝)開源后,和ChatGPT發生的一輪輪攻防戰,同樣精彩紛呈。

風云涌動中,圍繞大模型開閉源的白刃戰超過一年半。但至今誰也說服不了誰,誰也未取得決定性勝利,未來走向撲朔迷離。

唯一能確定的是,對公眾和企業來說,無論路線如何,解決不了最后一公里難題,開閉源都一文不值。對所有大模型而言,其真正考驗如同科大訊飛創始人劉慶峰所說,在最后一公里的應用和商業化落地上。

01 開閉源路線之爭的本質

回顧互聯網和軟件史,開源和閉源的戰爭一直都在上演。

直到今天,這依然是兩股并行、截然不同的力量。開源方面,以Linux、Android、unix為代表;閉源方面,則有Windows、Mac OS、iOS、WP等等。

戰爭核心,在于技術進步、?安全保障、?社會價值與經濟效益之間的平衡探索。

開源認為,應允許任何人獲得并修改軟件的源代碼,如同一座橋梁,?分享、融合才是其存在意義。閉源則認為,軟件和代碼屬于勞動成果,勞動成果需要保護和用來獲取財富。

客觀看,開源促進軟件繁榮和全球范圍內合作,拓寬創新邊界上,居功至偉。但就商業價值層面來看,此前所有領域都被閉源吊打。

一切技術路線爭議終點,需要商業化掙錢。這無可厚非,但需要意識到的是,AI大模型的路線戰爭,和此前任何一次開閉源戰爭都沒可對比性——業界共識是,大模型本身就是一個黑盒子,外界至今難以徹底揭開它的神秘。

從模型、算法到數據,如何產生一個可以使用的模型,無人知曉。未來到底是走向中心化,還是去中心化,都是矛盾而又流行的說法。

這種神秘性,造就大模型的獨特性——無論是國外還是國內,都不是巨頭的一枝獨秀,從科研到創業者,再到千行百業開發者,都可以參與其中,讓大模型呈現百花齊放、百家爭鳴的蓬勃生態。

技術實力來看,如果以ChatGPT為標尺,那么開源曾很長一段時間落后于閉源——到去年下半年,這種情況已經改變,很多超過 ChatGPT 3.5,甚至追趕ChatGPT 4.0能力的大模型陸續發布。不過,在Sora發布后,閉源又獲得一段時間領先。

“閉源和開源大模型,很難說誰就會永遠領先誰,這是一個永遠在動態平衡變化的狀態?!倍辔粯I內人士就認為,其差距取決于,研發團隊能力的差異,以及背后團隊所持有的資金、算力、數據。

非得在開源與閉源之間,做選擇題嗎?顯然不是。

如今,在開閉源陣營之爭外,還有一條技術路線陣營正迅速擴大——開源和閉源同時并行發展。在國外,以谷歌為代表;在國內,則包含科大訊飛、昆侖萬維、零一萬物、百川智能等企業。

這個陣營的技術實力,并不遜色任何開源或閉源企業。比如訊飛星火,V3.0版本在中文上全方位超越Chat GPT,英文上實現對標。而在V4.0版本中,在8個國際主流測試集中排名第一,在文本生成、語言理解、知識問答、邏輯推理、數學能力等方面實現了對GPT-4 Turbo的整體超越。

02 開源與閉源,為何可以兩條腿走路

“極點商業”觀察來看,選擇開源、閉源“兩條腿”走路的企業,布局大多主要遵循以下路徑:在最大模型上選擇閉源,在較小模型上選擇開源。

比如谷歌,就在推出“開源”大模型Gemma后,走上閉源+開源并行道路。有報道認為這代表谷歌大模型策略的轉變——開源主打性能最強大的小規模模型,希望戰勝Meta和Mistral AI;閉源則主打規模大效果最好的大模型,希望盡快追上OpenAI。

在國內,“兩條腿走路”的企業也類似。以科大訊飛為例,整體超越GPT-4 Turbo的訊飛星火V4.0是閉源,通過昇騰AI和訊飛星火的合作,打破大模型訓練的瓶頸;而130億參數的星火開源-13B則是開源,在多項知名公開評測任務中名列前茅。

其實,大模型不像手機操作系統,必須在IOS或安卓之間二選一,對開發者、用戶、企業來說,考慮的很直接:這個大模型是否易用好用,又同時具有性價比?穩定性、安全性是否可以保證?其生態和場景打造,又是否滿足用戶需求?

這意味著,讓所有用戶、企業、開發者乃至產業,都能選擇合適自己的大模型,就是最好的大模型。

這也是科大訊飛“兩條腿走路”核心目的,通過“閉源+開源”完整體系,閉源專注商業應用、產業落地,開源策略是生態開放,兩者優勢“合二為一”,激發中國大模型的產業、生態活力。

在閉源部分,基于星火大模型V4.0,科大訊飛有面向TOC的AI應用訊飛星火APP/Desk、星火智能批閱機、訊飛AI學習機、訊飛曉醫APP;面向TOB和生態伙伴,有星火企業智能體平臺、招采助手、機器人超腦平臺2. 0等等,讓企業可以構建自己的智算底座。

星火開源公開測評數據?????

在開源的星火大模型,科大訊飛的策略是生態開放,通過免費大模型,為開發者、學術界賦能。

“開源+閉源”兩條腿想順利走路關鍵,需要解決幾個關鍵問題,一是模型架構自主可控,有一定技術優勢,二是產業落地、商業模式完整,三是通過社區吸引更多開發者。

“誰控制了過去,誰就控制了未來;誰控制了現在,誰就控制了過去?!苯陙?,被“卡脖子”事件屢屢在我國科技產業上演,算力、數據是否會“卡大模型的脖子”,業界也是議論紛紛。

這意味著,主流國產、自主可控的模型架構,才可能最大限度發揮生態力量,匹配產業上下游環境,更好推進開源、閉源的并行融合。

“所有算法都是我們自主可控的,大模型的每一行代碼、每一個數據都是我們自己編寫、清洗出來的?!眲c峰表示。

而對處于早期的大模型來說,無論是開源、閉源,都需要聚集更多開發者,參與到開源模型的改進和優化。

在國外,包括Meta、谷歌和微軟以及第三方開發者都在社區內發布模型、參數、數據集;在國內,訊飛開放平臺之上大模型總開發者超35萬,其中企業開發者超22萬,推動大模型應用加速落地。

回顧PC、軟件、手機歷史,其實也有類似案例。比如在數據庫市場,Oracle就是“開源+閉源”兩條腿走路,在開源社區、商業應用均取得了巨大成功。

谷歌、科大訊飛們的大模型“兩條路”邏輯其實也類似。一種解讀是,在大模型時代,開源、閉源只是手段,在不同產品和應用場景中,兩者本是相輔相成。開源模型和開源社區可以在上游用免費策略負責擴大用戶基數、拓展產業生態、迭代模型技術。

來自開源部分的經驗,也可以復用到閉源,讓閉源大模型的產業化、商業化落地更順暢——最終兩條路線以多元化、靈活化的方式演進,并行甚至融合互補。

“實際上這兩塊是相互補充的?!笨拼笥嶏w創始人劉慶峰也認為。他以星火開源13B模型為例指出,等650億、1500億、1750億參數以及更大模型出來,就知道了它的天花板和邊界,再對它進行裁剪、濃縮,就變成13B,那13B的效果也提升了。

“如果不做閉源,不探索行業最高的天花板,開源也做不到最好?!眲c峰就認為。

“兩條腿”走路的互補價值,浙江大學人工智能研究所所長吳飛一個觀點是,任何開源基座模型,都是千錘百煉而來,不是所有公司和機構都具備這樣的能力?!霸陂_源之上進行閉源,可以很大程度上降低閉源模型研發的門檻?!?/p>

03 最后一公里才是真正挑戰

從劉慶峰、李彥宏、王小川等行業大佬觀點來看,一個共同之處是:閉源、開源只是手段,關鍵是讓大模型,如何快速應用千行百業場景里,如何作為生產力工具,更好地普惠,去替代人類完成各類業務流的碎片、繁雜工作。

這意味著,對國內目前尚處于高速發展階段的大模型而言,隨著開源、閉源路線的逐漸并行融合,選擇什么路線不是關鍵問題。

不同場景適配不同的參數。如同劉慶峰所說,無論大模型如何演進,最后一公里的產品體驗和應用落地,才是真正挑戰。

這也是誰能在“百模大戰”中占有一席之地,擁有更多的話語權的關鍵。如果解決不好最后一公里,那么技術路線將一文不值。當前國內大模型企業的應用開發的普遍思路是,并未等到技術完全成熟再落地應用,而是在快速迭代技術同時,從ToC、ToB兩端入手,相應地進行產業和應用落地。

這一點,在剛剛結束的WAIC上也體現得很明顯??拼笥嶏w、百度、阿里巴巴、騰訊、華為、字節跳動、快手等行業巨頭,以及百川、智譜等新銳帶來眾多新技術和新產品,展現了大模型和金融、醫療、教育、政務等多個行業、產業的深度融合。

關于如何更好地解決企業大模型應用的“最后一公里”問題,科大訊飛經過和大量的央國企和行業合作伙伴的共同探討,他們認為用智能體平臺打造每個崗位專屬助手的時間已經到了。

在這之前,星火已經成功賦能了很多場景,無論是代碼、數字勞動力,還是評標、客戶、APP智能互動??拼笥嶏w與太平洋保險合作是從審計這個崗位做起的,包括客服和評標;此外,國家能源集團、中國石油等公司選了科大訊飛作為合作伙伴;同時,星火大模型賦能中國移動APP幾億用戶,使中國移動APP更加智能、交互更順暢。

通過這么多的場景可以看到,大模型賦能企業“人工智能+”行動有兩個方面:一方面是大模型直接完成任務,訊飛星火一開始啟用,文本生成、語言理解、知識問答、邏輯推理和代碼能力對應到下面相關的各種各樣的工具,它自己就完成了,不需要借助任何外力。

還有一種模式是以認知大模型為中心大腦,它調動各種專用模型,比如說振動的模型、味覺模型、氣體模型,濕度模型等各種模型,然后配合相應的工具,再對接內外部的各種信源和數據,打通內部的辦公OA、ERP系統,再對接外部實時性來聯合完成任務,相當于用大模型來指揮調度一系列的能力,從而完成一個綜合的任務。

面向B端,從劉慶峰闡述來看,訊飛星火大模型在“最后一公里”用智能體平臺打造專屬于每個崗位的工作助手,在智能家電、智能汽車、運營商、機器人等行業場景實現全面賦能,甚至成為各行各業創新發展的重要驅動力。

面向具身智能和人形機器人企業需求,目前400+機器人企業已經采用訊飛機器人超腦平臺。另外,星火企業智能體平臺將圍繞智能體關鍵能力,覆蓋400+AI原子能力,集成 90+外部信源,打通100+內部 IT 系統,可供企業結合業務場景快速構建可落地的智能體應用。

“解決AI+行動的最后一公里的問題,是前所未有的機遇?!眲c峰就表示,星火已經成功賦能了很多場景,無論是代碼、數字勞動力,還是評標、客戶、APP智能互動。

不完全統計顯示,訊飛星火大模型正成為國家能源集團、中國石油、中國移動、中國人保、太平洋保險、交通銀行、海爾集團、美的集團等多領域頭部企業的首選。

公開招標網數據就顯示,今年上半年到6月中旬,整個公開招標數量約為234件。其中,60%以上的項目來自央國企。在央國企大模型訂單中標企業中,訊飛星火高居第一。

“我們能走多遠,取決于我們是否擁有自主開發的、可控的基礎能?!睆膭c峰表態來看,這是大模型如何解放生產力、釋放每個人、每家企業,甚至每位開發者想象力的關鍵。

“合抱之木,生于毫末,九層之臺,起于壘土?!比缤瑒c峰的說法,這正是大模型能力階段跨越的體現——意味著大模型從技術附加工具,轉向引領行業變革、助力企業降本增效、普惠大眾生活的關鍵階段。而針對更多商業化模式的探索,也正悄然形成“模型越強、落地越多、用戶越廣、算力越大”的增長飛輪。

從這個角度看,只要能做大生態,加速產業最后一公里的落地,無論是大模型技術路線是閉源,還是開源,其實一點都不重要。

本文由人人都是產品經理作者【極點商業】,微信公眾號:【極點商業】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!