別硬把大模型往手機里塞

2 評論 1601 瀏覽 4 收藏 14 分鐘

越來越多手機廠商將目光瞄向了AI大模型,那么,在手機上運行大模型這件事,可能會遇到哪些方面的挑戰?手機廠商們是否思考清楚了“把大模型裝進手機里”這個動作的背后意義?一起來看看作者的分析。

商業迷霧當中,那些看似金光閃閃的“機會”,往往是一把將人們困住的鐐銬。

CNBC最新消息稱,全球芯片巨頭高通打算在加州兩大據點砍掉約1258名員工。事實上,高通早就向加州就業部門送交了這份“死亡名單”:圣迭戈1064名、圣克拉拉194名。這場人事地震預計將在12月13日爆發。

高通上個季度的報告中,已經暗示了這次“血洗”。從財務結構來看,手機芯片是高通的主要收入來源,占比超過一半,但在三季度里收入同比下降了21.6%。智能手機市場的飽和,像一把無形的大手,正在悄悄扼殺上游供應鏈的巨頭。

手機市場的增長現在主要依賴于設備的升級周期。自2019年以來,受5G驅動的手機更換熱潮已經持續了近四年。但Counterpoint的資深分析師Peter Richardson卻揭示了一個冷酷的事實:到2022年時,全球手機更換周期已達到史上最長的43個月。

過去五年,手機界苦苦追尋創新之路,急于改變僵局。但當連Apple這樣的市場領導者也難以拿出令人震撼的新功能時,其他廠商更是難以維持其市場地位。越來越多的消費者開始質疑,換一部新手機的價值究竟在哪?

有行業專家指出,真正的破局點或許是軟件,尤其是AI領域像LLM、Transformer等大模型背后蘊藏著的力量。

盡管目前還不清楚,該如何最大化地利用這些潛力,但這并不妨礙國內手機巨頭試圖突圍。華米OV等都把目光瞄準了AI大模型,迫切要開辟一個新戰場。

一、手機巨頭爭斗大模型賽場

一時之間,國內手機廠商好像都追起了大模型的風頭。

8月14日,小米年度發布會上,小米AI大模型亮相,霎那之間成為焦點。在C-Eval、CMMLU兩大測試平臺上,它分別斬獲第十名和中文榜首的佳績。

雷軍信心滿滿地宣布,小米的這個13億參數大模型已經在手機端完美運行,其實力在某些場景中甚至能與60億參數的云端模型匹敵。而家喻戶曉的小愛同學也將強化AI大模型的能力,邀請測試已在發布會當天拉開序幕。

瞄準AI大模型的狼煙不只在小米一處升起。

早在8月4日的2023年華為開發者大會,余承東就大手一揮,宣布HarmonyOS 4將受益于“盤古大模型”的加持。與眾不同的是,華為決定將大模型深度整合進手機系統,實現更高層次的融合。

繼華米之后,vivo和OPPO亦不斷展露其對大模型領域的雄心。

近期,OPPO宣布對其全新“小布助手”進行首輪公開測試,引發業內關注。此產品基于了AndesGPT大模型技術。

AndesGPT模型出自OPPO旗下安第斯智能云團隊之手,其核心是一個基于混合云架構的高級生成式大語言模型。用戶可以通過喚醒小布語音助手并說出“小布大模型”,參與小布1.0公測版報名。更多信息將在11月16日的ColorOS 14發布會上公布。

與同行的宣傳異曲同工,AndesGPT在其官方介紹中也榮獲了“行業翹楚”等封號,此模型在多個權威評測榜單上頻頻亮相。

另一個戰線上,vivo已鎖定11月1日,要召開年度開發者大會。此番集結,vivo將揭曉其獨家研發的AI大模型與全新操作系統;而廣受矚目的OriginOS 4也將初露鋒芒。

尤其引人關注的,vivo打造的AI大模型矩陣極為豐富,覆蓋了十億、百億及千億三大參數級別,共五款模型,旨在滿足多樣化的核心應用場景。

同樣,這批尚在神秘面紗后的產品,已在多個權威評測中嶄露頭角。最新數據顯示,vivo自研AI大模型在C-Eval和CMMLU兩大平臺上均雄踞榜首。

近期,手機行業已經見證了各大品牌逐個投身于AI大模型的深海。存量市場的激烈爭奪,使得各大廠商都希望借助新技術鋒芒,為自身在高端市場塑造更具競爭力的形象。

多位行業內有深度洞察的人士認為,強調AI功能的優勢,顯然是各大廠商策略的重要一環。不僅能刺激用戶對高端產品的欲望,更能帶動產品價格上漲,從而為品牌創造更為豐厚的利潤。

隨著時間的推移或能見到,首波真正的“AI手機”即將震撼登場,而未來兩年,更會是AI在手機上的創新大爆發時刻。

二、大模型角逐移動端,路徑逐漸統一

雖然手機廠商們在宣傳中表現得在手機上運行大型模型就如同喝水吃飯般輕松,但實際操作中,背后隱藏的挑戰遠超預期。

根據小米技術委員會AI實驗室大模型團隊負責人欒劍的分享,要真正在手機上運行大模型,對手機硬件的要求絕不會低,特別是處理器和內存兩項。

大模型首先就是其“大”的特性,一旦占據過多的手機工作內存,將導致其他應用受限,甚至可能造成手機無響應、整體性能銳減,或者最糟糕的情況是直接死機。

此外,計算能力也是評判的關鍵點。若生成一個字符就需要花費好幾秒的時間,這對于用戶體驗無疑是災難性的??紤]到人們的平均閱讀速度約為每秒十幾個漢字,故模型的“生成速度”必須遠超于此。

而功耗問題也不容忽視。許多網上的模型Demo常常疏忽這一關鍵環節。高負載下的計算芯片會導致手機急速發熱,若如此長時間運作,勢必會對電池的續航產生嚴重損害。

綜上,手機大模型真正的挑戰在于如何在處理速度、散熱和電池續航等之間找到一個精妙的平衡。因此,業界的重心還放在了端云協同之上。

不久前,聯發科與OPPO達成協議,共同研發大模型在端側的輕量化部署方案,旨在讓大模型技術更為貼近消費者的實際使用。

10月18日,聯發科同樣宣布與vivo在AI領域深度合作和聯調,實現了10億和70億AI大語言模型以及10億AI視覺大模型在手機端側的落地,共同為消費者帶來端側生成式AI應用創新體驗。

端側大模型的好處是,用戶可以享受更快的響應速度,同時數據也不需要上傳到云端,更加安全。目前許多主流廠商都在研發在移動終端部署 AI大模型的解決方案,以實現在端側運行大模型的目標。

然而,不能假定僅憑手機端便能解決所有問題。正如小米透露的,他們將繼續遵循端云結合的策略。某些功能或能力,如果可以通過端側的模型來實現,就無需轉移到云端處理。

觀察vivo的情況,雖然缺乏確切的數據,但可以合理推測,它也將采納云端和本地結合的大模型策略。

從其大模型的參數量級可以分析,660億、1300億和1750億量級的云端大模型目的在于確保處理能力,以應對更復雜的問題。而10億和70億量級的本地大模型則是為了確保用戶隱私、能效和快速響應。

這意味著,vivo很可能會采取端云協同工作的方式,即通過評估問題的復雜性來決定是否在本地處理或轉移到云端。

結合云端和本地的大模型不僅可以有效地節省成本,而且能夠滿足用戶在計算能力、性能、能耗和隱私保護等多個方面的需求,這無疑是目前整合手機和AI大模型的優選策略之一。

三、廠商跟風之下,一些潛在的挑戰

某些業內觀點,將目前嘗試在手機端運行大模型的技術視作一柄鋒利之劍。然而深入背后,也不免露出一種應景而非真正求變的短視之感。

首先,對于“大模型”的界定仍舊模糊不清。以小米的端側模型為例,其參數量達到13億,與GPT2的1.5B參數相差無幾,但這真的足以賦予其“大模型”的頭銜嗎?

不乏有業界人士拋出質疑:手機端的大模型實踐,更多地是為了滿足市場短期熱潮,而非技術的真正躍進。若手機真的能毫不費力地驅動大模型,那顯卡巨頭英偉達的存在意義又在哪里?

再者,為了讓大模型適應手機,制造商不得不通過剪枝、蒸餾和量化等策略對其進行大幅壓縮。以vivo為例,它可能通過連續的模型裁剪和蒸餾,將參數從1750億降低到僅10億,這種操作是否過于牽強,值得思考。

要認識到,大模型并不僅僅是參數數量的簡單疊加,它的真正價值在于深度學習中的“深度”。大量的參數意味著更多的信息、知識和上下文的捕捉。

因此,當把一款千億參數的模型剪裁到幾十億參數時,勢必要失去一些原有的學習深度。對于AI的日常應用來說,可能影響不大,但對于那些期望從AI獲得深度見解和理解的高端用戶來說,這種損失是無法接受的。

即便小米宣稱其端側模型能與云端模型相提并論,但這其中的細節仍不容忽視。擁有13億參數的端側模型自然難以與擁有千億參數的云端模型相比。為了彌補這種差距,小米可以選擇讓其端側模型在特定場景下與云端模型匹敵,但終歸不能全面比肩。

從這些層面出發,當前手機上的大模型實現方式似乎有點“矯枉過正”。對于普通用戶而言,他們并不真正關心模型的參數數量,而更關心能為他們帶來什么價值。vivo和小米的這些嘗試固然值得鼓勵,但也應該反思其真正的目的和意義。

更重要的是,盡管眾多手機制造商都在積極探索AI大模型的應用,但未來的路徑仍然充滿未知。手機市場上,什么才是下一個“殺手級”應用,還有待時日揭曉。

目前手機制造商對AI大模型的具體應用似乎過于偏重“語音助手”。這種單一方向的追求,是否只是迎合了科技熱點趨勢,而非真正考慮用戶的實際需求?

以近期知名博主對vivo新款AI大模型的分享為例,盡管其在OriginOS 4上以煥然新姿亮相,但與現行的語音助手相比,核心并無太大顛覆。

簡而言之,AI大模型在手機領域的真正普及仍舊步履蹣跚。如今的種種努力,只是冰山初露的探秘之旅。

參考資料:

騰訊科技-小米的大模型“野心”,始于端側

作者:樟稻;編輯:伊頁

來源公眾號:科技新知(ID:kejixinzhi),洞察技術變化背后的產業變遷。

本文由人人都是產品經理合作媒體 @科技新知 授權發布,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 大模型 怕是要構建新一代的信息繭房

    來自天津 回復
    1. 確實,趕緊學起來

      來自北京 回復