蘋果卷入大模型,手機行業借AGI「吃掉」軟件層?
本文主要探討了蘋果公司在WWDC大會上展示的新一代AI技術和其對未來AI產業發展的影響,特別是AI能否像預測的那樣“吃掉”軟件層,成為主導力量。同時也提及了AI在各行各業的實際運用及存在的問題。
蘋果重新定義了AI(Apple Intelligence)。
6月11日凌晨1點,蘋果公司召開了今年的開發者大會WWDC,用了首場發布會將近一半的篇幅來講AI如何整合到蘋果系統中,將人工智能化于無形,融進Apple Intelligence。
媒體和資本評價兩極化,一部分認為蘋果這次出手,軟硬件結合,在系統層面提供了AI能力,一夜之間滅了許多AI創業者的生路——畢竟在當下的節點,利用OpenAI 接口包裝一個翻譯插件或者腦圖都算是創業,這可叫AI公司怎么活。
反方則認為蘋果此次更新了無新意,原地雕花,不夠炸裂,新功能還是基本集中在「文生圖」、「文本總結」、「跨應用聯動」這些老生常談的功能上。從發布會后的股價上漲近7.26% 的表現來看,資本市場倒是對「蘋果AI」基本滿意。
無論Apple Intelligence有多么誘人 華麗,也只是蘋果提前畫的大餅,英文版今年秋天上線,其他語言要到明年才會有后續。半年時間,對AI公司來說可以做很多事。會有其他競爭者對蘋果的藍圖提出挑戰嗎?
一、科技公司全面卷入AI
AI浪潮以來,美股七雄(Magnificent 7,即美國市場上市值最大的七家科技公司,包括Alphabet、亞馬遜、蘋果、Meta、微軟、英偉達和特斯拉)分化明顯,市值排序跌宕起伏。
在6月5日大漲后,「賣鏟子」的NVIDIA市值超3萬億美元,超越蘋果,距離3.15萬億的微軟只需再漲不到5%;微軟借AI登上第一,乘了OpenAI的東風,并乘勢建立了更好的工具和商用系統,推出了AI-PC,23年營收達到驚人的2210億美元;Meta用開源大模型造福了一票國內公司,用AI改進廣告,內容審核和個性化推薦,利潤翻了兩番;亞馬遜將AI整合到AWS框架中,意在企業級AI,它還投資了Anthropic,與NVIDIA合作Blackwell Gpu;Alphabet對標OpenAI節奏,但總感覺失之毫厘,略有漲幅;特斯拉掉隊,蘋果踟躕不前,還在畫餅。
大模型方面,科技公司都有fomo(fear of missing out)效應,人無我有,就很尷尬;產品和生態上,后發制人有優勢。非盈利機構OpenaAI是最大造浪機,蘋果與其合作,水到渠成。
蘋果放棄造車后,一門心思鉆研AI更廣泛的應用,思路與其他 6 家不同,提出個人化AI(Personal),區別于微軟的工具性AI(Azure/Microsoft365/Copilot),用盡生態優勢,更重視操作的「非AI感」,理解用戶身處的情境,和用戶的生活交融,強調隱私保護。
蘋果發布會上演示的例子是去機場接媽媽,Apple Intelligence可直接讀取媽媽發來的航班信息,查詢航班延誤情況和機場交通,直接生成行動時間表并更新在日程中,本身要花好幾分鐘安排的事現在可以自動完成了。與siri類似,是生活工作小助手的定位,但更強大。
語言界面替代了操作界面,Apple版AI更理解人的需求和語言意味,而非僅僅在數值上更聰明,跑分更高。這是在讓AI對齊人類生活方式,取巧,但又十分合理。
據「新皮層」報道,Apple Intelligence的模型架構主要由3部分組成,按調用的優先級,分別是自研的端側模型、云端模型和GPT-4o等第三方模型。其中自研模型是蘋果發布的一系列小型模型,包括可以讀懂iPhone屏幕的多模態理解模型ReALM(Reference Resolution As Language Modeling),OpenELM(開源高效語言模型)等。蘋果的模型能力不及OpenAI,是蘋果選擇接入第三方模型的原因。第三方模型可能不止GPT-4o。《華爾街日報》也曾于3月報道稱,蘋果還曾與百度初步談判,以在其中國版設備(比如 iPhone)中使用后者的AI技術。蘋果從未證實這一傳聞。
這么看來,Apple Intelligence更像是多種模型組裝的工具包,各司其職,各盡其用。AI在蘋果生態里,與其說是對話唱歌畫圖的小軟件,不如說是幫人完成一系列復雜操作的AI-Agent,它聯通各平臺設備,粘合使用體驗——肯定有一部分是以智能家居的那種方式,另一部分就可以展開想象。
當然,AI的聚合、融合,還是依靠AI公司、資本、政府的高期望。對很多人來說,這個期望的化身,就是AGI。
如果把實現AGI當作最終目標,當下AI處在大投入大基建的狀態:投算力、投新型的數據中心、投模型,三類投資分別對應的是生產GPU+ 賣GPU的云 + 用GPU訓練模型的公司,也就是英偉達、AWS+Azure和OpenAI等大模型公司。蘋果算是其中的異類,既不開發新模型,甚至也沒有推出新應用,只是整合。
但AGI的實現還很遙遠。造富路上,AI公司開始破產、倒閉、求收購。
2024年第二季度還沒有結束,曾經有10億美元估值、180名員工、創造出Stable Diffusion系列模型的明星獨角獸 Stability AI,就出現資金鏈斷裂,尋求合并。前OpenAI和谷歌AI開發人員創立的AI公司Adept,也在談判售價。在「洗牌期」,就算有足夠資金支撐下去的AI公司,都開始了裁員和降本增效。
這些現象暴露出殘酷的行業現狀:包括巨頭在內,所有AI公司/項目都盈利困難。連OpenAI也只能靠不斷融資來支撐ChatGPT高昂的運行成本?!该?OpenAI過河」,將訂閱模式和企業版模式作為行業統一標準的其他玩家,只會更艱難。Meta為AI建設增加了約100億美元預算,但未來幾年內依然不指望盈利。
據行研機構PitchBook 數據,AI創企在2021-2023年獲得了約3300億美元投資,同比增長2/3,但很多AI創企的錢仍不夠花,高昂的AI建設成本、人工成本已經拖垮不少AI公司。
國內風景獨好,煉制大模型的巨頭無憂生存,卻因競爭激烈,打起了價格戰。5月6日深度求索(DeepSeek)發布的DeepSeek v2,提供的API定價僅為GPT-4-Turbo的近百分之一,之后智譜、字節、阿里、百度、科大訊飛和騰訊都紛紛下調了部分大模型的API價格。
考慮到國內大模型,大部分是針對企業用戶和特定行業,也許是性能評測標準不夠刺激,也可能是大模型落地難,性能遇到了瓶頸,只能同質化競爭,價格戰成了國內大模型行業問題的縮影和最終解決方式。
國內的AI公司和產品,長時間對標OpenAI,希望自家養的AI在跑分、推理、表現都超過GPT系列,是否做到暫且不談,但其中有一些誤區。AI不同于搜索引擎、平臺入口、內容站,它的技術性遠高于后者,在實際進入應用領域前,是純粹科學和技術的事,也是純投入的事業。
國內環境,人們對于AI的實質和AI的真正用途之間,有一道「理解鴻溝」,這首先是大模型的黑箱性質所造成的,但同時,國內的AI產品,無論是豆包、元寶、Kimi,還是激進地投入整條賽道的阿里做出來的東西,目前所呈現出來的能力,很難讓用戶持續買單,更別說讓企業級用戶認同。畢竟GPT-4o和Midjourney早已設立了標準。
蘋果AI的確為國內市場打開了一條思路:跑分再高也只是抽象能力,自研模型夠用就好,多模型融合,多層級協同,讓AI上手做事,融入整體應用環境才是正經事。
從理論上來說,AI可以與迄今為止人類制造的所有軟件、系統、數據庫、云、電子設備結合,并產生新的交互模式。AI掌握了搜索引擎的使用方法和用戶需求,就誕生了新的流量和內容入口,搜索就變成了AI的子功能,以前的計算廣告投放模式會受影響。
AI吞噬一切,重新安排其重要性。
是時候擁抱新世界,做些新東西??偙忍O果做好一切,國內再模仿來得強。AI 時代與流量時代完全不同,起碼「模仿式創新」一定會變難。
二、AI改變個人工作流,但尚未改變行業
生成式AI的沖擊改變了科技行業的軌跡,但普通人視角下,沖擊在ChatGPT發布之后就逐漸放緩。
文字工作者(比如我)和廣義的內容創作者們,早已全面擁抱AI。盡管AI很難寫出80分的作品,但它可以高效滿足創作者工作流中的離散需求:快速生產大綱、和用戶一起頭腦風暴、模仿文風、文本修改、長文本翻譯、文字 – 語音互轉、信息獲取、數據整理、梳理財報等等,這些方面AI又快又好。
在藝術、影視、教育、人文學術圈,AI頗受歡迎,它提供了快速試錯過篩的工具,加上自身也是賣點和噱頭,AI成了一種隱喻修辭,代表著機遇,以及危機感。
任何研討會加個「AI時代」的名頭都能多吸引點注意力和流量。
這一波生成式AI的發展可能會經歷四個階段:驚艷的玩具,(多樣化且具備替代效應的)生產力工具,個人化系統,(具有網絡效應)的生態系統。
目前的產品大多在從第一階段到第二階段過渡。
大部分AI產品,包括國外的,長期用下來,除了內嵌在應用和網頁中的AI和特定用途AI以外(比如wiki AI,notion AI,memo AI,Perplexity),大多還是花里胡哨,重復造輪子居多。
AI在當下,嘗鮮多于工作,助力于個人多于組織,它只改變了游戲的樂趣,并未改變游戲規則,猶如個人寫東西用Word 還是Ulysses,只有體驗的細微區別,無關乎生產力。工具需的組織化、社會化、網絡化,才能最大化效能(比如微信和github)。
回到產業,AI尚未顛覆任何領域,干掉任何公司——除了做二次開發(套殼)的公司,在每次OpenAI發布新產品時都哀嘆不已。行業替代性在客服、審核等崗位的確存在,只是尚未爆發,因為AI還未先進到重塑流程。
與互聯網浪潮不同,大模型時代也許不需要Killerapp,無論AI多么強大,整體提升Workflow,提供端到端的輸出,都比較難。這些流程依賴于長程推理、常識和行業Know-how,光靠語義鏈接的橋梁還遠遠不夠。
大模型作為一個概率模型,在低容錯率場景時仍然面臨很多問題,遠沒有我們想的那么神奇:我在寫這篇文章時,讓GPT-4o查詢NVIDIA近年股票和市值變化,一個看似簡單的問題,它需要現將問題拆分成步驟,然后分別去搜相應的信息,再做一個總結,最后居然還是錯的,還不如直接用搜索引擎快。
此外,很多定制化的工作,可能90%的文檔都不能滿足大模型Embedding時的質量要求,還要做大量的數據清洗才能用。大模型的注意力也不夠穩定,經常被不相關的問題干擾,出現幻覺。
大模型的產品發展與互聯網的產品發展還有一個截然不同的地方:邊際成本非常高,模型成本要遠遠高于人力成本和買量成本。移動互聯網時代的App可以在小步快跑式迭代,但基于底層大模型+開源小模型的雞尾酒分層打法的App尚未找到類似路徑。也因此,還未出現大公司被小公司彎道超車的可能性。
當然,假以時日,AI也許能在軟件編寫上有所建樹。紐約市的風險投資基金Pace Capital的創始合伙人Chris Paik在「軟件的終結」(The End of Software)一文里提出,大模型不一定會顛覆toC產品,但有可能顛覆軟件生產,因為軟件的成本在于開發人員,他們將人類語言翻譯成計算機語言,大模型也許比人更擅長做這事,形成液態系統,建立中間層,鏈接一切。
「代碼將變得靈活可塑,傳統的技術棧概念將逐漸消失,取而代之的是由 AI 生成的微服務的流動海洋,這些微服務可以根據需要進行重新組合和再構」。
蘋果說:我也是這樣想的。
三、如果沒有AGI,你還會期待AI嗎?
不要太期待AGI。
在業界狂熱討論AGI何年達成之時,學界潑了三盆冷水。圖靈獎得主、Meta首席AI科學家楊立昆(Yann Lecun)就并不認可AGI,他認為根本不存在通用智能,且大模型也不可能通向AGI。他還在X上說,「如果你是一名對構建下一代人工智能系統感興趣的學生,不要研究大型語言模型(LLMs)」。
楊立昆并非唯一反對AGI的人。李飛飛從另一個角度論證了類似觀點,她認為無論大模型有多少參數,AI都無法擁有「知覺」,即所有的感覺——饑餓、疼痛、墜入愛河,因此AI不可能擁有主觀體驗的能力,甚至不可能接近人類智能。
李飛飛曾經的老師,香港大學馬毅認為,當前的生成AI其能力依靠規模定律(Scaling Laws)涌現其能力,但規模定律并非物理定律,而是一種偶然,早晚會失效,AI又不是只有喂數據堆參數這一種造法。
馬毅在接受《晚點》采訪時說,「如果你的信仰就是Scaling Laws,覺得把現在的系統做大就能實現AGI,我覺得你該改行了。因為你已經不可能有作為了,你就只能做一個螺絲釘」。大模型是有極限的,隨著語料庫耗盡,Scaling Law 失效,以及算力和電力幾何級數增加,內部黑箱無法破解,也許有一天,生成式AI的發展出現停滯,不是不可能。
我想起,在AlphaGo/Zero大展威力的時代,人們對AI的能力感到格外驚奇和恐懼,代表人類最強棋手的李世石最后輸給AI,似乎為碳基生命的命運寫下最后注腳。但從現在回看,并沒有那么悲涼。
當時,我偶然和人工智能早期先驅、《GEB》作者侯世達(Douglas Hofstadter)見過一面,我問他,你覺得Alphago是否實現了某種意義上的「智能」?他說,非也,即使Alphago戰勝了人類,但相比于人類,AI還是太簡單,如同缸中之腦,對現實一無所知。他確信深度學習無法抵達智能,但可以很好地解決一些問題。
Sora出現時,人們討論它是否理解物理世界(盡管它內置了牛頓定律),物理主義者可能會認為 AI= 大腦 = 智能 = 有無限潛力的理解工具,但擁有常識的人則會認為這是錯誤的問題。
如果沒有AI,AI前進的動力和目標在哪里?
OpenAI聯合創始人Greg Brockman有一個很好的比喻,人工智能被「烘焙」進了經濟之中。意思是,如何部署 AI,需要融入其他「原料」混合,它們以不同的方式運作,等待一段時間后,開始發揮作用。從消費者的角度來看,與 ChatGPT的對話只是調用一次API,就如同訪問一次網站,下載一部電影。隨著技術進化,公司把AI做細,AI融入軟件之間、用戶界面以及無數中間層,功能變得越來越細微,用戶就會習慣AI。
Apple對AI深度整合,即使平庸,至少可用。在未來,也許AI能服務每個人的日常生活,最后,你無需感受到AI的存在。大模型還沒有誕生殺手級應用,但手機形態可能會比大多軟件商活得更久,這是2024WWDC能隱約看到的圖景。
作者 | 向輝
編輯 | 周天
本文由人人都是產品經理作者【周天產業分析】,微信公眾號:【周天財經】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!