AI逼近,張一鳴比馬云更危險
本文討論了中國的科技巨頭字節跳動面臨的AI技術挑戰,指出公司在新興的人工智能領域的競爭力不足,尤其是在新技術研發和產品創新能力上的缺失,可能會使公司陷入更大的危機之中。
5月中旬,OpenAI、谷歌和字節跳動三大科技巨頭相繼公布AI業務最新進展,“畫風”卻差異巨大。
OpenAI的發布會僅僅持續26分鐘,CEO奧特曼甚至沒有露面,卻拿出了效果震撼的語音大模型GPT-4o(“o”代表著全能)。
現場演示中,GPT-4o聽說讀寫樣樣俱佳,響應速度幾乎與真人無異,還帶有情緒和語氣變化。它能夠隨時加入人類對話,被打斷后也能馬上轉入新的語境;注意到用戶過于急促的呼吸時,還會引導用戶放緩呼吸、放松下來。與呆板的蘋果Siri相比,GPT-4o作為AI語音助手的表現近乎完美。
一天后,谷歌在長達兩小時的發布會上推出一系列新品,包括升級后的Gemimi大模型,以及文生視頻模型Veo、文生圖模型Imagen3、AI語音助手Astra等。
盡管這場發布會的關注度遠不如GPT-4o,但仍有不少亮點:Veo能夠根據文字描述生成超過1分鐘的視頻,打破了Sora此前保持的紀錄。Astra效果驚艷,可以實時交互、延遲極低;一個令人印象深刻的演示是,手機攝像頭快速掃過場景后,用戶詢問“眼鏡放在哪兒”,Astra馬上回答“在紅蘋果的旁邊”。
又過了幾個小時,字節旗下的火山引擎舉行發布會,推出豆包大模型家族,并展示一系列AI應用。但這場發布會的最大記憶點,不是“技術”,而是“價格”。
根據官方介紹,豆包大模型的定價顯著低于行業水平。以豆包通用模型pro-32k版為例,模型推理輸入價格為0.0008元/千Tokens,而市面上同規格模型的定價約0.12元/千Tokens,是豆包的150倍。換言之,豆包把價格打下來了99%以上。
發布會上,為了證明到底有多便宜,火山引擎方面做了個類比:一元錢就能買到豆包主力模型的125萬Tokens,大約200萬個漢字,相當于三本《三國演義》。
火山引擎總裁譚待在接受媒體采訪時表示,今年是大模型提升應用之年,需要將AI相關生態建立起來。但是創新的風險成本很高,只有把試錯成本降低,才能實現更大范圍的普及,市場的呼聲就是字節跳動選擇降低成本的核心原因。
OpenAI和谷歌的發布會都或多或少提到了價格,但都沒有作為重點進行解讀。反而是技術和產品落在后面的字節,把價格放在了更突出的位置。
字節是受這一波AI浪潮影響最大的互聯網大公司。從ChatGPT、Midjourney到Sora,再到如今GPT-4o,生成式AI大模型及其應用不斷涌現,都指向了互聯網內容的個性化再組織和去中心化分發,用戶獲取信息、生產內容的方式將迎來劃時代的革命。
這一趨勢的刀鋒,恰好指向了字節的腹地。
面對AI新浪潮,字節只有投身其中,并成為領先者之一,才能守住并擴張帝國疆域。
然而,在大舉進軍AI的過程中,字節的創新魔力仿佛消失了。盡管豆包大模型及其他AI應用的用戶數據表現不錯,但字節一直沒能拿出像GPT-4o這樣,足以震撼整個行業的新技術、新產品。
不久前,抖音前CEO張楠掛帥的剪映推出文生視頻產品“即夢”,只能生成3秒視頻,與可生成60秒視頻的Sora相比差距巨大,甚至趕不上國產視頻大模型Vidu的16秒。
而在5月15日的發布會上,火山引擎發布的新產品不少,但在GPT-4o、Astra等產品的映襯下,顯得有些“普通”;反而是號稱比行業水平便宜99%的定價,成為圈內熱門話題。
主打“便宜”,無法讓字節在AI時代浪潮中立于不敗之地,也讓這家科技巨頭的想象空間受到限制。張一鳴和字節感受到AI“降維打擊”的鋒芒,卻未能重新建立技術優勢,反而打出低價牌,其處境可能比喊出“AI電商”的馬云更加危機四伏。
01
字節之所以能夠與阿里、騰訊比肩而立,根本原因是通過技術創新,建立了跨越互聯網周期的競爭壁壘。
十多年前,字節依靠橫空出世的推薦算法,抓住互聯網內容分發從搜索引擎轉向機器推薦的潮流,打造了今日頭條和抖音及其海外版TikTok兩張王牌。
2012年誕生的今日頭條,以推薦算法重塑互聯網圖文信息分發模式。它擊潰了停留在中心化+人工編輯時代的門戶新聞客戶端,讓字節成為大公司。
2016年上線的抖音,將推薦算法引入短視頻,最終在視頻化浪潮的助推下,成為互聯網最大的流量樞紐之一。它讓字節的流量、用戶規模和商業價值成倍放大,最終躋身“新BAT”。
字節的兩次飛躍,都站在了技術革新的風口浪尖。但在通用人工智能風潮漸起后,字節沒能及時抓住并引領機遇,反而成為被新勢力挑戰的對象。
大模型帶來了一系列AI應用,其中佼佼者如ChatGPT、Sora等,不僅讓每一個人有了批量生產優質內容的機會,也從根基上重塑人們獲取內容的方式。更可怕的是,AI大模型的進化速度遠超傳統互聯網,對于后者的顛覆也會快得多。
AI大模型落地前景廣闊,各行各業都有可能受到影響。首當其沖的,正是如今掌握著互聯網內容生產和分發權杖的字節。
過去十余年間,今日頭條、抖音、TikTok等平臺的內容生態幾經迭代,創作者社群不斷擴大,平臺提供的輔助工具和教程指引也愈發完備,但仍然以人工創作為基本模式。而在分化環節,平臺主導的中心化流量分發早已打磨成熟,用戶無需輸入任何內容,即可被推薦算法精準“投喂”。
以OpenAI為代表的AI挑戰者們,正在通過ChatGPT、Sora等AI應用,打破字節固化多年的內容生產與消費閉環。當然,這些應用尚不足以威脅抖音之類的巨無霸;但它們的驚艷表現和超快進化速度,依然展現了重新定義互聯網內容生態的潛力。
相比之下,其他互聯網大公司同樣面臨AI挑戰,但形勢并不迫切。
以電商為例,阿里、京東等公司均已宣布入局AI大模型。京東不久前推出了以劉強東為藍本的“采銷AI數字人”;阿里更是宣布,未來所有產品都會接入自家的通義千問大模型,進行全面改造。
但顯而易見,阿里和京東的最大對手不是AI公司,而是同屬電商賽道的拼多多。在可預見的未來,AI大模型領域的新技術、新產品,很難直接對電商巨頭的核心業務產生沖擊,反而會給阿里云等公司帶來生意機會。
去年11月,馬云在阿里內網發文稱,“AI電商時代剛剛開始”。如今半年過去,AI技術在阿里內外有了不少落地應用,但馬云口中的“AI電商”究竟為何物,尚未有統一定義。這也意味著,阿里暫時看不到以AI為核心基礎能力的挑戰者。
相比之下,生成式AI本身就是對字節商業模式的挑戰,新的玩家隨時有可能一飛沖天。錯失新浪潮的張一鳴,處境比馬云要危險得多。
02
在新的威脅面前,字節沒有展現出當年做今日頭條和抖音的洞察力,反應速度也慢得多。
正如梁汝波所言,行業內做得比較好的大模型創業公司,均創立于2018~2021年。OpenAI更是早在2015年底即已入局,歷經八年才有了今天的爆發。
相比之下,字節公司層面的半年度技術回顧,直到2023年才開始考慮GPT。字節參戰AI大模型,比行業領軍者晚了兩年以上。
字節追趕AI浪潮,失去了以技術和產品建立壁壘的先機。它只能退而求其次,盡快多點開花,拿出當年“APP工廠”的氣勢,充當“AI大模型工廠”,并以低價取勝。
截至目前,字節AI矩陣已經大體成型。
最新發布的豆包大模型家族除了兩款通用模型,還有面向角色扮演、語音識別、語音合成、文生圖等不同場景的模型;應用方面,字節先后推出十多款產品,如AI對話助手豆包、AI機器人開發平臺扣子、二次元AI聊天機器人話爐、AI教育軟件Gauth等,剪映、飛書等也添加了AI功能。
單看用戶指標,字節AI并不算差。
根據第三方數據,今年2~3月,豆包的DAU(日活躍用戶)一度超越文心一言,成為市場第一,目前全球DAU約為300萬;扣子的DAU也達到了百萬量級;在海外市場征戰多年的Gauth,近期增添AI功能后,DAU峰值突破200萬。
另據字節產品和戰略副總裁朱駿透露,豆包上已有超過800萬個智能體被創建,月活躍用戶達2600萬。
但字節尚未拿出一款令人印象深刻的AI產品。無論是知名度還是行業影響力,豆包等產品盡管有字節背書,仍難以與ChatGPT、GPT 4-o、Sora等相提并論,甚至比不上國內AI賽道的“當紅炸子雞”Kimi。
本次火山引擎發布會,字節AI圍繞價格做文章。譚待表示,之所以大降價,“一個是我們能夠做到,第二是我們需要這么做?!彼e例道,在模型工程上,以前使用單機推理方法,如今豆包采用分布式推理,不同的AI計算需求可以用底層的不同芯片來處理,從而讓算力效率大幅提升。
降低AI大模型的全系統成本,固然是有必要、有價值的;但在整個行業狂飆突進的時刻,將精力放在降低成本而非技術突破上,難免有重心偏移之感。
作為一項革命性技術,AI大模型仍處于爆發初期的“好東西不怕貴”階段,占領技術制高點才是關鍵;此前各大公司對于高性能芯片的追逐,也反映了這一邏輯。畢竟,只有底層技術不斷迭代,產品價格才能斷崖式下跌,而非以低價產品倒推技術進步。
這也意味著,字節為AI產品構建的價格優勢,很可能被迅速突破。例如,今年4月,百度文心大模型推理性能提升105倍,推理成本降到原來的1%??蛻粼瓉硪惶煺{用1萬次,同樣成本現在可以調用100萬次。
OpenAI CEO奧特曼也持有類似觀點。不久前,他在一次訪談中表示,許多人的創業或研究方向是補全現有AI的缺陷,本質上是在賭AI不會變得更好。然而,未來的GPT-5、6會讓這些努力變得沒有意義。
在不少垂直領域,奧特曼的警告已成為現實:快速迭代的GPT,導致大批專注于應用層的創業公司倒閉出局。
相比之下,字節具備AI大模型的全棧能力,GPT的進化不會帶來根本沖擊;但倘若它停留在降本增效、拉低價格的層面,遲遲無法取得關鍵技術突破,那么即便未來推出更多產品,字節也很難成為AI浪潮的頭部玩家。
03
放眼全球,字節并不是唯一面臨AI挑戰的互聯網大公司。
美國互聯網行業中,搜索引擎鼻祖谷歌在ChatGPT橫空出世后“壓力山大”,折戟元宇宙的社交網絡巨頭Meta也感受到了威脅。與字節類似,他們同樣在AI大模型時代落后;不同的是,谷歌等公司投入AI的決心更大,成果也更醒目。
以谷歌為例,在ChatGPT剛剛上線時,谷歌匆忙上線AI聊天機器人Bard,卻因為屢屢“智障”而遭到群嘲。但經過近一年的打磨后,去年12月上線的谷歌大模型Gemini已經超越了GPT-4,進步速度之快令人咋舌。
幾天前的谷歌I/O大會上,Gemini 1.5 Pro版本亮相,窗口能力擴充至200萬Tokens。此外,谷歌還推出了文生圖模型Imagen 3、文生視頻模型Veo、AI助理Astra等新品,其演示效果已經與OpenAI的同類產品不相上下,某些指標甚至略勝一籌。
除了谷歌,特斯拉、亞馬遜等受AI大模型威脅較小的公司,同樣紛紛加大投入。
去年7月,馬斯克成立了人工智能創業公司xAI。近日有消息稱,xAI正在與甲骨文公司談判,計劃花費100億美元租用AI服務器,以加速追趕OpenAI、谷歌等領先企業。倘若交易達成,xAI將成為甲骨文最大客戶之一。
相比之下,字節AI看上去聲勢浩大、產品眾多,但一直沒能拿出震撼全行業的產品和技術,卻在發布會上聚焦于低價。
字節曾是一家技術創新驅動的公司,依靠推薦算法打破了中國互聯網的舊格局,在吸引數億用戶的同時,生長出迥異于傳統互聯網公司的商業模式,最終成為互聯網視頻化時代的最大贏家。
如今,隨著AI大模型技術的誕生和擴散,互聯網新時代的大門正在徐徐打開。字節2023年之后大舉布局AI,但其主要精力仍然在榨干上個時代的最后紅利上,也就是基于人工生成內容生態,發展廣告、營銷、電商、本地生活等業務。
整體來看,字節近幾年仍然保持營收和利潤規模較快增長,表明舊時代的蛋糕尚有切割空間。但不時傳出的“廣告停止增長”傳聞,也折射出字節并非每一塊業務都在持續高歌猛進。開辟新的泉眼,依然是高光之下的字節的待解難題。
AI大模型,當屬最值得期待的泉眼之一。但字節當前的AI戰略,并沒有顯露過人之處,或許不足以帶領這家巨型公司穿越周期,拿到AI互聯網時代的船票。
過去十多年,字節以推薦算法擊潰了門戶網站、視頻平臺,技術領先的降維打擊威力驚人;如今,AI大模型的技術優勢并不在字節手中;OpenAI等新玩家羽翼漸豐后,字節精心構筑的算法壁壘也有可能快速歸零。
張一鳴要想帶領字節破局,恐怕首先要破除“擠出檸檬最后一滴水”的存量競爭哲學,并以更大決心和資源押注AI大模型的未來。正如馬云多年前竭力培育云業務,最終讓阿里云成長為今日阿里的關鍵籌碼,張一鳴也需要跳脫眼下的紛擾和“戰報”,拿出當年的敏銳洞察力和決斷力,為字節的下一個十年廓清輪廓、辨明路徑。
參考資料:
字母榜,《降價是字節AI的出路嗎?》
Tech星球,《揭秘字節AI版圖:調集多位高管參戰,數款重磅產品內測》
華爾街見聞,《馬斯克旗下xAI接近達成100億美元協議,將租賃甲骨文的AI服務器》
劉曠,《AI電商正當時,阿里、抖音、百度“嚴陣以待”》
雷科技,《剪映即夢AI上手體驗:想要「干翻」Sora,似乎還有點距離》
本文由人人都是產品經理作者【字母榜】,微信公眾號:【字母榜】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!