Kimi“顛兒了”以后:國(guó)產(chǎn)大模型危機(jī)感來(lái)了

0 評(píng)論 1058 瀏覽 0 收藏 10 分鐘

Kimi問(wèn)世之后,無(wú)疑對(duì)國(guó)內(nèi)其他AI大模型產(chǎn)生了一定的影響,甚至一定程度上喚醒了行業(yè)巨頭的危機(jī)意識(shí)。這款由月之暗面推出的對(duì)話式AI產(chǎn)品,其一舉一動(dòng),都十分引人注目。

受Kimi影響,百度的文心一言和阿里的通義千問(wèn),用戶訪問(wèn)量大幅下滑,降幅分別達(dá)到33.42%與45.05%。

一、此消彼長(zhǎng)

問(wèn)世以來(lái),Kimi就在不斷“吊打”國(guó)內(nèi)各大廠AI模型。

根據(jù)券商監(jiān)測(cè)數(shù)據(jù),截止3月25日,Kimi的網(wǎng)頁(yè)端、APP端的用戶DAU(Daily Active User,日活躍用戶數(shù)量)突破歷史新高,分別達(dá)到了79萬(wàn)和54萬(wàn)。疊加小程序用戶量,全端總DAU顯著大于225萬(wàn),或已超越百度(BIDU.O/9888.HK)旗下大模型文心一言的233萬(wàn)。

而半個(gè)月之前,3月10日,Kimi的全端DAU剛剛突破120萬(wàn)人。但其實(shí)早在2月,Kimi的用戶訪問(wèn)量就已達(dá)到305萬(wàn),相較1月超翻倍增長(zhǎng)。

與此同時(shí),百度的文心一言和阿里(BABA.N/9988.HK)旗下的通義千問(wèn)兩大TOP2玩家,用戶訪問(wèn)量則大幅下滑,降幅分別達(dá)到33.42%與45.05%。

數(shù)據(jù)屢破新高下,Kimi的一舉一動(dòng)也被大廠關(guān)注并模仿。

Kimi是月之暗面推出的對(duì)話式AI產(chǎn)品。3月18日,月之暗面宣布Kimi支持200萬(wàn)字的無(wú)損上下文輸入。而在半年之前,去年10月發(fā)布時(shí),Kimi可支持的無(wú)損上下文輸入長(zhǎng)度僅為20萬(wàn)字。

因此,大模型的“長(zhǎng)文本能力”也受到大廠關(guān)注,甚至被認(rèn)為是大模型競(jìng)爭(zhēng)的重要性能指標(biāo)。

3月22日,通義千問(wèn)升級(jí),向所有人免費(fèi)開(kāi)放 1000 萬(wàn)字的長(zhǎng)文檔處理功能;360的智腦正式內(nèi)測(cè) 500 萬(wàn)字長(zhǎng)文本處理功能,該功能即將入駐 360AI 瀏覽器。

文心一言也宣布將于4月升級(jí),屆時(shí)也將開(kāi)放長(zhǎng)文本能力,文字范圍預(yù)計(jì)將在200萬(wàn)-500萬(wàn)。

據(jù)筆者了解,不少業(yè)內(nèi)人士卻并不看好這些大廠的“東施效顰”。他們認(rèn)為,Kimi在長(zhǎng)文本領(lǐng)域的領(lǐng)先身位,并沒(méi)有那么容易被超越。

或許正因于此,今年2月,在月之暗面最新一輪融資中,阿里作為領(lǐng)頭方,其投資額度的百分之七八十,被置換成算力服務(wù)。

二、Kimi的靈魂

互聯(lián)網(wǎng)大廠,集中了各領(lǐng)域的技術(shù)頂尖人才,但鮮有像Kimi這樣的“明星員工”。

月之暗面創(chuàng)始人楊植麟,是Kimi團(tuán)隊(duì)的靈魂人物。他擁有清華和卡內(nèi)基梅隆背景,本人是長(zhǎng)文本領(lǐng)域?qū)<摇?/p>

在過(guò)去五年內(nèi)的自研語(yǔ)言處理(NLP)領(lǐng)域,楊植麟有相當(dāng)?shù)挠绊懥ΑT谌A人學(xué)者引用排名中,楊植麟的學(xué)術(shù)論文位居前10,在40歲以下排名第一。

在讀博士期間,楊植麟就以第一作者身份發(fā)表 Transformer-XL 和 XLNet 兩項(xiàng)工作,在谷歌學(xué)術(shù)上被引用近兩萬(wàn)次,并在多個(gè)NLP任務(wù)上取得了當(dāng)時(shí)的最佳效果。

Transformer-XL成為首個(gè)全面超越 RNN 的注意力語(yǔ)言模型,XLNet則在20項(xiàng)頂級(jí)會(huì)議中獲得最佳論文提名。

楊植麟以及他的團(tuán)隊(duì),創(chuàng)造了Kimi表現(xiàn)優(yōu)秀的無(wú)損壓縮技術(shù)。這種技術(shù)可減少參數(shù)對(duì)存儲(chǔ)的需求、推理的算力,以及數(shù)據(jù)傳輸?shù)膸捳加?,從而高效率無(wú)損處理百萬(wàn)級(jí)的長(zhǎng)Token。

而為了快速趕上長(zhǎng)文本熱潮,其他大廠只能退而求其次,選擇檢索增強(qiáng)生成RAG技術(shù)。

Kimi的無(wú)損長(zhǎng)上下文窗口的方案,是在逐字閱讀全文后給出答案。RAG技術(shù)是對(duì)全文關(guān)鍵信息進(jìn)行檢索生成答案,但可能會(huì)丟失掉部分關(guān)鍵的信息。

因此,與前者相比,無(wú)論對(duì)比輸出的深度還是精度,大廠的模型都還存在較大差距。

目前,Kimi并沒(méi)有公布無(wú)損壓縮技術(shù)細(xì)節(jié)。除了論文,該技術(shù)在學(xué)界也沒(méi)有太多開(kāi)源內(nèi)容可參照。大廠想要“學(xué)習(xí)”、并工程化是非常困難的。

技術(shù)之外,Kimi的戰(zhàn)略也值得思考。

為快速“跟上形勢(shì)”,大廠一上手就追求花哨的多模態(tài)、導(dǎo)致“樣樣通樣樣松”走入平庸。

而Kimi選擇“一擊必殺”——首先垂直選擇打透長(zhǎng)文本領(lǐng)域,以培養(yǎng)用戶心智,積累用戶留存。

自發(fā)布以來(lái),Kimi除了將上下窗口從最初的20萬(wàn)字拓展到200萬(wàn)字之外,在指令理解、信息檢索能力和模型相應(yīng)速度上,也持續(xù)迭代。

月之暗面內(nèi)部人士介紹,基于 Infra 層的優(yōu)化,Kimi生成速度較去年 10 月份提升了三倍。

2023年12月、今年1月和2月,Kimi用戶留存分別為18.48%、22.25%和23.36%。這種高留存的粘性,同時(shí)形成了正反饋。

用戶們?cè)谑褂眠^(guò)程中自發(fā)“喂”給Kimi很多專(zhuān)業(yè)語(yǔ)料。通過(guò)不斷學(xué)習(xí)和處理各種類(lèi)型的語(yǔ)料,Kimi更能理解和適應(yīng)不同的語(yǔ)境、問(wèn)題和需求,從而提高其性能和準(zhǔn)確性。

在此類(lèi)專(zhuān)業(yè)語(yǔ)料處理上的進(jìn)步速度,Kimi甚至快于Open AI。

這是因?yàn)?,目前Open AI對(duì)于C端用戶上傳文件仍然有限制。而對(duì)于Kimi用戶而言,則是親手培養(yǎng)了一個(gè)高學(xué)習(xí)力的免費(fèi)私人助手,持續(xù)進(jìn)行互動(dòng)。

三、加碼海外市場(chǎng)

正如馬斯克近日發(fā)言,升級(jí)技術(shù)路線的方法,不是與競(jìng)爭(zhēng)對(duì)手比較,那就太簡(jiǎn)單了。應(yīng)是不斷挑戰(zhàn)物理極限。

超越百度等大廠,或許并非Kimi的目標(biāo)。下一步擴(kuò)張,月之暗面指向了海外。

目前,月之暗面正在對(duì)外招聘國(guó)內(nèi)/國(guó)外效果廣告設(shè)計(jì)師。除國(guó)內(nèi)廣告平臺(tái)設(shè)計(jì)外,這一崗位,還需承擔(dān)公司產(chǎn)品在海外各大廣告平臺(tái),如Google,Meta,Tiktok等廣告創(chuàng)意設(shè)計(jì)。

同時(shí),月之暗面也在補(bǔ)足運(yùn)營(yíng)短板。

月之暗面技術(shù)團(tuán)隊(duì)僅有100多人,是頭部國(guó)產(chǎn)大模型公司中,人數(shù)最少的一家。包括安卓工程師、測(cè)試、市場(chǎng)、人力等等,都是公司正在招聘的崗位。

以產(chǎn)品增長(zhǎng)職位為例,該職位要求有大廠工作經(jīng)驗(yàn)且擅長(zhǎng)通過(guò)社交媒體和用戶裂變策略推動(dòng)產(chǎn)品增長(zhǎng),包括擁有從0到1000萬(wàn)用戶增長(zhǎng)的經(jīng)驗(yàn),專(zhuān)注于提升活躍用戶數(shù)量和長(zhǎng)期留存率等職責(zé)。

“打不過(guò)就加入”。對(duì)于Kimi的崛起,阿里雖有自己的通義千問(wèn),但也給予了支持。

目前,Kimi借調(diào)了阿里的英偉達(dá)(NVDA.O)A800以及A100 GPU處理器的機(jī)型進(jìn)行擴(kuò)容,未來(lái)Kimi算力側(cè)的支持,也將主要來(lái)自于阿里。

今年2月,在月之暗面最新一輪超10億美元投資中,阿里作為領(lǐng)投方,其投資額度的百分之七八十,將被置換成算力服務(wù)器。

有了阿里的支持,Kimi不用再擔(dān)心因?yàn)樗懔Σ蛔愣礄C(jī)。該人士也表示,擴(kuò)容并非一步到位。一下子擴(kuò)容太多,容易造成算力閑置和浪費(fèi),需要一定的策略。比如,Kimi也會(huì)對(duì)用戶的使用情況進(jìn)行預(yù)測(cè)。

自從2022年11月ChatGPT發(fā)布以來(lái),國(guó)內(nèi)AI大模型已超200個(gè),且還在持續(xù)增加。Kimi的問(wèn)世,喚醒了行業(yè)巨頭的危機(jī)意識(shí)。

但Kimi也并非這場(chǎng)技術(shù)競(jìng)賽的終點(diǎn)。

作者:竹芒

原文標(biāo)題:Kimi“顛兒了”以后:國(guó)產(chǎn)大模型危機(jī)感重重

來(lái)源公眾號(hào):AI新智能(ID:alpAIworks),一個(gè)致力于探索人工智能對(duì)商業(yè)世界和社會(huì)影響的平臺(tái)。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @AI新智能 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!