黄色网站在线,亚洲一区二区三区日本久久九,欧美日韩精品成人网视频

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

國(guó)產(chǎn)AI大模型猛打價(jià)格戰(zhàn)，但從業(yè)者表示沒什么用，純噱頭

知危

2024-05-28

0 評(píng)論 1304 瀏覽 4 收藏

16 分鐘

進(jìn)入5月，國(guó)內(nèi)大廠的大模型紛紛降價(jià)吸引用戶；但 AI 世界瞬息萬變，或許再過一段時(shí)間，這場(chǎng)價(jià)格風(fēng)波會(huì)迭代成新的戰(zhàn)斗方式。這篇文章，我們和作者一起，看看這場(chǎng)大模型降價(jià)背后的原因，以及可能的后續(xù)。

這個(gè) 5 月，國(guó)內(nèi)大廠的大模型也開始爭(zhēng) “ 地板價(jià) ” 了。

5 月 15 日，字節(jié)跳動(dòng)的豆包大模型發(fā)布，定價(jià) 0.0008 元/千Tokens。

21 日，阿里通義千問 GPT-4 級(jí)主力模型 Qween-Long 降價(jià) 97%，API 輸入價(jià)格從 0.02 元/千Tokens 降至 0.0005 元/千Tokens，每千 Tokens 比豆包便宜 0.3 厘。

同天，百度的文心大模型中的兩大主力模型 ERNIE Speed 和 ERNIE Lite 直接宣布免費(fèi)。

22 日，騰訊也跟進(jìn)了降價(jià)風(fēng)潮，旗下數(shù)款大模型降價(jià) 50%-87.5% 不等，有三款大模型直接免費(fèi)。

似乎，中文互聯(lián)網(wǎng)世界的任何事物都要經(jīng)歷一波價(jià)格主導(dǎo)的 “ 百團(tuán)大戰(zhàn) ”。

國(guó)產(chǎn)大模型價(jià)格普降，理論上并不意外，畢竟要全面鋪開市場(chǎng)，利用冗余產(chǎn)能，低價(jià)和免費(fèi)是最直接有效的方式。

但同時(shí)，在行業(yè)人士看來，降價(jià)這件事經(jīng)不起細(xì)琢磨，無論是長(zhǎng)遠(yuǎn)效益，還是眼下國(guó)產(chǎn)大模型的技術(shù)水平，這場(chǎng)價(jià)格戰(zhàn)來得都比較急，而且有點(diǎn)不痛不癢。

AI 世界瞬息萬變，或許再過一段時(shí)間，這場(chǎng)價(jià)格風(fēng)波會(huì)迭代成新的戰(zhàn)斗方式，幾分幾厘的爭(zhēng)執(zhí)并不重要。不過，在這個(gè)也許會(huì)轉(zhuǎn)瞬而逝的風(fēng)波面前，我們?cè)噲D稍作停頓，找尋國(guó)產(chǎn)大模型降價(jià)背后的原因，以及這場(chǎng)風(fēng)波有可能的后續(xù)。

01 國(guó)產(chǎn)AI大促銷，一家更比一家低

截至目前，參與到 “ 價(jià)格戰(zhàn) ” 中的大廠有字節(jié)跳動(dòng)、阿里、百度、騰訊。

5 月 15 日，字節(jié)跳動(dòng)正式發(fā)布旗下豆包大模型，在發(fā)布會(huì)上重點(diǎn)強(qiáng)調(diào)了豆包的價(jià)格優(yōu)勢(shì)。那天，豆包在這幾家大廠里還是最便宜的，在國(guó)內(nèi)整體大模型廠商中也幾乎是最低價(jià)，豆包主力模型在企業(yè)市場(chǎng)的定價(jià)只有 0.0008元/千Tokens，比行業(yè)便宜 99.3% 。

一周后，阿里和百度在同天跟進(jìn)降價(jià)。通義千問 GPT-4 級(jí)主力模型降價(jià) 97%，差不多打了一折，API 輸入價(jià)格從 0.02 元/千Tokens 降至 0.0005元/千Tokens，比豆包還便宜 0.3 厘。另一邊，百度文心大模型的兩大主力模型 ERNIE Speed 和 ERNIE Lite 干脆直接宣布免費(fèi)。

次日，騰訊混元大模型也來了一波價(jià)格普降，除混元-pro 的輸出價(jià)格仍保持在 0.1 元/千Tokens 之外，其他大模型的價(jià)格都降了 50%-87.5% 不等。調(diào)價(jià)前，最貴的是 0.12 元/千Tokens 的混元-standard-256k 大模型，而這次降價(jià)最多的也是它，輸入價(jià)格調(diào)至 0.015元/千Ttokens，輸出價(jià)格 0.06 元/千Tokens，降幅分別為 87.5% 和 50% 。在騰訊云降價(jià)的同一天，科大訊飛旗下大模型訊飛星火 API 能力也正式免費(fèi)開放。

如今，國(guó)產(chǎn)大模型已經(jīng)進(jìn)入了以毫厘論價(jià)甚至免費(fèi)的時(shí)代。

客觀來說，大模型降價(jià)是一直以來的趨勢(shì)。

去年以來，OpenAI 就進(jìn)行了多次降價(jià)，5 月 13 日新發(fā)布的 GPT-4o，面向 ChatGPT 的所有付費(fèi)和免費(fèi)用戶發(fā)布，取消其他所有限制，API 價(jià)格從 0.1 元/千Tokens 降至 0.035 元/千Tokens（價(jià)格單位經(jīng)過換算以便與國(guó)產(chǎn)廠商對(duì)齊?）。

幾位行業(yè)人士對(duì)知危表示，降價(jià)這件事不算大，也不算稀奇。“ 現(xiàn)在價(jià)格被打下來的主要是文字生成這塊的大模型，行業(yè)其實(shí)還沒有做到把別的模態(tài)也打下來。而經(jīng)歷過去一年多的技術(shù)迭代，文字生成效果比較好的模型現(xiàn)階段已經(jīng)可以跑到端側(cè)了，端測(cè)運(yùn)行客觀來講就是免費(fèi)的。” 心光 App 聯(lián)合開發(fā)者王禹效對(duì)知危說。

他補(bǔ)充，降價(jià)這件事本身可能也有很多沒直接說的東西。“ 比如 OpenAI 有兩種報(bào)價(jià)，一種報(bào)價(jià)對(duì)應(yīng)的服務(wù)響應(yīng)比較快，另一種報(bào)價(jià)響應(yīng)慢一些，也就是他們把服務(wù)器的剩余資源拿來給你用。一般來說，大模型廠商不太可能把最好的模型拿來做免費(fèi)，你會(huì)發(fā)現(xiàn)真正的好東西還是很貴，因?yàn)楹玫哪Ｐ偷乃懔Τ杀疽泊_實(shí)高。”

國(guó)產(chǎn)大模型在這個(gè) 5 月紛紛拿出價(jià)格誠(chéng)意，一方面是大勢(shì)所趨，連技術(shù)水平更高的大模型都沒那么貴，上述企業(yè)自然也希望通過降價(jià)獲得更多市場(chǎng)。

另一方面，來自于大模型自身的迭代。王禹效說，從技術(shù)角度來看，最開始大模型需要瘋狂堆料，但后來再做優(yōu)化的時(shí)候會(huì)發(fā)現(xiàn)，其實(shí)不用堆太大的參數(shù)，可以通過知識(shí)蒸餾降低計(jì)算資源和模型大小，那之前的模型成本就能降到之前的十分之一，還能保證差不多的效果，降價(jià)也就順理成章了。

02 噱頭大于實(shí)際的一次價(jià)格戰(zhàn)

在豆包大模型發(fā)布會(huì)上，火山引擎負(fù)責(zé)人譚待表示，大的使用量，才能打磨出好模型，也能大幅降低模型推理的單位成本。而且，如今基座大模型已經(jīng)進(jìn)入了穩(wěn)定迭代的階段，在模型訓(xùn)練和推理使用上，都還有長(zhǎng)足的優(yōu)化空間，成本下降得很快。

字節(jié)的解釋，透露出兩個(gè)信息。一是模型結(jié)構(gòu)完成了優(yōu)化調(diào)整，算力效率提升了，這是降價(jià)的底氣。二是通過降價(jià)拉高市場(chǎng)使用量，反過來對(duì)大模型的繼續(xù)迭代也是好事。

理論上講，這是一個(gè)完美的答案。不過，如果再仔細(xì)推敲起這個(gè)邏輯，很多現(xiàn)實(shí)結(jié)果還有待驗(yàn)證。

首先，從商業(yè)模式上說根基不穩(wěn)。AI 應(yīng)用創(chuàng)業(yè)者谷林（化名）對(duì)知危表示，以價(jià)換量占領(lǐng)市場(chǎng)，這個(gè)邏輯看起來是對(duì)的也是常見做法，但這一策略需依賴于能夠?qū)崿F(xiàn)規(guī)模效應(yīng)的商業(yè)模式，大模型 API 卻并不是：

“ 大模型面向 B 端用戶，也就是開發(fā)者，要切換 API 的話，不存在切換門檻和壁壘?！?/p>

大模型的成本分有模型訓(xùn)練、商業(yè)服務(wù)、API 服務(wù)這三類。

單說訓(xùn)練成本，就需要昂貴的投入，包括優(yōu)質(zhì)工程師、標(biāo)注過的高質(zhì)量數(shù)據(jù)以及各領(lǐng)域科學(xué)家對(duì)模型進(jìn)行調(diào)優(yōu)，這些成本都十分高昂。此外，API 使用模型進(jìn)行推理的運(yùn)算成本，涉及顯著的電力和硬件消耗。

谷林表示，“ 正常的商業(yè)模式，就算沒有利潤(rùn)，也要考慮到卡的成本和電力成本的，如果 toB 要持續(xù)提供好的服務(wù)，一定是要有利潤(rùn)的。現(xiàn)在廠商給出每百萬 Tokens 幾塊錢幾毛錢的價(jià)格，電價(jià)可能都不夠，更別提卡了，那肯定要靠企業(yè)從其他業(yè)務(wù)的利潤(rùn)上拿來做補(bǔ)貼?！?/p>

就像消費(fèi)互聯(lián)網(wǎng)常見的 “ 百團(tuán)大戰(zhàn) ” 一樣，在 AI 大模型領(lǐng)域，先挑起價(jià)格敏感的，也是大廠。無論算力效率如何提升，成本如何比以前降低，AI 大模型畢竟沒有到一個(gè)全行業(yè)形成價(jià)格標(biāo)準(zhǔn)的時(shí)代，現(xiàn)在去無限壓低價(jià)格，還是比較具有煽動(dòng)性的事情。

不過，如此降價(jià)能不能長(zhǎng)期持續(xù)也不好定論。

如果是傳統(tǒng)的 “ 價(jià)格戰(zhàn) ”，賣的是一次性或標(biāo)準(zhǔn)化的服務(wù)，那確實(shí)誰便宜誰占領(lǐng)市場(chǎng)。但 AI 大模型不一樣，畢竟 toB 的技術(shù)企業(yè)還是要不斷做研發(fā)創(chuàng)新的，現(xiàn)在的低價(jià)買到現(xiàn)在的技術(shù)，日后開發(fā)者必然也需要更好更與時(shí)俱進(jìn)的技術(shù)支持，到那時(shí)還可以用現(xiàn)在的價(jià)格去買嗎？

還有一個(gè)值得注意的點(diǎn)，大廠尚有充裕的算力資源可以拿出來做低價(jià)，“ 反而是現(xiàn)在正在燒錢跑的模型側(cè)的一些公司，包括跑開源的公司，他們壓力比較大，因?yàn)槟Ｐ脱邪l(fā)還是挺貴的，是一個(gè)比較重資產(chǎn)的游戲?！?王禹效表示。

在行業(yè)人士看來，國(guó)內(nèi)這批大模型理論上是要比 OpenAI 等海外廠商的大模型差上 2-3 代，要補(bǔ)齊差距可能也要半年到一年的時(shí)間。

也就是說，現(xiàn)在這撥低價(jià)，是用舊的模型去促銷，搶存量市場(chǎng)，壓力還在后頭。

所以，這可能不是一場(chǎng) “ 價(jià)格戰(zhàn) ”，而是賠本賺吆喝。

03 價(jià)格不是當(dāng)下最需要卷的

價(jià)格降了，無疑會(huì)帶來不少正向的影響。

能幫助到現(xiàn)有應(yīng)用的開發(fā)團(tuán)隊(duì)，為其提供很多選擇，可以把免費(fèi)或超低價(jià)的模型都拿來試試。同時(shí)也能帶來新的創(chuàng)業(yè)機(jī)會(huì)，在幾乎不需要考慮這方面成本的情況下，一些好的想法更容易落地。無論如何，大模型通過低價(jià)一定會(huì)收獲使用量上的暴增。

因?yàn)榇竽Ｐ捅阋肆?，所以選擇用用看，這個(gè)邏輯是成立的。但是，要不要繼續(xù)用下去，或者長(zhǎng)期選擇哪個(gè)大模型，卻不是以價(jià)格為導(dǎo)向的。

王禹效解釋，在國(guó)內(nèi)這批大模型宣布降價(jià)之前，一個(gè)創(chuàng)業(yè)者如果真想做點(diǎn)什么，那幾乎每家大模型廠商都會(huì)給出很高的免費(fèi)額度。“ 比如 GPT 一開始給的是將近 2 萬人民幣的免費(fèi)額度，大家都可以申請(qǐng)。”

對(duì)于真的有想法想做 AI 創(chuàng)業(yè)的人來說，價(jià)格不是最核心的痛點(diǎn)，只能說低價(jià)或 0 元購(gòu)吸引他們過來創(chuàng)業(yè)了，但繼續(xù)做下去的話，不會(huì)有人因?yàn)檫@款模型便宜就一直用，還是要篩選技術(shù)更好，更符合自己應(yīng)用開發(fā)需求的模型。

“ 對(duì)開發(fā)者而言，免費(fèi)可以毫無顧忌地使用到更多場(chǎng)景下進(jìn)行推理，使用更長(zhǎng)的 Context 提升推理的精確度和內(nèi)容的多樣性。但在認(rèn)真做產(chǎn)品的團(tuán)隊(duì)，在技術(shù)選型上，還是首先考慮多模態(tài)的支持和內(nèi)容質(zhì)量，而不僅僅是基于成本考慮。最終一定是回歸到大模型廠商的技術(shù)和服務(wù)上來，這才是壁壘，價(jià)格不是壁壘?！?谷林坦言。

不僅是開發(fā)，在應(yīng)用運(yùn)營(yíng)的實(shí)際情況中，價(jià)格也不敏感。

王禹效舉例，“ 前兩天我們 App 的技術(shù)同事還問我，要不要搭一套新架構(gòu)，這樣隨時(shí)可以在后臺(tái)切換任何模型，都可以試試，還不會(huì)影響到業(yè)務(wù)。我覺得這個(gè)事情不著急，因?yàn)?strong>在應(yīng)用側(cè)的實(shí)際情況中，用戶是不在乎你用了什么模型的，用戶只在乎你的場(chǎng)景。所以，對(duì)于開發(fā)者來說，今天這個(gè)模型好，明天那個(gè)模型差，誰便宜了幾毫厘，誰免費(fèi)了，都沒太大意義，你只要把用戶最關(guān)心的某個(gè)場(chǎng)景的問題解決了就好?！?/p>

更何況，一款 AI 產(chǎn)品會(huì)用到不止一個(gè)模型，價(jià)格高的模型、價(jià)格低的模型、免費(fèi)的模型，開發(fā)者都可以用，免費(fèi)的模型可以用在邊角料上，做點(diǎn)簡(jiǎn)單的處理。當(dāng)一個(gè)開發(fā)者同時(shí)是所有價(jià)位的模型的客戶，似乎也不存在用價(jià)格搶客戶的事情了，只能說大家都有飯吃。

說白了，眼下國(guó)產(chǎn)大模型的 “ 價(jià)格戰(zhàn) ” 更像是營(yíng)銷手段，為廠商帶來短期的獲客，而真正決定留客率的還是模型本身的技術(shù)水平。這也是從業(yè)者們對(duì)大模型 “ 價(jià)格戰(zhàn) ” 并不興奮的原因。不會(huì)因?yàn)楸阋硕恢边x擇，更不會(huì)因?yàn)橘F就放棄好的模型。

他們只覺得，在 AI 大模型還處于沒有確立標(biāo)準(zhǔn)的野蠻時(shí)代，廠商用價(jià)格作為營(yíng)銷策略也是能理解的，就像字節(jié)在著重強(qiáng)調(diào)豆包的價(jià)格優(yōu)勢(shì)一樣。“ 字節(jié)銷售也是總來找我們，和其他廠商比，感覺字節(jié)大模型在營(yíng)銷上確實(shí)算最賣力的?！?王禹效說。

歸根結(jié)底，開發(fā)者和大模型是雙向選擇的過程。篩選客戶的核心不是誰家便宜，這跟消費(fèi)互聯(lián)網(wǎng)的價(jià)格戰(zhàn)不一樣。

谷林解釋，“ ToC 的產(chǎn)品用戶切換的壁壘，有用戶心智，有市場(chǎng)占有。假如說廠商是 toC 之后積累了規(guī)模效應(yīng)后，競(jìng)爭(zhēng)優(yōu)勢(shì)很難打破，但現(xiàn)在大模型廠商提供的就是 API，不存在規(guī)模效應(yīng)，B 端用戶的切換成本也不高。實(shí)施免費(fèi)和補(bǔ)貼市場(chǎng)策略是否真的有助于商業(yè)增長(zhǎng)，能形成商業(yè)壁壘嗎？這個(gè)策略是幫助行業(yè)發(fā)展，還是進(jìn)入劣幣驅(qū)逐良幣的內(nèi)卷？”

搞促銷，是互聯(lián)網(wǎng)博弈局的常見套路。只是，對(duì)于正在探索的應(yīng)用層開發(fā)者和躍躍欲試的新創(chuàng)業(yè)者來說，這次不一樣，價(jià)格沒那么重要。

王禹效坦言，“ 機(jī)會(huì)真是滿天飛，你快點(diǎn)開始做就行了。現(xiàn)在立刻開始做，遠(yuǎn)比你去選哪個(gè)模型，哪個(gè)廠商，哪個(gè)更便宜，來得更實(shí)際一些?！?/p>

撰文：粥粥，編輯：大餅

本文由人人都是產(chǎn)品經(jīng)理作者【知危】，微信公眾號(hào)：【知?！?，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App