開(kāi)年搶跑AI賽道,Sora“截胡”字節(jié)

0 評(píng)論 515 瀏覽 1 收藏 14 分鐘

最近,OpenAI的Sora模型在互聯(lián)網(wǎng)圈、科技圈掀起熱議,而國(guó)內(nèi)選手在大模型領(lǐng)域其實(shí)也有了新動(dòng)作,比如字節(jié)就上線了“Coze扣子”AI Bot開(kāi)發(fā)平臺(tái)。AI賽道上的競(jìng)逐,看樣子還遠(yuǎn)未結(jié)束。

最近,國(guó)內(nèi)的大公司在AI賽道上被Sora搶占了風(fēng)頭。

在2024年2月初,此前在大模型領(lǐng)域保持低調(diào)的字節(jié)跳動(dòng)終于有了新動(dòng)作,上線了“Coze扣子”AI Bot開(kāi)發(fā)平臺(tái),據(jù)Coze官方介紹,Coze可以讓用戶快速創(chuàng)建各種由AI提供支持的問(wèn)答B(yǎng)ot,且可以將Bot發(fā)布到各種應(yīng)用程序,從而促進(jìn)與這些應(yīng)用程序上的用戶的動(dòng)態(tài)交互。

簡(jiǎn)單來(lái)說(shuō),Coze的特點(diǎn)是,可以讓用戶創(chuàng)建個(gè)人定制版Bot,實(shí)現(xiàn)“0代碼”開(kāi)發(fā)。

這倒也并非創(chuàng)新之舉。早在2023年末,OpenAI發(fā)布的GPTs也是旨在“每個(gè)人都可以定制自己的ChatGPT,從而讓GPT成為一個(gè)家族。”但對(duì)于字節(jié)跳動(dòng)而言,這多少算個(gè)大動(dòng)作,畢竟此前它在大模型領(lǐng)域沉寂已久。

不過(guò),還未等Coze掀起太大的水花,OpenAI發(fā)布的Sora直接“王炸”,搶走風(fēng)頭,引發(fā)熱議。

一、定制Chatbot,從求職到小紅書文案

“Coze是一個(gè)一站式AI機(jī)器人開(kāi)發(fā)平臺(tái)?!?/p>

據(jù)Coze官網(wǎng),為了促進(jìn)和簡(jiǎn)化AI機(jī)器人的開(kāi)發(fā)過(guò)程,Coze目前集成了60多個(gè)插件,增強(qiáng)了Bot在信息檢索、旅行協(xié)助、生產(chǎn)力、圖像理解等領(lǐng)域的功能,“你可以直接將這些插件添加到Bot中,豐富Bot能力。例如使用新聞插件,打造一個(gè)可以播報(bào)最新時(shí)事新聞的AI新聞播音員?!庇脩粢部梢酝ㄟ^(guò)指定現(xiàn)有API的輸入和輸出來(lái)快速創(chuàng)建自定義插件。

此外,Coze支持為Bot創(chuàng)建定時(shí)任務(wù)。Coze官網(wǎng)介紹稱,用戶無(wú)需編寫任何復(fù)雜的代碼,只需一個(gè)簡(jiǎn)單的描述,Bot就可以按需完成工作。例如,可以配置為:每天早上 9:00 向您發(fā)送個(gè)性化新聞。提醒您每天早上7:00查看今天的天氣預(yù)報(bào)和日程。

鋅刻度體驗(yàn)Coze時(shí)發(fā)現(xiàn),目前Coze的Bot商店內(nèi)已有各種場(chǎng)景的預(yù)置Bot,其中包括女生頭像生成器、小紅書文案輸出大師、求職助手等,而根據(jù)官網(wǎng)介紹,選擇預(yù)生成Bot后,用戶會(huì)被引導(dǎo)到該Bot的配置頁(yè)面。在這里,你可以查看這個(gè)Bot的配置信息,與這個(gè)Bot進(jìn)行交互,體驗(yàn)它提供的能力。

經(jīng)體驗(yàn),鋅刻度留意到,目前的預(yù)置Bot多搭載云雀大模型。其中,“求職助手”可以提供求職建議、推薦工作機(jī)會(huì)。

Coze Bot商店內(nèi)的“求職助手”界面

而部分Bot或許還有一定完善和提升空間。比如,在體驗(yàn)“小紅書文案輸出大師”時(shí),鋅刻度分別提出“幫我列出送媽媽的禮物清單”和“幫我列出送奶奶的禮物清單”的需求,但得到的回答基本相同。這一問(wèn)題在“春聯(lián)大王”這一Bot也出現(xiàn),據(jù)鈦媒體,要求bot幫助寫一個(gè)關(guān)于雪的春聯(lián),經(jīng)過(guò)兩次追加不一樣的提示詞(Prompt),最后生成的兩副春聯(lián)竟是一模一樣的,并未如預(yù)期出現(xiàn)不同的回答。

值得一提的是,除了可以體驗(yàn)這些預(yù)置Bot,用戶也可復(fù)制一個(gè)預(yù)置的Bot,并根據(jù)你的具體需求對(duì)其進(jìn)行修改。

至于Coze背后的開(kāi)發(fā)團(tuán)隊(duì),據(jù)界面新聞報(bào)道,Coze由2023年11月字節(jié)跳動(dòng)成立的AI創(chuàng)新業(yè)務(wù)部門Flow研發(fā)而成的,該部門業(yè)務(wù)主要聚焦于AI應(yīng)用層,由字節(jié)跳動(dòng)技術(shù)副總裁洪定坤擔(dān)任技術(shù)負(fù)責(zé)人,原今日頭條CEO朱文佳擔(dān)任字節(jié)大模型團(tuán)隊(duì)業(yè)務(wù)負(fù)責(zé)人。

不過(guò),Coze官網(wǎng)鏈接的企業(yè)為“北京春田知韻科技有限公司”,天眼查顯示,該公司成立于2023年7月,由北京抖音信息服務(wù)有限公司100%持股。

二、字節(jié)猛追進(jìn)度

在發(fā)布Coze之前,字節(jié)跳動(dòng)在AI賽道上一度“掉隊(duì)”。

在字節(jié)跳動(dòng)2024年全員會(huì)上,字節(jié)跳動(dòng)CEO梁汝波表示,字節(jié)跳動(dòng)存在低效和遲鈍現(xiàn)象,并直言,“字節(jié)對(duì)于大模型領(lǐng)域的反應(yīng)過(guò)于遲鈍,直到2023年中才出現(xiàn)跟GPT相關(guān)的討論,而GPT-1在2018年就發(fā)布了,且業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司也基本在2018-2021年間創(chuàng)立?!?/p>

回顧此前,直到去年8月,字節(jié)跳動(dòng)基于云雀大模型開(kāi)發(fā)的AI聊天機(jī)器人“豆包”才開(kāi)始公測(cè),面向C端市場(chǎng)發(fā)力AI應(yīng)用。與此同時(shí),還在國(guó)外發(fā)布了基于CPT模型訓(xùn)練的Cici,后者目前已經(jīng)在超過(guò)30個(gè)國(guó)家和地區(qū)上線。

字節(jié)跳動(dòng)“豆包”

與此同時(shí),國(guó)內(nèi)大公司紛紛在這個(gè)賽道發(fā)力:從2023年的3月到9月,從百度的大語(yǔ)言模型“文心一言”、360的智腦大模型,到阿里巴巴的“通義千問(wèn)”大模型、科大訊飛的星火大模型,再到騰訊的混元大模型,國(guó)內(nèi)傳統(tǒng)的三大互聯(lián)網(wǎng)巨頭“BAT”悉數(shù)下場(chǎng)。

手機(jī)廠商也未缺席,華為、小米、OPPO、vivo、榮耀都先后在賽道亮相;五科研院所和初創(chuàng)企業(yè)不甘示弱,北京智源人工智能研究院發(fā)布了“悟道”大模型,上海人工智能實(shí)驗(yàn)室推出了“書生”大模型,鵬城實(shí)驗(yàn)室研發(fā)了“鵬城·腦海”大模型;京東、攜程、好未來(lái)等也相繼召開(kāi)發(fā)布會(huì);甚至連移動(dòng)、聯(lián)通、電信三大運(yùn)營(yíng)商,長(zhǎng)虹等家電生產(chǎn)企業(yè)也欲分一杯羹……

更不用提諸多風(fēng)云人物對(duì)此的討論不斷。其中,據(jù)財(cái)經(jīng)網(wǎng),華為創(chuàng)始人任正非3月中旬參加華為 “難題揭榜火花獎(jiǎng)” 頒獎(jiǎng)座談會(huì)時(shí)稱,華為會(huì)做底層算力平臺(tái):“未來(lái)AI大模型會(huì)風(fēng)起云涌,不只微軟一家。ChatGPT把計(jì)算、管道流量撐大,華為的產(chǎn)品就有了機(jī)會(huì)?!蓖略碌?,騰訊總裁劉熾平在財(cái)報(bào)電話會(huì)上說(shuō),生成式人工智能可成為騰訊已有業(yè)務(wù),如社交、游戲的“倍增器”,也可幫助開(kāi)拓?cái)?shù)字助手、搜索等新增長(zhǎng)線。此外,《張朝陽(yáng)的物理課》直播結(jié)束后會(huì)自動(dòng)生成字幕:“‘社交互動(dòng)’‘算法推薦以及AIGC’‘自媒體’,是這些年來(lái)互聯(lián)網(wǎng)的三個(gè)線索?!?/p>

數(shù)據(jù)則更為直觀,據(jù)“趣解商業(yè)”,2023年5月的中關(guān)村論壇上,專家口中中國(guó)“10億級(jí)參數(shù)規(guī)模以上”大模型的發(fā)布數(shù)量尚為79個(gè);而《2023中國(guó)新一代人工智能科技產(chǎn)業(yè)發(fā)展報(bào)告》顯示,截至2023年10月,我國(guó)擁有10億參數(shù)規(guī)模以上大模型的廠商及高校院所共計(jì)254家,分布于20多個(gè)省市/地區(qū),國(guó)內(nèi)大模型總數(shù)達(dá)238個(gè);而據(jù)GitHub的統(tǒng)計(jì)數(shù)據(jù),到2023年底國(guó)內(nèi)已經(jīng)發(fā)布的大語(yǔ)言模型接近300個(gè)。

所以,當(dāng)“百模大戰(zhàn)”如火如荼時(shí),在2024年初發(fā)布Coze的字節(jié)跳動(dòng),與其說(shuō)是搶跑,可能更精確的說(shuō)法是“奮起直追”。

三、OpenAI搶占風(fēng)頭,字節(jié)又該如何應(yīng)對(duì)?

字節(jié)跳動(dòng)或許本想著在2024年初搶先嶄露頭角,卻不料OpenAI再放“狠招”,直接“王炸”,搶占了風(fēng)頭。就在Coze上線后不久,Sora橫空出世。

2月16日,OpenAI推出了一款能根據(jù)文字指令即時(shí)生成短視頻的模型,命名為Sora。據(jù)介紹,Sora能夠從文本說(shuō)明中生成長(zhǎng)達(dá)60秒的視頻,并能夠提供具有多個(gè)角色,特定類型的動(dòng)作和詳細(xì)的背景細(xì)節(jié)的場(chǎng)景。Sora還能在一個(gè)生成的視頻中創(chuàng)建多個(gè)鏡頭,體現(xiàn)人物和視覺(jué)風(fēng)格。此外,Sora可以一次性生成整個(gè)視頻,也可以擴(kuò)展生成的視頻。

Sora技術(shù)報(bào)告

這意味著,OpenAI已然在人工智能賽道上邁入下半場(chǎng),國(guó)內(nèi)外大模型的差距更明顯了。當(dāng)OpenAI官方公布長(zhǎng)達(dá)60秒未經(jīng)修改的AI視頻,國(guó)內(nèi)也有AI團(tuán)隊(duì)緊急上線相關(guān)“文字生成視頻”大模型,但與國(guó)外主流AI視頻模型能力相仿,均暫時(shí)無(wú)法超越Sora的水平。

不過(guò),當(dāng)OpenAI已經(jīng)開(kāi)始深耕文生視頻的大模型,字節(jié)跳動(dòng)卻似乎如夢(mèng)初醒,剛剛開(kāi)始追趕對(duì)話問(wèn)答大模型的進(jìn)度。

日前雖有消息稱,在Sora引爆文生視頻賽道之前,國(guó)內(nèi)的字節(jié)跳動(dòng)也推出了一款顛覆性視頻模型——Boximator。與Gen-2、Pink1.0等模型不同的是,Boximator可以通過(guò)文本精準(zhǔn)控制生成視頻中人物或物體的動(dòng)作。但對(duì)此,字節(jié)跳動(dòng)相關(guān)人士回應(yīng)新浪科技稱,Boximator是視頻生成領(lǐng)域控制對(duì)象運(yùn)動(dòng)的技術(shù)方法研究項(xiàng)目,目前還無(wú)法作為完善的產(chǎn)品落地,距離國(guó)外領(lǐng)先的視頻生成模型在畫面質(zhì)量、保真率、視頻時(shí)長(zhǎng)等方面還有很大差距。

事實(shí)上,字節(jié)跳動(dòng)的Coze也多少有些亦步亦趨,早在Coze發(fā)布之前,其實(shí)在2023年11月的OpenAI首屆開(kāi)發(fā)者大會(huì)上,GPTs就已經(jīng)發(fā)布,而根據(jù)當(dāng)時(shí)的介紹,GPTs無(wú)需編程技巧,可以讓用戶用自己的自然語(yǔ)言來(lái)創(chuàng)建“個(gè)人版ChatGPT”,實(shí)現(xiàn)全程“0代碼”開(kāi)發(fā)。

用OpenAI CEO奧爾特曼的話說(shuō),每個(gè)人都可以定制自己的ChatGPT,從而讓GPT成為一個(gè)家族。那時(shí)候,外界討論,GPTs搭配GPT Store,很可能會(huì)在AI應(yīng)用生態(tài)中誕生下一個(gè)蘋果。

彼時(shí),華西證券研報(bào)曾評(píng)價(jià),類比App Store,GPT Store將成為OpenAI生態(tài)重要一環(huán)。

按照研報(bào)的說(shuō)法,對(duì)初創(chuàng)公司來(lái)說(shuō),GPTs本身就是一個(gè)值得挖掘的AI應(yīng)用項(xiàng)目;而對(duì)于現(xiàn)有的互聯(lián)網(wǎng)應(yīng)用來(lái)說(shuō),GPT Store是一個(gè)優(yōu)質(zhì)的流量入口,GPTs要實(shí)現(xiàn)復(fù)雜功能普遍需調(diào)用外部API,若現(xiàn)有App能充分利用GPTs的高智能、高靈活性,并與自身應(yīng)用進(jìn)行結(jié)合,有望為現(xiàn)有互聯(lián)網(wǎng)生態(tài)注入新鮮血液,“AI+一切”已近在咫尺。

顯然,Coze的設(shè)定與此相同。

只不過(guò),當(dāng)字節(jié)跳動(dòng)這次試圖緊跟OpenAI腳步時(shí),還是稍有差距。可以預(yù)想的是,國(guó)內(nèi)或許很快也將掀起文生視頻大模型的新浪潮,而字節(jié)跳動(dòng)又該如何應(yīng)對(duì)呢?

作者:黎炫岐,編輯:黎文婕

來(lái)源公眾號(hào):鋅刻度(ID:znkedu),專注科技、互聯(lián)網(wǎng)新經(jīng)濟(jì)原創(chuàng)深度報(bào)道。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @鋅刻度 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!