李彥宏萬(wàn)字演講實(shí)錄:AI時(shí)代,應(yīng)用創(chuàng)造世界
本文為李彥宏在百度世界大會(huì)上的演講實(shí)錄,他說(shuō)百度不是要推出一個(gè)「超級(jí)應(yīng)用」,而是要打造數(shù)百萬(wàn)「超級(jí)有用」的應(yīng)用。?????????????????????????
各位來(lái)賓,歡迎參加百度世界2024大會(huì)!
每年我們都用這個(gè)機(jī)會(huì),向大家展示百度在過(guò)去一年當(dāng)中,百度在技術(shù)創(chuàng)新方面的最新成果,今年我們把大會(huì)的主題定成“應(yīng)用來(lái)了”,這代表了我們對(duì)大模型和生成式AI當(dāng)下的認(rèn)知和判斷。
大模型火了將近兩年,相關(guān)技術(shù)以前所未有的速度進(jìn)行迭代和創(chuàng)新,從大公司,到創(chuàng)業(yè)者,到風(fēng)險(xiǎn)投資,各路人馬大家都在尋找生成式AI時(shí)代基于大模型的超級(jí)應(yīng)用。
我們看到,這張圖是由第三方研究機(jī)構(gòu)最近發(fā)布的全球AI全景,基本展現(xiàn)了大模型和生成式AI爆發(fā)過(guò)程中,一浪一浪疊加的狀態(tài)。首先是OpenAI發(fā)布了ChatGPT,后來(lái)百度發(fā)布文心一言,緊接著就是谷歌發(fā)布了Bard,后來(lái)改名為Gemini;接著,以英偉達(dá)為代表的芯片廠商和微軟為代表的云廠商吃到紅利;然后我們也看到了開(kāi)源模型的奮起直追。
與此同時(shí),各類(lèi)應(yīng)用層的創(chuàng)業(yè)公司開(kāi)始獲得投資,一些傳統(tǒng)的軟件廠商也開(kāi)始用AI重構(gòu)自己的產(chǎn)品。然而客觀地講,大家期待的超級(jí)應(yīng)用還沒(méi)有出現(xiàn),甚至有人開(kāi)始問(wèn),過(guò)去這24個(gè)月,這種全球性的大模型狂熱,究竟是一場(chǎng)新的技術(shù)革命,還是新一輪泡沫?
作為中國(guó)人工智能的扛旗者,我想我們是有資格回答這個(gè)問(wèn)題的。
大家請(qǐng)看:這張圖這是文心大模型的日均調(diào)用量變化曲線圖,到今天這個(gè)數(shù)字已經(jīng)超過(guò)了15億,每天調(diào)用15億。這是一條非常陡峭的增長(zhǎng)曲線,在過(guò)去18個(gè)月當(dāng)中,中國(guó)的大模型應(yīng)用爆發(fā)可以用這張圖或者這個(gè)曲線來(lái)代表。
說(shuō)實(shí)話,這個(gè)增速是超出了我的預(yù)期的。
我記得今年5月份,就是6個(gè)月之前,當(dāng)我們的人均調(diào)用量達(dá)到兩億的時(shí)候,我跟我的高管們討論,討論大模型的未來(lái),討論怎么就叫成了。
我當(dāng)時(shí)說(shuō),如果我們的調(diào)用量日均的API調(diào)用量,大模型API調(diào)用量,一年之內(nèi)如果漲10倍,也就是從2億漲到20億,一年時(shí)間漲10倍,我認(rèn)為就成了,就說(shuō)明大家是真需要。
現(xiàn)在僅僅半年過(guò)去,我們就比較接近這個(gè)數(shù)字了,勢(shì)頭非常猛。
調(diào)用量漲這么快,背后是文心大模型不遺余力的升級(jí)進(jìn)化、降本提速的過(guò)程,也是我們緊貼客戶需求,不斷發(fā)現(xiàn)問(wèn)題、解決問(wèn)題的過(guò)程。去年三月,文心一言發(fā)布的時(shí)候,我們說(shuō)百度大模型的特色是知識(shí)增強(qiáng)、檢索增強(qiáng)。
后來(lái)我們發(fā)現(xiàn),檢索增強(qiáng)并不是百度特色,而是逐步成為了行業(yè)的共識(shí)。
檢索增強(qiáng)的手段,英文叫RAG,就是Retrieval-augmented Generation。
當(dāng)然,我們是做搜索起家嘛,這個(gè)方面我們理應(yīng)做得最好。
這個(gè)手段的意義在哪呢?
它就是讓大模型基本消除了幻覺(jué)。
你要想基于大模型開(kāi)發(fā)應(yīng)用,消除幻覺(jué)是必須的,如果這個(gè)模型總是一本正經(jīng)的胡說(shuō)八道,就不會(huì)有人信你,就不會(huì)有應(yīng)用。
有人說(shuō)我用模型來(lái)寫(xiě)小說(shuō),有點(diǎn)幻覺(jué)可能更有意思,更能引人入勝,不對(duì)!即使是文學(xué)創(chuàng)作,也需要故事前后保持一致,否則就不是智能而是智障了!所以如果你要問(wèn)我,過(guò)去這24個(gè)月,對(duì)行業(yè)而言,最大的變化是什么?那我的回答一定是,大模型基本消除了幻覺(jué),它回答問(wèn)題的準(zhǔn)確性大大地提升了,這讓AI從“一本正經(jīng)的胡說(shuō)八道”,變得可用、可被信賴。
我們知道,大模型是一個(gè)概率模型,生成的內(nèi)容是有不確定性的。但是當(dāng)我們采用RAG技術(shù)后,大模型會(huì)利用檢索到的信息來(lái)指導(dǎo)文本或答案的生成,從而極大地提高了內(nèi)容的質(zhì)量和準(zhǔn)確性。
今天,文字層面的RAG已經(jīng)做得很好了,但是圖像等多模態(tài)內(nèi)容和RAG的結(jié)合還不夠。
大家請(qǐng)看這張圖,這是我們用開(kāi)源模型生成的一張北京天壇的圖片,看上去確實(shí)有點(diǎn)像天壇,但你總覺(jué)得哪兒不對(duì)。
告訴大家,真正的天壇長(zhǎng)這個(gè)樣字,是三層,但是模型生成的是四層,這是文生圖比較典型的幻覺(jué)現(xiàn)象。
這種幻覺(jué)現(xiàn)象,今天仍然很普遍,所以今天的多模態(tài)大模型,沒(méi)有什么成規(guī)模的應(yīng)用出來(lái)。
就是幻覺(jué)沒(méi)有解決,至少?zèng)]有像文生文RAG解決得那么好。
今年年初,我們決定要解決這個(gè)問(wèn)題。
注意,就是在整個(gè)中文互聯(lián)網(wǎng)都為Sora而捶胸頓足上吐下瀉的時(shí)候,我們?nèi)Q定解決圖像生成的幻覺(jué)問(wèn)題。
這個(gè)問(wèn)題看起來(lái)更簡(jiǎn)單、甚至更枯燥,但是不解決就不會(huì)有應(yīng)用。
我們開(kāi)發(fā)了一項(xiàng)顛覆性的技術(shù)叫做iRAG,就是image based RAG,檢索增強(qiáng)的文生圖技術(shù)。
之前,完全基于大語(yǔ)言模型的文生圖系統(tǒng),生成的圖片常常是“一眼假”,甚至邏輯不合常理。
百度的iRAG,將百度搜索的億級(jí)圖片資源跟強(qiáng)大的基礎(chǔ)模型能力進(jìn)行結(jié)合,這樣就可以生成各種超真實(shí)的圖片,整體效果遠(yuǎn)遠(yuǎn)超過(guò)文生圖的原生系統(tǒng),去掉了機(jī)器味兒。
讓我們看一下這個(gè)案例,提示詞是:畫(huà)一張大眾攬巡汽車(chē)飛越長(zhǎng)城的圖片,寫(xiě)實(shí)風(fēng)格。
無(wú)論是車(chē)型還是車(chē)標(biāo),都沒(méi)有錯(cuò)誤或者變形,它跟長(zhǎng)城這個(gè)背景的融合度,也非常高。
這就是基于iRAG技術(shù)創(chuàng)作出來(lái)的一張圖片,它的內(nèi)容元素、畫(huà)面氛圍都非常真實(shí),逼近實(shí)拍的海報(bào),但實(shí)拍你的車(chē)是飛不起來(lái)的,就像是P上去的一樣。
當(dāng)然,你還可以讓AI生成這輛汽車(chē)在荒野上、城市中,在各種各樣真實(shí)場(chǎng)景的圖片。
隨著AI生成圖片的可用性大大提高,它的應(yīng)用空間也隨即打開(kāi)了。
比如在品牌宣傳場(chǎng)景,以前拍這樣一組海報(bào)動(dòng)輒需要一二十萬(wàn),甚至大幾十萬(wàn),但是現(xiàn)在這種創(chuàng)作的成本接近于0。
簡(jiǎn)單說(shuō)來(lái),iRAG的商業(yè)價(jià)值體現(xiàn)在:無(wú)幻覺(jué)、超真實(shí)、沒(méi)成本,而且呢,立等可取。
試想一下,如果大眾的海報(bào)生成的車(chē)型長(zhǎng)得像豐田,那可就糟心了。
除了特定的物品,我們還可以生成特定人物跟任意場(chǎng)景的背景結(jié)合的照片。
我們以愛(ài)因斯坦為例,生成一張他和天壇打卡的合影。
大家看是不是很像,這完全是利用iRAG技術(shù)生成的。
我們用同樣的提示詞,用一些開(kāi)源模型生成了幾張,大家可以做一下比較。
有的長(zhǎng)得根本不像愛(ài)因斯坦,唯一一個(gè)長(zhǎng)得像愛(ài)因斯坦的,那背景大家一看,也不是天壇。
可以說(shuō)在全球范圍內(nèi),百度的iRAG能力都是最領(lǐng)先的。
我們還可以通過(guò)提示詞,讓愛(ài)因斯坦游遍全世界,比如悉尼歌劇院、復(fù)活節(jié)島巨石陣、長(zhǎng)城、鳥(niǎo)巢等等,鳥(niǎo)巢顯然是在愛(ài)因斯坦去世后才建造的。
作為一項(xiàng)基礎(chǔ)技術(shù),iRAG在很多領(lǐng)域都有著很好的應(yīng)用空間。
比如,影視作品、漫畫(huà)作品,連續(xù)畫(huà)本,海報(bào)制作等,AI生圖都可以大幅降低大家的創(chuàng)作成本。
今天,基礎(chǔ)模型能力就緒,我們即將迎來(lái)AI應(yīng)用的群星閃耀時(shí)刻。
每一個(gè)應(yīng)用都是一顆星,每一個(gè)應(yīng)用都將成為改變世界的力量。
那么,AI應(yīng)用從哪里來(lái)?到哪里去?
下面,我就講講兩個(gè)大的AI應(yīng)用方向:一個(gè)是智能體,另一個(gè)是產(chǎn)業(yè)應(yīng)用。
我們認(rèn)為,智能體是AI應(yīng)用的最主流形態(tài),即將迎來(lái)它的爆發(fā)點(diǎn)。
今天,全球所有頂尖科技公司都很關(guān)注智能體,但像百度這樣把智能體作為最重要戰(zhàn)略方向的并不多。
我認(rèn)為,做智能體很像在PC時(shí)代做網(wǎng)站,或者是移動(dòng)時(shí)代做自媒體賬號(hào)。
不同之處是智能體更像人,更智能,更像你的銷(xiāo)售,像你的客服,像你的助理。智能體可能會(huì)變成AI原生時(shí)代,內(nèi)容、信息和服務(wù)的新載體。
為什么這么說(shuō)?
一方面,做智能體的門(mén)檻足夠低,誰(shuí)都能上手,在百度的文心智能體平臺(tái)上,甚至我們看到有11歲的小學(xué)生在創(chuàng)造智能體,然后通過(guò)搜索和其他渠道分發(fā)出去。
另一方面,智能體的天花板又足夠的高,可以做出功能非常強(qiáng)大的應(yīng)用。多個(gè)智能體的協(xié)作,還可以解決更加復(fù)雜的問(wèn)題。
今天呢,在最后的環(huán)節(jié),我會(huì)給大家展示一個(gè)多智能體協(xié)作解決復(fù)雜問(wèn)題的最驚艷的例子。
下面我就給大家展示一下4種不同類(lèi)型的智能體,包括公司類(lèi)智能體,角色類(lèi)智能體,工具類(lèi)智能體和行業(yè)類(lèi)智能體。
我們首先看第一類(lèi),公司類(lèi)智能體。它就相當(dāng)于AI時(shí)代的公司官網(wǎng)。
傳統(tǒng)官網(wǎng)具有的那些能力,比如公司介紹、產(chǎn)品圖片和參數(shù)展示、線下門(mén)店位置等等,公司類(lèi)智能體都有。而傳統(tǒng)網(wǎng)站沒(méi)有的主動(dòng)推薦、及時(shí)響應(yīng)和一對(duì)一服務(wù)能力,公司智能體也有。
我們以比亞迪的智能體為例,和一個(gè)傳統(tǒng)官網(wǎng)做個(gè)比較。
在百度搜索“比亞迪”,就能直接喚起它的官方智能體。點(diǎn)擊進(jìn)入,它會(huì)首先給你一段比亞迪品牌的簡(jiǎn)短介紹,這就類(lèi)似于傳統(tǒng)的官網(wǎng)。然后,你讓它推薦一臺(tái)性能均衡的車(chē)型。什么叫“性能均衡”,傳統(tǒng)的官網(wǎng)不知道什么是性能均衡,所以沒(méi)法兒給你推薦,而有了大模型理解能力的智能體,就可以很好地做出篩選,給出建議,并且展示產(chǎn)品的圖片。
當(dāng)你對(duì)幾個(gè)車(chē)型都有興趣,想比較一下,看哪個(gè)值得買(mǎi)的時(shí)候,在傳統(tǒng)的官網(wǎng)上是要花費(fèi)比較多時(shí)間的。因?yàn)槊總€(gè)車(chē)型對(duì)應(yīng)的商品詳情頁(yè)都是單獨(dú)的,你得在不同商品詳情頁(yè)之間來(lái)回切換著看,非常麻煩。
而智能體可以直接給你把多個(gè)車(chē)型的動(dòng)力類(lèi)型、車(chē)身尺寸、續(xù)航、加速性能放在一起拉出表格來(lái),非常直觀。
如果,你想進(jìn)一步到線下門(mén)店去試駕怎么辦?
智能體可以直接調(diào)用地圖,幫你一鍵導(dǎo)航,直達(dá)目的地。
另外,還有一點(diǎn)是智能體與傳統(tǒng)官網(wǎng)很不一樣的,那就是對(duì)最新信息或者最個(gè)性化問(wèn)題的回答。
傳統(tǒng)的官網(wǎng),對(duì)外界市場(chǎng)信息變化往往不敏感,客服人員對(duì)于個(gè)性化的問(wèn)題也難以給出令人滿意的回答,所以通常只能做記錄,再電話回訪。而智能體可以利用大模型的理解、生成、邏輯、記憶四大能力和檢索增強(qiáng)能力,快速?gòu)木W(wǎng)上獲取最新、最準(zhǔn)確的消息,并在一秒鐘之內(nèi)就給出一個(gè)令人滿意的答案。
如果你還有更復(fù)雜的問(wèn)題,智能體也可以通過(guò)不斷地跟你澄清、互動(dòng)、反問(wèn),來(lái)最終滿足你的需求。
不僅是比亞迪,像聯(lián)想、沙宣、洋河這些企業(yè),現(xiàn)在都已經(jīng)擁有了自己的官方智能體。
比起傳統(tǒng)的官網(wǎng),智能體既是你的品牌顧問(wèn)又是你的金牌銷(xiāo)售和客服,既專(zhuān)業(yè)又貼心,一對(duì)一的服務(wù),大幅地提升了互動(dòng)營(yíng)銷(xiāo)的效率。
比亞迪的官方智能體上線后,銷(xiāo)售線索轉(zhuǎn)化率提升了119%。聯(lián)想AIPC智能體在9月份的互動(dòng)率提升了89%,銷(xiāo)售線索轉(zhuǎn)化率提升了80%。
未來(lái),公司官方智能體很可能會(huì)替代官網(wǎng),成為最直接的面向消費(fèi)者的界面。
我們?cè)賮?lái)看 第二類(lèi),角色智能體。
提到角色,大家很容易想到數(shù)字人。
數(shù)字人有自己的人設(shè)、自己的知識(shí)庫(kù),這都是典型的智能體基本要素。所以當(dāng)智能體機(jī)制和多模態(tài)進(jìn)行有效結(jié)合的時(shí)候,它就變成了一個(gè)有形象、有動(dòng)作,并且動(dòng)作可以跟語(yǔ)言可以匹配起來(lái)的數(shù)字人。
之前的數(shù)字人,短板是顯而易見(jiàn)的。它們說(shuō)話的聲音、肢體動(dòng)作、口型都非常機(jī)械、呆板。但是,在大模型加持下,數(shù)字人逐漸變成了高度擬人化的智能體,更聰明、有情感、有態(tài)度。
他們可能是教育輔導(dǎo)老師,留學(xué)顧問(wèn),也可能是心理咨詢師,私人健身教練等等,都非常受歡迎。
今天, 你在百度搜索“教育輔導(dǎo)”這樣的關(guān)鍵字,在搜索結(jié)果頁(yè)中,就能看到這些數(shù)字人。他們不僅比我們以前看到的數(shù)字人更加自然、動(dòng)作幅度更大,甚至在直播場(chǎng)景下,還可以說(shuō)著說(shuō)著,在合適的時(shí)機(jī)停下,回復(fù)網(wǎng)友現(xiàn)場(chǎng)提出的問(wèn)題。
這需要大量的數(shù)據(jù)積累和直播互動(dòng)規(guī)律的總結(jié)提煉,以前,我們是不具備這樣的能力。
所以今天的數(shù)字人直播,很多情況下,轉(zhuǎn)化率已經(jīng)超過(guò)了真人。
這些數(shù)字人,動(dòng)作、語(yǔ)言、口型非常自然,如果不說(shuō)的話,你都不知道是數(shù)字人。
數(shù)字人的好處在于它的腳本完全是AI生成的,很多數(shù)據(jù),非常詳細(xì)的數(shù)據(jù),真人在直播的時(shí)候,他是記不住的,數(shù)字人完全沒(méi)有問(wèn)題。所以他的知識(shí)量,他的實(shí)際反應(yīng)能力,很多時(shí)候是超越了普通真人了已經(jīng)。
我們非常地相信,真人與虛擬人的交互,將創(chuàng)造巨大的產(chǎn)業(yè)價(jià)值和社會(huì)價(jià)值。
這里的虛擬人,可能就是現(xiàn)實(shí)生活中的一位名師的數(shù)字分身,也可能是一位名醫(yī)、王牌律師和金牌銷(xiāo)售的數(shù)字分身,而你從來(lái)沒(méi)有像現(xiàn)在這樣離他們?nèi)绱酥?/p>
我要講的第三類(lèi)智能體是工具類(lèi)。
工具類(lèi)智能體其實(shí)是個(gè)熱門(mén)賽道。
筆靈AI寫(xiě)作、canva設(shè)計(jì)助手、logo生成器等等,這些都是典型的工具智能體。
下面,我給大家展示一個(gè)全新的工具類(lèi)智能體,是由百度文庫(kù)和網(wǎng)盤(pán)聯(lián)合開(kāi)發(fā)的“自由畫(huà)布”。
我們以行業(yè)分析師寫(xiě)研究報(bào)告作為例子,來(lái)給大家介紹一下自由畫(huà)布。
在很多人的認(rèn)知中,行研報(bào)告就是圖文結(jié)合的內(nèi)容。但今天,它可以是另一種形態(tài),有傳統(tǒng)的圖文、表格,也有像發(fā)布會(huì)視頻、電話會(huì)錄音,組成一種更全的多模態(tài)報(bào)告。
這在自由畫(huà)布上,可以很好地實(shí)現(xiàn)。我們來(lái)看一下,什么叫做自由畫(huà)布。
首先,我們打開(kāi)百度APP,搜索“智能寫(xiě)作”等關(guān)鍵詞,就可以找到“自由畫(huà)布”智能體,它可以幫你完成從找資料、到編輯、再到生成和分享的全部任務(wù)。
第一步,輸入自由。自由畫(huà)布打通了公域和私域的數(shù)據(jù),比如,文庫(kù)上公開(kāi)的高質(zhì)量文檔或片段,外部網(wǎng)頁(yè)公開(kāi)的這些內(nèi)容,可以一鍵摘錄到自由畫(huà)布。來(lái)自私域的內(nèi)容,比如你在像網(wǎng)盤(pán)聽(tīng)記上記錄的多場(chǎng)電話會(huì)議的音頻,比如你在收藏在網(wǎng)盤(pán)里的專(zhuān)業(yè)視頻和深度調(diào)研報(bào)告等等,不限格式、不限來(lái)源,全部都可以拖到畫(huà)布上。這是輸入自由。
第二步,編輯自由:你不再需要去做居中、調(diào)字號(hào)、排版等基礎(chǔ)繁雜的工作。我們今天,重新定義了編輯,讓用戶成為總指揮,通過(guò)批注的方式告訴AI,如何利用素材,也可以圈選出最需要的內(nèi)容片段,或者原封不動(dòng)要復(fù)用的部分,這樣就能確保生成的內(nèi)容,完全符合你的真實(shí)想法。
第三步,我們叫做創(chuàng)作自由:劃好重點(diǎn)之后,框選全部需要的素材一鍵生成,AI就會(huì)根據(jù)輸入和要求開(kāi)始思考,在對(duì)應(yīng)章節(jié)下利用相關(guān)素材,生成一個(gè)結(jié)構(gòu)清晰的、全新的富媒體內(nèi)容。當(dāng)然,你也可以打開(kāi)這些文檔,再做局部的編輯,以及改寫(xiě)、擴(kuò)寫(xiě)、續(xù)寫(xiě)。實(shí)現(xiàn)一邊在畫(huà)布上捋思路,做草稿,一邊在文檔上完善細(xì)化,一站式解決各種各樣的問(wèn)題。
最后,我們叫做分享自由:最終生成的內(nèi)容可以保存在本地,也可以上傳在用戶的個(gè)人云上,還可以用一個(gè)鏈接分享出去,無(wú)論是行業(yè)交流群、朋友圈或者其他平臺(tái),都可以直接打開(kāi)鏈接觀看播放。所以不管你是內(nèi)容的生產(chǎn)者還是消費(fèi)者,都再也不用關(guān)心文件的格式是什么、我的手機(jī)或電腦有沒(méi)有相關(guān)的應(yīng)用、內(nèi)存還夠不夠等等這些瑣事了。
除了上面這種辦公場(chǎng)景,我再給大家演示一個(gè)偏向于個(gè)人創(chuàng)作場(chǎng)景的案例。
大家知道今年“黑神話悟空”很火,我們想讓AI幫我們放飛想象,看看大圣穿越到現(xiàn)代,會(huì)發(fā)生什么?自由畫(huà)布根據(jù)我的要求,生成了一個(gè)大圣穿越到現(xiàn)代探險(xiǎn)的故事。
那我們是不是可以基于這個(gè)故事,生成一幅漫畫(huà)呢?
當(dāng)然可以!
你們看,在漫畫(huà)中,孫悟空游覽了山西幾個(gè)打卡圣地,最后來(lái)到了上海。大家注意看,不同圖片中的孫悟空,它的一致性是非常好的,前后看著都像一個(gè)孫悟空,還結(jié)合故事情節(jié)做出了對(duì)應(yīng)的動(dòng)作。
漫畫(huà)很生動(dòng)。我們能不能讓AI生成視頻?我們來(lái)看一下:所以大家看到,原本漫畫(huà)中的對(duì)白,變成了字幕和配音,讓故事更加生動(dòng)。
那如果我們腦洞再大一點(diǎn),讓一個(gè)小朋友穿越到花果山怎么樣?其實(shí)很簡(jiǎn)單,你只需要上傳一張小朋友自己的照片,就能讓他融入到這個(gè)個(gè)人定制畫(huà)本中。你們看,自由畫(huà)布已經(jīng)生成了一個(gè)小朋友夢(mèng)游花果山的故事。
接下來(lái),點(diǎn)擊制作畫(huà)本就可以了,畫(huà)面中小朋友的神態(tài)和真人照片可以做得非常相似。
講到這呢,大家可以感覺(jué)到,自由畫(huà)布就是一個(gè)由文心多模態(tài)大模型加持的萬(wàn)能白板,它能很好地激發(fā)人們的無(wú)限靈感和創(chuàng)造力。
因?yàn)樽杂僧?huà)布,每個(gè)孩子都能成為故事的主角。因?yàn)樽杂僧?huà)布,每個(gè)人都可以是漫畫(huà)家、成為短視頻導(dǎo)演。
而且,這不是期貨,而是立即可用的現(xiàn)貨,是真正服務(wù)于創(chuàng)造的新質(zhì)生產(chǎn)力!我們很快會(huì)正式上線。
第四類(lèi)智能體, 我們稱(chēng)之為“行業(yè)智能體”。比如法律、醫(yī)療健康、金融、體育、旅行等等領(lǐng)域,都涌現(xiàn)出很多有用的智能體。
我們來(lái)看一個(gè)法律行業(yè)的智能體 ——法行寶。每個(gè)人工作生活中,都會(huì)遇到各類(lèi)法律相關(guān)的問(wèn)題,但不是每個(gè)人都能第一時(shí)間找到專(zhuān)業(yè)的律師來(lái)幫自己支招。這時(shí),法行寶就很有用了。它是很受用戶歡迎的智能體,在百度的平臺(tái)上,已經(jīng)回答了超過(guò)1660萬(wàn)個(gè)問(wèn)題。
我們來(lái)看看它具體能做什么?
我有一個(gè)朋友昨天被車(chē)撞了,現(xiàn)在躺在醫(yī)院花了很多錢(qián),報(bào)警后,警察說(shuō)是對(duì)方全責(zé),但對(duì)方不給賠償,該怎么辦?
針對(duì)這個(gè)情況,法行寶給出了四個(gè)步驟的指導(dǎo),先是保留相關(guān)證據(jù),請(qǐng)求交管部門(mén)去調(diào)解,如果調(diào)解失敗,可以再提起民事訴訟、申請(qǐng)法院的強(qiáng)制執(zhí)行。你可能還想知道,如果賠償,能獲得多少賠償金?這也可以繼續(xù)咨詢:
醫(yī)生說(shuō)他還有三個(gè)月才能正常走路,交通事故賠償怎么計(jì)算?
這時(shí),它會(huì)提供一個(gè)賠償計(jì)算器,要求你補(bǔ)充關(guān)于賠償責(zé)任、事故時(shí)間地點(diǎn)、傷者工作收入、傷殘認(rèn)定等詳細(xì)信息,最后給出了一個(gè)事故造成的總損失和賠償金計(jì)算。
如果想靠起訴狀來(lái)拿回這筆賠償金,法行寶還可以幫你寫(xiě)一封起訴狀:
幫我寫(xiě)一封交通事故起訴狀。
和之前一樣,它會(huì)繼續(xù)詢問(wèn)身份、代理人這些詳細(xì)信息,然后幫你生成。我們看到,現(xiàn)在起訴狀寫(xiě)好了,填上事實(shí)細(xì)節(jié)就可以使用。所以,法行寶不僅能像專(zhuān)業(yè)律師一樣給出專(zhuān)業(yè)解答,還能調(diào)用大模型的生成能力,生成起訴狀。
當(dāng)然,如果你還想找真正的名牌律師咨詢更加復(fù)雜的私人問(wèn)題,法行寶還能夠按照不同領(lǐng)域給你推薦知名律師,來(lái)提供進(jìn)一步幫助。
上線半年多以來(lái),法行寶為940萬(wàn)多人提供了高效、可信賴的法律服務(wù),成為了每個(gè)普通人專(zhuān)屬的AI免費(fèi)律師。
目前,文心智能體平臺(tái)上,已經(jīng)吸引了15萬(wàn)家企業(yè)和80多萬(wàn)名開(kāi)發(fā)者參與,覆蓋的應(yīng)用場(chǎng)景非常非常多。
現(xiàn)在大屏上顯示的,就是文心智能體平臺(tái)的TOP100智能體。是我們基于智能體的分發(fā)量、平均對(duì)話輪次、用戶喜愛(ài)度等指標(biāo)綜合遴選出來(lái)的。有角色類(lèi)的,像農(nóng)民院士智能體,有工具類(lèi)、行業(yè)類(lèi)的智能體,更有職場(chǎng)、情感、娛樂(lè)等類(lèi)型的智能體。
百度還邀請(qǐng)英偉達(dá)作為技術(shù)合作伙伴,共同發(fā)起了“文心智能體創(chuàng)新大賽”,大賽涌現(xiàn)出很多有價(jià)值的智能體應(yīng)用。
前面我講了智能體。下面我再講一下大模型的產(chǎn)業(yè)應(yīng)用。
大模型如何在產(chǎn)業(yè)落地?如何為千行百業(yè)的企業(yè)創(chuàng)造增量?jī)r(jià)值?這是我們一直在探索的問(wèn)題。
過(guò)去這一年半左右,我們看到在金融、能源、教育、招聘、公共服務(wù)等各個(gè)領(lǐng)域,大模型跟場(chǎng)景結(jié)合后,在降本和增效兩個(gè)方面都取得了實(shí)實(shí)在在的成果。
百度智能云是我們構(gòu)建智能產(chǎn)業(yè)生態(tài)的主要依托。目前在百度智能云的千帆大模型平臺(tái)上,我們已經(jīng)累計(jì)幫助用戶精調(diào)了3.3萬(wàn)個(gè)大模型,開(kāi)發(fā)出了77萬(wàn)個(gè)企業(yè)級(jí)應(yīng)用,百度智能云已經(jīng)擁有中國(guó)最大的大模型產(chǎn)業(yè)落地規(guī)模,一半以上的央國(guó)企以及很多很多的民營(yíng)企業(yè),都在聯(lián)合百度智能云進(jìn)行AI創(chuàng)新。
我們來(lái)看以下兩個(gè)案例:
一個(gè)是大型企業(yè)的代表——百勝中國(guó)。大家知道這是國(guó)內(nèi)規(guī)模最大的餐飲公司,我們經(jīng)常光顧的肯德基、必勝客,都是百勝旗下品牌。百度和百勝一直有良好合作,最早是在『門(mén)店選址評(píng)估』方面,我們幫助百勝完成了新增數(shù)千家門(mén)店的選址,大幅提升了選址質(zhì)量和效率。在客服領(lǐng)域,我們提供了客服產(chǎn)品和大模型能力,服務(wù)百勝旗下多個(gè)品牌。尤其是解決了原來(lái)的客服機(jī)器人,難以識(shí)別客戶真實(shí)意圖、沒(méi)法關(guān)聯(lián)上下文的問(wèn)題。
目前,我們的客服應(yīng)用和解決方案,已經(jīng)覆蓋了百勝全線業(yè)務(wù),大模型每天調(diào)用量的峰值達(dá)到數(shù)百萬(wàn),客服機(jī)器人的『?jiǎn)栴}解決率』提升到了90%。在大模型時(shí)代,百勝還需要建設(shè)一個(gè)安全可信的大模型服務(wù)專(zhuān)區(qū),來(lái)滿足內(nèi)部各品牌、各業(yè)務(wù)線的AIGC應(yīng)用需求。
因此,我們提供了千帆平臺(tái)、文心Speed模型、基礎(chǔ)云算力服務(wù)等給百勝,構(gòu)建了完善優(yōu)質(zhì)的大模型底座能力,幫助百勝更加便捷地開(kāi)發(fā)和部署AI應(yīng)用。
除此之外,我們正在和百勝一起,把ASR、TTS、大模型和數(shù)字人的技術(shù)結(jié)合起來(lái),共同驗(yàn)證在點(diǎn)餐屏上打造大模型點(diǎn)餐的能力。
未來(lái),我們還將繼續(xù)合作,共同探索企業(yè)數(shù)字化、智能化轉(zhuǎn)型等各種各樣的可能性。
下個(gè)例子是互聯(lián)網(wǎng)行業(yè)的代表。智聯(lián)招聘是國(guó)內(nèi)領(lǐng)先的招聘平臺(tái)。
招聘平臺(tái)最主要的工作就是把合適的人匹配到合適的崗位上。過(guò)去這個(gè)工作大量地依靠人工來(lái)完成,人工地給崗位打標(biāo)簽,人工地去篩選海量的簡(jiǎn)歷,人工地去分析求職者的對(duì)話,不僅費(fèi)時(shí)費(fèi)力,效果也難以保證,經(jīng)常會(huì)有遺漏和錯(cuò)配。
百度和智聯(lián)招聘合作,利用大模型重構(gòu)了這個(gè)核心環(huán)節(jié)。通過(guò)自然語(yǔ)言對(duì)話,結(jié)合崗位的描述,迅速地為求職者和崗位畫(huà)出精準(zhǔn)的匹配畫(huà)像,并且自動(dòng)回答有關(guān)工作時(shí)長(zhǎng)、薪資福利、工作地點(diǎn)這些求職者關(guān)心的問(wèn)題,甚至進(jìn)一步幫助安排面試。既為求職者推薦了合適的職位,也為用人單位精準(zhǔn)篩選出所需的人才,顯著提高了用人單位的招聘效率和質(zhì)量。目前,百度和智聯(lián)招聘合作,已經(jīng)成功沉淀出一系列提示詞模板,并在數(shù)萬(wàn)條實(shí)際數(shù)據(jù)中得到了驗(yàn)證,人崗匹配的平均準(zhǔn)確率高達(dá)93%,而大模型使用的成本卻下降了約90%,為招聘行業(yè)帶來(lái)了全新變革,。
讓每一位求職者都能更輕松地找到心儀工作,讓每一家企業(yè)都能更高效地獲得所需人才。
今天,我在這里發(fā)布基于大模型的100大產(chǎn)業(yè)應(yīng)用,它涵蓋了制造、能源、交通、政務(wù)、金融、汽車(chē)、教育、互聯(lián)網(wǎng)等眾多行業(yè),百度希望與更多合作伙伴和客戶一起推動(dòng)智能產(chǎn)業(yè)生態(tài)的建設(shè),共同來(lái)加速國(guó)家“人工智能+”行動(dòng)計(jì)劃的落地。
發(fā)布這100大產(chǎn)業(yè)應(yīng)用,其實(shí)也代表我們的認(rèn)知和態(tài)度。百度不是要推出一個(gè)“超級(jí)應(yīng)用”,而是要不斷地幫助更多人、更多企業(yè)打造出數(shù)百萬(wàn)“超級(jí)有用”的應(yīng)用。
今天,我們的確有條件讓一行代碼都看不懂的人具備程序員的能力,有讓任何一個(gè)想法都能迅速地、低成本地變?yōu)楝F(xiàn)實(shí)的能力。
當(dāng)然,這需要工具,這個(gè)工具就是我為大家?guī)?lái)的、今天的One More Thing——秒噠!
一個(gè)不需要寫(xiě)代碼就能夠?qū)崿F(xiàn)任意想法的軟件,一個(gè)由大模型和智能體組成的全新的軟件,我認(rèn)為它是“迄今為止人類(lèi)歷史上最復(fù)雜的多智能體協(xié)作工具”,它包括無(wú)代碼編程、多智能體協(xié)作以及規(guī)模化地調(diào)用各種的工具等能力。
注意,秒噠是跟任何輔助代碼生成工具是完全不一樣的,因?yàn)樗静恍枰隳芸炊a,所以看直播的朋友們,如果你是程序員,那你現(xiàn)在可以不看了,這個(gè)軟件是給非程序員來(lái)用的。
我用一個(gè)例子來(lái)給大家展示一下秒噠的能力:
假設(shè)我們要為蘿卜快跑開(kāi)個(gè)新技術(shù)發(fā)布會(huì)。我需要打造一個(gè)活動(dòng)邀請(qǐng)系統(tǒng),把邀請(qǐng)函分享給其他人,并且收集他們的想法和反饋。首先,上傳了一個(gè)有大會(huì)時(shí)間地點(diǎn)主題的文件給秒噠。
我們來(lái)看看,秒噠將如何滿足我這個(gè)需求。接收到指令后,屏幕上出現(xiàn)了0號(hào)智能體,就是小組長(zhǎng)。它是整個(gè)智能體團(tuán)隊(duì)的核心,負(fù)責(zé)規(guī)劃調(diào)度。它將這個(gè)任務(wù)拆解成了需求確定、內(nèi)容生產(chǎn)、工程開(kāi)發(fā)三個(gè)步驟。并且告訴我,它會(huì)召喚各個(gè)智能體來(lái)協(xié)作完成任務(wù)。
首先召喚的是1號(hào)智能體,是策劃智能體,負(fù)責(zé)活動(dòng)邀請(qǐng)函的策劃、設(shè)計(jì)解決方案。那1號(hào)智能體又將這個(gè)任務(wù)拆分成:核心需求、內(nèi)容結(jié)構(gòu)、開(kāi)發(fā)需求、數(shù)據(jù)收集四個(gè)子任務(wù)。
接下來(lái),2號(hào)智能體就被召喚出來(lái)了,即小編智能體,它的主要職責(zé)是編輯邀請(qǐng)函中的所有文字和媒體內(nèi)容。邀請(qǐng)函需要在正文里包含一段發(fā)布展望,這個(gè)智能體通過(guò)全網(wǎng)搜索和總結(jié),寫(xiě)出了一段關(guān)于蘿卜快跑的精彩描述。它自動(dòng)閱讀上傳文件后把時(shí)間地點(diǎn)等核心信息提取出來(lái)放到了合適的位置上。對(duì)于封面圖,我提出新的需求,給智能體幾張?zhí)}卜快跑六代車(chē)的照片,讓它生成一個(gè)充滿科技感的圖片作為邀請(qǐng)函封面。我們看到智能體通過(guò)iRAG的能力,成功繪制出了一張帶有RT6的封面圖。
然后,3號(hào)智能體出場(chǎng),它是程序員智能體,負(fù)責(zé)寫(xiě)代碼,來(lái)制作和部署網(wǎng)頁(yè)。大家看屏幕上,就是智能體在自動(dòng)寫(xiě)代碼,。但你完全不需要看懂這一側(cè)的東西,你只要看得懂那邊人話就行了。
等它寫(xiě)完后,4號(hào)智能體質(zhì)檢員出場(chǎng)了,它發(fā)現(xiàn)了一個(gè)bug,所以把程序員智能體再叫回來(lái),重新寫(xiě)、重新改代碼??梢钥吹?,質(zhì)檢員智能體會(huì)利用反思能力,運(yùn)行測(cè)試代碼,看看代碼是不是跑得通。
現(xiàn)在智能體已經(jīng)把代碼修復(fù)好了,自動(dòng)生成了邀請(qǐng)函,但我覺(jué)得這個(gè)畫(huà)風(fēng)不夠好看,想再換一個(gè)更有科技感的。輸入這個(gè)想法后,程序員智能體會(huì)再寫(xiě)一次代碼,給出一個(gè)新版本,這次換成了一個(gè)更有科技感的色調(diào),有邀請(qǐng)函、會(huì)議日程,最后還附上了參會(huì)報(bào)名的界面,通過(guò)調(diào)用地圖的API,嘉賓就可以一鍵導(dǎo)航到達(dá)會(huì)場(chǎng)。我們輸入個(gè)測(cè)試信息。
最后,可以在后臺(tái)看到,這條報(bào)名信息已經(jīng)在統(tǒng)計(jì)表格中了。
這樣一個(gè)發(fā)布會(huì)的邀請(qǐng)系統(tǒng),從你開(kāi)始到最后結(jié)束,只需要3分鐘,用戶不用寫(xiě)一行代碼,就可以完成。
整個(gè)過(guò)程體現(xiàn)了 整個(gè)過(guò)程體現(xiàn)了秒噠的三個(gè)特性:第一是無(wú)代碼編程、第二是第三是多智能體協(xié)作、多工具調(diào)用。
- 無(wú)代碼編程,是由大模型直接生成代碼,不需要人寫(xiě)一行代碼,所以門(mén)檻就大大降低了,每個(gè)人都可以去做,每個(gè)人都可上手;
- 智能體協(xié)作,是基于文心大模型思考、規(guī)劃等能力,實(shí)現(xiàn)對(duì)不同類(lèi)型智能體的調(diào)度、編排,這個(gè)任務(wù)中一共有5個(gè)智能體協(xié)作完成;
- 多工具的調(diào)用,剛才這個(gè)例子當(dāng)中,調(diào)用三個(gè)工具,一個(gè)是網(wǎng)頁(yè)檢索工具,他要到網(wǎng)上去找RT6各種各樣的資料來(lái)進(jìn)行創(chuàng)作;一個(gè)是iRAG,就是圖片的檢索生成,我們給了RT6圖片之后,可以保持原來(lái)的精準(zhǔn)度,生成相應(yīng)的圖片;還有地圖的API調(diào)用。
有了秒噠,一個(gè)人通過(guò)自然語(yǔ)言交互,就可以完成一整套系統(tǒng)的搭建。
除了上面展示的邀請(qǐng)系統(tǒng),秒噠還可以做任意場(chǎng)景下的各種應(yīng)用,應(yīng)用的復(fù)雜度也會(huì)隨著我們技術(shù)的提升不斷提升。最早開(kāi)始的時(shí)候,它只能做一些比較簡(jiǎn)單的編程,比如說(shuō)兩三百行代碼,以后隨著基礎(chǔ)模型能力提升,以及秒噠本身技術(shù)能力的演進(jìn),它就可以做越來(lái)越多的,越來(lái)越復(fù)雜的事情。
這意味著什么?
這意味著,你不需要去招募項(xiàng)目經(jīng)理、設(shè)計(jì)人員、開(kāi)發(fā)人員、測(cè)試人員等等,自己就可以指揮多個(gè)智能體來(lái)協(xié)同完成任務(wù)。
也就是說(shuō),只要有想法,你就可以心想事成,我們將迎來(lái)一個(gè)前所未有的只靠想法就能賺錢(qián)的時(shí)代。
以前有個(gè)想法,你還要去執(zhí)行,把想法做出來(lái)?,F(xiàn)在只要你有想法,秒噠就可以幫你做了。
我想,AI之所以被稱(chēng)為產(chǎn)業(yè)革命級(jí)的機(jī)會(huì),就是因?yàn)樗鼘?duì)于社會(huì)經(jīng)濟(jì),帶來(lái)了生產(chǎn)力的無(wú)限擴(kuò)張。
秒噠讓每一個(gè)人都能具備程序員的能力,會(huì)說(shuō)話就能做出應(yīng)用來(lái),它對(duì)于人類(lèi)工作效率的提升怎么說(shuō)都不為過(guò)?,F(xiàn)在你就可以去排隊(duì)預(yù)約,我們明年第一季度發(fā)布秒噠,大家就可以試用了。
今天,我們用大約一個(gè)小時(shí)的時(shí)間,回顧了過(guò)去24個(gè)月,全球生成式AI變革帶來(lái)的應(yīng)用大爆發(fā),也發(fā)布了文心iRAG和無(wú)代碼秒噠兩大技術(shù),展示了智能體、產(chǎn)業(yè)應(yīng)用兩大應(yīng)用方向的案例。
可以看出,AI應(yīng)用的時(shí)代是真的來(lái)了!
當(dāng)然,在人類(lèi)信息技術(shù)變革的不同歷史時(shí)期,應(yīng)用出現(xiàn)的的樣貌也不一樣:
在PC時(shí)期,它是一個(gè)個(gè)的軟件和網(wǎng)站;
在移動(dòng)時(shí)期,它是一個(gè)個(gè)的APP和被關(guān)注的賬號(hào);
在AI時(shí)代,應(yīng)用最主要的形態(tài)就是智能體。
隨著大模型技術(shù)和能力的指數(shù)級(jí)躍遷,自然語(yǔ)言成為了這個(gè)時(shí)代最重要的編程語(yǔ)言。我們每一個(gè)人都能動(dòng)手創(chuàng)造一個(gè)屬于自己、也屬于他人的AI應(yīng)用,或者智能體。我是軟件工程師出身,國(guó)外有一種說(shuō)法叫“軟件吞噬世界”。
但我認(rèn)為,這個(gè)世界不應(yīng)該被吞噬,而應(yīng)該被創(chuàng)造。
AI時(shí)代,應(yīng)用創(chuàng)造世界。
所以請(qǐng)大家和我一起見(jiàn)證,AI applications creating the world.
本文由人人都是產(chǎn)品經(jīng)理作者【財(cái)經(jīng)故事薈】,微信公眾號(hào):【財(cái)經(jīng)故事薈】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
李彥宏這次的演講太震撼了,AI時(shí)代的到來(lái),真的是應(yīng)用為王,創(chuàng)新引領(lǐng)未來(lái)?。?/p>