零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

3 評(píng)論 10864 瀏覽 53 收藏 13 分鐘

現(xiàn)在,許多企業(yè)都開(kāi)始借助AI技術(shù)來(lái)提高自己的生產(chǎn)效率,那么在了解了AI的強(qiáng)大之后,我們是否有可能搭建一個(gè)專(zhuān)屬于自己的AI機(jī)器人呢?這篇文章里,作者便嘗試教你零基礎(chǔ)學(xué)會(huì)搭建,一起來(lái)看看吧。

AI 這么強(qiáng),你或者你的公司一定想有一個(gè)專(zhuān)屬的機(jī)器人。

就是那種問(wèn)它問(wèn)題,它回答像 ChatGPT 一樣流暢,但回答的內(nèi)容是關(guān)于你或者公司的業(yè)務(wù)介紹。

但是看了一些資料后,都被里面那個(gè)“向量[1]知識(shí)庫(kù)”給勸退了。

這篇文章,只會(huì)提三次“向量[2]”(最后一次在文末)。

我們先講一下原理:怎么讓 AI 機(jī)器人回答問(wèn)題的時(shí)候,回復(fù)跟你自己/你公司相關(guān)的信息。

當(dāng)你正常問(wèn) ChatGPT 問(wèn)題時(shí),它是這么干活的:

你:張佳是誰(shuí)?

ChatGPT OS:(把你的問(wèn)題拆開(kāi),“張佳”“是誰(shuí)”)—>(理解到你想問(wèn)一個(gè)名字叫“張佳”的人)—>(在大模型里匹配查找關(guān)于“張佳”的信息)—>(沒(méi)找到“張佳”)—>(決定糊弄一下)

ChatGPT:很抱歉,根據(jù)我的知識(shí)截止日期(2021年9月),我無(wú)法提供有關(guān)”張佳”的具體信息,因?yàn)檫@個(gè)名字可能屬于普通的中國(guó)姓名,涵蓋了許多不同的個(gè)體。如果你能提供更多上下文或信息,我將盡力提供更準(zhǔn)確的答案。

但是如果你這樣問(wèn) ChatGPT:

你:張佳是誰(shuí)?請(qǐng)根據(jù)以下信息,整理成通俗易懂的介紹,告訴我:張佳,咨詢(xún)顧問(wèn),句子互動(dòng) CMO&解決方案專(zhuān)家,TOP1 醫(yī)療健康MCN運(yùn)營(yíng)VP,新榜高級(jí)咨詢(xún)顧問(wèn),專(zhuān)欄作家,《短視頻內(nèi)容算法》作者。在私域、流量、運(yùn)營(yíng)、數(shù)據(jù)和產(chǎn)品方面有豐富的經(jīng)驗(yàn),深諳商業(yè)邏輯,可以為個(gè)人和企業(yè)提供非常棒的解決方案和 idea。持續(xù)關(guān)注最新趨勢(shì)、最新玩法,希望每個(gè)人都能先進(jìn)。

ChatGPT OS:(拆解問(wèn)題:給了個(gè)提問(wèn),給了參考答案,讓我根據(jù)參考答案整理一個(gè)個(gè)人介紹)—>(這是個(gè)文本編輯題)—>(說(shuō)點(diǎn)好聽(tīng)的給他)

ChatGPT:張佳是一位……他在……他擅長(zhǎng)……總之,……。

看出第二次提問(wèn)和第一次提問(wèn)的區(qū)別了么?

這就是打造個(gè)人/企業(yè)專(zhuān)屬知識(shí) ChatGPT 的精髓所在。

你會(huì)問(wèn)了:我怎么讓用戶(hù)提問(wèn)問(wèn)題的時(shí)候帶著你說(shuō)的那些資料?。?/p>

想要打造一個(gè)專(zhuān)屬對(duì)話(huà)機(jī)器人,我們需要先“劫持”一個(gè)機(jī)器人,也就是在用戶(hù)問(wèn)它問(wèn)題之后,它帶著問(wèn)題去問(wèn)大模型之前,在傳輸?shù)男畔⑸蟿?dòng)點(diǎn)手腳。

我畫(huà)了一個(gè)圖,你大概就理解了:

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

所以,想要打造一個(gè)私有/企業(yè)專(zhuān)屬的 ChatGPT,你應(yīng)該有一些可以加到用戶(hù)問(wèn)題后面作為參考資料的知識(shí)庫(kù)。

這個(gè)知識(shí)庫(kù)可以是一些個(gè)人、公司、產(chǎn)品的介紹文檔,也可以是一些 QA 問(wèn)題庫(kù),或者你的客服應(yīng)答用戶(hù)的聊天記錄。

接下來(lái),你需要把這些知識(shí)資料拆成一段一段的,盡量保證是「一個(gè)問(wèn)題+一段答案」,或者一段一段的「概念描述或介紹」性的文字。

因?yàn)槲覀冎溃珹I 的對(duì)話(huà)都是有字?jǐn)?shù)限制的,太多了 AI 處理不了或者容易整不明白,并且我們調(diào)用人家的大模型,是按照字?jǐn)?shù)收費(fèi)的。(如果你以前不知道,現(xiàn)在已經(jīng)知道了)

所以每次發(fā)給大模型的文字盡量少一點(diǎn),拆完了大概是這樣的:

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

然后我們只需要再解決一個(gè)問(wèn)題:用戶(hù)發(fā)過(guò)來(lái)的問(wèn)題,我們識(shí)別出來(lái)以后,在拆好的一段段文字中找到最相關(guān)的,加到用戶(hù)的問(wèn)題后面發(fā)給大模型就好了。

原理搞明白了吧?

摩拳擦掌,開(kāi)搞!

這里推薦一個(gè)已經(jīng)相對(duì)成熟、應(yīng)用范圍比較廣的國(guó)產(chǎn)“玩具”

大概花 5 分鐘就能拍桌子大呼:“我自己真牛逼”。

網(wǎng)址在這里:https://chato.cn

注冊(cè)完進(jìn)去以后就會(huì)讓你創(chuàng)建個(gè)機(jī)器人,選 AI 創(chuàng)建。

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

相信我,AI 創(chuàng)建的比你自己琢磨的要牛逼。

把角色名起,寫(xiě)一下希望這個(gè)機(jī)器人完成的事,簡(jiǎn)單一倆關(guān)鍵詞就好了,剩下的等 AI 給你輸出。

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

創(chuàng)建完以后,其他的先不用管,直接進(jìn)入知識(shí)庫(kù)。

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

這里支持兩種方式:?jiǎn)柎鹗胶臀臋n式。

「錄入問(wèn)答」這種機(jī)械性的工作咱不干,直接選文檔式。

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

文檔式有三種選擇:第一種是你有現(xiàn)成的文檔,支持 N 多文檔格式(連epub都有,擺明了讓你上傳電子書(shū));第二種是輸入文檔,手打編輯復(fù)制粘貼這樣,上限 10 萬(wàn)字。前兩種你上傳完成以后系統(tǒng)自己給你分段,你決定不了啥,只能隨緣(Chato 的 PM 看到以后加個(gè)班)。第三種就“硬核”一點(diǎn)了,直接粘貼網(wǎng)址,它直接幫你采集(違法抓你不抓他們)。

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

我這里把白皮書(shū)里《如何使用企業(yè)微信添加客戶(hù)為好友》的一篇文檔上傳到知識(shí)庫(kù)了。

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

然后等著機(jī)器人來(lái)學(xué)習(xí),說(shuō)是 5-10 分鐘,如果字?jǐn)?shù)不多一兩分鐘就完事。點(diǎn)擊上面的聊天演示就可以測(cè)試一下 AI 的能力了。

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

問(wèn)了一個(gè)“知識(shí)庫(kù)”里有答案的問(wèn)題,AI 的回答基本上就是一個(gè)“抄”。

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

測(cè)試差不多,現(xiàn)在可以把我們的私有機(jī)器人拉出去溜溜了。

之所以給大家用這個(gè)玩具來(lái)展示,是因?yàn)樗梢越尤氲狡渌恢梅浅1憬荨D憧梢园阉度氲侥悻F(xiàn)成的網(wǎng)頁(yè)里,比如官網(wǎng);可以接入到企業(yè)微信賬號(hào)上,拉到你們的企業(yè)微信群中;也可以嵌入進(jìn)公眾號(hào)、飛書(shū)機(jī)器人、微信客服和抖音私信!

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

基本都是手把手配置,復(fù)制粘貼一些 ID 和密鑰就可以直接用的狀態(tài)。

我來(lái)展示兩個(gè):

比如我有一個(gè)官網(wǎng),它長(zhǎng)下面的樣子:

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

我想在官網(wǎng)里接入這個(gè)機(jī)器人,只需要把他們提供的代碼,復(fù)制粘貼到我的官網(wǎng)代碼里即可(給大家看源代碼了,證明它不是 PS 的)。

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

比如我想讓這個(gè)機(jī)器人在我們公司群里協(xié)助回答一些問(wèn)題,可以按照后臺(tái)的指引文檔,配置一個(gè)機(jī)器人應(yīng)用(也是手把手的,我就不一步一步教了)。

把飛書(shū)機(jī)器人拉進(jìn)群里,可以@它問(wèn)問(wèn)題。

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

回答也是完全按照知識(shí)庫(kù)資料來(lái)的,只是順序變了一些。

其他類(lèi)似企微客服接入、公眾號(hào)接入,也都是一步一步手把手教程文檔。(這里其實(shí)可以夸一下 Chato 的產(chǎn)品團(tuán)隊(duì),寫(xiě)的教程很好)

另外,如果你感興趣的話(huà),可以在 Chato 后臺(tái)的規(guī)則里配置各種模型、索引量(就是從你的知識(shí)庫(kù)里找?guī)锥沃R(shí)放在用戶(hù)問(wèn)題后面給大模型)、角色的設(shè)定(也是預(yù)設(shè)提示詞的一部分,讓角色更聽(tīng)話(huà)的)、默認(rèn)的關(guān)鍵詞回復(fù),比如加上一個(gè)聯(lián)系客服的二維碼。

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

這些自己探索吧,都是“增值”內(nèi)容了。

最后,還有一個(gè)關(guān)鍵信息。

類(lèi)似搭建企業(yè)專(zhuān)屬 ChatGPT 這樣的信息,是我《AI+私域提效行動(dòng)營(yíng)》的一部分。如果你想使用 AI 發(fā)揮更大的價(jià)值,把 AI 實(shí)實(shí)在在的用到你的工作中,提高工作的效率,請(qǐng)務(wù)必報(bào)名。

第一期已經(jīng)收獲了學(xué)員的巨多好評(píng)(我還沒(méi)來(lái)得及截圖,但我從不吹牛)。

第二期正式開(kāi)始招募,同樣采用 21 天直播+練習(xí)+答疑的模式,手把手教你把 AI 用起來(lái),讓具體的工作被提效!

零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)

還記得我們?cè)谖恼麻_(kāi)始的時(shí)候說(shuō)要再提一次“向量[3]”么?

現(xiàn)在說(shuō)一下:

因?yàn)镚PT 大模型支持的字符數(shù)是有限的;

為了盡最大可能的節(jié)省 token 的消耗,所以很多技術(shù)同學(xué)會(huì)把拆開(kāi)的一段一段知識(shí)庫(kù)文字,通過(guò) OpenAI 提供的 embedding 接口,轉(zhuǎn)化成跟大模型的參數(shù)存儲(chǔ)形式一樣的格式,也就是本文承諾只提三次的那個(gè)詞,這樣也更適合大模型去匹配自己的知識(shí)能力。

但如果你不差錢(qián),就不需要學(xué)習(xí)這些腦仁疼的技術(shù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 23年4月成立的公司,不得不說(shuō)效率可以,但我還是對(duì)企業(yè)沒(méi)有信任度 ,暫時(shí)不敢玩的太深入

    來(lái)自陜西 回復(fù)
    1. 再研究一下這家公司背后的百姓網(wǎng)呢~

      來(lái)自北京 回復(fù)
  2. 世事滄桑

    來(lái)自北京 回復(fù)