零基礎(chǔ)5分鐘搭建一個(gè)私有知識(shí)的AI機(jī)器人,接入微信、抖音和飛書(shū)
現(xiàn)在,許多企業(yè)都開(kāi)始借助AI技術(shù)來(lái)提高自己的生產(chǎn)效率,那么在了解了AI的強(qiáng)大之后,我們是否有可能搭建一個(gè)專(zhuān)屬于自己的AI機(jī)器人呢?這篇文章里,作者便嘗試教你零基礎(chǔ)學(xué)會(huì)搭建,一起來(lái)看看吧。
AI 這么強(qiáng),你或者你的公司一定想有一個(gè)專(zhuān)屬的機(jī)器人。
就是那種問(wèn)它問(wèn)題,它回答像 ChatGPT 一樣流暢,但回答的內(nèi)容是關(guān)于你或者公司的業(yè)務(wù)介紹。
但是看了一些資料后,都被里面那個(gè)“向量[1]知識(shí)庫(kù)”給勸退了。
這篇文章,只會(huì)提三次“向量[2]”(最后一次在文末)。
我們先講一下原理:怎么讓 AI 機(jī)器人回答問(wèn)題的時(shí)候,回復(fù)跟你自己/你公司相關(guān)的信息。
當(dāng)你正常問(wèn) ChatGPT 問(wèn)題時(shí),它是這么干活的:
你:張佳是誰(shuí)?
ChatGPT OS:(把你的問(wèn)題拆開(kāi),“張佳”“是誰(shuí)”)—>(理解到你想問(wèn)一個(gè)名字叫“張佳”的人)—>(在大模型里匹配查找關(guān)于“張佳”的信息)—>(沒(méi)找到“張佳”)—>(決定糊弄一下)
ChatGPT:很抱歉,根據(jù)我的知識(shí)截止日期(2021年9月),我無(wú)法提供有關(guān)”張佳”的具體信息,因?yàn)檫@個(gè)名字可能屬于普通的中國(guó)姓名,涵蓋了許多不同的個(gè)體。如果你能提供更多上下文或信息,我將盡力提供更準(zhǔn)確的答案。
但是如果你這樣問(wèn) ChatGPT:
你:張佳是誰(shuí)?請(qǐng)根據(jù)以下信息,整理成通俗易懂的介紹,告訴我:張佳,咨詢(xún)顧問(wèn),句子互動(dòng) CMO&解決方案專(zhuān)家,TOP1 醫(yī)療健康MCN運(yùn)營(yíng)VP,新榜高級(jí)咨詢(xún)顧問(wèn),專(zhuān)欄作家,《短視頻內(nèi)容算法》作者。在私域、流量、運(yùn)營(yíng)、數(shù)據(jù)和產(chǎn)品方面有豐富的經(jīng)驗(yàn),深諳商業(yè)邏輯,可以為個(gè)人和企業(yè)提供非常棒的解決方案和 idea。持續(xù)關(guān)注最新趨勢(shì)、最新玩法,希望每個(gè)人都能先進(jìn)。
ChatGPT OS:(拆解問(wèn)題:給了個(gè)提問(wèn),給了參考答案,讓我根據(jù)參考答案整理一個(gè)個(gè)人介紹)—>(這是個(gè)文本編輯題)—>(說(shuō)點(diǎn)好聽(tīng)的給他)
ChatGPT:張佳是一位……他在……他擅長(zhǎng)……總之,……。
看出第二次提問(wèn)和第一次提問(wèn)的區(qū)別了么?
這就是打造個(gè)人/企業(yè)專(zhuān)屬知識(shí) ChatGPT 的精髓所在。
你會(huì)問(wèn)了:我怎么讓用戶(hù)提問(wèn)問(wèn)題的時(shí)候帶著你說(shuō)的那些資料?。?/p>
想要打造一個(gè)專(zhuān)屬對(duì)話(huà)機(jī)器人,我們需要先“劫持”一個(gè)機(jī)器人,也就是在用戶(hù)問(wèn)它問(wèn)題之后,它帶著問(wèn)題去問(wèn)大模型之前,在傳輸?shù)男畔⑸蟿?dòng)點(diǎn)手腳。
我畫(huà)了一個(gè)圖,你大概就理解了:
所以,想要打造一個(gè)私有/企業(yè)專(zhuān)屬的 ChatGPT,你應(yīng)該有一些可以加到用戶(hù)問(wèn)題后面作為參考資料的知識(shí)庫(kù)。
這個(gè)知識(shí)庫(kù)可以是一些個(gè)人、公司、產(chǎn)品的介紹文檔,也可以是一些 QA 問(wèn)題庫(kù),或者你的客服應(yīng)答用戶(hù)的聊天記錄。
接下來(lái),你需要把這些知識(shí)資料拆成一段一段的,盡量保證是「一個(gè)問(wèn)題+一段答案」,或者一段一段的「概念描述或介紹」性的文字。
因?yàn)槲覀冎溃珹I 的對(duì)話(huà)都是有字?jǐn)?shù)限制的,太多了 AI 處理不了或者容易整不明白,并且我們調(diào)用人家的大模型,是按照字?jǐn)?shù)收費(fèi)的。(如果你以前不知道,現(xiàn)在已經(jīng)知道了)
所以每次發(fā)給大模型的文字盡量少一點(diǎn),拆完了大概是這樣的:
然后我們只需要再解決一個(gè)問(wèn)題:用戶(hù)發(fā)過(guò)來(lái)的問(wèn)題,我們識(shí)別出來(lái)以后,在拆好的一段段文字中找到最相關(guān)的,加到用戶(hù)的問(wèn)題后面發(fā)給大模型就好了。
原理搞明白了吧?
摩拳擦掌,開(kāi)搞!
這里推薦一個(gè)已經(jīng)相對(duì)成熟、應(yīng)用范圍比較廣的國(guó)產(chǎn)“玩具”
大概花 5 分鐘就能拍桌子大呼:“我自己真牛逼”。
網(wǎng)址在這里:https://chato.cn
注冊(cè)完進(jìn)去以后就會(huì)讓你創(chuàng)建個(gè)機(jī)器人,選 AI 創(chuàng)建。
相信我,AI 創(chuàng)建的比你自己琢磨的要牛逼。
把角色名起,寫(xiě)一下希望這個(gè)機(jī)器人完成的事,簡(jiǎn)單一倆關(guān)鍵詞就好了,剩下的等 AI 給你輸出。
創(chuàng)建完以后,其他的先不用管,直接進(jìn)入知識(shí)庫(kù)。
這里支持兩種方式:?jiǎn)柎鹗胶臀臋n式。
「錄入問(wèn)答」這種機(jī)械性的工作咱不干,直接選文檔式。
文檔式有三種選擇:第一種是你有現(xiàn)成的文檔,支持 N 多文檔格式(連epub都有,擺明了讓你上傳電子書(shū));第二種是輸入文檔,手打編輯復(fù)制粘貼這樣,上限 10 萬(wàn)字。前兩種你上傳完成以后系統(tǒng)自己給你分段,你決定不了啥,只能隨緣(Chato 的 PM 看到以后加個(gè)班)。第三種就“硬核”一點(diǎn)了,直接粘貼網(wǎng)址,它直接幫你采集(違法抓你不抓他們)。
我這里把白皮書(shū)里《如何使用企業(yè)微信添加客戶(hù)為好友》的一篇文檔上傳到知識(shí)庫(kù)了。
然后等著機(jī)器人來(lái)學(xué)習(xí),說(shuō)是 5-10 分鐘,如果字?jǐn)?shù)不多一兩分鐘就完事。點(diǎn)擊上面的聊天演示就可以測(cè)試一下 AI 的能力了。
問(wèn)了一個(gè)“知識(shí)庫(kù)”里有答案的問(wèn)題,AI 的回答基本上就是一個(gè)“抄”。
測(cè)試差不多,現(xiàn)在可以把我們的私有機(jī)器人拉出去溜溜了。
之所以給大家用這個(gè)玩具來(lái)展示,是因?yàn)樗梢越尤氲狡渌恢梅浅1憬荨D憧梢园阉度氲侥悻F(xiàn)成的網(wǎng)頁(yè)里,比如官網(wǎng);可以接入到企業(yè)微信賬號(hào)上,拉到你們的企業(yè)微信群中;也可以嵌入進(jìn)公眾號(hào)、飛書(shū)機(jī)器人、微信客服和抖音私信!
基本都是手把手配置,復(fù)制粘貼一些 ID 和密鑰就可以直接用的狀態(tài)。
我來(lái)展示兩個(gè):
比如我有一個(gè)官網(wǎng),它長(zhǎng)下面的樣子:
我想在官網(wǎng)里接入這個(gè)機(jī)器人,只需要把他們提供的代碼,復(fù)制粘貼到我的官網(wǎng)代碼里即可(給大家看源代碼了,證明它不是 PS 的)。
比如我想讓這個(gè)機(jī)器人在我們公司群里協(xié)助回答一些問(wèn)題,可以按照后臺(tái)的指引文檔,配置一個(gè)機(jī)器人應(yīng)用(也是手把手的,我就不一步一步教了)。
把飛書(shū)機(jī)器人拉進(jìn)群里,可以@它問(wèn)問(wèn)題。
回答也是完全按照知識(shí)庫(kù)資料來(lái)的,只是順序變了一些。
其他類(lèi)似企微客服接入、公眾號(hào)接入,也都是一步一步手把手教程文檔。(這里其實(shí)可以夸一下 Chato 的產(chǎn)品團(tuán)隊(duì),寫(xiě)的教程很好)
另外,如果你感興趣的話(huà),可以在 Chato 后臺(tái)的規(guī)則里配置各種模型、索引量(就是從你的知識(shí)庫(kù)里找?guī)锥沃R(shí)放在用戶(hù)問(wèn)題后面給大模型)、角色的設(shè)定(也是預(yù)設(shè)提示詞的一部分,讓角色更聽(tīng)話(huà)的)、默認(rèn)的關(guān)鍵詞回復(fù),比如加上一個(gè)聯(lián)系客服的二維碼。
這些自己探索吧,都是“增值”內(nèi)容了。
最后,還有一個(gè)關(guān)鍵信息。
類(lèi)似搭建企業(yè)專(zhuān)屬 ChatGPT 這樣的信息,是我《AI+私域提效行動(dòng)營(yíng)》的一部分。如果你想使用 AI 發(fā)揮更大的價(jià)值,把 AI 實(shí)實(shí)在在的用到你的工作中,提高工作的效率,請(qǐng)務(wù)必報(bào)名。
第一期已經(jīng)收獲了學(xué)員的巨多好評(píng)(我還沒(méi)來(lái)得及截圖,但我從不吹牛)。
第二期正式開(kāi)始招募,同樣采用 21 天直播+練習(xí)+答疑的模式,手把手教你把 AI 用起來(lái),讓具體的工作被提效!
還記得我們?cè)谖恼麻_(kāi)始的時(shí)候說(shuō)要再提一次“向量[3]”么?
現(xiàn)在說(shuō)一下:
因?yàn)镚PT 大模型支持的字符數(shù)是有限的;
為了盡最大可能的節(jié)省 token 的消耗,所以很多技術(shù)同學(xué)會(huì)把拆開(kāi)的一段一段知識(shí)庫(kù)文字,通過(guò) OpenAI 提供的 embedding 接口,轉(zhuǎn)化成跟大模型的參數(shù)存儲(chǔ)形式一樣的格式,也就是本文承諾只提三次的那個(gè)詞,這樣也更適合大模型去匹配自己的知識(shí)能力。
但如果你不差錢(qián),就不需要學(xué)習(xí)這些腦仁疼的技術(shù)。
23年4月成立的公司,不得不說(shuō)效率可以,但我還是對(duì)企業(yè)沒(méi)有信任度 ,暫時(shí)不敢玩的太深入
再研究一下這家公司背后的百姓網(wǎng)呢~
世事滄桑