“賈維斯”這類智能助手,已經(jīng)看到落地的可能性了

0 評論 3211 瀏覽 11 收藏 20 分鐘

近段時間以來,隨著ChatGPT這類大模型的火熱,引發(fā)了各行各業(yè)的變革,也讓我們不禁設(shè)想是否能夠創(chuàng)造一個“賈維斯”這類智能助手。本文總結(jié)分析了類似產(chǎn)品,探討“賈維斯”這類智能助手的落地可能性。

作為一個普通人,我曾經(jīng)設(shè)想過,如果能有一個類似與鋼鐵俠的智能助力“賈維斯”來幫助自己成為一個全能小助手,那是多么科幻的一個事。

最近半年,隨著ChatGPT這類大模型的火熱,引發(fā)了各行各業(yè)的變革,其中有智能問答類的,文章等宣傳文案生成類的、還有結(jié)合midjourney這類能力的衍生最近半個月則是顯得更加智能化的autoGPT的誕生。讓我覺得想要去打造一個“賈維斯”也是有可能的。

首先我們就想要實(shí)現(xiàn)這個目標(biāo),進(jìn)行一下需求與功能模塊的拆分,以我目前的理解,可以拆分為【ChatGPT】+【數(shù)字人】+【PRA】來實(shí)現(xiàn)。

接下來細(xì)說一下這3塊分別具備什么能力以及主要實(shí)現(xiàn)的功能作用:首先就【ChatGPT】、【數(shù)字人】、【PRA】進(jìn)行一下基礎(chǔ)的科普:

1. ChatGPT (Generative Pre-trained Transformer)

能用像模像樣的“人話”來回答幾乎任何領(lǐng)域的用戶問題,并對上下文有一定程度的理解。ChatGPT不僅會聊天,還可以幫助人類寫代碼、修復(fù)bug、寫工作周報、寫小說、進(jìn)行考試答題、繪畫、看病以及大幅度提高搜索效率和體驗(yàn)等。

強(qiáng)大的優(yōu)勢:

  • 它已經(jīng)經(jīng)過數(shù)百萬句子的預(yù)訓(xùn)練,并且在多項自然語言處理任務(wù)中取得了最先進(jìn)的結(jié)果。它能夠流暢地產(chǎn)生自然語言響應(yīng),有效地響應(yīng)用戶的疑問和請求。
  • 多個處理單元同時工作來處理多個用戶請求,可以在短時間內(nèi)處理大量的請求,為用戶提供快速而高效的響應(yīng)。
  • 是基于預(yù)訓(xùn)練的模型,并使用大量的數(shù)據(jù)進(jìn)行訓(xùn)練,因此其學(xué)習(xí)到的知識是通用的,可以適用于不同的業(yè)務(wù)場景。此外,還進(jìn)行了嚴(yán)格的指標(biāo)監(jiān)測和數(shù)據(jù)收集,以確保ChatGPT提供一致且可重復(fù)的響應(yīng)質(zhì)量。

2. 數(shù)字人

是一種使用計算機(jī)生成的圖像、聲音和方法來模擬人類交互的系統(tǒng)。

其特點(diǎn)和優(yōu)勢如下:

  • 逼真的表現(xiàn)力:虛擬數(shù)字人采用高級計算機(jī)圖形學(xué)技術(shù),其外觀和聲音都可以被設(shè)計得與真實(shí)人類非常相似。虛擬數(shù)字人能夠模擬真實(shí)人類情感,語言和動作,無論是在視聽上還是在交互上,都能產(chǎn)生高度逼真的效果。
  • 可定制性強(qiáng):由于使用計算機(jī)生成的系統(tǒng),虛擬數(shù)字人可以在控制臺上輕松進(jìn)行定制和編輯,包括其外觀、聲音、交互方式和應(yīng)用場景等。因此,用戶可以為其特定的應(yīng)用領(lǐng)域和客戶而定制虛擬數(shù)字人方案,從而提高交互的效率和滿足需求的多樣性。
  • 成本低廉:與雇用真實(shí)人類的費(fèi)用相比,虛擬數(shù)字人的成本更低廉,而且它們可以在全天候和全年范圍內(nèi)運(yùn)行,不受固定的時間和地點(diǎn)限制,從而為企業(yè)節(jié)省了大量的成本,并且能夠提供更高效的客戶服務(wù)。
  • 擴(kuò)展性:通過設(shè)計和定制虛擬數(shù)字人的語義和交互方式,可以擴(kuò)展虛擬數(shù)字人的功能和應(yīng)用領(lǐng)域。例如,虛擬數(shù)字人可以作為客戶服務(wù),智能家居,娛樂等領(lǐng)域的智能助手,實(shí)現(xiàn)與人類的高效互動和交流。
  • 支持多語言和跨文化交互:虛擬數(shù)字人的聲音可以通過技術(shù)手段實(shí)現(xiàn)多語種,并且設(shè)計技術(shù)也能考慮到文化差異。這使得虛擬數(shù)字人能夠成為全球商業(yè)和社交交互中的全球級參與者。

3. PRA-機(jī)器人流程自動化(Robotic process automation)

以軟件機(jī)器人及人工智能(AI)為基礎(chǔ)的業(yè)務(wù)過程自動化應(yīng)用程序,通過模仿最終用戶在電腦的手動操作方式,提供了另一種方式來使最終用戶手動操作流程自動化。

使符合某些適用性標(biāo)準(zhǔn)的基于桌面的業(yè)務(wù)流程和工作流程實(shí)現(xiàn)自動化,自動化工具(如屏幕抓取工具、Excel宏、業(yè)務(wù)流程自動化管理等),一般來說這些操作在很大程度上是重復(fù)的,數(shù)量比較多的,并且可以通過嚴(yán)格的規(guī)則和結(jié)果來定義。

一、類似【智能助手】產(chǎn)品設(shè)計舉例

初步設(shè)想的業(yè)務(wù)邏輯如下:

以【給XX郵箱或者手機(jī)號碼發(fā)送內(nèi)容】為例(如下為業(yè)務(wù)流程說明):

  1. 用戶可以通過語音或者文本輸入一些問題或指令;
  2. 這些內(nèi)容會被發(fā)送到chatgpt服務(wù)API中獲取答案;
  3. 在獲取答案之后,答案文本會被調(diào)用TTS服務(wù)的能力進(jìn)行語音合成;
  4. 數(shù)字人會獲取到TTS合成的文本內(nèi)容,并在客戶端進(jìn)行語音播報;
  5. 然后TTS會將相關(guān)指令通過RPA同步給郵件服務(wù)/短信服務(wù);
  6. RPA收到指令后會按照指令去做相應(yīng)的操作,并將結(jié)果返回給客戶端;
  7. 客戶端獲取操作結(jié)果后,將結(jié)果轉(zhuǎn)化為文本輸出給TTS;
  8. TTS同步給數(shù)字人;
  9. 在客戶端進(jìn)行語音播報告知用戶結(jié)果;

目前網(wǎng)上已經(jīng)有相關(guān)同學(xué)做了一個視頻,初步可以看出其效果,如下:

1)對接語音輸入模塊,支持語音輸入與文本輸入:

2)基于chatgpt進(jìn)行回復(fù)

3)發(fā)起業(yè)務(wù)同步,相關(guān)發(fā)送到手機(jī)端:

4)完成業(yè)務(wù)需求的交互

看到這,是不是發(fā)現(xiàn)其實(shí)想要實(shí)現(xiàn)搭建一個“賈維斯”好像已經(jīng)是可以觸摸到的了。

二、基于以上的運(yùn)用思路,再發(fā)散一下

以PRA多對接一些應(yīng)用的情況下,或者對接一些專有的NLP等其他應(yīng)用,在很多實(shí)現(xiàn)落地方面是不是可以有更多的想象空間:

1. 針對個人用戶的助理類產(chǎn)品

可以根據(jù)用戶需求和習(xí)慣,提供更為智能、個性化與專業(yè)的服務(wù)。 借助一系列的高效工具,能夠幫助人們更好地管理自己的生活并且讓生活變得更加美好和方便。

私人超級管家:

目前很多家庭的家電等設(shè)備都是智能化的,那么就可以通過語音交互幫助用戶完成很多基礎(chǔ)的事務(wù),例如調(diào)節(jié)房間溫度、打開窗戶、查找信息,或者發(fā)起一次語音通話等。

舉個具象一點(diǎn)的例子:比如在夏天時,室外氣溫很高,當(dāng)你工作了一天準(zhǔn)備下班回家,這個時候,他就出現(xiàn)在手機(jī)上來咨詢你,是否需要幫你提前開啟汽車的空調(diào),并調(diào)整到多少的車內(nèi)溫度,在開車回家前,基于是否在外面進(jìn)行吃飯以及是否有其他行程安排,規(guī)劃好最合適的路線,并在車內(nèi)設(shè)定好導(dǎo)航。另外,在解答一些疑問和提供如搜索特定內(nèi)容、聽取音樂、收聽新聞等,也能是一個合格的智能管家。

通過最初的系統(tǒng)設(shè)定,以及對用戶的日常行為進(jìn)行分析和學(xué)習(xí),能自動幫服務(wù)對象規(guī)劃日程,包括會議安排、旅行計劃等等,并提醒用戶收看日程變更等此類服務(wù)。

文案專員到視頻剪輯再到生成視頻:

基于ChatGPT本身文案生成的能力,在確定完內(nèi)容的核心主題后,先生成文案的核心框架,再通過框架的提綱,生成框架下的集體內(nèi)容,不僅可以直接從無到有,也可以是在一定內(nèi)容的基礎(chǔ)上在進(jìn)行潤色有優(yōu)化。在通過指令的形式,將生成好的文案直接導(dǎo)入到類似剪映此類可以通過文案直接生成視頻的軟件中,從而實(shí)現(xiàn)從大綱-文章輸出-視頻制作-發(fā)布自動化流水線的快速生成。

當(dāng)然,按照目前當(dāng)前的生成文案也好,需要基于很好的角色設(shè)定、基礎(chǔ)內(nèi)容輸入,ChatGPT類才會有高質(zhì)量的產(chǎn)出。另外自動生成的視頻也需要二次加工才能真正做到一個看起來比較連貫并且能表達(dá)清楚基本思路的一個視頻。

數(shù)據(jù)分析專家:

全天候的待機(jī)與支持情況下,幫助用戶更方便地分析相關(guān)的數(shù)據(jù)和統(tǒng)計,比如家庭財務(wù)預(yù)算、運(yùn)動指標(biāo)計算、睡眠監(jiān)測等。以幫助用戶制定家庭財務(wù)預(yù)算舉例:

首先,可以為用戶提供一個移動應(yīng)用程序,讓他們輸入他們的日常開銷和收入,例如購物、房租、電話賬單和工資。在這種情況下,再根據(jù)這些數(shù)據(jù)執(zhí)行以下操作:

  1. 通過自學(xué)習(xí)的算法對數(shù)據(jù)進(jìn)行分類和處理,例如自動識別不同種類的支出和收入,同時去除重復(fù)或無效的數(shù)據(jù)。
  2. 針對用戶家庭預(yù)算的需要,自動分析該用戶的數(shù)據(jù),例如分析每個月的開銷、品類占比,以及列出預(yù)算中的可支配收入。
  3. 幫助用戶識別一些有利的模式,例如指出某些支出的比例過高,或者某些開銷具有明顯的周期性變化,并作為指標(biāo)項進(jìn)行標(biāo)記。
  4. 如果需要更好的視覺顯示效果,也可以通過數(shù)據(jù)可視化工具,將數(shù)據(jù)呈現(xiàn)出來,例如把收入和支出用圖表或餅狀圖呈現(xiàn),讓用戶容易看懂。
  5. 最后在基于以上的收支情況,進(jìn)而制定出更合理和靈活的財務(wù)預(yù)算計劃以及建議。

將人工智能系統(tǒng)應(yīng)用于金融行業(yè),可以幫助企業(yè)和個體投資者更精準(zhǔn)的進(jìn)行投資與風(fēng)險控制、監(jiān)測市場走勢,提高相關(guān)業(yè)務(wù)線的效率以及為客戶提供更便捷的服務(wù)。

風(fēng)控方面:

假設(shè)有一個銀行正在使用類似chatgpt這類大模型來提高其風(fēng)險管理能力??梢詮亩鄠€數(shù)據(jù)源中收集信息,例如客戶開戶信息、信用評估數(shù)據(jù)、交易歷史記錄、市場數(shù)據(jù)等。再可以對這些數(shù)據(jù)進(jìn)行分析,并根據(jù)自身的算法自主處理和提取重要信息。

在風(fēng)險管理方面,就可以幫助銀行完成以下任務(wù):

  • 評估潛在風(fēng)險:可以快速分析和處理大量數(shù)據(jù),以識別和評估潛在的風(fēng)險,例如個人或企業(yè)的財務(wù)困境,交易異?;蛐庞每ㄆ墼p等。這將使銀行更快地發(fā)現(xiàn),并通過適當(dāng)?shù)拇胧┓乐够蚪鉀Q潛在的風(fēng)險問題。
  • 自動化決策:可以根據(jù)預(yù)設(shè)規(guī)則和算法自動化地做出決策,例如自動拒絕不良信用記錄的客戶,或者自動限制某些類型的交易。這樣銀行客服即使在非工作時間也可以自動地解決問題,提高了客戶服務(wù)效率。
  • 非線性建模:在風(fēng)險管理中非常有用,因?yàn)樗鼈兛梢岳梅蔷€性建模方法,更好地應(yīng)對復(fù)雜和不確定的領(lǐng)域。例如,新興的業(yè)務(wù)或市場領(lǐng)域,因?yàn)樾畔⒉蛔慊蜃兓焖?,可以使用大模型來進(jìn)行非線性建模以預(yù)測未來趨勢。

財富助手方面:

市場上原本存在的許多金融產(chǎn)品,包含股票債券的定價和交易受制于信息不對稱的情況,基于此,【ChatGPT】+【數(shù)字人】+【PRA】等APGC能力,可以幫助財富顧問實(shí)現(xiàn)更高效、更準(zhǔn)確地提供專業(yè)服務(wù),提出更好的投資計劃或優(yōu)化方案,以及更好地監(jiān)測市場趨勢和潛在風(fēng)險。

舉個例子:

  • 量身定制方案:可以針對每位客戶的獨(dú)特需求、背景和風(fēng)險承受能力,創(chuàng)建個性化的投資組合方案。在考慮客戶收入、年齡、婚姻狀況、風(fēng)險投資偏好等因素后,大模型可以自動創(chuàng)建出投資方案,以確保客戶收益最大化。
  • 動態(tài)優(yōu)化:可以通過數(shù)據(jù)分析來識別市場機(jī)會和潛在風(fēng)險,對客戶的投資組合進(jìn)行動態(tài)優(yōu)化調(diào)整,分析大量的市場數(shù)據(jù)并預(yù)測未來市場動向, 讓投資者能更好地制定投資策略和風(fēng)險控制策略。實(shí)時監(jiān)控國際貨幣、利率等經(jīng)濟(jì)數(shù)據(jù),對企業(yè)財務(wù)、投資組合等進(jìn)行跟蹤和監(jiān)測并給出實(shí)時提示和預(yù)警,從而幫助企業(yè)決策者及時調(diào)整策略。例如,如果市場出現(xiàn)某些風(fēng)險,可以及時調(diào)整該客戶的股票組合并增加投資基金和貨幣市場基金的分配。
  • 高效交易:可以利用機(jī)器學(xué)習(xí)和自然語言處理技術(shù)來預(yù)測市場趨勢和交易機(jī)會,根據(jù)收集到的數(shù)據(jù)預(yù)測行情,以便幫助財富顧問更快速地做出決策。例如,大型模型可以分析歷史數(shù)據(jù)、市場新聞或公司報告,并預(yù)測某些股票的未來表現(xiàn),財富顧問可以據(jù)此來做出決策。
  • 風(fēng)險控制:可以通過持續(xù)的風(fēng)險管理來控制客戶的風(fēng)險水平。通過跟蹤客戶投資組合中的資產(chǎn)分配、固定收益證券、股票與股票總市值之比、持倉期限以及其他指標(biāo)等,模型可以確定潛在風(fēng)險并提出建議,以便財富顧問與客戶共同控制風(fēng)險。

智能客服:

如同上文中,類似【智能助手】產(chǎn)品,銀行行業(yè)可以提供24小時全天候智能服務(wù),基于已有的NLP或者知識庫效用,對金融知識的專業(yè)講解、基礎(chǔ)客戶服務(wù)、理財產(chǎn)品的智能推薦回復(fù)等,可以實(shí)現(xiàn)步驟流程的規(guī)范化以及標(biāo)準(zhǔn)哈。

  1. 自動化問題解答:可以利用自然語言處理和機(jī)器學(xué)習(xí)技術(shù)來學(xué)習(xí)客戶請求的語言以及常見的問題,它們通過分析大量的數(shù)據(jù)來識別常見問題的關(guān)鍵字、句式等,訓(xùn)練出智能客服機(jī)器人來自動解答客戶的問題,減少需要人工干預(yù)的量,提高客戶服務(wù)的效率。
  2. 提供超預(yù)期體驗(yàn):智能客服機(jī)器人可以利用大型模型技術(shù),自學(xué)習(xí)人類學(xué)習(xí)到的經(jīng)驗(yàn),并將在相近情境下所學(xué)到的知識應(yīng)用于更復(fù)雜的情況。例如,客戶詢問交易信息,大型模型可以幫助智能客服機(jī)器人了解該客戶的交易和需求信息,提高客戶體驗(yàn)。
  3. 利用數(shù)據(jù)優(yōu)化服務(wù):可以利用自己分析大量數(shù)據(jù)的能力,從客戶歷史數(shù)據(jù)中發(fā)現(xiàn)不同級別的服務(wù)需求。例如,如果客戶詢問較基礎(chǔ)的問題,那么智能客服機(jī)器人可以通過自學(xué)習(xí)來為客戶提供更細(xì)致的答案,而非僅僅給出基礎(chǔ)的答案。
  4. 數(shù)字人的形象可以以更加生動的形象吸引客戶的注意,同時也可以利用顏色和音樂等元素,呈現(xiàn)出更加詳細(xì)、更有說服力的解釋,幫助客戶更好地理解一些復(fù)雜的金融概念和標(biāo)準(zhǔn)。

結(jié)語

以上是本人對于數(shù)字人+大模型+RPA集合后運(yùn)用的一些想法與思路分享。

如有不合理或不正確的,歡迎指正~

本文由 @毅鳴 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于 CC0 協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!