AI真的能理解人的情緒嗎?這家剛?cè)谫Y5000萬(wàn)美金的公司嘗試給出答案!
如果 AI 能理解和處理人類情感會(huì)發(fā)生什么?這一主題是科幻作品中的??停热纭躲y翼殺手》和《她》等。如何讓 AI 兼具情感和智能,也是 AI 領(lǐng)域內(nèi)的熱門(mén)話題。近期,一家初創(chuàng)公司 Hume AI 推出了可以理解人類情感的語(yǔ)言大模型。
Sense 思考:
我們嘗試基于文章內(nèi)容,提出更多發(fā)散性的推演和深思,歡迎交流。
- Hume AI 的 EVI 產(chǎn)品展示了情感計(jì)算領(lǐng)域的新方向,其創(chuàng)始人推出的語(yǔ)義空間理論為 EVI 提供了堅(jiān)實(shí)的理論基礎(chǔ)。使得大模型不僅能夠理解用戶的情緒,還能在對(duì)話中以類似人類的方式做出反應(yīng),這一點(diǎn)可能會(huì)徹底改變?nèi)藱C(jī)互動(dòng)模式。
- 盡管 Hume AI 的使命是“優(yōu)化 AI 以提高人類的幸福感”,但引入情感智能到 AI 中也可能帶來(lái)很多人對(duì)社會(huì)和倫理問(wèn)題的思考。機(jī)器能夠理解和模仿人類情感的范圍有多大?人們是否會(huì)開(kāi)始更多地依賴與 AI 的情感互動(dòng),從而影響人際關(guān)系?
AI Native 產(chǎn)品分析——Hume AI
1. 產(chǎn)品上線時(shí)間:2024 年 3 月
2. 創(chuàng)始人:Alan Cowen
- 前 Google 研究員和科學(xué)家,Google AI 情感計(jì)算研究團(tuán)隊(duì)創(chuàng)始成員之一,語(yǔ)義空間理論提出者
- 語(yǔ)義空間理論:基于數(shù)學(xué)的情感理論,將情感視為復(fù)雜、多維空間的維度
3. 產(chǎn)品簡(jiǎn)介:
Hume AI 推出了 EVI(Empathic Voice Interface)共情語(yǔ)音接口,搭載了強(qiáng)大的語(yǔ)言模型技術(shù),可以對(duì)文本、音頻和視頻進(jìn)行情感分析,旨在將情感理解融入聊天機(jī)器人的互動(dòng)中。
4.官網(wǎng):https://www.hume.ai/
產(chǎn)品體驗(yàn):https://demo.hume.ai/
飛速發(fā)展的人工智能時(shí)代,我們見(jiàn)證了 AI 在客戶服務(wù)、自動(dòng)駕駛、醫(yī)療、企業(yè)服務(wù)等領(lǐng)域的廣泛應(yīng)用。除了應(yīng)用 AI 的智能,讓 AI 可以理解和處理人類情感這一復(fù)雜挑戰(zhàn)也讓眾多科學(xué)家和創(chuàng)業(yè)者投入其中。
近期,一家名為 Hume AI 的初創(chuàng)公司推出共情語(yǔ)音接口 EVI(Empathic Voice Interface),可以讓開(kāi)發(fā)人員通過(guò)幾行代碼將情感智能人工智能語(yǔ)音集成到各類應(yīng)用場(chǎng)景。與此同時(shí),Hume AI 完成了 5000 萬(wàn)美金的 B 輪融資。投資方包括 EQT Ventures、 Comcast Ventures、LG Technology Ventures 等知名投資機(jī)構(gòu)。
一、讓 AI 表達(dá)更像人類的 EVI
EVI 代表 Empathic Voice Interface(共情語(yǔ)音界面),與其他主要通過(guò)文本形式進(jìn)行交互的多模態(tài)大模型不同,EVI 的特殊點(diǎn)在于能夠通過(guò)傾聽(tīng)人們的聲音了解他們的感受,同時(shí)使用符合這一感受的話語(yǔ)進(jìn)行回應(yīng)。
為了讓與 AI 的語(yǔ)音交流更加自然,業(yè)內(nèi)正致力于加入能表達(dá)情感或自然停頓的語(yǔ)句。OpenAI 通過(guò) ChatGPT-Voice 實(shí)現(xiàn)了這一點(diǎn)。而像 Figure 01 機(jī)器人甚至偶爾會(huì)說(shuō)“嗯”和“呃”。
Hume AI 的目標(biāo)是實(shí)現(xiàn)真實(shí)情感的整合,使機(jī)器人能夠感知并以一種反映或?qū)箤?duì)話中人類情緒的方式來(lái)回應(yīng)。EVI 能夠理解用戶的語(yǔ)調(diào),這為每一個(gè)詞匯增添了更深的含義,并利用這一點(diǎn)來(lái)指導(dǎo)其語(yǔ)言和發(fā)音。
EVI 擁有若干獨(dú)特的共情功能:
- 基于用戶的表情用類似人類的語(yǔ)調(diào)進(jìn)行回應(yīng)
- 用符合用戶需求的語(yǔ)言來(lái)增加滿意度
- EVI 知道何時(shí)說(shuō)話,可以判斷用戶合適結(jié)束對(duì)話
- 在被打斷時(shí)會(huì)停止,但能從中斷處繼續(xù)
- 通過(guò)應(yīng)用用戶的反應(yīng)來(lái)自我改進(jìn)
EVI 不僅是一款產(chǎn)品,還提供了 API 便于其他應(yīng)用程序的集成,并能與任何大型語(yǔ)言模型(LLM)無(wú)縫對(duì)接。
為了展示其 API 的能力,Hume 官方推出一款體驗(yàn)應(yīng)用,可以通過(guò)用戶的聲音分辨現(xiàn)在的情緒狀態(tài),并搭配相應(yīng)的歌曲。
二、能聽(tīng)懂人類情緒的大語(yǔ)言模型
傳統(tǒng) AI 系統(tǒng)更多關(guān)注語(yǔ)言層面的理解,但 Hume AI 的 CEO 兼首席科學(xué)家 Alan Cowen 指出人類的情感很大程度上是通過(guò)聲音、面部表情等非語(yǔ)言方式表達(dá)的。這一領(lǐng)域被稱為”情感計(jì)算”,在生成式 AI 模型應(yīng)用當(dāng)中相對(duì)落后。
為填補(bǔ)這一空白,Hume 開(kāi)發(fā)了一種新型多模態(tài)生成式人工智能 eLLM(移情大語(yǔ)言模型),它將先進(jìn)的自然語(yǔ)言處理技術(shù)與情感識(shí)別算法集成在一起。通過(guò)理解語(yǔ)音、面部表情等,模型能夠?qū)W習(xí)分辨何種表現(xiàn)意味著快樂(lè)、沮喪、困惑等情緒,并做出相應(yīng)響應(yīng)。
因此 eLLM 能夠檢測(cè)和解釋人類語(yǔ)言數(shù)據(jù)中的情感線索,使人工智能系統(tǒng)能夠生成句法和語(yǔ)義上一致,并且在情感上與用戶輸入相協(xié)調(diào)的響應(yīng)。
通過(guò)利用情感分析模塊、情感識(shí)別算法和情境理解機(jī)制,eLLM 使 AI 技術(shù)能夠讓用戶參與更具同理心和響應(yīng)性的對(duì)話。這種功能增強(qiáng)了人機(jī)交互,促進(jìn)更深層次的參與和融洽關(guān)系。
模型從大量真實(shí)數(shù)據(jù)中學(xué)習(xí),包括全球數(shù)百萬(wàn)人的語(yǔ)音和表情數(shù)據(jù)。因此這一模型不僅會(huì)學(xué)習(xí)情感的平均模式,還會(huì)捕捉個(gè)體和文化差異。當(dāng)然,對(duì)于不同語(yǔ)言和文化背景,Hume AI 需要對(duì)模型進(jìn)行微調(diào)或重新訓(xùn)練。有些語(yǔ)言的理解差異會(huì)更大。因此,該技術(shù)目前僅支持英語(yǔ)。
三、與 EVI 交談是一種怎樣的體驗(yàn)
科技媒體的報(bào)道和社交網(wǎng)絡(luò)上首批用戶的反饋,都表現(xiàn)出對(duì) EVI 的情感感知和回應(yīng)能力的贊嘆。
AI 媒體編輯 Ryan Morrison 表示:“與 EVI 對(duì)話,既不同尋常又引人入勝。它并不模仿人類,而是坦誠(chéng)地表明自己是人工智能。然而,它對(duì)情感的敏銳理解力卻讓人著迷?!痹谝淮螌?duì)話中,Rayn 詢問(wèn)它能否判斷自己是否吃過(guò)早餐,EVI 回應(yīng)道這個(gè)語(yǔ)調(diào)“顯得饑餓且堅(jiān)定”,因此判斷 Rayn 可能沒(méi)吃早餐,而且它判斷得完全正確。
筆者在體驗(yàn)了 EVI 的 demo 后感知到它跟其他 AI 語(yǔ)音模型的差異。首先是語(yǔ)調(diào)和發(fā)音上并沒(méi)有極大的機(jī)械感,而且連貫性和語(yǔ)氣方面表現(xiàn)的非常好,而這種感覺(jué)伴隨著交流的頻次增加更加的明顯,甚至不太能分辨其 AI 的真實(shí)身份。
一般用戶將其他的 AI 應(yīng)用當(dāng)做工具或者助手來(lái)使用,更多應(yīng)用到 AI 理性和智能的一面。或許在 EVI 上,確實(shí)可以體驗(yàn)到情緒和感性的一方面。就像 Alan 描述的 AI 助手作為”朋友”的愿景,它能夠理解并回應(yīng)人類的情感需求。
四、為什么 AI 需要情感
Hume AI 公司的核心使命是“優(yōu)化 AI 以提高人類的幸福感,而情感則是構(gòu)成幸福感的重要部分?!?/p>
想讓 AI 更好地服務(wù)于提升人類福祉或使人機(jī)交互更加自然,讓 AI 擁有共情能力是關(guān)鍵。當(dāng)前的 AI 助手只理解語(yǔ)義內(nèi)容,而忽視了語(yǔ)音語(yǔ)氣和情感這些同樣重要的因素,導(dǎo)致交互體驗(yàn)生硬和不自然。賦予 AI 情感理解能力,能讓人機(jī)交互更自然、富有溫度。
Alan 表示現(xiàn)有 AI 系統(tǒng)最大的限制是它們受限于人類的淺層評(píng)價(jià)和指導(dǎo),未能充分挖掘 AI 創(chuàng)造幸福新方式的潛力。因此 Hume 團(tuán)隊(duì)開(kāi)發(fā)的 AI 模型基于人類幸福感的直接數(shù)據(jù)學(xué)習(xí),這些數(shù)據(jù)與驅(qū)動(dòng)多模態(tài) AI 模型的標(biāo)準(zhǔn)數(shù)據(jù)集一同作為訓(xùn)練材料。
Hume AI 的技術(shù)目前已經(jīng)應(yīng)用于培訓(xùn)心理治療師、改善客戶服務(wù)等領(lǐng)域。通過(guò)分析語(yǔ)音和面部表情,系統(tǒng)能更好地理解患者或客戶的情緒狀態(tài),從而提供更精準(zhǔn)的服務(wù)。
目前,已經(jīng)有很多不同背景的用戶,嘗試借助 EVI 來(lái)開(kāi)發(fā)自己的應(yīng)用。Hume AI 社區(qū)的活躍用戶除了開(kāi)發(fā)者和工程師、設(shè)計(jì)師和產(chǎn)品經(jīng)理以及研究人員之外,還包括了很多教育培訓(xùn)、醫(yī)療健康領(lǐng)域人士和藝術(shù)家與創(chuàng)意工作者。每個(gè)人都帶著自己獨(dú)特的視角和需求,希望通過(guò) Hume AI 的相關(guān)技術(shù)來(lái)推動(dòng)自己領(lǐng)域的進(jìn)步。
他們正在或想要開(kāi)發(fā)的應(yīng)用涵蓋了健康與福祉、社交通訊、教育學(xué)習(xí)工具、情感分析、多模態(tài)內(nèi)容生成等不同領(lǐng)域。其中大多都應(yīng)用到了 EVI 的情感智能這一特點(diǎn)。例如讓用戶能更加真誠(chéng)連接的在線社交應(yīng)用,分析用戶自信水平和提高其狀態(tài)的應(yīng)用,通過(guò)增強(qiáng)語(yǔ)音體驗(yàn)幫助老年人的 AI 助理,根據(jù)用戶的情緒狀態(tài)調(diào)整健康程序的女性健康應(yīng)用等等。
(Hume AI 社區(qū)成員開(kāi)發(fā)的產(chǎn)品)
當(dāng) AI 擁有了情感智能,融合了理性和感性兩方面的能力,或許可以讓 AI 真正接近人類智能的高度。讓它們更貼近人性,為人類生活帶來(lái)全新體驗(yàn)。
參考材料:
https://www.tomsguide.com/ai/i-had-a-conversation-with-evi-the-new-empathic-ai-voicebot-from-hume
https://www.youtube.com/watch?v=uR-z-Ypio-M
https://twitter.com/hume_ai/status/1773017060173365306
編譯:Wes
來(lái)源公眾號(hào):深思SenseAI;關(guān)注全球 AI 前沿,走進(jìn)科技創(chuàng)業(yè)公司,提供產(chǎn)業(yè)多維深思。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @深思SenseAI 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!