久久久噜噜噜久久天堂,99精品国产一区二区三区2021

搜索

APP

起點(diǎn)課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

千萬別認(rèn)為對話式交互是進(jìn)步！詳解對話式交互的6大缺點(diǎn)。

杜昭

2024-07-22

9 評論 2846 瀏覽 15 收藏

13 分鐘

本文深入探討了對話式交互相較于傳統(tǒng)的圖形用戶界面（GUI）的優(yōu)缺點(diǎn)，揭示了背后的技術(shù)驅(qū)動因素，并分析了在不同場景下的應(yīng)用效果。通過全面比較，我們可以更清晰地理解兩種交互方式的適用性和局限性。

最近兩年很多AI產(chǎn)品出現(xiàn)之后都采用了對話式（Chat）的形式。導(dǎo)致很多人認(rèn)為對話形式（Chat）交互相對于常見的圖形化界面是一種進(jìn)步。事實(shí)并非如此。

這種錯誤認(rèn)知可能因?yàn)榘袮I技術(shù)與對話式交互畫上了等號，在看到AI技術(shù)迅猛發(fā)展的時候。就同樣認(rèn)為對話式更優(yōu)秀。

但這種交互形式被眾多AI產(chǎn)品使用的原因只是因?yàn)檫@一波AI浪潮最大的技術(shù)進(jìn)步是大語言模型。而大語言模型的核心功能之一就是生成內(nèi)容。加上OpenAI最早使用了這種形式被后來者效仿。

在2017年前后上一波AI浪潮中，主要的技術(shù)發(fā)展方向是計算機(jī)視覺，像人臉識別、自動駕駛、OCR等等都是基于計算機(jī)視覺技術(shù)衍生的。

由于其技術(shù)突破方向并非語言方向所以就沒有產(chǎn)生對話式形式，由此我們可以看出：對話式交互只是一個附屬形式并非更優(yōu)秀。

一、對話式交互和圖形化界面相比有哪些缺點(diǎn)

1. 操作效率

GUI的操作過程其實(shí)是眼、手、預(yù)置信息等三方面協(xié)同，眼睛瞄準(zhǔn)、手點(diǎn)擊、預(yù)置信息觸發(fā)對應(yīng)操作，但在Chat形式中幾乎全部依賴手了，所以操作效率下降。

其實(shí)很多圖形化界面的交互形式點(diǎn)擊幾次就能解決的問題使用對話形式可能需要多輪次、多描述才能完成，例如典型的訂外賣場景：

使用圖形化界面是這樣的：

千萬別認(rèn)為對話式交互是進(jìn)步！詳解對話式交互的6大缺點(diǎn)。

對4項(xiàng)不同的設(shè)置，只需要點(diǎn)擊4下就可以了，但如果使用chat的形式可能是這樣的：

系統(tǒng)：你要大杯還是小杯？

用戶：大杯

系統(tǒng)：零卡糖還是蔗糖？

用戶：0卡糖

系統(tǒng)：正常糖量還是半糖？

用戶：正常糖

系統(tǒng)：熱的還是溫的還是冰的？

用戶：熱的

可以看出需要幾輪對話此案完成圖形化界面中4次點(diǎn)擊就能完成的操作，整體效率是很低的，這種形式也是非常真實(shí)的，不通過手機(jī)點(diǎn)單而是在門店直接下單店員真的需要把這些問題都問一遍。

但并非所有場景下Chat形式都比GUI形式低效，例如使用手機(jī)語音助手創(chuàng)建一個日程，可以退直接用語音指令：明天下午3點(diǎn)提醒我搶火車票，而不需要打開某待辦APP-點(diǎn)創(chuàng)建待辦按鈕-輸入待辦各個字段的文字-點(diǎn)擊保存。

所以還是存在一個臨界值，需要從點(diǎn)擊次數(shù)、路徑長度、迷失度、可通訊通道場景等方面綜合衡量。

Chat形式的每一次交互包含了操作+對象+修改內(nèi)容的具體描述，例如在修改代碼時，需要給出指令：增大登錄按鈕的寬度到500PX，需要把GUI交互中修改方式、修改對象、修改數(shù)值等全部使用自然語言描述一遍，因此會降低操作效率。

2. 操作歧義

由于操作過程完全依賴自然語言的描述，因此當(dāng)用戶輸入的文字不準(zhǔn)確、有錯字、多含義時，可能產(chǎn)生錯誤的結(jié)果。對用戶輸入準(zhǔn)確率的保證性較低。

出現(xiàn)錯誤后還需要多加一輪對話進(jìn)行澄清，這又會進(jìn)一步影響操作效率。

例如，如果用戶想要搜索“蘋果的營養(yǎng)價值”，但不小心打成了“萍果..”，AI可能會將“萍果”理解為一個不常見或者不存在的詞匯，從而無法正確提供關(guān)于蘋果的營養(yǎng)信息?；蚴墙o出與用戶期望不符的結(jié)果。

這是因?yàn)椤疤O果”是一個常見詞匯，而“萍果”可能不是，導(dǎo)致AI無法正確理解用戶的查詢意圖。

同樣的，作者真實(shí)的經(jīng)歷是在某電商平臺搜索【蘋果】結(jié)果顯示了一堆手機(jī)，其實(shí)作者本身是想買點(diǎn)紅富士吃吃。對于有多重含義的詞匯使用對話式交互就很容易出現(xiàn)這樣的問題。

當(dāng)然我們可以通過更完整的描述來避免誤解，但輸入更完整的描述本身就是更高的操作成本了。

3. 自我描述能力

GUI形式會把產(chǎn)品的能力直接體現(xiàn)在用戶界面中，如搜索框、時間選擇器、下載等能力，Chat形式最大的問題是手續(xù)愛你需要用戶能想到，這一步就把產(chǎn)品設(shè)計時從要求產(chǎn)品變成了要求用戶，對產(chǎn)品清晰性的影響較大。

在下圖中用戶可以很清晰的知道某篇筆記能導(dǎo)出、且能以多種格式導(dǎo)出，但Chat的形式則需要用戶先想到。

千萬別認(rèn)為對話式交互是進(jìn)步！詳解對話式交互的6大缺點(diǎn)。

4. 用戶習(xí)慣

工具需要細(xì)分，手指甲和腳指甲的剪刀都會細(xì)分，何況是各種大需求，微信里可以打車但滴滴APP的日活還有幾億。

想打破用戶的習(xí)慣需要并非不可以，但一定需要新方案的體驗(yàn)強(qiáng)于舊方案體驗(yàn)+遷移成本。

人類會用自己習(xí)慣的方式解決問題，路徑依賴會影響人類在擁有多工具時的選擇，而GUI在過去的10年已經(jīng)為用戶形成了極強(qiáng)的操作習(xí)慣。

還有一些生活中下意識的習(xí)慣也會有影響，例如兩個對話時，往往不是只只針對唯一話題進(jìn)行多輪次對話，可能是兩三個主題并行的，此時AI在理解時就會比較困難（因?yàn)槌霈F(xiàn)了一句與上下文無關(guān)的話）。

如果是在使用了多個模型/提示詞/agent的產(chǎn)品中，這個問題可能會更加明顯，因?yàn)樵谟脩粼趯υ掃^程中切換話題時是否能馬上切換到其他模型/提示詞/agent來回答無法確定。

5. 能力精細(xì)度

即使模型能力范圍越來越大，但很難想象把所有應(yīng)用集中到一起會是什么樣子，分類是人腦生理結(jié)構(gòu)決定的人處理任務(wù)/信息的方式。工具的ALL in one是個偽命題。

現(xiàn)在大多數(shù)通用Chat，既能寫代碼也能畫表格，但通用的結(jié)果一定是不夠精深，在細(xì)分能力是不夠強(qiáng)大。

還是以畫表格為例，通用Chatbot可以實(shí)現(xiàn)快速把數(shù)據(jù)填充到表格，但不一定能設(shè)置某行固定。更復(fù)雜的科學(xué)計算公式也無法實(shí)現(xiàn)。

以WPS為例，功能豐富到需要使用十幾個標(biāo)簽+每個標(biāo)簽下數(shù)十個子功能來呈現(xiàn)。

千萬別認(rèn)為對話式交互是進(jìn)步！詳解對話式交互的6大缺點(diǎn)。

難以想象使用通用Chatbot如何幫助用戶觸達(dá)這些功能，而這還只是一個WPS中的功能點(diǎn)，所以作者堅定的認(rèn)為工具產(chǎn)品的All in one是個偽命題。追求通用則一定在精細(xì)化能力上會有不足，就像我們設(shè)計師常用的設(shè)計規(guī)范，在追求通用性的同時面對不同業(yè)務(wù)場景的個性化能力就會被削弱。

6. 多語言適配

在面對產(chǎn)品國際化、多語言適配的問題中，圖形化用戶界面只需要把界面中出現(xiàn)的文字做翻譯即可，部分還可以使用圖標(biāo)替代更具通用性。

但大模型的輸入、輸出都使用了大量的文字，那么面對多語言是否能很好的支持是個問題。

對于一些小語種，可能根本沒有足夠用于模型訓(xùn)練的數(shù)據(jù)量，那么模型就更加不可能提供優(yōu)質(zhì)服務(wù)了。

以上是對話式交互的6大缺點(diǎn)。下面再簡單聊聊

二、對話式交互的優(yōu)點(diǎn)

1. 易學(xué)性

對話式交互很直觀，用戶無需學(xué)習(xí)復(fù)雜的界面或命令，可以直接用自己的語言與系統(tǒng)交流。就像功能點(diǎn)非常多產(chǎn)品里面我們經(jīng)常找不到需要的功能在哪里一樣，對話式交互沒有這個問題，因?yàn)椴恍枰趶?fù)雜的界面中尋找。但依然需要用戶已有【這個產(chǎn)品用這個功能】的認(rèn)知。

2. 靈活性

用戶可以通過對話來表達(dá)繁瑣的命令，例如手機(jī)語音助手的一句話創(chuàng)建待辦，但要注意這里所說的【繁瑣的命令】還不是【復(fù)雜的命令】，只能解決多步驟但每一步都比較簡單的問題。

圖形用戶界面中，用戶只能點(diǎn)擊到當(dāng)前顯示出來的元素（如按鈕），操作依賴屏幕可顯示范圍，但對話式交互沒有這個問題，因?yàn)橐呀?jīng)用【描述】代替了屏幕中必須顯示出來的功能。

3. 設(shè)備適應(yīng)性強(qiáng)

對話式交互可以很容易地集成到移動設(shè)備、智能揚(yáng)聲器或其他物聯(lián)網(wǎng)設(shè)備中，只要設(shè)備有麥克風(fēng)、揚(yáng)聲器、處理器即可滿足基本的對話式交互（這里特指語音交互了），減少了屏幕在設(shè)備中的成本。

這方面的實(shí)例已經(jīng)非常多了，就像小米的智能音箱，還有商場中的服務(wù)機(jī)器人。

4. 擴(kuò)展性

可以添加新的功能和服務(wù)，而用戶無需下載更新或?qū)W習(xí)新的交互方式。正式因?yàn)闆]有圖形界面的限制，在增加功能時也不需要考慮界面顯示能力，不需要像GUI時代一樣因?yàn)榭臻g只能擺放有限個入口而爭來爭去了。

但這一點(diǎn)同樣會帶來曝光率的問題，因?yàn)槟芰Φ臄U(kuò)展對用戶來說是隱形的過程，即使使用新版本功能引導(dǎo)也只能被用戶看到一次（其實(shí)大概率一次都看不到就點(diǎn)擊關(guān)閉了）。

而不像GUI那樣有一個固定的位置顯示，經(jīng)常能被用戶看到。

專欄作家

杜昭，微信公眾號：AI與用戶體驗(yàn)，人人都是產(chǎn)品經(jīng)理專欄作者，實(shí)戰(zhàn)派設(shè)計師，目前在某手機(jī)公司負(fù)責(zé)手機(jī)OS交互設(shè)計，所負(fù)責(zé)產(chǎn)品覆蓋用戶數(shù)億，主要研究AI與人機(jī)交互設(shè)計的融合及人因?qū)W對用戶體驗(yàn)的影響。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自 Pixabay，基于 CC0 協(xié)議。

該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

杜昭

某手機(jī)公司交互設(shè)計師，公眾號：AI與用戶體驗(yàn)

38篇作品 352499總閱讀量

醒醒吧，中國 SaaS ！

02-179107 瀏覽

MaaS來臨，SaaS進(jìn)入「奇點(diǎn)」時刻

05-193725 瀏覽

畢業(yè)兩年，工資漲幅80%，晉升高級產(chǎn)品經(jīng)理待遇，我是怎么做到的？

07-026841 瀏覽

【實(shí)戰(zhàn)經(jīng)驗(yàn)分享】競爭激烈，小伙伴是怎么拿到三個offer的？

12-182990 瀏覽

TOB產(chǎn)品經(jīng)理如何規(guī)避項(xiàng)目招投標(biāo)帶來的困擾

12-041114 瀏覽

評論

三琴

寫作不易，頂一下。

最近來自廣東回復(fù)
空谷幽蘭

語音交互算對話交互的一種，而且不同的交互方式也可以組合使用，對于有殘障的人士來說會更有利，說實(shí)話你看問題的方式太片面了，技術(shù)總是向前發(fā)展的，這樣才會有更好的交互方式出現(xiàn)，以后甚至?xí)霈F(xiàn)腦電波交互方式的出現(xiàn)

最近來自美國回復(fù)
1. 杜昭作者回復(fù)空谷幽蘭
  
  拜托你仔細(xì)看看，首先這份內(nèi)容沒討論語音交互，然后也沒說對話形式一定不好，后面有列優(yōu)點(diǎn)。
  
  最近來自重慶回復(fù)
汪仔8099

不贊同，現(xiàn)在只是很多模態(tài)沒有和語言對齊，等把不同模態(tài)的信息都對齊了，就可以實(shí)現(xiàn)說一句話就能下單

最近來自廣東回復(fù)
1. 杜昭作者回復(fù)汪仔8099
  
  不同模態(tài)信息能完全轉(zhuǎn)化很難，比如怎么把語速、音量、重音、停頓等信息分析成不同意圖的文字
  
  最近來自重慶回復(fù)
2. 杜昭作者回復(fù)汪仔8099
  
  一句話下單只是個小場景，VUI的穿透特性是OK的
  
  最近來自重慶回復(fù)
覓初于影

點(diǎn)單適合熟客哈哈，如果客戶邊工作邊跟ai助理說了一句，“燕麥奶茶三分糖少冰大杯”來一杯—-立即下單，是不是也很爽；“老樣子來一杯”–立即下單，是不是也很爽，技術(shù)是慢慢迭代的～也許將來用語音交互后，我們的低頭族就越來越少了，調(diào)用起來的五官有助于我們更豐富的去體驗(yàn)感受精彩的生活，而不是整天??手機(jī)哈哈哈哈～純屬謬論，作者別見怪哈哈～

最近來自中國回復(fù)
1. 杜昭作者回復(fù)覓初于影
  
  那應(yīng)該打開美團(tuán)外賣還是餓了么還是各個咖啡APP？文末說了哦，本文分析的是對話式交互不是語音交互
  
  最近來自重慶回復(fù)
杜昭作者

作者留言：這篇主要是填坑，在上一篇關(guān)于AI搜索產(chǎn)品的萬字長文分析中留的坑，對AI搜索感興趣的朋友可以點(diǎn)我頭像看那篇。

最近來自重慶回復(fù)