AI 產(chǎn)品的五種交互模式

2 評論 5241 瀏覽 41 收藏 15 分鐘

本文深入分析了五種主要的AI交互模式,探討了它們?nèi)绾嗡茉煳磥淼膽?yīng)用開發(fā)和用戶體驗。通過具體實例,我們將了解AI如何在不同場景下發(fā)揮作用,并預(yù)見其對未來軟件生態(tài)的影響。

一、歷史

回顧計算機(jī)交互的演變歷程,經(jīng)歷了批處理—命令行式交互—圖形界面交互,AI 的出現(xiàn)帶來了自然語言交互,基于人類的意圖完成輸出。

早期的批處理系統(tǒng)古樸且笨拙,交互依靠的是穿孔卡片——一種編碼數(shù)據(jù)和指令的媒介。用戶將一系列任務(wù)預(yù)先編碼到這些卡片上,然后將它們交給數(shù)據(jù)中心。這里的計算機(jī)巨大如房間,它們不斷地讀取這些卡片,執(zhí)行上面的命令。

需要排隊等待一夜才能知道程序是否完成運行。即便如此,也能幫助科學(xué)家和工程師們執(zhí)行復(fù)雜的計算任務(wù),如天氣預(yù)報的模擬、工程問題的數(shù)值分析,甚至是太空探索任務(wù)的軌道計算。

現(xiàn)在,在需要處理大規(guī)模數(shù)據(jù)集,如日志分析、金融交易記錄或大量的用戶行為數(shù)據(jù)時,批處理仍然是一個有效的方法。

后來,分時系統(tǒng)的出現(xiàn),讓 CPU 可分配使用,提高了利用率,計算機(jī)可以根據(jù)命令對用戶的每一個輸入給出反饋。這種基于命令的交互,讓用戶可以控制計算機(jī)來執(zhí)行任務(wù),逐步解決問題。

但仍需要學(xué)習(xí)大量的指令,體驗并不友好,不過至少讓人感覺在和機(jī)器建立連接。

至今, Linux、Mac、windows 系統(tǒng)中的命令行仍然存在,是程序員們與計算機(jī)底層交互的常見方式。

AI 產(chǎn)品的五種交互模式

GUI 的出現(xiàn)徹底改變了規(guī)則,計算機(jī)不再只是枯燥的命令行,而是充滿了窗口、圖標(biāo)和鼠標(biāo)點擊的界面。這種所見即所得的革新,讓 word 、Excel 這樣的效率工具出現(xiàn),完全革命了人們的辦公方式,瀏覽器出現(xiàn),則成為了互聯(lián)網(wǎng)的開端。

等智能手機(jī)普及后,GUI不再局限于笨重的桌面電腦。現(xiàn)在,一個小小的觸屏設(shè)備就能完成從購物到預(yù)定機(jī)票,從社交到遠(yuǎn)程工作的各種任務(wù)。

當(dāng)AI驅(qū)動的界面開始融入我們的生活,我們又站在了另一個交互革命的前沿,AI該如何改變軟件,又怎樣影響人們的生活。

二、基于意圖的交互

現(xiàn)在只要你有問題,AI就能給你答案。

想要一幅太空宇航員的畫作?不必親自動手,AI可以根據(jù)你的描述生成幾個選項供你選擇。讓我們的交流更直接,更本質(zhì),不再是命令和代碼,而是愿望和創(chuàng)意的直接表達(dá)。

當(dāng)移動互聯(lián)網(wǎng)出現(xiàn)時,有人說所有的應(yīng)用都值得用 APP 再做一遍,事實也確實如此。

那么所有的產(chǎn)品都值得用 AI 做一遍嗎?如果是的話,該怎么做呢?

先來看看大模型廠商的答案:

OpenAI 作為生成式 AI 的破局者,提供面向C端的 ChatGPT 對話助手,和面向開發(fā)者的模型 API 調(diào)用,前者通過每月20美元的訂閱模式,占到了總營收34 億美元的 80%。

移動互聯(lián)網(wǎng)時代有 APP,瀏覽器有插件,微信有小程序,它們都是依托于一個平臺生態(tài)衍生出全新的軟件交互和商業(yè)模式。

一個平臺級的產(chǎn)品,必然擁有有良好的生態(tài),用戶因為找到合適的應(yīng)用而付費、開發(fā)者因為有用戶使用而入局、平臺因為有持續(xù)增長而不斷改善,機(jī)構(gòu)、企業(yè)、組織陸續(xù)加入,廣告、娛樂、購物統(tǒng)統(tǒng)改變。

OpenAI 也看到了這條路,并且也在這么做。

OpenAI 在去年先后推出了 GPT 插件,和GPTs,通過封裝知識庫和 Prompt 可以定制對話機(jī)器人,這樣就能把 AI 的能力應(yīng)用在垂直領(lǐng)域的。

解決更多用戶問題,奧特曼也說通過傭金分成方式吸引開發(fā)者,從而建立起平臺的生態(tài)。

在推出之際,就被行業(yè)內(nèi)認(rèn)為可以顛覆 PC、移動端操作系統(tǒng)。

現(xiàn)在一年過去,國內(nèi)的大模型廠商也在推出類似GPTs 的功能——被大家稱作 Agent 智能體。豆包、文心一言和 GPT 一樣,允許用戶創(chuàng)作Agent 并發(fā)布到廣場。Kimi 就比較保守了,只是官方推出不允許用戶創(chuàng)作。

不管怎么做,Agent 是有它的應(yīng)用場景在的,不用每次都去輸 Prompt 了,用戶進(jìn)入平臺也能快速找到適用于自己的 Agent,但是它難以撼動操作系統(tǒng),也難以成為平臺級產(chǎn)品。

不論是用戶創(chuàng)建的 Agent 還是官方推出 Agent,活躍度和創(chuàng)建數(shù)都在下降,用戶用不起來,開發(fā)者也不愿意進(jìn)來,平臺在嚴(yán)格選擇 Agent 的展示。

我們大可以想象未來 OpenAI 能夠打造一個平臺級產(chǎn)品,完全顛覆軟件的交互和商業(yè)模式。

但目前來看,有苗頭卻看不到前景,因為傳統(tǒng)應(yīng)用的生命力太旺盛,而且他們也在融入 AI 的能力。

這些應(yīng)用運行在windows、MacOS 、安卓和IOS,網(wǎng)頁以及瀏覽器插件等。要么是傳統(tǒng)應(yīng)用+AI,要么是依托于AI而生的應(yīng)用。

下面我就通過例子,來說明下 AI 在應(yīng)用中的五種交互:

  1. 輔助回答型:集成在應(yīng)用中的AI,能夠根據(jù)用戶的直接輸入提供即時幫助和信息,如回答問題或提供具體操作的指導(dǎo)。
  2. 主任務(wù)驅(qū)動型:AI直接融入應(yīng)用的核心功能,通過用戶的常規(guī)操作觸發(fā),幫助優(yōu)化和執(zhí)行主要的業(yè)務(wù)或工作任務(wù)。
  3. 自動生成型:AI根據(jù)由其他任務(wù)觸發(fā)而接收給定的輸入自動生成內(nèi)容,如給文章自動總結(jié)、打標(biāo)簽。
  4. 隱藏型:AI隱秘地工作,用戶通常意識不到其存在,自動執(zhí)行背后的優(yōu)化和功能增強(qiáng),如推薦系統(tǒng)或內(nèi)容過濾。
  5. 工作流自動化:AI被集成到低代碼工作流中,自動化處理輸入和輸出

AI 產(chǎn)品的五種交互模式

1. 輔助回答型

在主應(yīng)用界面,通過右側(cè)面板或者彈窗內(nèi)置一個對話框 ,在想用的時候就喚起,這種簡單有效的方式是大部分應(yīng)用采用的做法。

比如,現(xiàn)在使用微軟Office或Google Docs處理文檔時,遇到了表達(dá)或語法的困難。這時候,AI輔助回答框就是一個隨時待命的助手,你可以隨時向它提問或請求幫助。它能即時為你提供寫作建議,還能幫你糾正錯誤。

好處在于你幾乎感覺不到它的存在。缺點就是每次都要復(fù)制內(nèi)容,思考問題才能完成輸入,這和在網(wǎng)頁端使用GPT有什么區(qū)別的,看似融入AI,如果模型能力不夠垂直或強(qiáng)大,這樣的融合意義不大。AI 產(chǎn)品的五種交互模式

2. 主任務(wù)驅(qū)動型

我一直認(rèn)為Notion的做法非常的巧妙,23年初就已經(jīng)融入AI, 成為了文檔類產(chǎn)品的交互設(shè)計的典范,當(dāng)你在創(chuàng)作的過程中,在Notion的page里編輯你的bolok ,給AI 輸入的內(nèi)容可以是你現(xiàn)在所寫的東西,AI輸出的答案也會呈現(xiàn)也在當(dāng)前的page中。

它很好的處理了AI打斷任務(wù)的影響,我會為這樣的便利而付費,即使模型的輸出能力比不上GPT4。

AI 產(chǎn)品的五種交互模式

它的優(yōu)勢就是體驗更加流暢,但它也會增加系統(tǒng)的復(fù)雜性,如果集成一個生成質(zhì)量或性能的模型,這樣做無疑帶來很大風(fēng)險。

3. 自動生成型

通過我們在使用軟件過程中的任務(wù),自動觸發(fā)AI的能力,不同于主任務(wù)驅(qū)動型,自動生成不需要用戶輸入問題或指令,它能夠根據(jù)用戶當(dāng)前的任務(wù)觸發(fā)AI的使用,自動生成內(nèi)容。

比如:Arc瀏覽器中,當(dāng)用戶創(chuàng)建新的瀏覽器標(biāo)簽時,AI自動分析頁面內(nèi)容并生成相關(guān)描述性強(qiáng)的標(biāo)簽名稱,幫助用戶更容易識別和管理開啟的多個標(biāo)簽頁。

再比如:Notion的database中,用戶可以定義一個表頭字段為AI生成類型,如標(biāo)簽(AI ),那么在創(chuàng)建一條記錄時,這個標(biāo)簽會根據(jù)主內(nèi)容自動生成。

這種結(jié)合方式,我想象不到什么缺點,很多場景都有待使用這種方式改善,比如文件夾、筆記的命名管理。
AI 產(chǎn)品的五種交互模式

4. 隱藏式

AI 的能力早已隱藏在我們使用的數(shù)碼產(chǎn)品中,以至于我們感受不到它的存在,在使用手機(jī)拍照的時候,手機(jī)識別不同的景色、光線來優(yōu)化照片的拍攝效果,在相冊搜索關(guān)鍵詞,比如貓,就能搜到所有和貓相關(guān)的照片;Siri 會根據(jù)你的日常查詢和命令優(yōu)化其響應(yīng)。這些背后都是算法的能力。

當(dāng)然,今天提到的GenAI也有很多隱藏式的,iOS最新的Apple Inteligence,CEO 蒂姆庫克強(qiáng)調(diào)蘋果的AI助手在設(shè)計上對于用戶來說更加“自然”,不張揚但又無處不在。例如在文本輔助生成環(huán)節(jié),Apple Intelligence建議回復(fù)的內(nèi)容文本直接呈現(xiàn)在輸入法內(nèi)部;在歸納總結(jié)文檔時,交互按鍵也很好的被設(shè)計并且集成在界面的側(cè)邊位置。
AI 產(chǎn)品的五種交互模式

5. 工作流自動化

如果你手頭上有成堆的進(jìn)度報告和計劃調(diào)整需求。通常這種情況下,你可能需要花費大量時間在手動分析和整理數(shù)據(jù)上,但有了AI,你就可以把數(shù)據(jù)發(fā)給它做總結(jié)分析。

不過這樣,還不夠理想,假如你想指定某一行去分析,并且將分析結(jié)果寫入表格,GPT就不可能實現(xiàn)了,必須要借助工具去搭建一個工作流,這樣你不僅可以在任務(wù)中自動使用AI的能力,還能批量去處理相同的任務(wù)。

這本質(zhì)上是低代碼工具+AI,大模型廠商都在售賣自家的模型API,通過API接入到低代碼工作流中。

低代碼比如蘋果的快捷指令,Dify、n8n、zaiper、集簡云等等,通過拖放界面設(shè)計工作流,集成大模型的API后,AI在背后幫助自動化數(shù)據(jù)處理和決策邏輯。
AI 產(chǎn)品的五種交互模式

這種交互方式不同于Agent,它具備更高的靈活性,和更強(qiáng)的能力,感興趣的可以動手實踐。

今天了解這些多少能幫你在使用 AI 產(chǎn)品時有個方法論,目前的交互再怎么花哨也逃不出這幾種。最后再來給這五種交互方式做一個簡單的總結(jié):
AI 產(chǎn)品的五種交互模式

移動互聯(lián)網(wǎng)發(fā)展依托于手機(jī)這一硬件,經(jīng)歷了工具產(chǎn)品,娛樂社交產(chǎn)品,購物生活產(chǎn)品,最后到 ToB 產(chǎn)品的演變,AI 和那個時代已經(jīng)不同,沒有成熟的硬件,技術(shù)棧也不同。

但相同的的是,都是在早期出現(xiàn)大量的工具產(chǎn)品,因為工具產(chǎn)品場景足夠明確。

未來,娛樂類,社交類,購物類如何發(fā)展,我們拭目以待。

本文由 @Zephyr 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 總結(jié)的很到位

    來自江蘇 回復(fù)
  2. womomoojkkkllghaowuq

    來自甘肅 回復(fù)