產(chǎn)品經(jīng)理的胡言亂語:寫在AI帶來的交互模式變革前夜
在科技的迅速發(fā)展下,我們的交互模式、甚至未來的信息分發(fā)模式可能都將迎來巨大的變化。這篇文章里,作者就闡述了他的感想,一起來看。
當(dāng)計(jì)算機(jī)操作系統(tǒng)從DOS(磁盤操作系統(tǒng))到圖形用戶界面(GUI)時(shí),人類拖動著光標(biāo)雙擊圖標(biāo)打開文件時(shí)帶來多少震撼已經(jīng)不可考,但是卻真實(shí)的塑造了我們已知的世界。
而今,我們又站在了一個新時(shí)代的前夜。但任何變革真正顯示出排山倒海的氣勢前,其中發(fā)展的草灰蛇線往往不被人重視,當(dāng)時(shí)只道是尋常,如果非要給這個開始的開始,提供一些注腳,那可能大家需要關(guān)注幾個科技動態(tài):
- vision pro帶來的更成熟的自然交互模式探索;
- GPT-4o 帶來的更成熟的多模態(tài)交互能力;
- 以Diaspora等為代表的社交服務(wù)商帶來的基于區(qū)塊鏈技術(shù)的去中心化的信息分發(fā)模式發(fā)展。
當(dāng)我們嘗試?yán)斫庖粋€信息系統(tǒng)的運(yùn)行邏輯時(shí),我們都可以抽象出這樣一個模型:
輸入 – 處理 – 輸出
當(dāng)前主流的交互模式主要包括基于圖形用戶界面(GUI)的交互方式,用戶通過鼠標(biāo)、鍵盤、觸摸屏等傳統(tǒng)輸入設(shè)備與計(jì)算機(jī)系統(tǒng)進(jìn)行互動,系統(tǒng)獲取信息后,通過對應(yīng)的驅(qū)動程序,負(fù)責(zé)將硬件生成的電信號轉(zhuǎn)換為操作系統(tǒng)能夠理解的輸入事件。
我們更像一個機(jī)器的操作工,汗流浹背的在多個APP中切換,使用APP預(yù)設(shè)的方式錄入信息,獲取有限的功能。我們被系統(tǒng)馴化了,所謂的學(xué)習(xí)成本,不過是因?yàn)橄到y(tǒng)本身交互模式和信息處理方式局限造成的約束,是系統(tǒng)和人之間的巴別塔。但這不是終點(diǎn)。
我們期望可以像和人一樣和系統(tǒng)交互,由此引發(fā)了對自然交互模式(Natural Interaction)的期盼,用以減少用戶學(xué)習(xí)和適應(yīng)新技術(shù)的負(fù)擔(dān),提高用戶體驗(yàn)和效率。曾經(jīng)這個想法多么遙不可及,但是現(xiàn)在來看,未來已來:
- 蘋果所演示的Vision Pro,支持語音+手勢+面部/眼動追蹤,實(shí)現(xiàn)可見即可交互。VR和AR技術(shù)通過創(chuàng)建沉浸式環(huán)境,使用戶可以以自然的方式獲取更豐富的信息細(xì)節(jié)。它解決了輸入和輸出階段的問題。
- GPT-4o 支持多模態(tài)交互能力,為新一代的交互模式解決了后端信息處理的難題。一段文本承載的信息量是完全低于一段語音,一段語音承載的信息量完全低于面對面的交談。手勢、微表情、語音、語調(diào)、音量、語速、停頓、重音,未來甚至交談人的溫度和氣味,意味著大模型可以獲取更多的信息以輔助其更準(zhǔn)確的理解問題,縮短其推理的時(shí)間,并支持提供更高質(zhì)量的回答。
所以,我們無法再將大語言模型當(dāng)成一種智能的對話機(jī)器人,未來將出現(xiàn)一個以大語言模型為信息組織基底,以混合顯示為信息展示載體的自然交互模式,它將是新一代操作系統(tǒng)的雛形,它的最終形態(tài)一定不是現(xiàn)有圖形界面操作系統(tǒng)的附庸,而是顛覆者。
可能這么想比較抽象,我們看兩個場景:
牛爵爺在《自然哲學(xué)的數(shù)學(xué)原理》(Mathematical Principles of Natural Philosophy)中描述了包括了萬有引力定律、運(yùn)動定律和微積分的應(yīng)用等內(nèi)容,整本書包含了約 50000 字左右,對后世科學(xué)發(fā)展產(chǎn)生了深遠(yuǎn)影響。
而當(dāng)前,一個普通博士的論文,可能都不止 50000 字了。最近一百年來,信息的密度和廣度成指數(shù)型增長,任何一個期望在本專業(yè)做出突破的學(xué)生,不得不皓首窮經(jīng)以期踩在前人的肩膀上在一個非常細(xì)分的領(lǐng)域得以繼續(xù)前進(jìn),人類用每秒幾KB的信息讀寫速度來面對信息爆炸,那么也總有一天會面對知識傳遞層面的“光錐之內(nèi)皆是命運(yùn)”。
如果不能理解這個,也可以看看自己企業(yè)內(nèi)部的知識庫管理,在N多部門孜孜不倦的信息沉淀下,有多少寶貴的知識變成了沉睡的字節(jié),一直以來的,使用樹形層級結(jié)構(gòu)及文本匹配搜索的方式失效了,我們已經(jīng)無法快速獲取自己想要的信息了。在這種前提下,拋開系統(tǒng)不講,我們獲取我們想要信息的最佳實(shí)踐是什么?
對,問別人,問活生生的人,我們可以用更高信息密度的交互模式,包括但不限于語言,圖表,表情動作,讓他理解我們的訴求,而他可以快速的綜合各種信息,給出最匹配的答案。
曾經(jīng)在某個網(wǎng)站上有個笑話,說當(dāng)前提供兩種購買商品的方式,一個是經(jīng)過瀏覽-決策-付款-填寫收貨信息-收貨,一個是大聲喊“媽媽,我要這個!” 媽媽總是理解我們那些不易察覺的小心思和習(xí)慣,對不對。
我曾經(jīng)有個斷言,就是淘寶以當(dāng)前的路徑繼續(xù)前進(jìn),遲早有一天會被抖音和小紅書電商所取代,是的,不是被拼多多取代。原因在于,抖音以其千人千面的推薦算法洞悉著我們的喜好,我們自己由于社會準(zhǔn)則的存在,尚且無法對自己有一個全面的認(rèn)知,但是那些不經(jīng)意的停留的行為數(shù)據(jù)出賣了我們,抖音得以比較完整的勾勒我們的形象,洞悉我們的需求。
這是淘寶夢寐以求的,但是在一個購買行為里,又能勾勒出多準(zhǔn)確的消費(fèi)者畫像呢,所以淘寶推薦商品的尷尬就不難理解了(總是推薦我們已經(jīng)購買或者瀏覽后沒有付款的商品)。
我們期望更自然的輸入,更自由的輸出,以及更理解我們的系統(tǒng),就像,一個老管家!
更進(jìn)一步,假如有一天,大模型更理解我們,給出我們更想要的信息,更匹配的商品,我們真的還能接受去一個個信息孤島上交流,購物,搜索信息嗎,還能接受競價(jià)排名對我們匹配信息的干擾嗎,由此,對未來信息系統(tǒng)底層架構(gòu)的最后一片拼圖就來了:
基于區(qū)塊鏈技術(shù)的去中心化的信息分發(fā)模式。
我們不再需要按照各個平臺的要求,限制文字字?jǐn)?shù)的輸入文本,限制圖片格式的輸入圖片,限制不同視頻長度的輸入視頻,也不需要去微博看新聞,不需要去B站看番,不需要去淘寶購物。信息是原子化的,通過區(qū)塊鏈技術(shù)保證其安全性,和不篡改性,通過大模型來處理浩如煙海的信息并給出最匹配我們需求的東西,并以我們能理解的自然交互方式給到我們,那么我們就真的迎來了新的伊甸園。
免噴聲明:由于本人對信息行業(yè)的沿革發(fā)展,交互行為科學(xué),語言大模型,去中心化的信息分發(fā)模式等都沒有比較深入的理解,所以此篇文章僅作為一家之言,博君一笑(順便暖暖公眾號),如果能順便啟發(fā)你按照這個思路去思考,重構(gòu)我們當(dāng)前習(xí)以為常的一切,那我就善莫大焉了。
專欄作家
Kathic,人人都是產(chǎn)品經(jīng)理專欄作家。深耕B端多年,致力于OMSTMSWMS等供應(yīng)鏈相關(guān)產(chǎn)品設(shè)計(jì)?!鞍l(fā)現(xiàn)、洞見、行動、反思”是我的信條。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!