隱形AI與設計

1 評論 3736 瀏覽 13 收藏 20 分鐘

文章從AI輔助設計過程、仿人類AI和隱形AI,三個角度描述三個設計與AI關(guān)聯(lián)的方式。

作為一個設計師,我對現(xiàn)在的AI浪潮的態(tài)度起初是:

聽起來很棒,但跟我這個設計師有什么關(guān)系呢?

我對所有的趨勢保持謹慎態(tài)度,何況現(xiàn)在媒體鼓吹的人工智能,跟我們在科幻小說中讀到的強人工智能相比還有很大差距。更重要的是,一直以來設計師關(guān)注的都是界面,職責是根據(jù)不同的交互方式設計不同的好用的界面,而AI似乎是一個底層的創(chuàng)新,和界面沒有太多關(guān)系。

當然隨著我對這個問題一步一步的了解,我發(fā)現(xiàn)自己之前的見解非常狹隘。

我對AI算法的了解

我對AI算法的接觸并不多,只是在TU/e讀碩士的一門課(Embodied Social Interaction)上接觸過。在這門課上,導師教了我們一個叫做Neural Gas的神經(jīng)網(wǎng)絡機器學習算法(此為JavaScript寫的Demo),并讓我們自己去嘗試使用這個算法,訓練數(shù)據(jù),并獲得結(jié)果。

整堂課下來,教室里的大半學生都聽得云里霧里(尤其是歐洲的設計學生,大部分數(shù)學不是特別好)。我雖然是理科上來的,但也是半懂不懂。

但是機器學習有趣的地方在于:你即使不懂算法,也有可能運用它得到很好的效果。

我們當時嘗試了很多數(shù)據(jù)集,一開始我們對算法理解不深,訓練的數(shù)據(jù)是RGB的,后來改成了灰度;后來誤以為算法更容易識別非常不同的兩組數(shù)據(jù)集,所以我們讓算法識別不同顏色的衣服,結(jié)果失敗等。

其實經(jīng)過這么多的嘗試,我們發(fā)現(xiàn)機器學習特別擅長的是那種很難用邏輯分析的問題。

這種很難用邏輯分析處理的問題有個例子是:用算法去識別手寫的數(shù)字。

[Fig – 1] 一組不同手寫方式寫的數(shù)字

可以想象,如果不用機器學習,你可能要為每個數(shù)字編寫不同的算法,你需要深入理解人的習慣、筆畫的順序、形狀等,你需要編寫一套邏輯,從一堆像素中獲取到路徑、特征點等等,你還要處理大量的規(guī)則以外的特殊情況……總之,不容易。而很多時候,根本不可能(比如識別圖片里各種不同的的物體)。識別手寫的數(shù)字這種問題屬于那種對人腦很簡單而對電腦很困難的問題。機器學習,或深度學習對于解決這類問題很擅長,甚至比人類更擅長,比如下圍棋和股票等。當然,我對AI的技術(shù)理解十分粗淺,如有錯誤,請在評論區(qū)指出。

好了,技術(shù)方面先普及到這里。

聽到這里,你可能跟我一樣的態(tài)度:“AI聽起來能解決很多之前解決的不好的問題,但這個對于我一個設計產(chǎn)品的設計師來說,有很大關(guān)系嗎?” 這個態(tài)度很合理。搜索引擎早就用人工智能技術(shù)來幫助用戶搜索了,但這些技術(shù)的改進一般是由工程師或是產(chǎn)品經(jīng)理推進的,設計師好像就是把搜索框設計得好看一些、界面布局編排合理一些、讓人多點一些廣告即可(這些自然也非常重要)。

我認為有兩個因素會影響你的觀點:

  1. 我相信設計師應該為最終的體驗負責。如果設計師僅僅是在產(chǎn)品經(jīng)理和工程師想好功能和技術(shù)之后為其加一個好看的殼,我很懷疑這種合作方式能否成功(事實上,大部分公司設計師都要和產(chǎn)品經(jīng)理深度溝通,尤其是交互設計師)。我也相信這些職位之間的區(qū)分比較模糊,尤其是產(chǎn)品經(jīng)理和設計師之間。
  2. 未來人工智能技術(shù)可能會影響產(chǎn)品的方方面面,而且也不會僅限于那些聽起來“很AI”的產(chǎn)品(搜索,語音交互),如果你不了解這些技術(shù),你的產(chǎn)品可能在體驗上就會落后。

我將在這篇文章中描述三個已經(jīng)出現(xiàn)的設計與AI關(guān)聯(lián)的方式。它們分別是AI輔助設計過程、仿人類AI和隱形AI。

AI 輔助設計過程

設計是我認為非常需要創(chuàng)造力的領(lǐng)域之一,也應該是最晚被AI取代的職業(yè)之一(據(jù)這個網(wǎng)站所述^_^)。但產(chǎn)業(yè)中有很多設計需求不需要特別有創(chuàng)造力,也正是這些需求最有可能被AI取代。

比如人們在很早之前就對簡單的排版進行自動化了,這類需求十分旺盛(想象電商網(wǎng)站里面巨量的商品圖片),而有時對創(chuàng)造性的要求沒有那么高。隨著AI技術(shù)的發(fā)展,這些自動化算法越來越有效。以下是一些例子:

[Fig – 2] 阿里魯班的Banner自動化與個性化設計

[Fig – 3] Netflix根據(jù)照片內(nèi)容自動裁切排版并生成多個版本

[Fig – 4] Wix人工設計智能

我看了非常多的例子,我覺得目前這里面并沒有真正的設計和智能在里面。你在使用過程中就能明顯感覺到里面模板的痕跡。誠然,對于一些需求來說,甚至簡單的模板就夠了。如果深挖行業(yè)需求,這里面還有不少的創(chuàng)新機會。但是對于大部分有一定追求的設計師來說,談AI對設計師職業(yè)的威脅目前來看還甚早。

完全模仿人類交流的AI

打造一個2001太空漫游里面的能和人交流的HAL機器人是科技界的夢想。國際科技巨頭如亞馬遜、微軟、Facebook、蘋果都推出了聊天機器人或是智能音箱。用戶可以以聊天的方式點菜、訂機票,可以用智能音箱放音樂、設置鬧鐘、控制智能家居等。

這些產(chǎn)品我也使用了一些,總體來說,語音識別成功率挺高的,但是真正理解語言背后的含義,還不是特別好。更重要的是:這些交互形式本身有其自身的限制,因此有些時候并沒有傳統(tǒng)的GUI更有效率。

人工智能確實是很大的浪潮。這并不意味著手機會消失,并不是說語音助手會替代屏幕。人們有眼睛,而只要人們有眼睛,他們也會想要屏幕。我們有手指,我們喜歡觸摸東西。但是從很早期的科幻中,人們就希望有一臺能夠用自然的方式對話的電腦。這個正在逐漸變?yōu)楝F(xiàn)實。

——亞馬遜的CEO Jeff Bezos在問及人工智能的時候所說

曾經(jīng)我也看到一些論點說VUI(Voice User Interface)和CUI(Conversational User Interface)將取代GUI,這個很顯然也不對,它們各有所長。目前最大的設計問題是如何在有限的技術(shù)水平下打造合格的用戶體驗(如設計Alexa Skills)以及從產(chǎn)品角度提出技術(shù)需要提升的點。要深入談這個需要另外再寫一篇文章。

隱形的AI

這一部分是本文的重點,也是我認為在今天開始就需要關(guān)注的趨勢。

所謂的隱形的AI(好吧,這是我自己的稱呼)就是在傳統(tǒng)UI中隱形地智能地將信息推薦給你。在傳統(tǒng)UI中,UI是靜止的,意味著UI不會根據(jù)用戶的不同輸入做出太多改變,不會幫助用戶進行輸入,不能理解用戶的意圖,也更加無法對不同用戶給出針對性的建議。

我認為交互設計師們可以利用隱形AI來重新思考UI的方方面面,我覺得還有更多的創(chuàng)新方式等待發(fā)掘,在這里介紹兩種:減少輸入和更優(yōu)的輸出。

減少輸入

人們都是懶惰的,我們其實并不愿意敲鍵盤來輸入一些東西,尤其在移動平臺上。首先移動平臺上的文字輸入本身效率就不高,二是移動平臺上的許多用戶(如老年人)其實非常不擅長輸入,三是人們往往處于移動狀態(tài)或是單手操作狀態(tài),四是人們很有可能很希望快速完成一個任務,如排隊支付。

我個人認為錘子科技在這方面探索得比較好。很早開始,錘子科技就發(fā)現(xiàn)了驗證碼輸入麻煩這一痛點,首次加入驗證碼自動識別并停留在通知欄的功能。之后各大ROM廠商也紛紛跟進,增加了更多功能如直接復制的按鈕等。

我個人總結(jié)的減少輸入的方式有Ambient推薦和Multi-modal輸入。Ambient推薦是指不占據(jù)用戶主要注意力的推薦方式,Multi-modal輸入則是用圖像識別和語音識別等來輔助或替代鍵盤輸入。

Ambient推薦

我們可以現(xiàn)在就思考一下,我們平時使用產(chǎn)品的所有輸入中,有哪些是可以自動化的或者用AI進行智能推薦的?

太多了,很多輸入方案都可以用AI優(yōu)化,我們只需轉(zhuǎn)換一下思維,就能在現(xiàn)有產(chǎn)品中發(fā)現(xiàn)很多需要優(yōu)化的點。

以在瀏覽器添加書簽為例。之前我的書簽都不會加標簽或分組,因為懶。但當我需要找一個之前收藏過的網(wǎng)頁的時候,這時候就發(fā)現(xiàn)沒有合理的分類很難快速找到我收藏過的頁面。我也使用過EverNote的網(wǎng)頁剪藏工具,但是每次收藏都要輸入一次標簽,太過麻煩。

[Fig – 5] 使用Raindrop添加網(wǎng)頁時,會自動添加標簽,icon是創(chuàng)建文件夾時自動生成的

我正在使用的Raindrop就利用AI優(yōu)化了這一流程。

它會自動分析網(wǎng)頁的文本,并推薦一個我之前創(chuàng)建過的文件夾。并且它能夠根據(jù)我每次收藏過的網(wǎng)頁不斷地學習和優(yōu)化。當然,這個方法只有80%的準確率。但沒關(guān)系,因為我可以很方便快速地對文件夾進行快速更改和創(chuàng)建。更有趣的是,它會自動對文件夾添加圖標。如果我創(chuàng)建一個叫做游戲的文件夾,它就會自動添加一個游戲手柄的圖標給我。

整個使用過程非常流暢,即使出錯了你也可以很方便快速地修改。

當然,這里涉及到一個設計原則:當AI為我們做決策的時候,決策越精準,決策越不重要,就越不需要給用戶方便的修改方式。

比如圖標,它是基于單個詞的分析給出,精度往往比較高;同時圖標是一個Nice to have的功能,它不會特別影響我的正常使用。因此沒必要給特別明顯的更改圖標的功能。

反之,如果決策相對重要,而AI不能給出完全正確的決策時,要么只是給出建議,要么就是能提供快速的修改方式。這里需要交互設計師在這個過程中找到合適的平衡點。

[Fig – 6] 谷歌Inbox的自動回復功能

[Fig – 7] Tribe app能自動識別語音聊天中的信息,并提取關(guān)鍵信息

在這里我在追加幾個例子,谷歌郵箱服務中的Inbox的自動回復功能和Tribe在視頻聊天中自動提取信息并生成卡片的功能。這些就像溝通流中默默觀察并在適當時候提供幫助的助手一樣,如果設計得當也能給人們生活帶去便利。

Multi-modal輸入

在過往的這些年圖像識別和語音識別已經(jīng)發(fā)展得相當完善,已經(jīng)能夠在一些日常功能中使用它替代一些輸入了。比如

  1. 錘子科技在發(fā)布會試圖推動的語音輸入
  2. 各大地圖和搜索應用中添加的語音輸入
  3. 利用攝像頭直接進行翻譯的谷歌翻譯

之后這些應用場景只會越來越多。

對于交互設計師或產(chǎn)品經(jīng)理來說,如何巧妙地將這些新技術(shù)應用到現(xiàn)有的產(chǎn)品中,使得用戶能夠很方便的在他們需要的情況下調(diào)用這些功能,是我們真正應該關(guān)注的。這就需要找到非常有需求的應用場景。

在Smartisan OS的大爆炸功能中,當界面上的文字無法被直接提取時,系統(tǒng)會提示用戶選擇屏幕截圖,然后針對所選區(qū)域?qū)嵤㎡CR功能。這其實就是用圖像識別這一巧妙的方式繞過系統(tǒng)的壁壘。

那下一步其實就是更深度地在算法上進行優(yōu)化,針對圖片和點擊區(qū)域進行智能的裁切,用戶根本就不需要進行裁剪這個操作(這個操作其實又是個操作成本比較高的、應該用AI優(yōu)化的操作,我每次都不愿意使用,都是直接對整個截圖進行OCR),整個體驗不會被打斷,用戶可能根本沒有意識到背后的一系列算法操作。這樣用戶體驗又可以進一步提升。

更優(yōu)的輸出

除了在輸入方面能夠減少大家工作量,AI還有可能提供更加個性更加優(yōu)化的輸出。

這個趨勢非常熱門,比如說:

  1. iPhone可以通過給用戶的照片進行分析,直接生成一段可以分享的電影;
  2. 包括今日頭條在內(nèi)的各大資訊網(wǎng)站對不同用戶進行智能的內(nèi)容的分發(fā);
  3. YouTube自動生成的智能預覽圖;
  4. 各大國產(chǎn)ROM中對郵件和短信進行智能分析和重新排版等。

這種應用在算法上和用戶分析上都相當有挑戰(zhàn)性。

結(jié)語

這篇文章提到了很多AI在產(chǎn)品中的使用。我覺得最核心的是一個思維方式的轉(zhuǎn)變,之前我們解決問題很多時候都是用創(chuàng)新的界面設計,使得用戶可以更快地達到他們想要的目的;而在AI時代,我們可以重新思考所有問題能否在后端用AI嘗試解決,并在前端以一個合理的方式呈現(xiàn)出來。比如:

  1. 我們總是被惱人的通知打擾,是否系統(tǒng)能通過判斷我們?nèi)∠ㄖ牟僮鱽硗茢辔覀儚膩聿豢茨承玫耐ㄖ?,并將其降低?yōu)先級或定時清理?
  2. 我們的屏幕亮度調(diào)節(jié)不準,是否系統(tǒng)能根據(jù)我每次在自動模式下人為干預亮度,對亮度調(diào)節(jié)算法進行優(yōu)化?
  3. 系統(tǒng)有沒可能檢測到我經(jīng)常進行的重復性操作(每天到公司打卡),為我自動創(chuàng)建IFTTT類似的快捷功能?
  4. 視頻播放器能否在字幕和聲音不匹配時自動匹配呢?(當這個發(fā)生時,要很好地對齊真的很困難)
  5. 能否智能分析如何取消郵件的訂閱,使得我能有一個列表告訴我訂閱了哪些郵件,我只需點擊checkbox,后臺自動為我取消或恢復訂閱?或是想Smartisan OS那樣,以智能屏蔽的方式取消訂閱?
  6. 能否在我通話時提及電話號碼時,自動識別數(shù)字并保存?錄音也同時保存下來確保不發(fā)生識別錯誤。

下一次,當你遇到問題時,試試用AI的方式解決吧~

引用

Fig – 1:使用神經(jīng)網(wǎng)絡識別手寫數(shù)字 · 神經(jīng)網(wǎng)絡與深度學習,引自https://hit-scir.gitbooks.io/neural-networks-and-deep-learning-zh_cn/content/chap1/c1s0.html

Fig – 2:設計與AI的現(xiàn)在Ⅰ:設計了1.7 億個 banner的阿里魯班,設計與AI的現(xiàn)在Ⅰ:設計了1.7 億個 banner的阿里魯班

Fig – 3:Design In An Age of Artificial Intelligence,https://medium.com/startup-grind/design-in-an-age-of-artificial-intelligence-739e656b44ba

Fig – 4:The Future of Website Creation: Introducing Wix ADI,https://www.wix.com/blog/2016/06/wix-artificial-design-intelligence/

Fig – 6:Google Inbox will soon predict your replies by analyzing your emails,Google Inbox will soon predict your replies by analyzing your emails – gHacks Tech News

Fig – 7:Sequoia-backed video chat app Tribe spammed its customers’ address books,Sequoia-backed video chat app Tribe spammed its customers’ address books

 

作者:盧智雄,正在轉(zhuǎn)型為產(chǎn)品經(jīng)理的交互設計師

本文由 @盧智雄 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自PEXELS,基于CC0協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!