蘋果 Vision Pro 的“眼動交互”有哪些普通人創業機會?

0 評論 1678 瀏覽 6 收藏 25 分鐘

本文以蘋果 Vision Pro 的眼動交互功能為主要討論內容,分享眼動交互這一功能中存在創業的機會。作者從六個層面出發做具體分析,可以給不同創業方向的伙伴提供一些參考建議,希望能對你有啟發。

蘋果 Vision Pro 的亮相,將眼動追蹤技術融入進了核心交互中,Vision Pro 拋棄掉了傳統的手柄,利用“眼動追蹤+手勢+語音”多模態的交互方式,用眼睛的轉動來選擇交互的對象,用手勢來確定或者切換,眼動交互的重要度上升到了前所未有的高度。

蘋果產品的很多特性往往會成為業界標準,慢慢出現在各類 AR 設備里,國內在 AR 上有所布局的大廠大概率會緊鑼密鼓的在眼動追蹤技術上加大研發力度。因此眼動硬件逐漸成為標配已經成為無可爭議的事實。

圖源:蘋果官網

交互技術的重大改變,往往伴隨著巨大的創業機會。例如以鍵盤和鼠標作為基礎誕生 PC 電腦,進而誕生了大量基于鼠標鍵盤的圖形化軟件;例如以全面屏多點觸控作為基礎誕生了iPhone,基于觸摸交互誕生了大量的 APP 應用。

而且如今各個互聯網大廠所分析的用戶數據、精準營銷、廣告推送,都是需要用戶付諸明確的交互行為才可以獲得。

試想一下如果未來AR眼鏡硬件性能進一步成熟,那么在未來基于眼動交互可能會有那些?APP 和創業機會呢?

一、眼動識圖

圖源:電影《大黃蜂》

在眼動追蹤技術中,大家常聽說注視點渲染,也就是實現眼睛看哪里圖像渲染哪里進而降低了計算機的功耗和算力。但是大家可能不常聽過的是-注視點圖像識別,也就是實現眼睛看哪里圖像識別哪里。

例如,蘋果 Vision Pro 的前置攝像頭實現的 AR 透視,再結合注視點圖像識別可以間接的將眼睛注視點映射在現實世界,從某種意義上來說,這是讓計算機在以用戶的第一人稱視角在感知并理解用戶的所聞所見。

那么如果計算機能夠以用戶的視角在感知世界,見你所見,思你所思,那么 AR 眼鏡能夠為用戶提供的個性化服務的想象空間實在是很大了。

那么想象空間有哪些?其中就包括筆者早年曾探索 AR 眼鏡的識圖購物。

圖源:陳濤

上圖是本人早年基于 Magic Leap One 研發的基于眼動識圖購物的應用場景,圖中白圈是用戶的注視點,此時用戶正在看著一架無人機,實現了對無人機圖像信息的 AI 搜索,下單購買,虹膜身份識別,模擬了用戶通過 AR 眼鏡眼動的整個購物過程。

基于注視點圖像識別實現眼動購物。通俗一點解釋就是看什么買什么。

例如,當一名男性用戶在大街上看到一輛迎面駛來的新款汽車非常感興趣,智能眼鏡通過眼動追蹤獲取此時的眼動行為判斷用戶正在對目前注視的目標圖像感興趣,AR智能眼鏡獲取用戶注視區域的汽車圖像,將圖像通過網絡上傳到云端計算機進行圖像識別,識別出和感興趣汽車一模一樣的產品或者相似的商品。

當然商品不局限于汽車,還可以是數據庫記錄的任意產品。在一定程度上也可以理解成淘寶的拍立淘功能與眼動追蹤結合在智能眼睛上呈現,這是潛在未來一種全新的購物體驗。

或許在不久的將來,雙十一不再是剁手,可能還需要挖眼了?。。。。?!

總結來說,通過注視點圖像識別技術能夠最直接、最流暢的方式將用戶、AR眼鏡、物理世界三者聯系在一起,基于這個思路還有大量的應用場景和工具型 APP 可以思考。

例如可以把現在的圖像識別的應用結合眼動注視點引導再實現一次,看哪里翻譯哪里,看哪里哪里彈出評論、彈幕等。

例如,用戶在超市選購蔬菜,當用戶看到某個蔬菜時。是否可以為其提供今晚的菜譜做法、熱量提示、健康搭配。

再比如今年爆火的 ChatGPT,AI 已經可以對圖像中的場景進行理解,那么和 AR 眼鏡的眼動追蹤結合又能產生什么樣的應用?可以想象眼動追蹤是未來互聯網的潛在理想“流量入口之一”。

二、眼動數據應用

回顧前 20 年的互聯網發展,互聯網產品的商業模式可以大致分為廣告收益、收中介費、以及近幾年才流行的為產品本身價值付費。并且廣告收益是早期 PC 互聯網產品的主要營收來源,至今廣告收益也占據了半壁江山。

后來移動互聯網興起,通過手機可以追蹤到個人用戶,因此廣告的推送講究精準推送,通過 APP 收集用戶的數據,進行用戶畫像分析,進而實現廣告的精準推送。

以 Facebook 為例,旗下矩陣產品有 Facebook 主應用、Instagram、WhatsApp、 Messenger 以及其他多款工具和服務。

這些應用都可以收集多種類型的用戶數據,以下是幾個關鍵的類別:

  • 用戶基本信息:包括姓名、年齡、性別、職業、教育背景、地理位置等。
  • 社交網絡數據:用戶的朋友列表、關注的人或頁面、分享和評論的內容,以及用戶在這些社交媒體平臺上的其他互動。
  • 用戶行為數據:包括用戶在應用中的瀏覽歷史、點擊行為、使用頻率、停留時間等。
  • 用戶偏好和興趣:根據用戶的搜索歷史、瀏覽內容、分享和點贊的帖子等來推斷。
  • 設備信息:包括設備型號、操作系統、瀏覽器類型、IP地址、移動網絡信息等。

我將上述的用戶數據都歸為傳統數據,因為這些數據獲取的前提是需要用戶經過主觀思考并且付諸于交互行為輸入到計算機中。

例如上文提到的“用戶行為數據”和“用戶偏好和興趣”。但是反觀眼動數據,它不僅僅可以獲取用戶主觀意識層面的行為數據,而且還可以獲取潛意識層面的數據。

例如當我們看到一款心儀的新款汽車,人看的那一瞬間,人眼瞳孔直徑的變化、眼跳的速度、眼跳距離、平滑追視的行為等都可能會有相應的變化,重點是這些行為人類不能自己自由控制,是客觀生理的反應。也就是說眼動數據獲取可以挖掘用戶不經意之間的喜好、情緒等情感數據。

當然眼動數據的分析挖掘前提一定是建立在用戶隱私保密技術和用戶許可的情況下,正是因為眼動數據的潛在價值、侵入性都是前所未有的,所以蘋果并沒有開放眼動數據,或許可能是目前現有技術、監管、用戶心智還有沒有準備好利用眼動數據。

三、眼動數據隱私安全

在上文中提到眼動數據的存在巨大商業價值的同時,也存在更大隱私安全風險。比如單從注視點位置一種眼動數據,就可統計分析知道你對某一種事物的特定視覺偏好。

例如某種設計風格的商品,是沉穩的、性感的、創意的、自由的、新中式的等等,往往人們對產品風格的偏好也與用戶的性格和自我認知有相關性。

甚至對戶外廣告傳媒行業也是一種全新變革,因為傳統戶外廣告行業的廣告效果是難以統計和量化的,他不像手機 APP 上的廣告本身就是數據很好統計,但是在未來的更先進小巧的 AR 眼鏡再結合眼動追蹤,戶外傳媒將迎來變革。

例如當 AR 眼鏡用戶看到某一塊戶外廣告牌,不僅可以為用戶呈現更多的內容,還可以戶外廣告的曝光度進行數據統計。

再比如在先進智能制造行業也可能會有積極的作用,在產品制造或者備貨過程中,對于一件商品可能需要準備多種不同顏色、不同款式以適應不同客戶細微差異,但是每種不同款式分別生產多少件?

倉庫分別存儲多少貨物一直是商家們的痛點,不然哪里來的雙十二。但是結合 AR 眼鏡的眼動追蹤技術就可以最高低成本的方式統計分析大量用戶商品視覺偏好,進而指導生產備貨,類似商家付費請大量用戶做產品視覺偏好的調查問卷,用戶則可以通過授權眼動數據用于分析獲得“收益”

但是,蘋果目前并沒有把眼動數據開放出來,Vision Pro 眼動追蹤所帶來的隱私問題,這也是產品發布會上所強調的重點之一。

Mike Rockwell 透露,Vision Pro 的解決方案是把眼動數據進行隔離并在后臺進行單獨處理,蘋果稱只有當用戶進行雙指捏合操作時才會釋放結果,這樣就很好規避了 APP 和網站獲取隱私問題。

圖源:蘋果官網

我的個人觀點:雖然蘋果目前沒有開放眼動數據給開發者,但是我覺得在大趨勢上一定會逐步開放給開發者,但是一定對使用眼動數據的開發者的要求和限制極高,當然也不排除蘋果自己使用的可能。因為眼動數據的潛在商業價值太大了,即使有風險有困難,但一定會在利益驅使下得以解決,通過技術和制度的監管完善眼動數據管控。

我想要引出的創業機會就是關于眼動數據隱私保護的相關技術,例如通過區塊鏈技術讓用戶對自己的隱私數據有絕對的掌控權,而不是屬于某一家公司,用戶可以將自己的眼動數據授權給某個 APP 分析使用,第三方企業對自己的眼動數據做了那些使用可以不可篡改的顯示出來,企業使用了個人數據后還可以獲得利潤分成。

如果用戶對自己的數據能夠完全掌握,充分了解,能夠做到這一點我相信用戶對眼動數據的隱私排斥心理可以極大的緩解。所以眼動隱私數據保護、確權等方面是個有待解決的創業方向。

在未來得眼動數據者可得未來互聯網的天下,得隱私保護者可得眼動數據。

四、眼動滑動輸入法

圖源:蘋果官網

Vision Pro 輸入文字的方式:一種是在空中漂浮的虛擬鍵盤,虛擬鍵盤可以讓用戶用手指在空中輸入文字。

在互聯網初期有大家熟悉的搜狗輸入法,以輸入法作為流量入口,通過搜索、廣告、游戲等多種方式實現盈利。那么基于眼動交互是否存在某種輸入法產品?

目前蘋果 Vision pro 正在使用的手勢識別和傳統的 QWERTY 鍵盤布局作為文字的輸入。但是實際上在未來手勢識別的鍵盤輸入方式不能夠覆蓋全部的生活場景。

比如想象一下在擁擠地鐵車廂內,很難想象所有人都通過手勢識別實現頭顯的交互和文本輸入,因此在一些特定場景需要純眼動交互來進行補充。

當然如果要高效的辦公還是需要物理鍵盤,如果是在不方便說話或公共的場景則適合使用眼動交互進行快速鍵盤文字輸入,用眼睛鍵入字母需要解決技術問題有:

1. 在輸入過程中需要區分開眼睛的有意識的交互行為和無意識行為,有意識行為例如眼睛的交互行為,無意識例如視覺搜索行為。無意識注視行為會干擾對目標鍵的鍵入。

圖源:陳濤

2. QWERTY 全鍵盤布局并不適用于眼動輸入,因為 QWERTY 全鍵盤上眼動滑行輸入中,一次長距離的眼跳需要跨過太多鍵位,在眼跳過程中掠過太多無用的字符鍵位可能會造成誤觸鍵位,以至于輸入錯誤的字符,這也會增加鍵入錯誤字符的幾率,降低眼動滑動輸入的體驗。

圖源:VR陀螺

3. QWERTY 全鍵盤布局是長方形的,長方形鍵盤可能會超出用戶的視野范圍,需要用戶調整頭部視角來進一步實現眼動輸入,這是需要完善的體驗。如 SideQuest 有一款眼動追蹤打字 demo《Eye Tracking Keyboard》,可以發現通過眼動鍵入并不是很精準,另外需要一直轉動頭部來調整視野,本人認為更好的交互體驗是盡可能少的讓用戶付出精力和運動。

眼動滑行輸入法,圖源:陳濤

本人認為需要有新的鍵盤布局來適應眼動鍵盤輸入,QWERTY 全鍵盤布局的權威地位是由于人們近百年來養成了不可撼動的使用習慣,促就如今地位。

但是事實上如今 QWERTY 全鍵盤布局設計的初衷并不是為了幫助人們提高輸入高效,而是機械式打字機為了降低在快速輸入過程中容易出現的機械故障,因而設計成如今我們通用的反人類鍵盤布局。

但是完全用眼睛去輸入文本是全新交互習慣,面對普通消費者則要追求交互的效率,所以有機會開辟出一種全新的基于眼動交互的輸入法,并且眼動交互還存在大量的技術問題有待解決,所以是存在新的機會的。

五、眼動人機識別

Vision Pro 眼鏡對比于電腦、手機的 2D 屏幕內容呈現形式和交互方式發生了巨大的變化。

例如 Vision Pro 眼鏡呈現的內容是全息 3D 立體的,交互采用“眼動+手勢”,那么現如今基于內容呈現形式和交互方式這兩項構建的互聯網基礎都發生改變后,用傳統的方法放在 AR/VR 眼鏡上是不適用的。

就比如“人機識別”,現如今的很多互聯網產品通過短信驗證碼、正確輸入難以理解的字母數字、拖拼圖等等,用這種方式來識別用戶是爬蟲機器人還是真人用戶,以此作為安全機制防止被薅羊毛。

但在 AR/VR 場景下可以有哪些人機識別機制呢?

圖源:蘋果官網

例如,要求用戶按照提示在空間中尋找正確的 3D 圖標,并通過眼動注視點看著 3D 圖標保持一定的時長。這是通過利用人對三維空間的意識理解和眼動交互實現的人機識別。

圖源:陳濤

再進一步,作為拖動滑塊拼圖的眼動升級版,如上圖中,系統隨機生成一個光球在空間中不規則的移動,然后用戶需要始終注視移動中的光球,直到光球到達終點。

這是通過人眼的追視行為和人眼無法憑空實現平滑移動的特性,以及光球在空間中深度(距離)發生變化時,人眼的視線夾角會產生變化等人類特有行為作為依據判斷是真人還是爬蟲機器人。除了上述提出的一些眼動人機識別方法,還有很多的眼動行為特性沒有被挖掘,甚至大伙有可能會想到更好的技術方案。

六、眼動追蹤與健康醫療、精神

圖源:陳濤

現在的智能手表基本功能重點在運動健康方面,比如心率、血氧、睡眠、壓力、體溫監測等技術,都已經比較成熟了,諸如蘋果、華為、小米等智能手表。

但是在未來基于 AR 眼鏡與眼動追蹤技術同樣具備健康檢測與精神檢測。目前在醫學界眼動追蹤技術是腦震蕩、自閉癥、小兒注意力缺陷等精神類病癥的重要依據,那么是否在未來 AR 眼鏡普及之后會誕生更多幫助改善注意力缺陷和自閉癥的醫學類 APP,這對于家長,以及一些特殊家庭的幫助是極大的。

基于 AR 眼鏡的眼動追蹤技術還可以做到腦異常、心臟異常、眼癌、高血壓等心腦血管類身體疾病檢查,因為可以通過眼動追蹤技術獲取眼睛的眼底圖像,眼底的特征包括眼睛的視網膜,視盤,黃斑,中央凹,眼底的一些病變和眼睛的健康情況,通過 AI 對所獲取的眼底圖像進行圖像分析是可以檢測出一些疾病的。

那么這對未來的智慧醫療的想象空間就很大了。

再者,業內人士也知道 Magic Leap 在消費者市場遇到挫折后,更換的新 CEO Peggy Johnson 將戰略重心轉向商業場景,尤其是醫療領域。

圖源:Magic leap 專利 US10359631

筆者看了 Magic Leap 將眼動追蹤技術應用在醫療領域的相關專利文獻,在他們的專利號 10365488 描述中,AR 眼鏡加上眼動追蹤技術有可以能成為 “視力自動驗光儀”、“眼底鏡”、“裂隙燈”的眼科醫學的檢測設備,通過研究AR眼鏡的眼動和光學成像技術發現其硬件結構就像微縮版視力自動驗光儀

試想一下未來如果真的 AR 眼鏡可以起到驗光儀的作用,那么對于現在的眼鏡店的變革也會很大,因為我們眼睛近視了,要去實體店通過驗光儀測算眼睛的度數,然后再制作出相應度數的眼鏡。但是如果眼睛近視度數在家就可以測算,將眼睛度數數據發送至后臺工廠,然后再將加工好的眼鏡寄送到客戶家里,這也可能隔了傳統眼鏡店的命,傳統實體眼鏡的未來也是未知之數。

上述分享了一部分在AR眼鏡上基于眼動追蹤的應用場景,有更多的更有價值的應用場景需要更多的小伙伴一起去挖掘。眼動追蹤將會是未來互聯網的重要組成元素之一,需要有更多的小伙伴投身其中才有機會變成現實。

PS:上述的所有應用場景都是基于AR眼鏡硬件已經比較成熟的前提條件下。未來很美好,現實很殘酷。

行業專家評述:

七鑫易維創始人黃通兵:眼球追蹤在AR中的應用,我們已能看到的,就像冰山展現在水面之上的部分,而水面之下的部分更加龐大和壯觀,其神秘面紗正在等待廣大的創業者和開發者去慢慢揭開。

清華大學副教授何吉波:隨著AR/VR技術的發展和AR眼鏡的普及,眼動交互將成為未來的主要交互方式之一,眼動交互在醫療、教育、人機協作等領域的應用具備巨大市場價值。不僅如此,眼動交互在智能汽車、智能座艙、車載HUD場景中,眼動交互也是未來重要的研究方向。

成都虛實夢境CEO 吳瀾:作為國內最早將XR技術應用于精神健康領域的公司,我們在精神疾病的評估,干預和訓練等環節,都引入了眼動技術。比如在注意力缺陷與多動障礙中(ADHD),眼動技術可以定量分析患者的注意力維持和注意力轉移;在自閉癥譜系障礙中(ASD),眼動可以很好地與共同凝視范式結合起來。

作者:VR陀螺 陳濤

來源公眾號:VR陀螺(ID:vrtuoluo),XR行業垂直媒體,關注VR/AR的頭部產業服務平臺。

本文由人人都是產品經理合作媒體 @VR陀螺 授權發布,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!