生物特征與生物電在人機交互中的運用
隨著科技的發展,生物特征與生物電正深入到人機交互中……
每個個體都有唯一的可以測量或可自動識別和驗證的生理特性或行為方式,即生物特征。它可劃分為生理特征(如指紋、面像、虹膜、掌紋等)和行為特征(如步態、聲音、筆跡等)。生物特征識別就是利用這些個體固有的特征信息進行身份鑒別。在人機交互中,生物特征也主要運用于身份鑒別。
運用最成熟和廣泛的的生物特征就是指紋了。拋開日常所見的考勤機、簽到機不談。指紋識別早在功能機時代就已經進入了手機中用于身份識別(F505i – 由日本電信公司NTT DoCoMo在2003年7月推出)。在智能手機時代,摩托羅拉和HTC都曾發布過帶有指紋識別的智能手機,但若說是更為成熟和廣泛的應用,是在蘋果發布iPhone5s之后,緊隨其后的三星在自己家的旗艦機Galaxy S5上也采用了指紋識別,不同的是,三星采用的滑動式指紋識別,蘋果采用的是按壓式的指紋識別。在操作上,按壓式指紋識別的用戶體驗明顯優于滑動式指紋識別,并且支持360度的指紋識別。目前各手機廠商也均采用了按壓式的指紋識別方案。
到今天,指紋已經不僅僅用于解鎖屏幕時的身份鑒別,而且在各種支付場景中,也都得到廣泛應用,免去輸入密碼的繁瑣。
在安全性上,指紋識別仍存在較大爭議,雖然其避免了輸入密碼時可能被偷窺的可能性,但是最大的漏洞是缺乏生物活性的檢測,而指紋是可以復制的。通過竊取他人指紋,再使用橡膠對指紋進行復制,完全可以騙過手機的指紋身份驗證,解鎖手機。
面部識別早已不是新鮮事,記得早在三星的Galaxy S3上,就已經實現了人臉解鎖,但識別精度和識別速度都很不令人滿意,其安全性也極低,可以輕易地使用照片來騙過手機,解鎖屏幕,實用性不強,這也是面部識別發展的一個難點。
9月蘋果發布iPhone X,首次用面部識別代替指紋識別作為身份驗證的解決方案。相比于其他廠商在全面屏手機中采用后置指紋識別的方案,可以說又是跨躍性的一步。根據蘋果官方說法,隨機挑人能夠指紋解鎖你手機的概率是1/50000,而面部識別能解鎖你手機的概率是1/1000000。但iPhone x所采用的面部識別,可以不被照片欺騙了嗎?雖然沒有實際測驗過,但根據其“劉?!辈糠炙植嫉母鞣N傳感器元器件來說,似乎是的。
iPhone X面部識別硬件結構
除傳統的聽筒和前置攝像頭外,還有一個可以投射30000多個肉眼不可見的光點的點陣投影器以及讀取點陣的紅外鏡頭和泛光感應元件。大部分人可能并不了解其工作原理,這點可以參考結構光3D成像原理,筆者的畢業設計剛好與之相關,通過線形激光在物體表面移動,攝像頭采集各個時刻線條的形狀結構,反推物體表面的三維結構。
類似的,蘋果通過30000多個點陣在面部的分布位置,通過合適的算法就可以反推出面部的3D輪廓。也就是說手機中所存儲的是面部的三維輪廓,每次識別時也是對比實時三維輪廓,也就從根源上避免了可能被照片欺騙的問題。而且根據發布會介紹,進行面部識別時,眼睛必須注視手機,否則將無法解鎖,可以說是增加了生物活性的檢測,從一定程度上避免了復制特征解鎖的可能性。
雖不是果粉,但不得不說蘋果真的很強大。當別的廠商還在糾結到底要不要使用充滿詬病的面部識別的時候,蘋果已經使用了最前沿的3D面部識別技術。所以,蘋果就算背負著罵名也要留著那一撮“劉?!?。
在行為特征中,大家最熟悉也是目前發展迅速就是語音了。而且已經不再僅僅局限于語音識別,向難度更大的語意識別邁進。
可以發現,任何一款手機的系統內置應用中,都有語音識別軟件。蘋果有Siri,三星有最新的Bixby。根據目前了解,小米、華為、魅族均采用了科大訊飛的語音識別引擎,在識別精度和基本功能上,并無較大差別。關于Siri、Bixby有更為詳細的評測介紹。
筆者曾對比分析小米、華為、魅族的語音識別,以華為為例,通過語音識別,可以實現撥打電話、翻譯、管理鬧鐘、管理日程、管理備忘錄、嘀嘀打車、發微博、查詢生活資訊、發送信息、查詢出行信息、打開系統常用開關、播放/查找音樂、查找餐館、百科搜索、查找菜譜、使用高德地圖、查詢天氣、打開應用查找地圖、搜索、打開常用網站、查詢股票、查看幫助共22個場景。
但實際上,用戶對于智能手機中語音識別并不在意,日常使用頻率很少。其主要原因在于在大部分場景中,語音識別式的交互仍存在技術和用戶體驗上的一些問題。首先是啟動問題,用戶既然可以使用觸控的方式去啟動手機上的語音識別功能,然后輸入語音去完成某項操作,為什么不直接靠觸控去完成想要進行的操作呢。在這點問題上,可以看到華為做了些許努力,華為的語音助手支持語音喚醒和藍牙耳機按鍵喚醒,雖然功能基本實現,但識別率仍較低。根據使用習慣,藍牙耳機按鍵喚醒則更適用于駕駛環境中,但筆者使用魅族的EP51藍牙耳機連接后,發現并不能通過耳機按鍵喚醒???
到目前為止,語音識別的準確度都已較高,在語意識別上的相關研究也正進一步推進,但最大的問題在于通過語音識別進行人機交互的隱私性太弱。與傳統的觸控操作不同,語音交互相當于直接把自己的操作過程和意圖暴露到使用環境中去。想想自己在上班的時候,在工位對著手機說:幫我查一查xxx股票/幫我發一個微博。相信大多數人都不會選擇這么干。
相比智能手機上的語音識別,近期在家庭生活場景中,以智能音箱的身份出現的語音識別似乎更能引起人們的注意力。畢竟在家中不必擔心旁人聽到自己都干了什么。
小米AI智能音箱
筆者曾在小米之家調戲小愛同學,不僅由于在家庭生活場景中,可以直接或間接地與各種智能硬件、家用電器等實現一對多的連接??梢哉f語音識別在從可玩兒到可用慢慢轉變。而且其不僅僅從簡單的語音識別切入,而是以語音+智能場景(硬件)的方式切入,類似于目前家電企業的“智慧家居”。
相信看過鋼鐵俠的都知道托尼的賈維斯智能管家是多么酷炫和強大的存在。而且在家庭生活中,似乎更適合使用語音的方式進行交互,做法的時候可能想把電視關掉,而此時手已經沾滿了水,你只要說一聲就好;睡下的時候忘了給空調定時,又不想去拿遙控器,你只要說一聲就好;而且也不會存在隱私暴露的情況。智能音箱已經不僅僅再是一個語音識別的工具,而是作為一個多設備控制器的形式進入我們生活中,語音僅僅是作為適用于這個場景的一種交互方式。畢竟你肯定不希望得到的是一個集空調、電視、頂燈開關于一體的有著數不清的按鍵的超大遙控器。
相比生物特征,通過生物電來進行人機交互,了解的人并不是很多,可以說這是一種未來的交互方式,大部分仍處于實驗和研究階段。由于筆者曾在某電子科技大學主修生物醫學工程專業,對此方面有一定了解。
生物的器官、組織和細胞在生命活動過程中發生的電位和極性變化。它是生命活動過程中的一類物理、物理-化學變化,是正常生理活動的表現,也是生物活組織的一個基本特征。人類在進行各項生理活動時都在放電。心臟跳動時會產生1~2毫伏的電壓,眼睛開閉會產生5~6毫伏的電壓,而思考問題時大腦會產生0.2~1毫伏的電壓。
生物電信號經過采集、濾波、放大后可作為特定的輸入控制信號,從而組成人-機系統。
生物電在人機交互中,同樣既可以作為身份鑒別特征,也可以作為控制輸入。
大家平時接觸較多的是心電,每個心電周期的曲線都由一個P波、一個QRS波群、一個T波、一個U波,由于個體的年齡、行別、體重以及心臟的大小、位置、結構以及胸腔結構存在或大或小的差異,這些差異會作用于心電周期內的某個波上,因此在大的總體特征下,每個人在不同的波段的波峰、波谷又存在一些個性特征。通過提取、比較細微的個體差別,就可以通過心電進行身份的鑒別。這一點在實驗室已經成功實現,相比指紋識別、面部識別,心電身份識別的隱私性和可復制性更低,有著更高的安全性。而且華米的米動健康手環已經搭載這一功能,但僅僅是作為beta版的功能上線,識別精度和識別速度上仍有不少問題。
與心電不同,肌電信號多用于控制輸入,不同的肌肉運動會產生不同的肌電信號,將不同的肌電信號作為輸入便可進行操作和控制,相當于可以凌空進行操作,不必說話,也不必接觸被控制器,只需一個信號采集器,便可通過無線方式進行控制。也許旁人看到你在手舞足蹈,但其實你只是在切換歌曲或者切換電視節目。由于生物電信號及其微弱,信號采集后干擾信號較多,需要進行大量的放大、濾波操作。所以信號采集處理設備很難做到體積微小。這也是目前限制其發展的一個主要原因。
通過肌電信號控制的智能手表
相比心電、肌電,腦電的開發前景可以說是沒有盡頭。個人認為,也是人機交互的終極。
首先,腦電可以像心電一樣作為個體特征進行身份識別,簡單點說,我每次在腦海中想象我的手和你每次在腦海中想象你的手所產生的腦電信號是具有個體特征的,也就可以用做身份識別了。
另外,腦電還可作為控制輸入,可以實現所謂的“意念操作”,通過想象不同的物體、動作、詞匯,產生的腦電信號經過放大、濾波后作為控制輸入信號。當然目前也是僅僅停留在實驗室階段。相信技術成熟后,對殘障人士將會產生巨大的幫助,在人機交互中,也有不可估量的發展前景。到那一刻,你不必用手去觸摸,也不必說話,更不必手舞足蹈,只需冥想。
通過腦電信號控制的“意念小球”
可以說,人機交互的方式隨著科技發展在漸漸脫離雙手,脫離肢體,轉向“全面交互”。
作者:孤星守月
來源:http://www.jianshu.com/p/a8e296669d10
本文由 @孤星守月 授權發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自PEXELS,基于CC0協議
- 目前還沒評論,等你發揮!