攝像頭“讀臉”的另一種打開方式
用戶們對被攝像頭“讀臉”這件事如臨大敵,擔心自己的隱私被泄露;而這卻并沒有影響科技公司攻克心情識別技術的一片“初心”,積極攻克攝像頭心情識別技術難關。矛盾之下,如何雙贏?
攝像頭早已與人們的生活密不可分,AI相關的技術也是赫赫有名。但如果有人告訴你,開發者們能調用電腦或手機上的攝像頭識別你的面部情緒,你是會為更多人/機器了解你而感到刺激和開心,還是油然而生一種抗拒和不安全感?
反正我是后者。
畢竟互聯網公司或者黑客利用攝像頭獲取用戶隱私的事故,多的足夠寫好多本“科技恐怖故事會”,連起來繞地球幾周了。不過,用戶們對被攝像頭“讀臉”這件事如臨大敵,卻并沒有影響科技公司攻克心情識別技術的一片“初心”。
一、初心易得,始終難守:用戶與攝像頭的對決
最近,視頻播放器Bitmovin 上線了觀眾感知功能。
在播放視頻的時候,它會打開攝像頭,觀察正在看視頻的觀眾。通過面部表情來分析、衡量用戶對廣告內容的情緒反應,如果用戶對產品布局表現出積極的面部反應時,就顯示廣告;如果用戶正沉浸在痛苦或不適中,就不顯示特定的廣告。
看起來似乎還挺人性化的。
不過,心情識別技術早就不是什么新鮮事了。之前The Sync Project 、emo 就以此方式來推薦音樂,可口可樂也曾用檢測表情的辦法做過營銷活動。除了商業用途,還有不少有意思的應用場景。
比如:卡內基·梅隆大學的研究人員,就用IntraFace來進行分心狀態檢測。一旦駕駛員在開車時去哄孩子、接電話等,就會遭到軟件的警告。
那么,這個神奇的“讀臉”技能究竟是怎么實現的呢?
簡單來說:就是調用攝像頭,實時監測畫面中人物的面部位置,采集眉、眼、鼻、嘴和面部輪廓的變化數據,然后通過機器學習訓練出實時更新的算法模型,進而判斷出他們的情緒狀態。
在Bitmovin的視頻感知功能中,系統在完成判斷之后,還會驅動各個功能模塊進行動作,比如播放調整、控制廣告等等。
盡管心情識別技術看起來是如此有用,但似乎很少有人會認為,情緒感知是一個未滿足的需求。通過很多其他的解決方案或者技術路徑,似乎都可以做到差不多的預測用戶喜好的水平。
為此迎來一個連表情都被實時監控的世界,實在有點得不償失了。尤其是商業組織進行“讀臉”,會更強烈地引起不適。問題的關鍵在于,企業通過攝像頭對用戶的表情進行收集和分析,本質上是一種單向消耗。
只有企業自身從這一行為上真實地獲得了大量收益,比如推薦更多更精準的廣告,引誘用戶進行消費。
對于用戶而言,網上沖浪的體驗并沒有因此變得更好,甚至可能更糟,又憑什么要求大家用“臉”買單呢?
二、世上哪得雙全法:攝像頭心理戰,有沒有“雙贏”的解法?
當然,這么說對科技公司來說也有點過于刻薄了。畢竟很多負責任的公司都為之做出了不少妥協和努力。
比如:允許用戶選擇在使用應用時才能訪問相機,或者在狀態欄顯示攝像頭活動狀態,在拍照或攝像時發出提示音,有的手機在攝錄時攝像頭還會自動浮起來……盡管效果看起來都不盡如人意吧,但至少人家努力了??!
要從根源上解決用戶與企業圍繞攝像頭展開的拉鋸戰,讓“讀臉”這件事顯得不那么冒犯,還是要在消耗用戶和服務用戶之間,找到一個“雙贏”的最優解。
幸好,心情識別技術的應用范圍非常多,絕不是只有互聯網世界才可以討論。所以我們不妨思考這樣一個可能性,如果讓現實世界里的攝像頭具備感知能力,能不能激發更大的想象。
答案顯然是值得樂觀的。
最近特別火的無人零售,就需要生物識別來幫助AI系統了解消費者。
比如天貓的無人超市,就曾推出過“Happy購”情緒營銷。貨架上的攝像頭能夠及時捕捉用戶的表情,并根據情緒幅度,快速計算對商品的偏好程度,進而給予不同的優惠折扣。
在另一類商業場景中,也非常需要能夠看懂表情的攝像頭,那就是線下娛樂。
娛樂消費的盈利模式,就是依靠調動受眾的情緒進行內容變現。通過攝像頭感知用戶的情緒變化,進而調整商品或服務,埋藏著不少讓人驚喜的“彩蛋”。
簡單舉幾個例子,比如鬼屋/密室逃脫等娛樂項目。
為了保證玩家在封閉體驗區的安全,攝像頭本來就是標配,而通過感知玩家的情緒變化,可以及時反饋來迭代游戲體驗。一些自以為很恐怖,結果大家內心毫無波動還有點想笑的項目,就別拿出來丟人了。
還有,就是電影試映會或分級制,可以通過小規模的觀影活動,借助攝像頭來實時收集真實的觀眾反饋,減少“人情分”“看完忘了”“被營銷號帶節奏”之類的無效操作。
哪些作品比較受大眾喜歡,哪些鏡頭會引起兒童不適,都可以通過情緒識別進行量化分析,告別“拍腦袋”決策。
還有就是一些文娛演出場所,比如京劇、相聲、音樂會、話劇等等,這些劇目最需要觀眾的臨場反應來調整和迭代演出內容。但傳統的“人肉統計”顯然有點落后了,攝像頭完全可以代勞。
可以看出:情緒識別技術的應用場景是多種多樣的,橫亙在豐滿理想和殘酷現實之間的,說到底還是企業與用戶的利益之爭。要改變“讀臉”人人喊打的現狀,一是讓用戶也能在技術融合中真實受益;二是企業通過應用告知、合理授權、數據脫敏等方式,贏得公眾的信任。
讓攝像頭讀懂喜怒哀樂,或許并不宏大看到這里,想必優秀的小伙伴已經發現了一個問題——既然攝像頭感知在現實中有諸多用處,為什么還沒有普及開來呢?
我來搶答一下:“讀心術”只是攝像頭進化的第一步,想要大規模應用,情況就復雜地多了,只能先從小打小鬧開始。
1. 有限的終端算力
目前常見的智能攝像頭大多還在從事監控、安防之類的基礎工種。要對復雜場景進行多目標的實時識別和分析,終端算力還無法支持。當然,也可以將視頻送到云端去處理,這樣又會帶來高延遲和數據安全性的問題。
因此,心情識別技術想要大規模應用,還為時過早。
2. 跨地域的隱私授權
如今各個地區都在加強隱私建設,以“史上最嚴”的歐盟隱私法案(ePR)為例,要收集必要的用戶數據之前,必須征得畫面里所有用戶的同意,否則將被禁止處理該數據。試想一下,在人流量密集、流動性強的區域去完成這樣的授權工作,幾乎很難被執行。
當然,這些問題正在不斷地被技術和企業們解決。比如集合了云端計算、邊緣計算、端側計算的一體化部署方案,能解決攝像頭算力不足的難題。而對隱私敏感的用戶指責,則可以通過主動限制釋放“讀臉”技能來規避。
比如前面提到的:只在小型場景、知情的情況下進行情緒讀取。只要面臨“用還是不用”的道德糾結,果斷選擇不用,總是更加穩妥。
亞馬遜的無人超市Amazon Go,就沒有國內無人便利店、盒子常見的拍臉環節,用戶只需掃碼就能進入。而店內的100多個攝像頭也只是捕捉身體動作的視覺線索,判斷分區和動線是否合理。
總而言之:攝像頭的心情感知能力,固然可以化“自私”為“雙贏”,但大規模應用還是很遙遠的事情。而且在新的規則完善之前,還是得把它關在籠子里。
愛,即是克制——這或許是讓人類與攝像頭之間建立信任最快的捷徑。
作者:腦極體,微信公眾號:腦極體
本文由 @腦極體 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!