人體輔助,AI落地的另一種可能

0 評論 2699 瀏覽 5 收藏 12 分鐘

想要實現殘障人士的“殘而不障”,人體輔助是一條被忽略的垂直賽道,這也是AI落地的一種可行方式。

(說明:本文并非創業報道,而是對具體場景的需求分析。為避免產生相關誤解,已將相關公司、產業和業務名全部去除)

近期,《時代周刊》公布了2019年的100大最佳發明。

最引人注目的一欄是“Accessibility”、人體輔助功能。這一項目里,由會說話的AI助聽器、眼控技術、智能手杖、智能假肢、視聽轉換等。

當人工智能還是很多上市公司哄抬的概念、vc口中的風口、專家手中的炫技、自媒體們筆下渲染的惶恐未來時,有一些人已經開始做出實際的行動,瞄準的是一個痛得不能再痛的垂直痛點。

在大洋的另一端的中國,同樣的項目和故事開始上演,先來看兩個案例。

一、看不清的公眾號運營

小雨(化名,以下同)是一個配音演員,患有視力障礙,平日里卻在運營微信公眾號,這是如何做到的?

曾幾何時,小雨是一個風華正茂、前途一片光明的大學生,彈了十多年鋼琴,正在考駕照,愛好戲劇和表演,喜歡畫水彩,對未來充滿想象。

但是命運卻在剎那急轉,起因是瞳孔出血,接著是一次小手術的失敗引發了不可逆轉的后果,作為一個彈慣了肖邦莫扎特、心靈手巧的女孩子,忽然間鋼琴上的按鍵她一個都看不清了,那一年她才19歲。

她撕光了所有畫不下去的水彩畫,把看見看不見的東西踢得粉碎,帶著對這個世界滿滿的恨意。

小雨是不幸的,但是她很倔強。在混沌迷茫的世界里,她依然保持著搜羅各種劇本的愛好,開始給其中的人物配音,但是劇本上密密麻麻的小字,如何看得清?

好在一些屏幕閱讀軟件可以把文字轉化成聲音,諸如訊飛輸入法這樣的APP,可以精準地把語音轉化成文字,這樣她每一個新奇的點子都不會忘掉了。

就這樣,在視覺墮入混沌之后,“聲音文字的互轉”成了她和世界交互的關鍵紐帶。

她給動漫配音的事業很快走上軌道,一邊運營起了視障主題的公眾號,她還是那個激情洋溢的女孩,她很堅強。

這是一個溫暖的案例。

在中國,大約有6000萬肢體障礙、視力障礙和聽力障礙者,更廣義的殘障人群則達到了總人口的6%。人工智能技術正在幾個方向上迅速突破,致力于解決他們面臨的核心問題:

一是如何讓他們看見?

通過文字識別技術,看不清的文字都可以轉為語音。通過圖像識別技術,看不清的人或事也可以轉化為語音的描述。

二是如何讓他們書寫?

通過語音語義的識別,他們的聲音可以轉換成文字。

三是如何讓他們更方便地生活?

這里有很多細節。比如常見的網站登錄圖像驗證,需要滑動拼圖驗證碼,他們怎么辦?常見的人臉識別需要眨眼睛,他們怎么辦?

當然,這些技術在發展中依然面臨諸多困境,文字識別往往需要視障人士拍照聚焦、可他們怎么聚焦?很多不規范的手寫字能不能識別出來?語音語義的識別能否絕對準確,方言能不能聽得懂?

二、聽不見的三辯

在廣東,殘障人士有一個練習溝通表達的表達社,表達社里出了一個“最佳辯手”。這個男生擔綱三辯,可以和正常人唇槍舌戰,盡管他是一個聾子,聽不見任何聲音。

聽不見任何聲音,包括自己的說話聲,如何與常人辯論呢?

換一個角度說,在中國約有2.1億人患有聽力障礙,其中7200萬人患有中等以上聽力障礙,通過助聽器、人工耳蝸獲得有效助聽服務的只有2.5%。

好在AI迅猛發展,人們有了很多辦法,比如開發專業的聽力障礙APP,可以有這樣的功能:

  • 字幕聊天,別人說的話(線下、視頻)可以即時轉化為文字,這樣一來就交流無障礙了。
  • 語言康復訓練,通過語音識別、合成和評測,幫助聽障人士重新開口,練習普通話,通過拼音、詞語、句子、文章循序漸進。

比如廣州的這位最佳辯手,就是通過專門的APP實現了與正常人的話語交鋒,對方辯友的聲音都第一時間轉化為文字,而長期語言康復訓練的他已經可以直接“回懟”了。即便張開口來,聲音還不夠標準、自然,但這已經是非常了不起的一步了。

圍繞這個人群,還有另一個困境:聾啞人士常常通過手語交流,但是對普通大眾來說,手語有如天書。在美國,手語翻譯的比例是1:120,但是在中國,這個比例遠遠小于1:10000。

這樣一個痛點該怎么解決?

國內的公司已經進行了很多探索,一個解決方案是智能手環,聾啞人士戴上后,手環可以自動識別跟蹤人手的肌肉信號,把手勢轉化為文字和動圖。

但是面前有兩大疑難:

  1. 一是需要龐大的手語數據庫,這不是一朝一夕可以完成的;
  2. 二是如何適應聾人手語與眾不同的語序,如何區分同一動作在不同語境和表情下的不同含義,是否引入自然語言處理的算法?

三、人體輔助的場景分析

在《時代周刊》的榜單中,可以看到這樣一些案例:

orcam myeye2這樣的輔助攝像頭,可以直接夾在用戶的眼鏡上,只要用手指指向想看的東西,設備就可以讀取上面的內容,不僅有文字,還可以識別人臉和物體顏色。

wewlk智能手杖內置傳感器、揚聲器、語音助手和導航,還能用超聲波檢測胸部上方的障礙物并震動警告。

智能假肢更是將腦機接口推向落地,用戶可以直接像手一樣控制,且假手具備感知能力和自主智能。樹洞行動發起人黃智生說:“人工智能技術的進步所取得的經濟效益要充分導流到弱勢群體那邊,讓他們充分受益?!?/p>

殘障人士是不幸的,命運無情剝奪了他們與常人共處的一些能力。但萬幸在這個時代,人工智能技術的突進正在打破藩籬、填平溝壑,于是一些歷史上不可想象的事情發生了。

  1. 其一,文字轉語音,圖像識別轉語音,視覺障礙人士可以“聽到”更多了。
  2. 其二,語音轉文字,手勢轉語音,聾啞人士可以與正常人交流了。
  3. 其三,對于肢體殘障人士,智能聲控輪椅正在成為一種新的可能。

圍繞“無障礙”的目標,人工智能領域的大公司在行動。

騰訊發起“信息無障礙”行動,視障用戶可以用聲紋加好友,圖片語音描述功能可以幫助他們“看見”圖片,并且圍繞語言障礙人士身份認證需求優化粵事省小程序。

阿里發布助殘報告,17萬殘疾人在淘寶天貓開店,三年銷售額近300億,阿里巴巴達摩院與清華大學人機交互實驗室推出了為盲人研發的智能手機膜。

17年以來,科大訊飛發布了“三聲有幸”公益計劃,從資金到技術,對涉及殘障人士的項目進行扶持,對很多語音文字交互的項目無保留地開放底層技術。在1024開發者節上,相關的技術和案例展示感動了很多人。

在國外,亞馬遜、谷歌和蘋果的智能音箱成為殘障人士的福音,自動駕駛的技術推進也為殘疾人的出行帶來新的助力。

“雖殘不障”正在成為現實,但是這一進程的演進仍然緩慢,人體輔助是一條被忽略的垂直賽道,產品和商業模式卻非常清晰,討論這一公益領域的商業構成本身并不違和。

從市場前景看,基于AI的人體輔助是康復醫療行業的未來。根據前瞻產業預測,2022年康復醫療行業的市場規模將達到1033億元。

從需求和產品模式看,人體輔助的解決方案正在迅速成熟,針對的就是殘障人士日常生活溝通的需求和痛點,更像是盲杖、助聽器和義肢的智能升級,其使用效果伴隨著數據積累和算法迭代不斷升級。

從行業前景看,殘障人士的“殘而不障”將與更多的新技術結合,與物聯網技術結合帶來更多的智能硬件和可穿戴設備,與機器人技術結合帶來更多的陪伴和康復機器人,與VR結合實現更多的情境模擬訓練。

當然,基于AI的人體輔助也面臨著比較顯著的問題:涉及的算法和數據要求較高,不是一般創業公司可以hold住的。

或許一個比較好的模式是:由政府牽頭、大公司參與,去完成一些底層基礎設施和數據庫的構建,比如語音圖像手勢的底層數據、語義分析的算法,并對外開源,比如訊飛、百度的開放平臺;由更加垂直的創業公司去深挖,研發出更多兼具針對性和價格低廉的解決方案。

#專欄作家#

張俊,微信公眾號:阿辯論(ID:bianlunlove),個人微信13385698365。人人都是產品經理專欄作家。上海帥醒創始人,專注社交傳播、事件營銷、商業預測分析和產品開發。

本文原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!