谷歌助手點餐,微軟小娜下單:AI橫行的未來世界里沒有人類什么事
機器人和機器人之間的交流,摒棄了任何人類的從中參與。而沒有人類的參與,也就同時意味著,這當中的任何一個過程都不由人類來創(chuàng)造價值。
國內(nèi)用戶基本上已經(jīng)熟悉了在手機上下單訂餐,不過很多美國人依然習慣直接給餐廳打電話訂位或訂餐。
不過,如果有人對自己的手機說,想吃什么地方的什么菜,這個手機能夠代替你,自動給餐廳打一個電話,用電腦合成的語音跟餐廳服務員點餐,那該是何等令人驚悚的景象呢?
這個時候如果我告訴你,餐廳接電話的服務員也是一個機器人,只要兩個機器人之間語音通話,就能把餐送到你的面前,你這個時候又會怎么想呢?
一、谷歌替用戶點餐
當?shù)貢r間 5 月 8 日,2018 年谷歌 I/O 開發(fā)者大會在谷歌園區(qū)召開,會上演示的最驚悚的一項技術,大概就是使用谷歌助手(Google Assistant)生成一段就像真人一樣打電話的語音。
這個 AI 助手能夠用自動生成的語音與真人理發(fā)店店員,或快餐廳接線員進行對話。甚至,谷歌助手還在對話中展現(xiàn)出了強大的糾錯能力。
在后一個演示的例子中,接線員英文不太好,沒有聽懂谷歌助手的訴求,對話過程是零散而混亂的。然而接線員的每一次理解失誤,都能夠被谷歌助手一一發(fā)現(xiàn)并糾正。
谷歌助手:我想定一個位置,在下周三,7 號。
餐廳接線員:7 個人嗎?
谷歌助手:4 個人。
餐廳接線員:4 個人的話,哪一天,今晚還是明晚?
谷歌助手:下周三。
親自負責演示的谷歌 CEO 桑達爾·皮查伊(Sundar Pichai)說:
“令人驚訝的是,谷歌助手能夠理解對話里的細節(jié)之處?!?/p>
皮查伊將這一融合了語音-文字互轉、語義理解、深度學習三大技術的功能稱為“Google Duplex”(Duplex 有電信技術中的“雙工傳輸”之意),計劃今年夏天提供給谷歌助手用戶測試。
二、小娜做餐廳員工
無獨有偶,航通社曾在2016年11月參加過微軟中國的一次技術交流會,微軟展示的一個技術原型,則是讓店員和顧客之間的對話過程轉換為文字,同時即時抽取出菜單細節(jié)。
在一家麥當勞“得來速”(Drive Thru)汽車餐廳(司機不用下車即可點餐),服務員與顧客之間的對話,立即被語音識別轉換成精準的文字,并且通過 AI 運算提取了客戶描述的關鍵信息,不需服務員操作即可自動生成訂單。
顧客:我想要兩份快樂兒童餐,一個是吉士漢堡的,一個是雞米花的,這倆都要加薯條和蘋果片,一個配巧克力牛奶,另一個配小橙汁。
系統(tǒng)訂單:1 快樂兒童餐(主食:吉士漢堡包,小食:薯條、蘋果片,飲料:巧克力牛奶)+ 1 快樂兒童餐(主食:雞米花,小食:薯條、蘋果片,飲料:橙汁)
服務員:嗯。
顧客:再來單點兩個吉士漢堡,這倆都不要洋蔥,其中一個也不要番茄醬。
系統(tǒng)訂單:1 快樂兒童餐(主食:吉士漢堡包,小食:薯條、蘋果片,飲料:巧克力牛奶)+ 1 快樂兒童餐(主食:雞米花,小食:薯條、蘋果片,飲料:橙汁)+ 1 吉士漢堡包(特殊要求:不要洋蔥)+ 1 吉士漢堡包(特殊要求:不要洋蔥,不要番茄醬)
顧客:還有……一個薯條,一杯大杯咖啡,要兩個咖啡伴侶,三包糖。
系統(tǒng)訂單:1 快樂兒童餐(主食:吉士漢堡包,小食:薯條、蘋果片,飲料:巧克力牛奶)+ 1 快樂兒童餐(主食:雞米花,小食:薯條、蘋果片,飲料:橙汁)+ 1 吉士漢堡包(特殊要求:不要洋蔥)+ 1 吉士漢堡包(特殊要求:不要洋蔥,不要番茄醬)+ 1 薯條(尺寸:大)+ 1 咖啡(尺寸:大,特殊要求:2 植脂末,3 糖包)
服務員:好的,謝謝。
在屏幕左側生成對話語音轉文字記錄的同時,屏幕右側結構化提取的訂單信息也在即時改變。如果顧客臨時新增或修改了對某個產(chǎn)品的要求,那么也會把結果及時的顯示在屏幕上。服務員不需要按動手指去選擇所點的產(chǎn)品,就可以生成一份訂單。
當語音合成技術足夠成熟之后,像案例中這位人工服務員跟顧客交互的過程,就可以轉換為電腦語音實現(xiàn)。這樣,一家無人值守的麥當勞汽車餐廳就初具雛形了。而更值得注意的是:這段演示的技術是 2016 年就已經(jīng)達到的水平。
三、除了生產(chǎn),消費也將由 AI 代勞?
很顯然,如果把自動詢問和自動應答的方式結合起來,那么不僅點餐員可以由機器取代,就連去點餐的顧客這個角色,也有語音助手來取代了。
當谷歌助手所代表的顧客,向微軟小娜(準確的說法是 Bot Framework)所代表的店家來點餐的,就會出現(xiàn)這樣一幅無比戲劇性的場面:一個機器人向另外一個機器人點餐,最終把點好的餐送給主人。
——在整個過程當中,沒有人類什么事情。
兩個例子之間僅僅相隔 2 年多,語音助手的巨大進步令人吃驚。其中,最值得注意的突破,自然就是:讓助手記住上下文,進行連貫的,首尾相關的對話。到現(xiàn)在,谷歌助手所演示的對話已經(jīng)難以和真人在同一場景下能說的話區(qū)分。
或許今后唯一能夠區(qū)分的線索就是:機器所生成的對話非常完美,不會有任何的停頓與錯別字之類的東西,就像念稿子一樣,完整而不間斷的準確表達。但我相信,如果人類想要的話,讓機器再附加上一些人類才有的中斷,卡殼現(xiàn)象也是不難的。
實際上,一旦 AI 理解了一個來自主人的訂單需求之后,將其標準化,并直接使用數(shù)字表單的方式提交訂單,當然是更簡便,也更容易被機器理解的做法。似乎把它轉換成語音實在是多此一舉。
不過這種技術目前還是有一定用武之地的,主要是因為不能期望所有飯館和小商販,都有可適配的在線訂餐系統(tǒng),也許只是打電話給一個路邊攤什么的,總還是需要與真正的人類打交道。
但是比起使用價值,無論如何都不能抹殺的,是這種語音交互所體現(xiàn)出來的強烈的符號意義。機器人和機器人之間的交流,摒棄了任何人類的從中參與。而沒有人類的參與,也就同時意味著,這當中的任何一個過程都不由人類來創(chuàng)造價值。
根據(jù)樸素的“多勞多得,按勞分配”的理念,如果不能為社會創(chuàng)造價值,一般來說,又沒有什么理財或經(jīng)營手段的話,人們就會沒有收入來源,因而陷入貧困。
傳統(tǒng)意義上,拯救這些窮人的方法,是讓他們達到所謂的“自食其力”。然而,越是最基層的工作,就越會加速由機器人替代。
其實,機器人替代人類勞動之后,最大的問題并不是人類不能工作了,而是生產(chǎn)出來的東西,沒有那么多的家庭買得起,消費得起了。也就是說,在消費者是誰這個問題上產(chǎn)生了麻煩,做出來的東西大家都享受不起,而唯一能享受的只有機器人。
最終,可能如同占有生產(chǎn)資料的資本家和普通老百姓之間的差異一樣,是不是買得起一個機器人,或者簡單點,買得起幫自己提高生產(chǎn)力的 AI 程序,一開始只是個小小的差異,最終卻可能影響到不同人和家庭的社會分層。
機器人替我們說話,幫我們跑腿,他們?yōu)槭裁床荒艿玫綉械幕貓?,非要把勞動成果拱手讓人呢?而由這些機器人平白無故創(chuàng)造出來的財富,是理應屬于它的所有者,還是屬于溢出的剩余價值,要合理分配給社會大眾呢?這都是人們將不得不思考的問題。
谷歌和微軟分別進行的兩項技術測試,只是在告訴人類的倫理學家和政策制定者們,留給他們思考的時間不太多了。
作者:航通社,微信ID:lifeissohappy ,微信公眾號:航通社 ,微博:@lishuhang
本文由 @航通社 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉載
題圖來自網(wǎng)絡
沒人類什么事,那AI服務誰呢