科大訊飛華南研究院執(zhí)行院長劉舒:“AI+”時代,產品經理能力模型
近日,由人人都是產品經理與騰訊大講堂聯合主辦的2018中國產品經理大會深圳站完美落幕,科大訊飛華南研究院執(zhí)行院長、訊飛易聽說總經理 劉舒做了“AI+時代,產品經理能力模型”的主題分享,并引發(fā)探討:整個AI行業(yè)的產品經理從業(yè)者,應該具備哪些能力模型?enjoy~
分享嘉賓:科大訊飛華南研究院執(zhí)行院長、訊飛易聽說總經理 劉舒
以下內容為嘉賓分享實錄,由人人都是產品經理社區(qū)@Daisy 整理編輯,部分內容有修改,嘉賓已確認:
16年我曾提到,互聯網時代的“流量暴利”已經消失了,所以當時提出了“互聯網+行業(yè)”這個命題?;仡櫼幌逻@兩年多的發(fā)展,我們可以看到這樣的命題實際上是成立的。
最近兩年多,那種因暴利連接的產品其實已經是消失,取而代之的是垂直細分行業(yè)里生根的一些企業(yè)。其中,我們最重要的是要對行業(yè)知識進行一些理解,從而提升它的效率。而人工智能就是在“互聯網+行業(yè)”的過程中引發(fā)出來的新一輪革命。到了2018年,人工智能實際上已融入到了我們生活中的方方面面。
所以,今天我也是希望結合這兩年多的一些從業(yè)案例,以及對人工智能的一些思考,在此跟大家做一個主題分享《“AI+”時代,產品經理能力模型》,主要分為三個部分:
- AI時代的來臨
- AI的前世今生
- AI產品經理的三大能力模型
一、AI時代的來臨
1. 從國家層面上來看
無論是美國,還是中國和歐盟,都陸續(xù)發(fā)布了有關人工智能的國家戰(zhàn)略;對于互聯網來說,這是一個很重要的事件:
2017年7月20號,國務院發(fā)布了新一代人工智能的發(fā)展規(guī)劃,這是國務院首次以行政規(guī)劃的方式發(fā)布產業(yè)發(fā)展規(guī)劃。從這一點上可以看出:中國正在以舉國之力搶戰(zhàn)AI的制高點。
2. 從行業(yè)層面上看
大家可以看到:無論從國家還是從行業(yè)的層面上,AI都已經到來。
無論是麥肯錫,還是科學雜志、德勤,以及埃森哲的一些報告,大家都紛紛預言:人工智能在未來會更多地取代人類現有的一些工作,并且使得人類社會的生產效率變得更高。對此,大家也感到了一些擔憂,比如就業(yè)率會進一步地下跌——或者說失業(yè)率會進一步地上漲。
3. 從生活層面上看
AI并不僅僅停留在國家層面和行業(yè)層面,也融入到了我們生活中的方方面面。
從上圖我們可以看到,AI現在確實很火。
而對于想要從事AI的產品經理來說,該抓哪些重點呢?
首先要了解AI技術的發(fā)展演進歷程,包括它的一些技術原理和技術邊界;只有這樣,我們才能更好地去設計產品。
所以,我們先看下AI的前世今生。
二、AI的前世今生
AI其實并不是這兩年才出現的,它很早就誕生了,但是為什么到這兩年它才開始火起來呢?
1. AI的誕生與AI的成長
在1965年Dartmouth會議上,當時四個圖靈獎的得主聚集在一起提出了十大問題,標志著AI行業(yè)的誕生:
自此之后,AI一共經歷了三次浪潮:
70年代和90年代,由于算法結構及當時的計算能力因素,在當時行業(yè)的應用上、效果上,都沒有達到一個很有效的效果,所以前兩次浪潮都是潮起潮落。
隨著這個深度學習的出現,歷史上的一些問題得以被解決,且取得了超前的好成績。比如語音識別、圖像識別等,都比傳統(tǒng)算法有更好的實用效果。因此,我們遇到的AI才變得實用,從而帶到生活中。
所以,我們認為這一次是人工智能真正到了爆發(fā)的時候。
那么,什么是深度學習?
接下來,我就會用一些簡單直觀的例子,對深度學習做一個詳細分解:
首先,深度神經網絡本質上是一個分類器,它是模仿人的感知過程。
如上圖,這是一個簡單的深度神經網絡。從左往右看,整個深度神經網絡是一個函數(F就是一個函數),左側的“1”和“-1”,我們稱為輸入的特征或者輸入的向量;右側的“0.62”和“0.83”,我們稱之為它輸出的一個結果。
在這個案例當中,“0.62”和“0.83”實際上是屬于不同分類的概率。相當于圖像識別中的“這個是男人還是女人?”。
那么,證明他是男人的概率為0.62,她是女人的概率為0.83。
所以,深度神經網絡就是:每一個輸入經過深度神經網絡的運算后,最后得到它在不同分類的概率;而它的本質就是輸入一個特征向量,即“1”和“-1”。
換言之,通過深度網絡的逐層運算,最終得到該向量屬于不同類別的概率。
至于如何定義這個類別?
- 比如語音識別:屬于哪個中文字?屬于哪個發(fā)音?這些都是分類;
- 比如人臉識別:是男是女?他年紀多大?這些都是分類;
- 比如自動評測:它得多少分?他得100分還是得0分?這也屬于分類。
所以實際上,深度神經網絡的核心就是解決一個分類的問題。
那么下面我們怎么來使用這個深度神經網絡?
它一般分為三步走:
操作步驟1:準備標注數據
第一步,我們稱之為叫標注數據。
剛才這個神經網絡當中,進行逐層計算的時候,中間都有很多參數,那么這個參數是怎么得到的?
舉一個數字識別的例子:假設我要識別一個圖像,它里面寫了0~9這十個數字。如果這個圖片的像素點上有值,我就認為它是“1”;如果沒有顏色,白色就認為它是“0”。
這樣一來,我就把一個圖像變成了一個向量——比如它是16×16,那么就是X1到X256。
我會事先準備一些數據,再交給機器去學習,我會事先選出標準“2”。
拿出來后,我告訴這個機器,它的輸出是什么呢?
比如說我準備的標準是“1”,它的輸出屬于“1”的概率是100%;那么它屬于其他數字,比如說2345等,它的這個概率為0,它不可能是其他的數字——所以我會準備大量的數據。
操作步驟2:訓練網格
準備完這個數據以后,我就拿進去,我們稱之為“訓練”,即“訓練”這個網格。
我們準備了大量的手寫體“1”的各種變形、“2”的各種變形、“0”的各種變形……這些是圖像,每一張圖像我們都把它轉化成向量(特征),然后把特征輸到這個網絡里面(右側為輸入);輸出我也是跟機器講好了,比如說第一排的這個數字,無論他怎么寫,最后我認為它都是“1”,屬于“1”的概率是100%,屬于其他數字概率是0;第二行,所有的這種手寫的方式,我認為它都是“2”——相當于把這樣的輸入和輸出,明確地告訴機器,去訓練這個網格。
在訓練的過程中,需要的訓練數據集是非常之大的。
比如在語音識別中,要大量的標注人員準備差不多10^11這么多的語料。而要解決某一個問題,比如說語音識別,要這么多的數據量;解決肺部結節(jié)的圖像自動診斷,又需要這么多的數據量……每一個領域都需要這么大數據量,要提前輸入到計算機里面,然后訓練好這個網格——所以在做AI的時候,這個成本是巨大的。
操作步驟 3:使用網絡
訓練好以后就很簡單了,這個網格就可以叫人工智能,就可以拿來用。
如上圖,這個時候我再拿一個圖片進來(事先不知道是幾),我把它的特征抽出來后,用這個網格一算,最后得出:
- 屬于“1”的概率是0.01(幾乎不可能);
- 屬于“2”的概率算出來是0.99(可能性很大);
- 屬于“0”的概率是0.01(幾乎不可能)。
這樣逐層算下來后,最后我們認為這張圖片就是“2”——實際上,這個網格就可以解決數字識別的問題。
以上就是關于深度神經網絡的一個簡單直觀說明。
2. AI的現狀
如上圖,我們可以看到整個AI發(fā)展的三個階段:
- 第一個階段:計算智能。大數據和云計算技術的出現,使得計算智能機器已經遠遠超過人類,比如說Alpha Go;
- 第二個階段:感知智能。由于深度學習的出現后,人工智能目前已經在大部分的領域能媲美,甚至超過了人類;比如在語音識別、圖像識別等領域。
- 第二個階段:認知智能。這是最重要的一個階段,認知智能就是人區(qū)別于萬物最核心的一個點,比如動物也是有感知的,也能分辨這個是不是能吃的,也能做一些簡單的分類。
那么,這三者的區(qū)別在哪?
我們實際上認為:人類區(qū)別于動物最重要的是想象。
什么叫想象?就是人類能創(chuàng)造一些根本不存在的東西。
比如:
- 什么叫勝利?
- 什么叫失敗?
- 什么叫沮喪?
- 什么叫神明?
這些概念實際上是人創(chuàng)造出來的——通過這種想象出來的概念去凝聚人類,共同去完成一個目標。
目前這個人工智能還沒找到有效的一些模型;因為目前整個人工智能的發(fā)展,更多的是技術在人們已有的一些計算框架下,通過一些仿真學的一些方式,然后讓它的效率變得更高。
因此,我們認為:目前人工智能的發(fā)展還處于前兩個階段,即計算智能和感知智能階段——已經媲美,甚至是超越人類,但在認知領域是有待突破的。
最近這兩三年,感知智能在深度神經網絡出現以后,取得了飛躍式的發(fā)展。
那么在感知智能的應用上,目前已經在哪些領域里面已經非常實用了?
如下圖:
我們簡單地分析了算法的機理,下面我就會結合它的一些特征,然后繼續(xù)分享:在這樣的一個技術框架下,我們產品經理應該具備哪些能力,才能夠區(qū)別于互聯網的產品經理,從而在AI這個領域取得更好的一些成果?
三. AI產品經理的三大能力模型
基于AI的一些特有性,我們來分享一下關于AI產品經理的三大能力模型:
能力1:對AI技術邊界的認知
第一個能力模型很重要, AI產品經理一定要對AI的技術邊界要有很強的認知——因為你對所在行業(yè)技術邊界的認知,直接決定了你設計產品的應用場景。如果你對AI技術的認知深度不夠高,那么你設計出來的產品要么沒人用,要么就累死開發(fā)——所以AI技術是一個很重要的特征,這是基于概率體系。
也就是說,所有的輸入和輸出不是一個確定性的結果。
比如我一個手寫的“2”,對于一般的人理解,這個肯定是“2” ;但是對于計算機,對AI引擎來說,它輸出的是概率,如:
- 輸出屬于“2”的概率是多少?
- 輸出屬于“1”的概率是多少?
- 輸出屬于“0”的概率是多少?
而且有些時候還會犯錯——最后輸出的結果,可能屬于“1”的概率比屬于“2”的概率還大。
這個顛覆了我們原來傳統(tǒng)做軟件、做互聯網的思維。
舉個例子:
在語音識別這個領域,我們的識別準確率在過去十多年是低于95%的。這時候,我能用這個概率去作會議記錄嗎?
這個是不行的——100個字里面錯5個字,甚至可能有些關鍵字都錯了,這個東西不實用。
但是在哪些地方能用呢?比如說K歌的評分,輔助的文字輸入——這種偏娛樂性,對準確率要求不高的一些場景下面,我們就可以使用。
再舉一個大家耳熟能詳的例子:
在圖像識別領域,前兩年特別火的是什么?猜年齡,或者看你長得像哪個明星?——為什么當時這類型應用特別火?因為當時的圖像識別準確率比較低,比如說是低于95%;在這種技術邊界下,我們只能做一些娛樂型的設計。
最近兩年的發(fā)展,在一些特定場景下,我們的準確率能提高到95%以上,甚至是99%。這項人工智能技術,由于它的邊界前移了,往后也提升了,所以使得它的應用場景就變得更加寬闊了。比如現在的安防身份認證,包括用微信領公積金,都是用人臉識別作為密碼,這個的原因在于:人臉識別的準確度,我們經過十多年的努力達到了技術邊界。
這個是很典型的一種場景:
作為互聯網軟件的產品經理,你對開發(fā)說的一句話肯定走到他桌邊,說:“哎,這個功能要多久實現?”
開發(fā)說:“可能要兩個月吧?!?/span>
但如果你是AI產品經理,就不能這樣去問了——因為這樣問就顯得太業(yè)余了;而且這樣的問法,這個產品肯定做不好。
那么該怎么問?
你應該說:“三個月,語音識別率能達到95%嗎?”
你絕對不能說三個月時間能不能搞定語音識別,這時沒有人能回答你什么叫搞定——所以,你要把這個邊界提出來。
而且參與這個的開發(fā)同事肯定會這樣回答,
“三個月,識別率只能達到90%,而且需要標注100萬條數據,需要100個標注師,如果你搞不定這些,那這個準確率也保證不了?!?/p>
所以在AI時代,作為產品經理設計產品的時候,關于技術邊界的認知是最重要的。
能力2:具備行業(yè)相關知識和深刻洞察
作為AI產品經理,第二個能力模型一定是要具備行業(yè)的相關知識和深刻洞察——這一點也是區(qū)別于互聯網其他領域的產品經理。
互聯網創(chuàng)造了新的行業(yè)和規(guī)則。比如「微信」這種通信方式,之前是沒有的,現在創(chuàng)造出來了這樣的一種交互方式;再比如阿里巴巴這種電商,雖然這是從外國引入進來的,但對絕大部分中國人來說,以前是沒有這樣的一種交互方式,所以里面的規(guī)則、操作和一些認知結構全是由互聯網人全新創(chuàng)造的——你會感覺到天地開闊,你設計的每個功能好像全國人民都能用。
但是,AI行業(yè)并不是去創(chuàng)造行業(yè)和規(guī)則;恰恰相反,AI行業(yè)是賦能傳統(tǒng)行業(yè),然后幫助傳統(tǒng)行業(yè)提升。
因此結合上文提到的算法結構來說:AI得有輸入和輸出的數據,你才能夠訓練你的網格。而這個輸入、輸出則是由傳統(tǒng)行業(yè)里面的專家給你提供的。所以,如果你對傳統(tǒng)行業(yè)的認知不深,那么你是無法參與到AI行業(yè)中。
比如:
- 自動駕駛:除了掌握互聯網的技術和算法,其核心是要了解整個駕駛的機械原理,包括對交通法規(guī)的了解等。你不具備這樣的一些行業(yè)基礎的話,光靠AI算法是無法從事這個行業(yè)。
- 智慧醫(yī)療:那么你得了解醫(yī)學的一些病理知識、藥理知識等,畢竟醫(yī)療是一個幾千年的行業(yè);
- 智能客服:你要幫一個電商公司,或者幫一個金融企業(yè)做機器人客服,首先得對這個行業(yè)的一些話術,包括他們答題的一些規(guī)范要做一個深入的了解。
- 智慧法院:要幫助法官去庭審、去審犯人,那么你要對法律知識足夠了解才行。
所以,AI產品經理肯定比互聯網產品經理更加受拘束。
大家一定是要首先理解行業(yè),然后再運用我們的聰明才智,把AI和領域融合起來。因此,這就提出來——了解行業(yè)的痛點和技術的可切入點,1+1的模式是最好的入門途徑。
什么叫1+1?
一般做AI的時候,一定是要找一個行業(yè)專家來合作——當然,這種行業(yè)專家可以是一個團隊,也可以是顧問的形式。比如做教育,一定得跟很多有經驗的教研人員來進行合作;做醫(yī)療,一定時和從事某個細分領域的醫(yī)療專家來進行合作。只有這樣,我們才能真正提升AI產品的使用程度,也才有數據。
能力3:設計創(chuàng)新的人機耦合運營模式
第三點能力,我們稱之為“設計創(chuàng)新的人機耦合運營模式”,AI時代的這個運營模式也是需要創(chuàng)新。
互聯網時代,因為確定性的存在,所有的問題都減少了中間環(huán)節(jié),直達終端用戶,這是互聯網的本質——提升效率。
但在AI時代,你不能這么去做,因為這可能會有問題:
案例1:智能客服——完整工作量降低10%,總體效率提升30%
如下圖左側的這個理想中機器人客服,用戶一上來后面沒人了,就是一個機器人“噠噠噠……”。但現實中由于AI技術邊界的存在,這個對于語義理解的準確性還無法達到很實用。
現實生活中,我們都跟很多機器人對過話,也知道這個機器人的水平基本上就是兩三歲小朋友的水平。如果你認識不到這樣的技術邊界,而要去設計這么一個機器人,在當前這個環(huán)境,你肯定會失敗。
所以,我們提出了這樣的一種方式:指針對AI領域的不完美性,通過“人+機器”一起來做。
如上圖右側的這個模型,現在的智能客服系統(tǒng)是這樣的:用戶打進來以后,把用戶的行為分解成兩種:導航和提問題。
你打到銀行,首先銀行都會先問你:“如果你要問某某某業(yè)務,請按1號鍵;如果你要問某業(yè)務,請按2號鍵……”這個就是分類,這是人工智能解決得最好的一個問題。
現在有一個語音導航,當你進來以后根據你語音識別成文字,再判斷你的分類屬于哪一類問題,自動幫你導航——這個接線員就不用了,而且也不需要用戶一步步地操作。
當用戶進來后可直接用自然語言說話,然后一秒鐘就可以自己導到機器人客服;如果發(fā)現機器人理解不了客戶的話,需馬上自動轉人工客服,這樣一來就稱之為叫人機耦合的創(chuàng)新模式。
這樣的模式,已經被我們大量地應用在金融行業(yè)和運營商行業(yè)。
我們可以看到:完整的工作量降低了10%,就是說有10%的工作是完全被機器人取代了;總體的效率比原來提升30%,即通話時長節(jié)省了30%。
通過這種人機耦合的運營模式,AI才能在這個行業(yè)當中真正起到實際的效用。
案例2:醫(yī)療影像智能檢測——有效降低誤診率
接下來一個案例,我們分析一下理想中的醫(yī)療影像智能檢測:
比如說我們照完了肺部、乳腺等以后影像,就要判斷是否得了癌癥:這個結節(jié)有沒有結節(jié)?有,是哪一種結節(jié)?有沒有癌癥也要做一些判定。
如下圖左側是我們理想中的模型:醫(yī)療這個機器人診斷醫(yī)療圖像傳進來,機器人給結果——但是這樣的路徑是錯誤的。因為我們是基于概率體系的,而機器人也會犯錯;如果你這么去做,那跟以前的做法是一樣的。
人際耦合模式是怎么做?
實際上,我們現在在醫(yī)院里面合作的是右邊這種模式。醫(yī)療影像上傳以后,由人類的醫(yī)生先看,醫(yī)生把所有的圖片以及診斷結果上傳到云端。我們在云端部署一個叫質檢的機器人。
也就是:質檢機器人也來看一次,如果兩者得到的診斷結果是一致,那就是pass;反之,則會讓人類的專家再來仲裁。
通過這樣的方式,能有效到降低誤診率,并且也非常實用。
所以,AI產品經理在設計產品時,不光是要設計功能,一定要預先考慮到產品在應用的時候,它的運營模式是什么。而你如何試用運營模式,是和你對行業(yè)的認知,對技術邊界的認知,以及你的技術在行業(yè)中是否足夠實用等都是息息相關的。
以上為本次大會分享內容。
相關閱讀
雖然很多人都被點名,但很少有人被選中|2018中國產品經理大會深圳站現場報道
AI產品,如何做好從零到一?|2018中國產品經理大會深圳站嘉賓總結
當00后已經18歲,產品運營er如何“永葆年輕”?|2018中國產品經理大會深圳站嘉賓總結
你拼命追求的日活,其實一個公式就搞定了|2018中國產品經理大會深圳站嘉賓總結
用AI工具解構智能零售|2018中國產品經理大會深圳站嘉賓總結
本文為2018中國產品經理大會深圳站嘉賓分享整理總結,未經許可,禁止轉載。謝謝合作
有兩個錯別字,AI識別一下
哈哈,就你皮~
比我記得筆記詳細多了,自愧不如啊,不過你這樣寫確實很累啊,文字很多啊