淺談:YY直播平臺(tái)中內(nèi)容分發(fā)、自然語言對(duì)話NLP的人工智能AI
本文是關(guān)于在直播平臺(tái)中內(nèi)容分發(fā)、自然語言對(duì)話的人工智能AI應(yīng)用。主要側(cè)重其定義、作用、實(shí)現(xiàn)方式,同時(shí)也拋出相關(guān)的資訊及案例進(jìn)行分析。這也是當(dāng)時(shí)面試歡聚YY AI產(chǎn)品經(jīng)理其中六輪面試中第三輪中一些問題的梳理總結(jié),后面拿下了這個(gè)Offer。(由于利益關(guān)系去掉了一些內(nèi)容)對(duì)AI產(chǎn)品經(jīng)理的相關(guān)面試和準(zhǔn)備有興趣的小伙伴,歡迎關(guān)注收藏,不斷更新。
本文目錄如下:
1. 內(nèi)容分發(fā)在直播平臺(tái)中的AI應(yīng)用
1.1 內(nèi)容的審核監(jiān)管
1.1.1先說:問題和風(fēng)險(xiǎn)
1.1.2再看:傳統(tǒng)的解決
1.1.3應(yīng)用改進(jìn):AI
1.2 個(gè)性化的內(nèi)容分發(fā)
1.2.1背景
1.2.2利用AI挖掘出內(nèi)容特征
2. 自然語言對(duì)話在直播平臺(tái)中的AI應(yīng)用
2.1客服機(jī)器人
2.1.1現(xiàn)狀
2.1.2對(duì)話增加情感分析
2.1.3對(duì)話增強(qiáng)自我學(xué)習(xí)
2.14 對(duì)話增強(qiáng)意圖分析、上下文分析
2.15其他
2.2語音助手
2.3直播間輔助
2.3.1 場景1:語言表達(dá)缺陷
2.3.2.場景2:直播環(huán)境語音不可用時(shí)
2.3.3 場景3:直播間輔助
4. 總結(jié)
1. 內(nèi)容分發(fā)在直播平臺(tái)中的AI應(yīng)用
首先,根據(jù)直播平臺(tái)的內(nèi)容,可泛分為三種:內(nèi)容創(chuàng)作者(主播)、視頻直播、小視頻;
其次,從內(nèi)容的“進(jìn)與出”,可分兩大方面:一是內(nèi)容的審核監(jiān)管,二是個(gè)性化的內(nèi)容分發(fā)。
最后,內(nèi)容的生產(chǎn)創(chuàng)作方面(這個(gè)本文先不討論,以后單獨(dú)再發(fā))
1.1 內(nèi)容的審核監(jiān)管
該場景聚焦的是:科學(xué)管控、提升效率,降低成本。
1.1.1 先說:問題和風(fēng)險(xiǎn)
(1)直播內(nèi)容監(jiān)控復(fù)雜度高,人工易漏判
違規(guī)的直播有多種類型,如涉黃、廣告、侵權(quán)、賭博、暴力、政治、敏感、屏中屏等,人工以或標(biāo)準(zhǔn)化的審核模型難以精準(zhǔn)識(shí)別,誤判、漏判的概率較高。
(2)網(wǎng)絡(luò)直播規(guī)模龐大,人工審核成本高
監(jiān)管要求24小時(shí)實(shí)時(shí)進(jìn)行,雖然違規(guī)比例占比不高,但為了做到“無漏網(wǎng)之魚”,需要投入大量的人力、物力和財(cái)力進(jìn)行監(jiān)管,運(yùn)營成本壓力增加。
(3)直播流量聚焦夜晚,人工審核效率低
夜晚疲勞,人眼識(shí)別精確度降低,出現(xiàn)誤判漏判的概率上漲,審核效率降低,難以達(dá)到網(wǎng)絡(luò)直播的內(nèi)容監(jiān)管需求。
(4)主播實(shí)名及直播實(shí)時(shí)驗(yàn)證難
一是主播注冊(cè)的實(shí)名驗(yàn)證,若完全依靠人力審核,人力成本增加,難以做到真實(shí)有效的審核;二是每次主播直播時(shí),都驗(yàn)證是否屬于本人在直播,這又增加一部分人力成本,運(yùn)營難度上升。
1.1.2 再看:傳統(tǒng)的解決
傳統(tǒng)的審核方式主要有三種:
- 純?nèi)斯徍耍?/strong>人員“三班倒”工作,人眼鑒別該圖片或視頻是否違規(guī);
- 建立MD5數(shù)據(jù)庫:網(wǎng)監(jiān)建立存儲(chǔ)違規(guī)圖片、視頻的MD5數(shù)據(jù)庫,用戶上傳后自動(dòng)分析MD5是否合法,則可避免涉黃內(nèi)容重復(fù)分享。
- 傳統(tǒng)的智能審核:如識(shí)別色情圖像,基本是通過圖片 RGB 值識(shí)別膚色比例;通過建模識(shí)別異常動(dòng)作、敏感部位等。
弊端:這些審核方式都存在較大的漏洞?!叭嗟埂钡娜斯と菀讓?dǎo)致審核效率低、誤判漏判多等主觀性問題;MD5則非常容易被篡改;傳統(tǒng)智能識(shí)別色情圖片準(zhǔn)確率低、經(jīng)常誤報(bào)等。同時(shí),對(duì)近兩年熱門的視頻直播審核需求更難以滿足。
1.1.3 應(yīng)用改進(jìn):AI
基于上述場景與問題,可引入AI技術(shù)落地優(yōu)化。
(1)方案:利用AI識(shí)別+人工審核的模式
(2)場景:如舉例“鑒黃”:通過鑒黃模型對(duì)內(nèi)容分析的類型為“色情”、“性感”和“正?!比?,并且機(jī)器會(huì)自動(dòng)將識(shí)別結(jié)果分為確定和復(fù)審兩部分,確認(rèn)部分的識(shí)別精確度達(dá)到或超過人工,無需復(fù)審,對(duì)于復(fù)審部分,機(jī)器會(huì)根據(jù)可能性排序,人工再根據(jù)概率從高到低來審核。
同樣,可延伸至主播封面圖等審核任務(wù)。
1.2 個(gè)性化的內(nèi)容分發(fā)
聚焦:視頻直播的推薦結(jié)果與用戶的心理預(yù)期重合度變大,用戶在觀看直播時(shí)的選擇更加直觀和精準(zhǔn),用戶的活躍度明顯提高,平臺(tái)的點(diǎn)擊率和留存率明顯上漲。
1.2.1 背景
大數(shù)據(jù)時(shí)代,對(duì)于電商、內(nèi)容型產(chǎn)品,個(gè)性化推薦已成標(biāo)配,應(yīng)用好處不多復(fù)述。
此處的內(nèi)容分發(fā),側(cè)指的是前端的個(gè)性化內(nèi)容排序,即個(gè)性化推薦。
目前主流的推薦算法是協(xié)同過濾,推薦引擎是多種推薦算法組合的。此處也不對(duì)算法層面過多開展,側(cè)重關(guān)注的是:無論是何種算法引擎,都是基于用戶畫像、貨物(內(nèi)容)畫像的基礎(chǔ)上進(jìn)行計(jì)算。沒有這些基礎(chǔ)特征是難以開展個(gè)性化的內(nèi)容分發(fā)。
同時(shí),用戶畫像中的興趣、行為偏好,往往受內(nèi)容畫像所映射的。如A用戶閱讀一篇名為“周杰倫最新演唱會(huì)定時(shí)間了!”,可能會(huì)被標(biāo)上“娛樂偏好”、“周杰倫”等標(biāo)簽,并通過不同的行為給予不同的權(quán)重分值。因此,如何識(shí)別出內(nèi)容的特征,是影響著個(gè)性化內(nèi)容分發(fā)的效果、效率、體驗(yàn)。
1.2.2 利用AI挖掘出內(nèi)容特征
此處只針對(duì)視頻直播進(jìn)行分析。
利用AI技術(shù)從人臉、圖像、音樂和語言四個(gè)維度對(duì)視頻直播進(jìn)行分析和理解,可以對(duì)其做出基本的分類,特征化。
(1)從內(nèi)容看特點(diǎn)
- 從內(nèi)容識(shí)別難度來看,視頻直播比文章、圖片的難度要大;
- 從內(nèi)容特性來看,直播有互動(dòng)性、場景性、才藝類型等,甚至還有“主播”調(diào)性;
- 從內(nèi)容時(shí)效來看,直播是實(shí)時(shí)的;
- …….
(2)應(yīng)用流程
首先,按上述特點(diǎn),應(yīng)對(duì)視頻直播的內(nèi)容按多種維度劃分,利用AI對(duì)內(nèi)容識(shí)別,挖掘出豐富內(nèi)容特征。
其次,由于直播是實(shí)時(shí)性,是由主播產(chǎn)出,是先有主播再有視頻直播內(nèi)容。因此,此處的對(duì)直播內(nèi)容識(shí)別出的特征,應(yīng)是給主播打上。
最后,可以考慮一種的個(gè)性化內(nèi)容分發(fā)是:用戶特征+主播特征,進(jìn)入推薦引擎計(jì)算,召回一批符合用戶偏好的“主播權(quán)重列表”。此時(shí)再去查詢這些主播是否有開直播、直播開始多久了、親密程度等等維度進(jìn)行綜合推薦,以達(dá)到個(gè)性化內(nèi)容分發(fā)。
(3)AI識(shí)別維度、內(nèi)容分發(fā)排序
列舉一些對(duì)內(nèi)容識(shí)別的特征維度(舉例一些,不全):
從直播來看:
- 互動(dòng)性:主播與粉絲的互動(dòng)情況,包括語言交流反饋、問答情況等。
- 打賞性:打賞刷禮物,直接反應(yīng)收入狀況。有時(shí)需考慮業(yè)務(wù)的干擾,利于平臺(tái)傭金收入。
- 時(shí)長度:直播的時(shí)間長度;
- 場景:直播的場景,是戶外還是戶內(nèi)。如直播間、運(yùn)動(dòng)場、健身房、車內(nèi)等;
- 物體:貨物、擺件,美妝物品等;
- 離場:是否有離場,頻次等。
從主播來看:
- 行為:唱歌,聊天,表演,魔術(shù),解說,多手勢(shì)…
- 聲音:甜美系,女漢子系,治愈系…;
- 才藝:彈琴,唱歌…;
- 風(fēng)格:韓系裝扮,性感,成熟,紳士,運(yùn)動(dòng)陽光,萌妹子…
- 性別:男,女…
- 年齡:年齡區(qū)間,或XX后,視模型口徑;
- 顏值:….
舉例:
- 風(fēng)格:一個(gè)喜歡做嘟嘴表情的年輕女主播,會(huì)有很大可能被打上“萌妹子”的標(biāo)簽(人臉識(shí)別);
- 顏值:基于顏值模型判斷主播的顏值分(人臉識(shí)別)
- 聲音:基于模型判斷出主播的聲音(語音識(shí)別)
- 手勢(shì):一個(gè)主播常喜歡做比心、愛心、嘟嘴等一連貫的手勢(shì)肢體動(dòng)作,可能被打上手勢(shì)大人、愛互動(dòng)等標(biāo)簽(動(dòng)態(tài)手勢(shì)識(shí)別)
上面這些的識(shí)別基本都需要結(jié)合AI技術(shù)進(jìn)行,挖掘出內(nèi)容特征作為推薦使用。
(4)個(gè)性化內(nèi)容分發(fā)的排序-算法
自己YY一下基本的維度:
(5)其他
個(gè)性化的內(nèi)容分發(fā),可以用于多個(gè)場景,如搜索結(jié)果頁、首頁、關(guān)注頁等,基于不同用戶分群進(jìn)行個(gè)性化推薦策略。此外,除了在內(nèi)容特征識(shí)別應(yīng)用AI,在推薦引擎中的深度學(xué)習(xí)、知識(shí)圖譜也是AI在支撐。
2. 自然語言對(duì)話在直播平臺(tái)中的AI應(yīng)用
首先,NLP涉及領(lǐng)域很多,凡是有自然語言(語音、文字)輸入的場景,都有可能會(huì)使用到。如語義分析、機(jī)器翻譯等。此處的自然語言對(duì)話,側(cè)指智能助理/智能問答/語音服務(wù)等方面。個(gè)人理解是:即利用AI技術(shù)打造出:統(tǒng)一的CUI(對(duì)話交互界面)、一站式的整合信息&服務(wù)。
其次,若按對(duì)話的場景區(qū)分有:封閉域?qū)υ?、開放域?qū)υ挕Mㄋ椎恼f,前者是”要求用戶輸入指定地話語才能繼續(xù)對(duì)話”,輸入輸出是可枚舉的、有明確始與終;后者是“用戶愛說什么就說什么都可以持續(xù)對(duì)話”,輸入輸出無法窮盡、無明確流程。
若按對(duì)話內(nèi)容方式有:文字、語音。(一般情況下,文字可以直接處理,如果是語音,通常情況下需要將語音轉(zhuǎn)換成文字(ASR技術(shù))
一般原理是:是用戶輸入,引擎內(nèi)部通過長期積累的知識(shí),首先經(jīng)過自然語言分析,在通過語義理解、上下文分析進(jìn)行知識(shí)推理,從而生成個(gè)性化的答案,輸出給用戶。整個(gè)典型的自然語言對(duì)話如下圖。
最后,從幾個(gè)場景去分析,包括有:客服機(jī)器人、語音助手、直播間輔助。
2.1 客服機(jī)器人
基本原理是:輸入的是用戶的問題,引擎內(nèi)部通過長期積累的知識(shí),首先經(jīng)過自然語言分析,在通過語義理解、上下文分析進(jìn)行知識(shí)推理,從而生成個(gè)性化的答案,輸出給用戶。整個(gè)典型的自然語言對(duì)話如下圖。
2.1.1 現(xiàn)狀
客服機(jī)器人依據(jù)媒體類型分為兩種,基于電話語音,基于文本信息。前者如10086的自助語音服務(wù);后者一般是置于應(yīng)用中,能解決簡單而又大量重復(fù)問題,以節(jié)約成本,如淘寶的小蜜、萬象,直播APP里的客服助手等。
從輸入方式來看有:語音輸入和文字輸入,技術(shù)上的區(qū)別是語音輸入要做語音識(shí)別,將語音信號(hào)轉(zhuǎn)換成文字。目前客服機(jī)器人主要是兩者都支持。
從輸出方式來看有:文字輸出、圖像輸出、語音輸出。這個(gè)類型視業(yè)務(wù)需求、產(chǎn)品場景所決定。目前客服機(jī)器人主要是文字輸出,一般基于用戶畫像預(yù)測(cè)問題、熱門問題前置等。
如下圖的所示,屬于能支持自然語言對(duì)話(語音+文本)的客服機(jī)器人。
問答機(jī)器人其實(shí)是在頭部問題上實(shí)現(xiàn)了綜合過濾,然后通過對(duì)話的形式反饋給用戶,如果用戶實(shí)在問的是長尾問題,問答機(jī)器人回答不了的,此時(shí)可走人工客服。滿足了用戶九成以上問題的直接答復(fù),是問答機(jī)器人的核心目標(biāo)。滿足在服務(wù)上,縮短服務(wù)尋求路徑與服務(wù)尋得率,從而提升用戶自助體驗(yàn),降低人工入線率,降低運(yùn)營成本。
2.1.2 對(duì)話增加情感分析
即相當(dāng)于賦予客服機(jī)器人EQ,能在對(duì)話中對(duì)語義進(jìn)行分析,精準(zhǔn)感知用戶情緒,并在回復(fù)表達(dá)中蘊(yùn)含相應(yīng)情感,讓互動(dòng)更有溫度。
原理是自動(dòng)識(shí)別對(duì)話過程的文字或語音,尤其是帶有主觀描述的進(jìn)行情感分析,如,可以識(shí)別生氣、喜悅、失望、著急等多種人類細(xì)分情感,對(duì)此生成相應(yīng)帶情感的、口語化的表達(dá),若判斷精準(zhǔn),能讓用戶體驗(yàn)佳,不冰冷。
舉個(gè)例子如下圖,JD客服JIMI機(jī)器人增加情感分析,從IQ到EQ的升級(jí),用戶體驗(yàn)上是有明顯差異的:
此外,增加情感分析也可用作對(duì)話質(zhì)量(服務(wù))評(píng)估。如根據(jù)前來咨詢的客戶來時(shí)的情緒,以及離開時(shí)情緒的對(duì)比,就能從另一個(gè)維度感知此次服務(wù)的質(zhì)量。既可以用以考核客服人員,也可以用來改進(jìn)客服的服務(wù)。
2.1.3 對(duì)話增強(qiáng)自我學(xué)習(xí)
場景:客服機(jī)器人無法滿足用戶需求,出現(xiàn)呼叫人工客服。
在人工溝通-解決的過程,客服機(jī)器人應(yīng)將此對(duì)話過程沉淀學(xué)習(xí)。如記錄下:呼叫人工客服前的對(duì)話過程、人工對(duì)話的過程,分析不足與改進(jìn)點(diǎn)。若每一次人工解決問題,中間的所有信息都被人工智能所記錄,多次學(xué)習(xí)自我進(jìn)化,能提升客服機(jī)器人對(duì)話服務(wù)質(zhì)量。
2.14 對(duì)話增強(qiáng)意圖分析、上下文分析
場景:客服機(jī)器人增加意圖推薦模塊,當(dāng)開始對(duì)話過程時(shí),能基于用戶過往的行為偏好分析,主動(dòng)預(yù)測(cè)用戶意圖,提供相應(yīng)信息。(非常見熱門問題)
場景:對(duì)話過程中的上下文,分析預(yù)測(cè)相應(yīng)的場景、語境,進(jìn)而精準(zhǔn)服務(wù)。
2.15 其他
不能以對(duì)話輪數(shù)多少相比。
比如,人類用戶與小冰的平均每次對(duì)話輪數(shù)可達(dá)到23輪,微軟對(duì)此也頗為津津樂道,但是,在客服上,如果機(jī)器人要與前來咨詢的客戶對(duì)話23輪,才能給出答案,你可以想象客戶的反應(yīng)會(huì)是什么。
2.2 語音助手
相比較于客服機(jī)器人,語音助手更是起到連接、推薦作用。用戶通過輸入語音或文字,可調(diào)用直播平臺(tái)內(nèi)各項(xiàng)功能、服務(wù)。整個(gè)對(duì)話過程是類似開放域的場景。
- 場景1:如用戶輸入“我關(guān)注的主播有哪些已經(jīng)開播?”,得到對(duì)話可以是告訴有哪些主播在開播,開播多久了,直播間的互動(dòng)情況,甚至根據(jù)用戶偏好及其他維度分析,優(yōu)先推薦哪個(gè)直播間;
- 場景2:如新用戶剛來,又沒有強(qiáng)目的、強(qiáng)關(guān)注的主播等?;蛟S可以通過助手進(jìn)行對(duì)話引導(dǎo),獲取偏好進(jìn)行直播推薦,甚至是某個(gè)主播,并將該主播的一些信息進(jìn)行描述,讓用戶多方面了解;
- 場景3:如猜你喜歡什么主播或直播,那么助手對(duì)話過程的引導(dǎo)可以有多種,或許通過用戶自拍、發(fā)送某些圖像信息等,給出相應(yīng)趣味的關(guān)聯(lián)分析,如性別,年齡等,以此提供個(gè)性化推薦服務(wù);
- 場景4:……
2.3 直播間輔助
自古民間出高人。對(duì)于直播的平臺(tái)是歡迎各大IP入住開播,主播也樂于展顯看家本領(lǐng)。而直播更具強(qiáng)調(diào)互動(dòng)性,直播過程中需要通過言語肢體等與粉絲互動(dòng),其中,言語表達(dá)尤為基礎(chǔ)重要。
2.3.1 場景一:語言表達(dá)缺陷
有一類人,他們身患絕技、各懷才藝,卻有表達(dá)缺陷,如啞巴。在如今強(qiáng)調(diào)人人是IP、自媒體的時(shí)代,他們可能因此而失去一些做主播的機(jī)會(huì)。
但是,他們本身是懂表達(dá),如唇語、手語。從本質(zhì)上,一切人類溝通的語言都屬于自然語言。因此,能利用AI的技術(shù)手段進(jìn)行識(shí)別、跟蹤,通過NLU進(jìn)行理解、翻譯,最后輸入語音表達(dá)。
關(guān)于輔助聲音,創(chuàng)作者錄音通過聲音模型學(xué)習(xí),盡量擬合原聲或差異個(gè)性化的。
同時(shí),若聲音實(shí)現(xiàn)不理想,也可以將唇語或手語識(shí)別進(jìn)行文本翻譯,也是一種互動(dòng)方式。
2.3.2 場景二:直播環(huán)境語音不可用時(shí)
直播過程中或許存在一些語音不可用的場景,如噪音突然變大、攝像頭未配備麥克風(fēng)(損壞)。這時(shí),若主播調(diào)用唇語識(shí)別功能,基于以上原理能保持直播間互動(dòng)正常,避免突然冷場中斷、離場等情況。
2.3.3 場景三:直播間輔助
場景:針對(duì)現(xiàn)場直播解說類,為主播解說提供輔助。如,體育、游戲等競技類的比賽直播。
這里的輔助有4個(gè)方面:
- 針對(duì)直播視頻的信息:能實(shí)時(shí)提取一些相關(guān)的信息。如動(dòng)作、球員信息,能夠識(shí)別并輸出文字記錄,類似對(duì)話模式,或許可以供主播對(duì)大盤比賽有參考;
- 針對(duì)直播間的互動(dòng)解說:有時(shí)候主播對(duì)于粉絲、或者解說某些內(nèi)容有些疑惑,如想中途插入一些故事或者其他相關(guān)情節(jié)、解答粉絲的熱門問題。此時(shí)直播間的助手可以將這些對(duì)話記錄并分析,根據(jù)熱門信息或關(guān)鍵詞進(jìn)行尋找,以供主播進(jìn)行參考以更好解說,或許也能滿足粉絲的互動(dòng)提問,活躍氛圍。
- 針對(duì)直播視頻,增加虛擬主播解說。如某場球賽直播,在視頻中進(jìn)行識(shí)別,如球員頭像、動(dòng)作行為、跑動(dòng)軌跡等特征,再用語音的方式來為用戶解讀比賽進(jìn)程,提供精選球迷評(píng)論、分享球星趣事等; 或許用戶還可根據(jù)興趣選擇喜歡的球星觀看,讓虛擬主播成為自己專屬的機(jī)器人解說員。
- …..
4. 總結(jié)
最近對(duì)AI進(jìn)行學(xué)習(xí)了解,包括從概念知識(shí)、應(yīng)用領(lǐng)域、AI產(chǎn)品經(jīng)理的相關(guān)工作流程等方面。同時(shí)參閱其他資料信息,對(duì)于AI PM有一些看法總結(jié),其中這些也是和傳統(tǒng)PM差異點(diǎn):
4.1 需要了解技術(shù)現(xiàn)狀
這里的現(xiàn)狀,側(cè)重是指技術(shù)原理、邊界。每一項(xiàng)技術(shù)都有邊界和最優(yōu)應(yīng)用場景,尤其目前AI技術(shù)相對(duì)是不夠成熟的,那么了解好技術(shù)可能實(shí)現(xiàn)的能力范圍、所需的成本、當(dāng)前存在的技術(shù)瓶頸…,具備這些基礎(chǔ)會(huì)更好去溝通、發(fā)散和結(jié)合。
4.2 需要尋找并定義AI業(yè)務(wù)場景
正如上述所言,理解技術(shù)優(yōu)劣勢(shì)的基礎(chǔ)上,尋找到可以提供更好用戶體驗(yàn)的業(yè)務(wù)場景。也就是說,如何結(jié)合當(dāng)前現(xiàn)有AI技術(shù)與業(yè)務(wù)場景,為用戶提供更好更便捷用戶體驗(yàn)的產(chǎn)品。因此其中主要的工作就是:完成當(dāng)前技術(shù)與現(xiàn)有市場需求的映射,側(cè)重對(duì)場景的思考。
4.3 多一層評(píng)估、多一層挖掘價(jià)值
當(dāng)前AI技術(shù)的實(shí)現(xiàn)成本相對(duì)還是高。也并非有想法就能實(shí)現(xiàn),即使條件+成本都能滿足時(shí),也存在較大試錯(cuò)風(fēng)險(xiǎn)。因此還需對(duì)場景多思考,充分評(píng)估產(chǎn)品定位、用戶價(jià)值、成本、商業(yè)價(jià)值等因素是否相匹配。讓現(xiàn)有技術(shù)所定義的產(chǎn)品價(jià)值能夠轉(zhuǎn)化為商業(yè)價(jià)值。
4.4 與互聯(lián)網(wǎng)產(chǎn)品經(jīng)理的差異
(1)關(guān)注業(yè)務(wù)的范圍不同
互聯(lián)網(wǎng)PM可能會(huì)深入關(guān)注局部業(yè)務(wù)范圍的產(chǎn)品優(yōu)化與用戶價(jià)值,而AI產(chǎn)品經(jīng)理可能需要在基于公司業(yè)務(wù)的整體范圍,尋找存在AI優(yōu)化的場景需求。
(2)多了一種語音交互方式
機(jī)器學(xué)習(xí)促進(jìn)了語音識(shí)別技術(shù)的發(fā)展,也促進(jìn)發(fā)展了語音交互場景。AI語音交互的設(shè)計(jì)可能比手機(jī)/PC端的交互設(shè)計(jì)難很多,因?yàn)檎Z音交互系統(tǒng)不是限定好的GUI操作界面,而是不便于規(guī)范且自由延展的自然語言。會(huì)話的開放性意味著 AI 交互設(shè)計(jì)者必須考慮用戶可能采取的幾乎無數(shù)的選擇。要能夠理解用戶,了解他們的動(dòng)機(jī),然后合乎邏輯地思考如何引導(dǎo)他們完成一件事情。
(3)更多的理論基礎(chǔ)支撐
機(jī)器學(xué)習(xí)的理解、算法模型優(yōu)化等等。
(碼字不易分享可貴!歡迎關(guān)注收藏后續(xù)再更新….)
本文由 @鳳城狂客 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Pexels,基于 CC0 協(xié)議
干貨啊,老哥