對(duì)比分析:AI產(chǎn)品PRD和互聯(lián)網(wǎng)產(chǎn)品PRD的異同
本文嘗試以“智能車載終端語(yǔ)音助理”產(chǎn)品為例,從語(yǔ)音識(shí)別、自然語(yǔ)言處理兩類AI產(chǎn)品的角度出發(fā),去盡可能的介紹人工智能產(chǎn)品需求與傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品需求的異同。
一、引言
1. 因技術(shù)領(lǐng)域而異的人工智能產(chǎn)品
首先,要說(shuō)明的是,每個(gè)人工智能產(chǎn)品都因其所屬的行業(yè)不同以及其應(yīng)用的相關(guān)技術(shù)不同,有著很大的差異。比如:機(jī)器視覺產(chǎn)品和自然語(yǔ)言處理產(chǎn)品從行業(yè)數(shù)據(jù)特征、業(yè)務(wù)場(chǎng)景以及算法模型等方面都顯得大相徑庭,雖然同屬于人工智能行業(yè),但兩個(gè)細(xì)分領(lǐng)域下產(chǎn)品經(jīng)理所需的背景和知識(shí)完全不同。
2. 人工智能產(chǎn)品分類
通常來(lái)說(shuō),人們從技術(shù)角度,將人工智能產(chǎn)品細(xì)分為:語(yǔ)音識(shí)別產(chǎn)品、自然語(yǔ)言處理產(chǎn)品、機(jī)器視覺產(chǎn)品和機(jī)器學(xué)習(xí)產(chǎn)品(詳細(xì)內(nèi)容,可以參考之前團(tuán)長(zhǎng)的文章《AI產(chǎn)品經(jīng)理的定義和分類》)。
此外,還有一類終端應(yīng)用產(chǎn)品,它通過(guò)各種終端載體形式,綜合應(yīng)用了上述的多項(xiàng)技術(shù)。比如:對(duì)于車載智能終端上的語(yǔ)音助理,它主要應(yīng)用了語(yǔ)音識(shí)別和自然語(yǔ)言處理兩個(gè)領(lǐng)域的技術(shù),它的產(chǎn)品需求除了涉及到這兩個(gè)領(lǐng)域技術(shù)的應(yīng)用策略外,還涉及語(yǔ)音助理客戶端上相關(guān)的產(chǎn)品設(shè)計(jì)。
本文嘗試以“智能車載終端語(yǔ)音助理”產(chǎn)品為例,從語(yǔ)音識(shí)別、自然語(yǔ)言處理兩類AI產(chǎn)品的角度出發(fā),去盡可能的介紹人工智能產(chǎn)品需求與傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品需求的異同,也許無(wú)法完整的概括人工智能產(chǎn)品需求的方方面面,還請(qǐng)各位讀者見諒。
二、AI產(chǎn)品和互聯(lián)網(wǎng)產(chǎn)品PRD的異同
既然是PRD,AI產(chǎn)品的PRD也不外乎由文檔描述、需求背景、競(jìng)品分析、需求范圍、需求內(nèi)容幾大部分組成。其中,從文檔描述到需求范圍的部分,AI產(chǎn)品PRD和傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品PRD并沒有太大的不同,二者的差異主要集中在需求內(nèi)容的部分。而需求內(nèi)容這方面的差異又因PM角色的不同而有所不同,因此在展開這一部分之前,先簡(jiǎn)要介紹一下車載語(yǔ)音助理產(chǎn)品的分工。
一般來(lái)說(shuō),一個(gè)車載語(yǔ)音助理可以由聲學(xué)前端&ASR、客戶端及Bot Framwork三部分組成,分別對(duì)應(yīng)著聲學(xué)交互PM、客戶端PM及技能PM。
1. 車載語(yǔ)音助理的產(chǎn)品分工
1)聲學(xué)交互PM ?
通過(guò)制訂應(yīng)用語(yǔ)音識(shí)別技術(shù)時(shí)的一些策略,來(lái)實(shí)現(xiàn)端上的一些產(chǎn)品特性。聲學(xué)交互PM有點(diǎn)類似傳統(tǒng)互聯(lián)網(wǎng)的策略PM,但需要PM對(duì)語(yǔ)音識(shí)別的各項(xiàng)技術(shù)及其應(yīng)用的場(chǎng)景較為了解。
2)客戶端PM ?
主要對(duì)語(yǔ)音助理框架性的交互(GUI及CUI)體驗(yàn)負(fù)責(zé),過(guò)程中,往往需要形成一套交互規(guī)范供技能PM參考,保證端體驗(yàn)的一致性。語(yǔ)音客戶端PM相比于傳統(tǒng)互聯(lián)網(wǎng)的客戶端PM,除了要對(duì)GUI交互熟悉之外,更需要對(duì)CUI交互有獨(dú)到的理解。
3)技能PM?
基于Bot Framwork,設(shè)計(jì)各個(gè)技能的意圖、會(huì)話及服務(wù),來(lái)實(shí)現(xiàn)端上的一些產(chǎn)品特性。技能PM需要對(duì)語(yǔ)義技術(shù)、語(yǔ)義設(shè)計(jì)有自己的理解,同時(shí)在服務(wù)設(shè)計(jì)上需要對(duì)CUI交互有自己的理解。
如果將語(yǔ)音助理比作一座大廈,那聲學(xué)交互PM就像是負(fù)責(zé)打地基的,提供了最基礎(chǔ)的語(yǔ)音交互能力;而客戶端PM,則像是用鋼筋搭起了整個(gè)建筑的框架;而技能PM,則是用混凝土們將整個(gè)建筑填充的更加豐滿。
2. 車載語(yǔ)音助理的產(chǎn)品需求
由于聲學(xué)交互PM、客戶端PM和技能PM的分工不同,他們的需求文檔在需求內(nèi)容方面的側(cè)重就有所不同。
1)聲學(xué)交互類需求
這類需求,首先對(duì)技術(shù)提出了能力方面的要求,其次選取合適的場(chǎng)景將能力落地,形成一定的語(yǔ)音交互上的產(chǎn)品特性。
一方面,產(chǎn)品需要在需求文檔中說(shuō)明“要運(yùn)用的技術(shù)需要達(dá)到的能力”,并將這個(gè)能力包裝為接口,指定相應(yīng)的輸入和輸出,同時(shí)規(guī)定一些性能指標(biāo)。另一方面,產(chǎn)品也會(huì)結(jié)合一些場(chǎng)景,制訂一些策略,從而產(chǎn)出一些新的交互特性。這些特性,往往可能不是由一個(gè)單一的技術(shù)來(lái)實(shí)現(xiàn)的,可能需要將多種技術(shù)綜合應(yīng)用。
例如:語(yǔ)音助理的多音區(qū),其實(shí)包含了兩種技術(shù)能力。首先是聲源定位,即分辨車內(nèi)發(fā)音人的來(lái)源是在主駕、副駕還是后排,其次是波束成形,即可以只對(duì)喚醒人所在方向進(jìn)行收音,對(duì)過(guò)程中非喚醒人的聲音信號(hào)進(jìn)行抑制。
在這個(gè)能力上,產(chǎn)品可以指定將多音區(qū)的聲源定位能力加入車控指令,從而實(shí)現(xiàn)副駕說(shuō)打開車窗,僅開啟副駕側(cè)車窗的特性。也可以指定將多音區(qū)的波束成形能力接入語(yǔ)音交互的流程,使得主駕喚醒之后只接收主駕的指令。
2)客戶端類需求 ?
一般來(lái)說(shuō),語(yǔ)音助理是圍繞一個(gè)bot來(lái)運(yùn)作的,這個(gè)bot接收文字輸入,輸出語(yǔ)義或服務(wù)結(jié)果,過(guò)程中可能會(huì)涉及到多輪和應(yīng)答。而客戶端類需求,就是針對(duì)bot從輸入到輸出的整個(gè)過(guò)程去定義框架性的交互體驗(yàn),同時(shí),還會(huì)涉及到一些端上常規(guī)模塊的功能設(shè)計(jì)。
首先,需要定義bot接收文字輸入前所有流程的設(shè)計(jì),主要是喚醒和識(shí)別流程中的GUI和CUI設(shè)計(jì),以及過(guò)程中的異常流程處理,例如用戶不說(shuō)話時(shí)如何處理、超時(shí)時(shí)如何處理、網(wǎng)絡(luò)異常時(shí)如何處理等。
其次,需要定義在bot運(yùn)行過(guò)程中,包括語(yǔ)義解析、多輪會(huì)話及相應(yīng)多輪應(yīng)答以及最終輸出語(yǔ)義及服務(wù)結(jié)果時(shí)所需的框架性GUI設(shè)計(jì),如顯示區(qū)域定義、顯示模板定義、GUI交互定義等。
值得指出的是,這兩部分需求的提出,往往伴隨著設(shè)計(jì)規(guī)范一起產(chǎn)出。對(duì)于GUI而言,類似于傳統(tǒng)互聯(lián)網(wǎng)的客戶端PM,需要給出整個(gè)界面的原型設(shè)計(jì),不同的是,這里往往需要給出模板化的設(shè)計(jì),來(lái)盡可能的滿足各類場(chǎng)景下GUI展示的需要。CUI方面,會(huì)給出回復(fù)語(yǔ)設(shè)計(jì)應(yīng)該遵循的一些原則,例如:合作原則、禮貌原則等,同時(shí),也會(huì)根據(jù)語(yǔ)音助理的設(shè)定提一些語(yǔ)氣方面的要求。
最后,是語(yǔ)音助理客戶端上一些常規(guī)模塊設(shè)計(jì)。例如:用戶登錄、設(shè)置、幫助等,而后者和傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品基本上是一致的。
3)技能類需求
這類需求側(cè)重于技能相關(guān)的語(yǔ)義 、會(huì)話及服務(wù)設(shè)計(jì)。
(1)語(yǔ)義設(shè)計(jì)
語(yǔ)義設(shè)計(jì),分為語(yǔ)義表示定義、模板定義和語(yǔ)料定義三個(gè)部分。
語(yǔ)義表示定義,即定義技能所屬領(lǐng)域Domain、領(lǐng)域下的意圖Intent、意圖內(nèi)的參數(shù)Slot以及參數(shù)對(duì)應(yīng)的實(shí)體。例如:為了讓語(yǔ)音助理聽懂并回答“今天天氣怎么樣?”
這一問(wèn)題,技能PM需要設(shè)計(jì)一個(gè)天氣查詢的技能,定義它屬于語(yǔ)義所屬的領(lǐng)域 – 天氣、意圖 – 查詢天氣,定義用戶query中可能會(huì)出現(xiàn)的參數(shù) – 地點(diǎn)、時(shí)間等,同時(shí)還要定義參數(shù)對(duì)應(yīng)的實(shí)體庫(kù)。
模板的設(shè)計(jì),其實(shí)就是寫一些正則表達(dá)式來(lái)保證冷啟動(dòng)時(shí)的召回。這一部分可能會(huì)在專門的語(yǔ)義平臺(tái)上進(jìn)行,不一定會(huì)在需求文檔中體現(xiàn)。
語(yǔ)料的定義,即語(yǔ)料的收集及標(biāo)注。需要產(chǎn)品在需求中說(shuō)明語(yǔ)料收集的場(chǎng)景、示意的問(wèn)法等等給到專門的團(tuán)隊(duì),同時(shí)說(shuō)明標(biāo)注的規(guī)則,供標(biāo)注人員在語(yǔ)料收集完成后進(jìn)行標(biāo)注工作。而標(biāo)注好的語(yǔ)料,會(huì)給到語(yǔ)義模型進(jìn)行學(xué)習(xí),來(lái)提升意圖的準(zhǔn)召率。
模板和語(yǔ)料的定義,直接關(guān)系到了語(yǔ)音助理在意圖上的泛化能力,也是需求中不容忽視的部分。不論是在語(yǔ)義表達(dá)的設(shè)計(jì)還是在語(yǔ)料定義的時(shí)候,都需要盡可能的考慮用戶的表達(dá)方式,盡可能的去覆蓋更多的說(shuō)法。
(2)會(huì)話設(shè)計(jì)
會(huì)話設(shè)計(jì),主要是針對(duì)多輪對(duì)話過(guò)程中的CUI及GUI設(shè)計(jì),即根據(jù)當(dāng)前所處的對(duì)話狀態(tài)對(duì)用戶進(jìn)行引導(dǎo),從而明確用戶的指令。如果用戶提供的信息還不足以執(zhí)行任務(wù),需要設(shè)計(jì)相應(yīng)的澄清話術(shù)引導(dǎo)用戶完成填槽,過(guò)程中,可能會(huì)配合必要的視覺展示,供用戶進(jìn)行決策。同時(shí),GUI有時(shí)候還承擔(dān)了一定的用戶引導(dǎo)作用,提示用戶當(dāng)前可以說(shuō)些什么指令來(lái)繼續(xù)對(duì)話。
(3)服務(wù)設(shè)計(jì)
服務(wù)設(shè)計(jì),即最終服務(wù)結(jié)果呈現(xiàn)時(shí)的回復(fù)話術(shù)設(shè)計(jì)及GUI的設(shè)計(jì)。還是以天氣舉例子,用戶聽到的“深圳今天是晴天,氣溫21到26攝氏度”就是典型的回復(fù)話術(shù)設(shè)計(jì),而看到的天氣卡片就是GUI的設(shè)計(jì),上面可能顯示了天氣、氣溫、濕度、空氣質(zhì)量指數(shù)等。
回復(fù)話術(shù)的設(shè)計(jì),包含成功執(zhí)行和異常時(shí)的回復(fù)。由于語(yǔ)音具備輸入高效,輸出低效的特點(diǎn),因此在回復(fù)語(yǔ)的設(shè)計(jì)上需要盡可能簡(jiǎn)潔地給出必要的信息。
在結(jié)果的呈現(xiàn)上,需要產(chǎn)品在需求中定義視覺展示時(shí)頁(yè)面的信息如何排布,是否涉及二次交互等等。這一部分的內(nèi)容類似傳統(tǒng)互聯(lián)網(wǎng)的原型設(shè)計(jì),只是在設(shè)計(jì)的時(shí)候需要考慮車載端的交互特性。
三、結(jié)語(yǔ)
最后想說(shuō),無(wú)論是什么領(lǐng)域的需求文檔,它都是一份產(chǎn)品需求文檔,和傳統(tǒng)互聯(lián)網(wǎng)的需求文檔在結(jié)構(gòu)上并沒有什么不同,具體的差異因?yàn)楫a(chǎn)品經(jīng)理角色的不同體現(xiàn)在了需求內(nèi)容的部分。
說(shuō)明:如作者所說(shuō),由于人工智能產(chǎn)品的分類很多,還有計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)等其他領(lǐng)域的PRD特點(diǎn)沒有涵蓋,如果你是有興趣來(lái)分享輸出的AI產(chǎn)品經(jīng)理,歡迎單獨(dú)聯(lián)系我。
作者:星云
本文由 @星云 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Pixabay,基于 CC0 協(xié)議
- 目前還沒評(píng)論,等你發(fā)揮!