槽位背后 | AI專家系統(tǒng)的5個階段(上篇)
本文筆者著重介紹專家系統(tǒng)的五個發(fā)展階段——基于規(guī)則、基于框架、基于案例、基于模型和基于網(wǎng)絡(luò)的基本邏輯及側(cè)重點(diǎn)。
有許多AI產(chǎn)品朋友經(jīng)過一定階段的學(xué)習(xí)和實(shí)踐能夠掌握槽位在機(jī)器人客服、搜索、智能音箱等等產(chǎn)品的應(yīng)用,但是如果能提升到懂槽位背后的邏輯會對AI產(chǎn)品經(jīng)理深度發(fā)展有更大的支撐,而槽位背后對應(yīng)的人工智能主要是有專家系統(tǒng)構(gòu)成。
專家系統(tǒng)又名ES(Expert System),ES一路是逐步由的5個階段發(fā)展而來。
本篇筆者對每個階段分析了對應(yīng)的AI專家系統(tǒng)的知識點(diǎn),給出實(shí)踐算法,并通過若干實(shí)踐案例進(jìn)行詳述。期望通過對專家系統(tǒng)知識點(diǎn)的學(xué)習(xí)結(jié)合實(shí)踐案例為未來更好上手AI產(chǎn)品做積累。
下文著重介紹每個階段的基本邏輯及側(cè)重點(diǎn):
階段一:基于規(guī)則的專家系統(tǒng)
知識點(diǎn):
基于規(guī)則的專家系統(tǒng)是目前最常用的方式,主要?dú)w功于大量成功的實(shí)例,以及簡單靈活的開發(fā)工具。它直接模仿人類的心理過程,利用一系列規(guī)則來表示專家知識。
例如對動物的分類:
- IF(有毛發(fā)or能產(chǎn)乳)and((有爪子and有利齒and前視)or吃肉)and黃褐色and黑色條紋,THEN老虎。
- IF(有羽毛or能飛and生蛋))and不會飛and游水a(chǎn)nd黑白色and ?,THEN企鵝
這里,IF后面的語句稱為前項(xiàng),THEN后面的語句稱為后項(xiàng)。前項(xiàng)一般是若干事實(shí)的“與或”結(jié)合,每一個事實(shí)采用對象-屬性-值(OAV)三元組表示。根據(jù)值的選擇不同,可將屬性分為3類。
- 是非屬性,例如“有爪子”,該屬性只能在{有、無}中二選一;
- 列舉屬性,例如:“吃肉”,該屬性只能在{吃草,吃肉,雜食}中選擇;
- 數(shù)字屬性,例如:“觸角長度3.5 cm”,“身高1.5 m”,“體重32 kg”等。
算法:
上述算法規(guī)則是通過專家集體討論得到的。這樣形成的規(guī)則存在以下3個缺點(diǎn):
- 需要專家提出規(guī)則,而許多情況下沒有真正的專家存在;
- 前項(xiàng)限制條件較多,且規(guī)則庫過于復(fù)雜。比較好的解決方法是采用中間事實(shí)。例如:首先確定哺乳動物、爬行動物、鳥類動物,然后繼續(xù)進(jìn)行劃分;
- 在某些情況下,只能選取超大空間的列舉屬性或者數(shù)字屬性,此時該屬性值的選取,需要大量樣本以及復(fù)雜的運(yùn)算。
因此,更傾向于采用一套算法體系,能自動從數(shù)據(jù)中獲得規(guī)則。
決策樹算法基本能夠滿足知識工程師的需要,較好的決策樹算法包括基于信息增益的ID3、C4.5、C5算法,基于Gini 索引的 CART 算法。
階段二:基于框架的專家系統(tǒng)
知識點(diǎn):
基于框架的專家系統(tǒng)可看作是基于規(guī)則的專家系統(tǒng)的一種自然推廣,是一種完全不同的編程風(fēng)格。用“框架”來描述數(shù)據(jù)結(jié)構(gòu),框架包含:某個概念的名稱、知識、槽(槽為的槽)。
當(dāng)遇到這個概念的特定實(shí)例時,就向框架中輸入這個實(shí)例的相關(guān)特定值。
編程語言中引入框架的概念后,就形成了面向?qū)ο蟮木幊碳夹g(shù)。可以認(rèn)為,基于框架的專家系統(tǒng)等于面向?qū)ο蟮木幊碳夹g(shù),對應(yīng)關(guān)系如下圖:
算法:
神經(jīng)網(wǎng)絡(luò)、特征提取、NLP類算法
實(shí)踐:
如下圖圖像處理識別框架:
上圖圖顯示了一個典型的圖像處理識別框架,這里將整個系統(tǒng)分為4個大類:文檔類、圖像類、圖像像素類、圖像識別類,每類賦予特定的對象和事件,最后組合成一個系統(tǒng)。
階段三:基于案例的專家系統(tǒng)
知識點(diǎn):
基于案例推理的專家系統(tǒng),是采用以前的案例求解當(dāng)前問題的技術(shù)。
求解過程如下圖所示:
首先獲取當(dāng)前問題信息,接著尋找最相似的以往案例。如果找到了合理的匹配,就建議使用和過去所用相同的解;如果搜索相似案例失敗,則將這個案例作為新案例。因此,基于案例的專家系統(tǒng)能夠不斷學(xué)習(xí)新的經(jīng)驗(yàn),以增加系統(tǒng)求解問題的能力。
算法:
最常用的匹配算法是最近鄰法,k-近鄰法,徑向基函數(shù)網(wǎng)絡(luò),排序算法等。
實(shí)踐:
佐治亞理工學(xué)院的一名電腦科學(xué)教授戈埃爾,創(chuàng)造的AI助教吉爾·華生,吉爾·華生是佐治亞理工學(xué)院的線上機(jī)器人助教。戈埃爾上傳了四個學(xué)期的數(shù)據(jù),共四千多個問題與答案,并附上了其他Piazza上的閑談,用基于案例的專家系統(tǒng)開始訓(xùn)練他的人工智能助教。
有一次,一位學(xué)生問它“挑戰(zhàn)性問題是否會包括文字和圖片數(shù)據(jù)?”。
“挑戰(zhàn)性問題里沒有文字?jǐn)?shù)據(jù),”吉爾的回答非常正確,“他們只會被當(dāng)作形象化的問題來運(yùn)行。但歡迎你自己寫下文字?jǐn)?shù)據(jù)并試試運(yùn)行它們!”(是的,吉爾用了一個感嘆號)。
新學(xué)期結(jié)束的時候,戈埃爾揭露了吉爾的身份。學(xué)生們不僅沒有感到不愉快,還像對待教師們一樣感到欣喜。一位學(xué)生稱它“無與倫比地酷”。另一位學(xué)生則想與它共進(jìn)晚餐。
階段四:基于模型的專家系統(tǒng)
知識點(diǎn):
傳統(tǒng)的專家系統(tǒng)一個主要缺點(diǎn)在于“缺乏知識的重用性和共享性”,而采用本體論講問題模型化來設(shè)計專家系統(tǒng),可以解決該缺點(diǎn)。另外,它既能增加系統(tǒng)功能,提高性能指標(biāo);又可獨(dú)立深入研究各種模型及其相關(guān),將結(jié)果用于系統(tǒng)設(shè)計。
算法:
機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法。
實(shí)踐:
下圖是由6個模型搭建起來的一個小型控制系統(tǒng),實(shí)現(xiàn)了利用神經(jīng)網(wǎng)絡(luò)逼近車間生產(chǎn)過程,繼而預(yù)測產(chǎn)量。
上圖可見由于模型組件、接口、通信、限制等全部標(biāo)準(zhǔn)化,因此利用Simulink軟件,通過簡單的鼠標(biāo)連線,可在1分鐘內(nèi)開發(fā)出這個系統(tǒng)。
階段五:基于網(wǎng)絡(luò)的專家系統(tǒng)
知識點(diǎn):
隨著第三波人工智能高潮發(fā)展之前移動互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)已成為用戶的交互接口,軟件也逐步走向網(wǎng)絡(luò)化。
而專家系統(tǒng)的發(fā)展也順應(yīng)該趨勢,將人機(jī)交互定位在網(wǎng)絡(luò)層次:專家、工程師與用戶通過瀏覽器訪問專家系統(tǒng)服務(wù)器,將問題傳遞給服務(wù)器;服務(wù)器則通過后臺的推理機(jī),調(diào)用當(dāng)?shù)鼗蜻h(yuǎn)程的數(shù)據(jù)庫、知識庫來推導(dǎo)結(jié)論,并將這些結(jié)論反饋給用戶。
算法:
神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、決策樹、Logistic回歸、判別分析等算法。
實(shí)踐:
賽事預(yù)測系統(tǒng)、乳腺癌等醫(yī)療影像病癥診斷系統(tǒng)。
例如:對環(huán)法自行車賽引入機(jī)器學(xué)習(xí)算法,幫助人們預(yù)測比賽各種可能情況。通過收集車隊車手歷史數(shù)據(jù),人工智能將預(yù)測不同參賽人員的比賽進(jìn)程。同時,觀眾也可以根據(jù)統(tǒng)計數(shù)據(jù)了解現(xiàn)場車速以及各個車手的具體位置、騎手之間的距離以及各車隊情況。
在每部自行車鞍座下安裝全球衛(wèi)星定位系統(tǒng),通過這些訊號轉(zhuǎn)發(fā)器收集資料,結(jié)合賽道坡度及天氣情況等外部資料,產(chǎn)出各種分析結(jié)果。例如:個別車手的實(shí)時速度與所在地點(diǎn)、各個車手之間的距離、參賽隊伍陣容等,建立各車手的歷史數(shù)據(jù)資料中心,在網(wǎng)絡(luò)上(也云端)進(jìn)行管理。
小結(jié)
隨著人工智能逐步成熟,對于人工智能產(chǎn)品經(jīng)理來說,僅僅會設(shè)計槽位還不夠,明白槽位背后的人工智能深處的邏輯,能夠更好的將AI應(yīng)用于垂直領(lǐng)域。
如果你想系統(tǒng)化入門AI產(chǎn)品經(jīng)理,掌握AI產(chǎn)品經(jīng)理的落地工作方法,戳這里>http://996.pm/7bjab
#專欄作家#
連詩路,公眾號:LineLian。人人都是產(chǎn)品經(jīng)理專欄作家,《產(chǎn)品進(jìn)化論:AI+時代產(chǎn)品經(jīng)理的思維方法》一書作者,前阿里產(chǎn)品專家,希望與創(chuàng)業(yè)者多多交流。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash, 基于CC0協(xié)議。
起點(diǎn)學(xué)院見 http://996.pm/MeANw
http://996.pm/MeANw
謝謝干貨,LineLian老師一直是干貨。
也請同學(xué)們報名 http://996.pm/MeANw
我報過 干貨中的干貨
http://996.pm/MeANw