業務進階:AI圖像識別
編輯導語:作為一名AI產品經理,你需要對自身所負責的業務有所洞察,進而根據具體的業務需求、用戶需求來做好產品架構設計。那么,你了解AI圖像識別業務嗎?本篇文章里,作者便結合實際經驗,總結了AI圖像識別的相關業務原理,一起來看一下。
一、靈魂三問
1. AI 業務的盈利模式是否完善、合理?
個人認為這是PM/PO/BA最容易發生的問題,把自己放在已有業務上而喪失觀察相鄰業態的大局觀。因為不夠了解市場的多樣性,限制了擴展業務的思路和眼界。
之前我負責的產品主要服務對象是G端客戶,幫助他們識別圖像中的特征,提高業務效率。后來我在衛生間靈光一現,想到除了G端還可以服務B端,因為很多中小微型企業沒有技術能力來實現這些系統,那么就可以把這些業務給產品化,給這些企業提供AI-a-a-S產品,一來是增加公司盈利渠道,二來是通過市場來檢驗產品,而且最重要的點是能夠留存大量第三方的數據,這些數據對于企業來說是巨大的寶藏。
2. ROI能否達到公司預期?
ROI的時間維度是非常重要的因素,不知道有多少項目由于各種因素導致暫時不能給公司盈利而被砍掉。大象無形,大音聲稀,沒有人能永遠掌握市場的需求,盡量多跟商務和市場的同事溝通,做好當下,規劃未來。
3. 產品是否符合公司政策和發展基調
PM直接對公司和用戶負責,二者的側重點如同排序一樣,有時候好的產品并不符合公司利益,絕對忠于公司,其次才是用戶。
之前我們公司贏利點在G端,但是B端在國內也有大量客戶,公司規劃的發展方向也是逐漸摒棄G端以B端為主,所以毫無疑問往B端發力,不管是不是屬于我負責的業務,都要想方設法跟B端產生更多業務聯系。
二、產品架構設計
公司資源、業務需求等各種條件都較為復雜的情況下,可以通過劃分維度來設計產品,比如可能涉及到配置層、操作層和應用層。
1. 配置層
用來幫助客戶配置AI產品的規則邏輯等內容。包括但不限于
- AI識別模型庫:用來維護識別模型的種類,也是業務中科技含量最高的模塊,便于規劃下沉市場和管理;
- AI權限模塊:用來管理相關的業務人員進行操作,定位權限問題,定義使用AI服務的客戶;
- 人工審核管理模塊:用來管理使用AI識別還是人工識別的規則,便于對不太成熟的算法進行優化,減少誤識率;
- 事件定義模塊:統一定義事件的判斷結果和觸發條件,可通過對比模型之間的規則提高業務適用率;
- AI服務周期:用來管理AI服務的有效期。
根據各公司實際情況,判斷以上內容是否適用。
2. 操作層
對AI識別后的結果進行二次檢查。可以設計AI標注庫,用來校驗AI的識別結果,提高正確率。也可以使用人工標注的數據優化現有算法。
3. 應用層
AI產生的結果直接面向客戶。可以設計通知觸發規則,用來管理通知的內容、觸發頻率和受眾類型等;客戶類型,根據客戶類型給客戶展示識別結果和數據可視化內容。
三、圖像識別原理
1. 概念
通過當前已有數據對算法模型進行訓練,總結數據的規則,預測新數據的結果。
2. 學習方式
分為《預測學習》和《描述學習》。
1)預測學習
模型訓練之前,使用人工的方式提取特征并給打上標簽。其目標是在給定一系列輸入輸出實例所構成的數據集的條件下,學習輸入x到輸出y的映射關系。
這里的數據集稱為訓練集,實例的個數稱為訓練樣本數。對于給定的x,可以對所視察到的值與預測的值進行比較。
例如我們現在有大量的獅子和老虎的照片,首先給每張照片都打上對應動物的標簽。然后把這些帶標簽的圖片喂給模型,讓模型知道獅子長什么樣,老虎長什么樣。最后我們找一些新的、沒打標簽的圖片給模型,讓它自己識別圖片里是什么。這就是一個完整的有監督模式的機器學習過程。
2)描述學習
直接把數據丟給算法模型,又稱為“聚類”。
在給定一系列僅由輸入實例構成的數據集的條件下,其目標是發現數據中的有趣模式。
描述學習有時候也稱為只是發現,這類問題并沒有明確定義,因為我們不知道需要尋找什么樣的模式,也沒有明顯的誤差度量可供使用。為了讓機器能夠理解物體之間的關系,我們最終把現實中的特征轉化為“向量”進行計算。
例如擎天柱,張三和我,如果細分的話,張三和我應該是一類,因為屬于人類;擎天柱屬于機械類。最后三者才同歸屬于生命體類。
3)算法模型
目前所有算法模型都是各有千秋的狀態,沒有一種算法能夠被證明全面優于其他算法,每種算法都是為了解決某一特定場景的問題,只有某一特定場景更優的算法,可以通過對比找到其中最好的算法。
目前出現的相對流行的算法主要是以對象、區域、上下文等場景的分類算法:
① 基于對象的場景分類
這種分類方法以對象為識別單位,根據場景中出現的特定對象來區分不同的場景;基于視覺的場景分類方法大部分都是以對象為單位的,也就是說,通過識別一些有代表性的對象來確定自然界的位置。
典型的基于對象的場景分類方法有以下的中間步驟:特征提取、重組和對象識別。
缺點:底層的錯誤會隨著處理的深入而被放大。例如,上位層中小對象的識別往往會受到下屬層相機傳感器的原始噪聲或者光照變化條件的影響。尤其是在寬敞的環境下,目標往往會非常分散,這種方法的應用也受到了限制。
需要指出的是,該方法需要選擇特定環境中的一些固定對象,一般使用深度網絡提取對象特征,并進行分類。例如PCA算法實現識別人臉降維原理,排除冗余和噪音的干擾,試驗步驟如下:
② 基于區域的場景分類
首先通過目標候選候選區域選擇算法,生成一系列候選目標區域,然后通過深度神經網絡提取候選目標區域特征,并用這些特征進行分類。
③ 基于上下文的場景分類
這類方法不同于前面兩種算法,而將場景圖像看作全局對象而非圖像中的某一對象或細節,這樣可以降低局部噪聲對場景分類的影響。將輸入圖片作為一個特征,并提取可以概括圖像統計或語義的低維特征。
該類方法的目的即為提高場景分類的魯棒性。因為自然圖片中很容易摻雜一些隨機噪聲,這類噪聲會對局部處理造成災難性的影響,而對于全局圖像卻可以通過平均數來降低這種影響。
基于上下文的方法,通過識別全局對象,而非場景中的小對象集合或者準確的區域邊界,因此不需要處理小的孤立區域的噪聲和低級圖片的變化,其解決了分割和目標識別分類方法遇到的問題。
四、圖像識別過程
圖像識別技術歸納起來,主要包括4個步驟:
- 首先是獲取信息,主要是指將各類信息通過傳感器向電信號轉換,也就是對識別對象的基本信息進行獲取,并通過“聚類”的方式,將其向計算機可識別的信息轉換。
- 然后是信息預處理,主要是指采用去噪、變換及平滑等操作對圖像進行處理,基于此使圖像的重要特點提高。
- 其次是抽取及選擇特征,主要是指在模式識別中,抽取及選擇圖像特征,概括而言就是識別圖像具有種類多樣的特點,如采用一定方式分離,就要識別圖像的特征,獲取特征也被稱為特征抽取。
- 最后是設計分類器及分類決策,其中設計分類器就是根據訓練對識別規則進行制定,基于此識別規則能夠得到特征的主要種類,進而使圖像識別的不斷提高辨識率,此后再通過識別特殊特征,最終實現對圖像的評價和確認。
五、工作應用
作為PM\PO\TPM來說,給到技術大佬們的策略是要清晰完整的,舉例:要識別圖片中的人是否帶帽子,那么這時我們就要描述清楚帽子的顏色、種類和所在位置等維度信息。
最好用爬蟲的方式爬取大量帽子,然后判斷帽子是否在人的腦袋上。在語音識別中,需要建立字符庫,完善優化字符庫的內容。
通過收集和整理,我們對要產品需求會有一個直觀的認知,但隨著調研的繼續,我們還可能會發現其他問題。為了避免有價值的信息遺漏,這個階段我們收集的案例,應該具有更多的發散性。
六、用戶感知提升
對于用戶來說,能夠讓用戶感知到的是產品的擬人度。但AI的輸出是否合理,這個取決于人的主觀評判。這也是數據標注工作所做的意義所在——盡可能通過標注讓模型更像真實的人。比如在情景對話中,雖然有些回答聽起來很搞笑,但只要輸出的結果讓人覺得合理,就依然會被人接受。
- 老巫婆:你說這個世界上最美麗的人是誰?
- AI:是白雪公主!
- 老巫婆:再給你一次重新組織語言的機會!
- AI:是白雪公主!
- 老巫婆:你看清楚了,我手里拿著刀呢!
- AI:是你,你是世界上最美的人!
PS:與AI算法工程師的溝通小技巧
客觀化、可量化、數字化、就事論事。如下:
業務說:大佬,能不能優化下這個模型,好多地方都不準,客戶都投訴啦。
建議溝通方式:
業務說:博士,這個模型的準確率能不能提高到95%?因為目前圖像上的3個點都屬于特征點,但是沒有識別成功。
本文由 @趙大師 原創發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議
你好 可以請教一下 如何設計AI識別因業務
設計思路需要根據業務來的,AI識別是業務的中間節點
小哥哥能不能私聊下,想請教一些問題
可以的,805370546
AI圖像識別業務真的是一個很值得學習的知識,里面蘊含了很多。
之前對AI識別的了解不是很多,看完這篇文章讓我懂得了很多。
看完這篇文章讓我對AI識別有了新的了解,學習到了很多!
ai識別還是挺好的,但是有時候也不是那么的靈敏,還是需要繼續精進一下的,希望以后可以更好吧
ai識別真的是ai業務的進階版,現在很多人工智能真的太蠢了
別著急,給人工智障一些時間,未來可期~
ai業務還有很多需要改進的地方
是的,讓我們一起改進世界!
ai識別真的非常的好用和實用,建議多多升級