淺談人工智能產品設計:情感分析

1 評論 10121 瀏覽 58 收藏 7 分鐘

情感分析是自然語言處理中的一項技術,也是文本挖掘中常用的方法。在產品中應用情感分析技術也不少見,例如新浪的輿情大數據平臺運用情感分析對全網數據進行挖掘。另外在一些電商產品中,也會運用情感分析來進行商品評論挖掘,作為推薦系統的一部分。本文主要結合情感分析技術的應用談談人工智能產品的設計。

一、人工智能產品設計與互聯網產品設計的區別

人工智能產品的定義較為廣泛,智能硬件、機器人、芯片、語音助手等都可以叫做人工智能產品。本文討論的人工智能產品主要是指在互聯網產品中運用人工智能技術。

1、從用戶需求的角度看

互聯網產品主要著手與解決用戶的痛點,對于C端產品來說,痛點就是指的個人想解決而無法解決的問題,如個人想要美化自己的照片,但是他不會復雜的PS軟件,于是美圖秀秀就可以解決這個痛點。從KANO模型中,就是滿足用戶的基本需求與期望需求。

人工智能產品(在互聯網產品中運用人工智能技術)則是要滿足用戶的興奮需求。如將情感分析運用到電商的產品評論中,用戶則可以通過可視化的數據展示來大致對產品有個全面、直觀的了解,而不再需要自己一頁一頁的翻看評論內容。

2、產品設計角度看

互聯網產品主要關注點在于用戶需求、流程設計、交互設計、商業模式等。著眼于用戶需求,設計滿足用戶需求的產品,通過合理的流程設計、交互設計達到產品目標,進而實現商業目標。典型的思路是發現用戶需求——>設計滿足用戶需求的產品——>迭代完善、產品運營——>商業變現。

人工智能產品關注點在于模型的構建,它不再是對于布局、交互的推敲,而是通過選擇合適的數據,構建合適的模型,最終呈現出來的是好的效果。什么是好的效果呢?這就需要引入評測指標。互聯網的評測指標有我們熟知的留存率、轉化率、日活躍等,那么人工智能的產品主要是通過一些統計指標來描述,以情感分析為例,把情感分析看成一個分類問題,則可以使用P、R、A、F值來描述。

  1. 查準率(Precision):P值,衡量某類分類中識別正確的比例,如情感分析中,有10條被分類為“正向”,其中8條是分類正確的(由人工審核),那么P=8/10=80%
  2. 查全率(Recall):R值,又叫查全率,又叫召回度,指的是某類被被正確分類的比例,同樣以情感分析為例,100條數據中有10條是正向的,機器分類后,這10條中有7條被分類為正向,則R=7/10=70%.
  3. F值,因為P值和R值通常是兩個相互矛盾的指標,即一個越高另一個越低,F則是兩者綜合考慮的指標,不考慮調節P、R權重的情況下,F=2PR/(P+R)
  4. 精確度(Accuracy):這個最好理解,就是被準確分類的比例,也就是正確率。如100條數據,90條是被正確分類的,則A=90/100=90%。

以上指標越高,說明模型效果越好。

二、情感分析產品設計

我們從上面內容可以知道,人工智能產品設計關注:數據——>模型——>效果評估。

現在我們以情感分析為例子說明產品設計的過程。

1)數據:

數據的選擇對最終模型的結果有直接影響,情感分析,根據不同的目的,選擇的數據也不同。如將情感分析運用于電影票房預測,則一些更新及時、內容豐富的數據源,如微博,是比較好的選擇。如果是應用于商品的評價,如電子產品,很多評測內容是無法在短短幾句話內描述清楚的,這時候微博不是個好的選擇,選擇論壇上更新較慢、但是詳細的內容就比較適合。

如果能在產品的早期就有引入人工智能的打算,則可以在產品中事先做好數據采集。

2)模型:

在選擇模型中,產品需要了解不同的模型的優缺點,進而選擇更加合適的模型。在情感分析中,NB、SVM、N-gram都是常用的模型,其中SVM效果最好(這是已有的結論),如果是其他的智能產品,可能需要算法團隊進行實驗,給出測試數據,進而選擇合適的模型。

3)效果評估:

效果評估在上文中已經描述得比較清楚,具體指標不再贅述。

4)產品呈現:

最后這一步,是將結果展示給用戶。在情感分析中,我們可以選擇雷達圖、詞云、情感趨勢圖來展示結果。取決于產品屬性,如電商產品評論挖掘,可以使用詞云;

如輿論分析,可以使用情感趨勢圖。

三、總結

人工智能產品的設計要關注:數據、模型、評判、呈現。

 

本文由 @躚塵 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自PEXELS,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!