如何進行遷移學習?對產品經理有什么啟發?

3 評論 4079 瀏覽 17 收藏 9 分鐘

遷移是機器學習中一種常見的方法,可以通過遷移學習,將一些建好的學習模型通過遷移的方式來加速訓練過程。

遷移學習概述

遷移學習是人工智能機器學習中的一種(除了遷移學習還有深度學習、強化學習),將一個開發模型應用到其他任務或是類型中,也就是在機器處理全新的領域時,難以獲取大量數據取構建模型時可以通過遷移學習的方法,通過少量數據訓練從而適用于新領域。通俗來講,遷移學習就是一種舉一反三的學習方法。

比如:我們學會了彈吉他,我們再去學習鋼琴、小提琴等其他樂器,可以節約好多時間,我們可以從學習吉他中的樂理知識、音階等相關知識,遷移到其他樂器中,從而降低我們學習的成本,節約學習的時間。

遷移是機器學習中一種常見的方法,通常應用到計算機視覺、自然語言處理等相關人工智能領域,通過神經網路學習需要大量數據、長時間的計算,某些情況下我們難以獲取足夠的資源,所以我們通過遷移學習的方式,將一些建好的學習模型通過遷移的方式來加速訓練過程。

如何進行遷移學習?

在理解如何進行遷移學習中,我們先了解一下如下定義:

域:一個域 D 由一個特征空間 X 和特征空間上的邊際概率分布 P(X) 組成,其中 X=x1,x2,…xn 。舉個例子:對于一個有文檔,其有很多詞袋表征(bag-of-words representation)X 是所有文檔表征的空間,而 xi 是第 i 個單詞的二進制特征。P(X)代表對X的分布。

任務:在給定一個域 D={X,P(X)} 之后,一個任務 T 由一個標簽空間 y 以及一個條件概率分布 P(Y/X) 構成,其中,這個條件概率分布通常是從由特征—標簽對 xi,yi組成的訓練數據中學習得到。

源域:在遷移學習中,我們已有的知識叫做源域。

目標域:在遷移學習中,要學習的新知識叫目標域。

以上概念如果不是專門做AI技術的同學可能很難理解,那我們舉個例子來解釋一下:

有一個養狗的高手,對不同的狗狗的類型都能分辨出來,能夠識別不同狗狗的特征。有一天想去賣賣貓貓了,他就從養狗狗的經驗上去學習貓貓,分辨貓貓,發現按照狗狗狗的特征是難以正確的分辨貓貓的,因此他又重新學習了貓貓的特征。

在以上案例中:域就是貓貓或狗狗,源域就是狗狗,目標域就是貓貓,任務就是貓貓或狗狗的特征或是特點,這樣說就好理解了。

在遷移學習中有不同的方法:

1. 基于實例的遷移學習方法

意思是說在源域中找到與目標域相似的數據,把這個數據的權值進行調整,讓目標域與源域權值數據進行匹配,然后對調整的數據進行訓練學習,不斷的調整權值,最終形成目標域的模型。

這種屬于源域中的樣本進行遷移,也就是樣本與樣本之間相似度較高的情況,我們看如下圖片(以下圖片來自于百度):

2. 基于特征的遷移學習方法

意思是說通過源域與目標域相同的特征進行提取,找到共同特征,然后學習。它與基于實例的遷移學習方法,不同在于——基于實例的是從實際數據中進行選擇來匹配與目標域相似的部分,進行學習,基于特征的是找到源域與目標域的相同交集特征,進行學習。

如下圖所示(圖片來自于百度):

3. 基于模型的遷移學習方法

意思是說通過源域訓練好的模型,直接應用到目標域中,通過目標域中少量數據去訓練此模型,進行學習,比如:你有一個識別狼狗的模型,這個模型可以男出來訓練哈士奇。

4.基于關系的遷移學習方法

意思是說當兩個域是有某些相似的時候,他們之間存在某種關系,我們可以根據域中的相同的關系背后邏輯進行遷移,比如:生物病毒傳播的規律遷移到電腦病毒的傳播規律。

遷移學習對我們產品經理的啟發

通過對遷移學習的概述以及遷移學習的方法的介紹,我們總結一下遷移學習使用場景:

  1. 數據量不足的問題:一方面是因為某些領域,數據量比較少;一方面是因為收集大量數據需要較高的資源和成本,我們需要考慮通過遷移學習的方法。
  2. 個性化方面的問題:通過群體數據,難以反映一個個體的特征。

對于我們產品經理,我們在設計產品或是設計某些邏輯的時候,可以看一下我們設計場景是否符合遷移學習的使用場景,我們如果通過遷移學習的方法,去解決我們的產品設計問題。

比如以下案例:

數據量成本案例

比如:不同產品用戶評價模型的遷移,一個產品好或者壞,我們需要分析大量用戶的評價,通過對評價的標注,建立評價模型但。是如果我們有大量產品,并且不同用戶有不同的用戶評價習慣,不同的用語,來表達對產品的好或是壞,我們很難收集到全面的用戶評價數據。

因此,我們只需要從少量產品大量數據評價中去標注,去訓練,找打標注模型,通過此模型應用到其他產品中,我們就可以迅速分辨出這個產品的在用戶眼里是好或者是壞。

個性化推薦案例

比如:我們有一個售賣書籍的電商平臺,根據用戶偏好、行為等對其做了智能推薦,然后我們想在電商平臺上新增了電影推薦內容。

假如我們想在這個產品一上線就能智能推薦給用戶,這時候我們可以使用書籍的智能推薦方案遷移到電影內容推薦這個產品上,比如:某一用戶群體喜歡懸疑類書籍,那我們可以推薦一些懸疑類電影內容。

再比如:我們一個新APP冷啟動時的個性化推薦,是否可以利用之前已上線APP的用戶畫像描述,通過特征遷移的方式,做個性化推薦?

本文通過對遷移學習的介紹,希望我們產品經理我們設計產品在考慮后臺設計邏輯時有一些啟發!

 

本文由 @?羅飛 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 很棒,學習了

    來自上海 回復
    1. 多謝多謝!

      來自北京 回復