欧美性大战XXXXX久久久√,狠狠躁夜夜躁人人躁婷婷,亚洲美女高潮久久久久

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

策略產品經理：通俗易懂了解機器學習原理（下篇）

策略產品Arthur

2022-12-02

0 評論 3440 瀏覽 11 收藏

16 分鐘

作為策略產品經理，簡單理解有關機器學習的相關原理，可以更了解核心的應用場景，從而助推策略產品經理去更好地服務于業務。本篇文章里，作者針對機器學習的部分算法原理與應用場景進行了一定解讀，一起來看。

今天我們繼續講完剩下的幾個算法原理與應用場景。

一、基本的機器學習算法

1. 支持向量機算法（Support Vector Machine,SVM）

1）支持向量機入門了解

支持向量機可以算是機器學習當中比較難的部分了，一般很多學習機器學習的同學學到這個部分都會選擇“狗帶放棄”，但是我們還是要堅持去通俗易懂的理解，盡量幫助大家深入淺出。

SVM一般用于解決二分類問題（也可以解決多分類和回歸問題，目前主要的應用場景就是圖像分類、文本分類以及面部識別等場景），歸根結底就是一句話最大化離平面最近的點到到平面之間的距離，這個其實就叫支持向量；類似圖中的直線，對兩邊的點形成的超平面（綠色虛線與紅色虛線）能夠最大。

2）線性分類器定義

在機器學習的上篇中講到線性回歸為一元線性回歸，一元也就是一個自變量加上一個因變量，這種在二維坐標軸可以表示成（x，y）；假設有兩類要用來區分的樣本點，一類用黃色的“●”，另一類用紅色的“□”，中間這條直線就是用來講兩類樣本完全分開的分類函數，用數學化的方式描述圖片就是：

樣本數據：11個樣本，2個輸入 (x1,x2) ，一個輸出y。

第i個樣本的輸入：

輸出y：用1（紅色方形□）和-1（黃色圓點●）作為標簽。

訓練樣本集合：

訓練的核心目標：以訓練的樣本為研究的對象，找到一條直線能夠將兩類樣本能夠有效分開，一個線性函數能夠把樣本進行分開的話，我們就稱之為樣本的線性可分性：

當樣本點位（x1，x2，y）的時候，找到上述這條直線進行平面樣本點分割，其中區域 y = 1（圖中的類+1）的點用下述公式表達：

那么y = -1類的點表達式就是：

上述就是線性可分的明確定義，由此類推用更高維度的超平面可以通過增加x維度來表達，我們認為這種表達方式會比較的麻煩會用矩陣表達式來進行代替：

一般簡寫為，方便理解：

大家要厘清一個概念，在公式當中X不是代表橫坐標，而是樣本的向量表達式，假如上圖最下方的紅框坐標是（5,1），那么這個對應的列向量表達式如下所示；其中WT 代表是一個行向量，就是我們所說的位置參數，X是一組列向量，是已經知道的樣本數據，Wi表示的就是Xi的系數，行向量和列向量相乘就得到了1*1的矩陣，也就是一個實數了：

3）如何找到合適的參數構建線性分類器

機器學習就是找到通過學習的算法找到最合適超參Wi，支持向量機有兩個目標：第一個是使間隔最大化，第二個是使樣本正確分類；

我們都學過歐式距離公式，二維空間當中的點位（x，y）到對應直線的距離可以表示為，

用這個邏輯推演擴展到n維度空間之后，n維度的向量表示為：

即n維度列向量到直線公式的距離可以表示為：

其中：

根據下圖可以指導，支持向量到超平面的距離就是d，其他點到超平面的距離就會大于d；

所以按照歐式距離原理，我們就可以得到下列式子：

公式兩邊同時除以d，并且我們令||w||d = 1（方便公式推導，對目標函數本身無影響），可以得到下列式：

并且我們對方程進行合并可以得到式：

我們就得到了最大間隔下的兩個超平面，分別為過綠色原點的平面和過黃色三角的平面，我們來最大化這個距離就可以得到：

我們令y(wTx+b ) = 1，最后可以得到：

再做一個分子與分母之間轉化可以得到：

為了簡化問題，再把w里面的根號去除一下，所以我們最終優化問題可以得到要求解決的w：

策略產品了解支持向量機SVM到這個階段已經差不多了，后面詳細的求解w涉及到對偶問題的求解拉格朗日乘數法和強對偶問題求硬間隔，當分類點位存在交織的時候還需要設定軟間隔（放寬對于樣本的要求，允許少量的樣本分類錯誤），已經屬于偏算法數學解題范疇了，感興趣同學可以深度了解與推導一下。

4）支持向量機的優缺點

優點：

理論基礎完善，相比較于神經網絡可解釋性更強；
求解是全局最優而不是局部最優；
同時適用于線性問題和非線性問題（核函數）兩種；
高緯度樣本空間同樣也能用SVM支持向量機；

缺點：

SVM不太適合超大的數據集類型。

2. 樸素貝葉斯算法-Naive Bayes

樸素貝葉斯是基于貝葉斯定理和條件獨立性假設的分類方法，屬于生成模型（工業界多用于垃圾郵件分類、信用評估以及釣魚網站監測等場景），核心思想就是學習輸入輸出的聯合概率模型P(X,Y)，然后使用條件概率公式求得P(Y | X )-表示在X發生的條件下，Y事件發生的概率。Arthur先帶大家回顧一下大學數學概率論的基礎知識，便于大家能夠快速理解。

1）概率論基礎必備知識

其中條件概率公式如下所示：