算法人生(16):從“K均值 & C均值”看“為人處事之道”

0 評論 2202 瀏覽 2 收藏 9 分鐘

我們都知道有一類人在生活中特別“雙標”,其實這種現象在代碼中也存在。這篇文章,我們從無監督學習中的K均值 & C均值兩種聚類算法中可窺見一些一樣的思路。

現代生活中,經常會聽到一個詞“雙標”,通常用來描述某人對人對己采用了不同的標準,當然生活中會出現這樣的情況,個人處于“利己”的思維來“雙標”, 但“雙標”可能還有另外一個原因,就是這個人是懂得“變通”的人。我們從K均值 & C均值兩種聚類算法中可窺見一些思路。

K均值(K-means)和C均值(C-means,也稱為模糊C均值,Fuzzy C-Means, FCM)是兩種常見的聚類算法,以下簡單介紹下這兩種方法,已經熟知的小伙伴可略過。

K-means算法是一種無監督學習方法,它的目標是將數據集劃分為K個不重疊的子集(簇),使得每個數據點到其所屬簇中心(質心)的平方距離之和最小。這個算法假設簇是凸的,并且每個數據點只屬于一個簇

大致步驟為:

  1. 初始化:隨機選擇K個數據點作為初始質心。
  2. 分配:將每個數據點分配給最近的質心所在的簇。
  3. 更新質心:重新計算每個簇的質心,通常為該簇內所有數據點的均值。
  4. 重復:重復步驟2和3直到質心不再發生顯著變化或達到預定的迭代次數。

C-means是K-means的一種擴展,它允許數據點以不同程度(隸屬度)屬于不同的簇。每個數據點對所有簇都有一個隸屬度,介于0和1之間,表示它屬于該簇的程度。

大致步驟為:

  1. 初始化:為每個簇隨機選擇一個中心,并為所有數據點賦予初始的隸屬度向量,通常為均勻分布或隨機初始化。
  2. 更新隸屬度:根據當前質心,計算每個數據點到各個簇中心的距離,并據此更新每個數據點的隸屬度,使類內誤差平方和最小化,同時保證所有簇對每個點的隸屬度之和為1。
  3. 更新質心:根據新的隸屬度向量,重新計算每個簇的中心,作為所有數據點的加權平均,權重是數據點對該簇的隸屬度。
  4. 重復:重復步驟2和3,直到質心的變化小于某個閾值或達到迭代上限。

總的來說,

  • K均值:是一種硬聚類方法,即每個數據點被劃分到一個且僅一個聚類中。聚類的歸屬是明確無誤的。適合于聚類邊界明確、聚類間隔較大的數據集。這個算法較為簡單直接,計算效率高,但對于復雜或模糊邊界的數據集靈活性較低。
  • C均值:是一種軟聚類方法,允許數據點以一定的隸屬度或概率屬于多個聚類。這意味著數據點可以同時屬于多個聚類,且對每個聚類有一個隸屬度分數。更適用于數據點可能屬于多個類別、聚類邊界模糊或重疊的情況。但它的計算復雜度高于K-means,因為需要迭代更新所有數據點的隸屬度。而且,它的參數選擇(如隸屬度的隸屬度因子m)對結果影響較大,且不易確定最佳值。

那在“雙標”的場景下,可能這個人是出于“對人對己兩套標準”,也可能是他把這件事歸屬到了多個類別下(如A和B兩個類別),某個場景可能A類別的隸屬度高于B類別,而某個同類型的場景B類別又高于了A類別,也會給人一種雙標的“錯覺”。想知道“雙標”的原因到底是屬于哪一類,主要是看場景,這里就要考驗每個人應對不同場景下的“應變力”了。這里分享個佛經中的小故事:

古代有個君王去找佛陀說,他的國家正在面臨外來軍隊的威脅,但是他們國家的人都深受佛陀眾弟子的教導,不愿sha生,自然就沒有什么戰斗力。但如果士兵們都這樣,這個國家只能被侵略了,百姓會被欺負。

這個國王很困惑,因為他也深受佛陀的教導,覺得很兩難,不知道該如何抉擇。

佛陀的回答很快就讓他解了困惑,回去安排士兵保護家園。佛陀回答的大意是,如果sha念是出于自己的私利自然不行,但是如果sha是萬不得已,是為了保護他人那就不一樣了,如果有能力保護,卻沒有保護,眼看著同胞被欺負那也是另外一種sha。

于是佛陀下令他的僧侶不能再繼續對這個國家的士兵講法,從而保證士兵們面對敵人時的戰斗力,避免他們用錯了“執”,好心辦了壞事。這里佛陀說的意思是就是要“變通”,如果不分場景,死守某個詞,某段話,就會陷入“法執”,被文字束縛住了思維。

人家常說,沒有佛經,看不到佛法,但是還有后面一句,佛經里沒有佛法。佛經是看到佛法的路,但佛法不在佛經里,看了佛經后還要靠“實踐”才可能看到佛法。

那從以上“變通”這個角度看,生活中,你喜歡c均值的思維還是k均值的思維呢?筆者的想法還是看“場景”,在此舉例一二,大家可各自發散!

K均值適合的場景

  1. 決策明確性要求高的場合:在需要快速明確決策的商業或緊急情況下,K均值的思維方式可以迅速將問題和解決方案進行明確分類,加快決策過程,如危機管理、緊急響應等。
  2. 法律或規則嚴格的場景:某些原則性的或沒有容錯的事情,只有0次或N次的,K均值的硬聚類思維有助于確保規則得到嚴格遵守,避免模糊地帶的產生。

C均值適合的場景

  1. 多元文化環境:在多元文化的工作或生活環境中,人們來自不同的背景,擁有不同的價值觀和行為習慣。C均值的思維方式可以幫助個體理解并接納不同文化之間的交叉和重疊,促進更好的跨文化交流和合作。
  2. 多任務工作環境:在需要同時處理多個項目或任務的工作環境中,C均值思維方式幫助個體在各個項目間平衡精力和資源,優化總體工作效率。

以上只是拋磚引玉,總體來說,如果能保持對“原則”的深刻認知,同時又抱有“變通”的思維,就能在明白“知識層面”的道理后,根據場景變通去應用出來,才能更加擁有“應用層面”的智慧。

用“手”指“月”,要人看的是“月”,不是指向“月”的“手”,文字或詞匯是想讓人明白某個道理,但如果執著于某段文字,不知道根據這個道理的意思,分場景來“變通”,就會失了焦點,過猶而不及了。

本文由 @養心進行時 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!