全球專利數據怎么玩才有趣?之 共現圖譜(二)

0 評論 0 瀏覽 0 收藏 7 分鐘

?本文介紹了從全球專利數據中構建共現圖譜并對網絡中心度進行測算方法,為產業研究提供了一種新的視角和工具,幫助用戶更有效地識別和分析技術領域的頂尖資源。

一、說職場故事

招才引智、科研合作、科技攻關都有以下需求:

  • 找到某個技術領域的頂尖人才團隊
  • 找到某個技術領域的頂尖科研機構/企業

如何通過大數據挖掘的方式幫客戶實現這些需求呢?以下我們從全球專利視角給出對應答案。

二、共現圖譜構建、中心度的測算

接下來我們主要講解如何從全球專利中找到頂尖團隊、頂尖科研機構/企業,在進入這個主題之前我們需要學習下共現圖譜知識。

從下圖我們可以看出,同一篇專利可能存在多個申請人、發明設計人、IPC分類號。

全球專利數據怎么玩才有趣?之 共現圖譜(二)

如果有100條專利,我們就可以根據這3個字段構建共現關系。比如,以IPC為例,就可以構建IPC共現圖譜:

全球專利數據怎么玩才有趣?之 共現圖譜(二)

在該圖中,節點的大小表示相應分類號出現的頻次,節點越大,說明100篇專利與該分類號相關的標準必要專利越多;節點之間的連線表示兩個分類號同時出現在一個標準必要專利中,連線越粗,代表兩個節點同時出現的次數越多,關系越密切。

社區發現是一種將網絡分成若干個社區的方法,根據其網絡中節點之間的聯系和相似性將節點劃分為不同的社區,處于同一社區的節點之間更加相似、聯系更加緊密。

在社會網絡分析方法中,常見的衡量節點重要性的指標有點度中心度、中介中心度、接近中心度特征向量中心度,可以根據這些中心度計算綜合中心度從而確定某個節點在整個網絡的重要性,各個中心度的說明如下:

三、說應用場景

有了共現圖的構建方法及網絡中心度的測算方法,在產業研究領域主要應用場景有:

  • 找到某技術領域的頂尖人才團隊
  • 找到某技術領域的頂尖科研機構/企業
  • 找到某技術領域的核心技術

應用場景一 :找到某個技術領域的頂尖人才團隊

比如推薦人工智能領域5個頂尖人才團隊

實施步驟 將人工智能和IPC體系做映射(或者根據關鍵詞制定搜索策略)形成專利數據集,在數據集基礎上構建“專利發明人共現圖譜”,在共現圖譜中計算網狀人物中的綜合中心度,根據綜合中心度取TOP5作為團隊領頭人,再將領頭人到共現圖譜中找合作最緊密人物,最終形成以領頭人的領域團隊,流程如下圖所示:全球專利數據怎么玩才有趣?之 共現圖譜(二)

應用場景二:找到某個技術領域的頂尖頂尖科研機構/企業

比如推薦人工智能領域的頂尖的科研機構團隊

方法同上,只不過這次換成“申請人”構建共現圖譜,這里可以分為二類:一類為研究機構、一類為企業,流程如下:

全球專利數據怎么玩才有趣?之 共現圖譜(二)

應用場景三:找某個技術領域的核心技術

比如人工智能領域的核心技術有哪些

方法同上,這次根據專利所屬“IPC分類號”構建共現圖譜,流程如下:

全球專利數據怎么玩才有趣?之 共現圖譜(二)

需要特別指出的是,如果需要對核心IPC進一步凝練成技術短語的化,可以利用大模型語義理解和抽取能力做進一步工作。

四、寫在后面的話

本文主要介紹了共現圖譜的構建方法、網絡中心度的測算方法,然后闡述了共現圖譜可以在產業研究領域的應用場景。需要注意一下幾點:

  1. 范圍可以不限于全球專利:雖然講述的是全球專利分析挖掘,但該分析研究方法可以拓展到“頂刊”“全球項目”數據的挖掘中。
  2. 在實際應用中可以保持靈活性:比如本文用的“綜合中心度”代表節點的重要性,實際可以根據情況選取任意一個中心度作為重要性指標。

本文由 @王海濤 原創發布于人人都是產品經理。未經作者許可,禁止轉載

題圖來自Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!