全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

0 評論 1045 瀏覽 1 收藏 7 分鐘

?本文介紹了從全球?qū)@麛?shù)據(jù)中構建共現(xiàn)圖譜并對網(wǎng)絡中心度進行測算方法,為產(chǎn)業(yè)研究提供了一種新的視角和工具,幫助用戶更有效地識別和分析技術領域的頂尖資源。

一、說職場故事

招才引智、科研合作、科技攻關都有以下需求:

  • 找到某個技術領域的頂尖人才團隊
  • 找到某個技術領域的頂尖科研機構/企業(yè)

如何通過大數(shù)據(jù)挖掘的方式幫客戶實現(xiàn)這些需求呢?以下我們從全球?qū)@暯墙o出對應答案。

二、共現(xiàn)圖譜構建、中心度的測算

接下來我們主要講解如何從全球?qū)@姓业巾敿鈭F隊、頂尖科研機構/企業(yè),在進入這個主題之前我們需要學習下共現(xiàn)圖譜知識。

從下圖我們可以看出,同一篇專利可能存在多個申請人、發(fā)明設計人、IPC分類號。

全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

如果有100條專利,我們就可以根據(jù)這3個字段構建共現(xiàn)關系。比如,以IPC為例,就可以構建IPC共現(xiàn)圖譜:

全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

在該圖中,節(jié)點的大小表示相應分類號出現(xiàn)的頻次,節(jié)點越大,說明100篇專利與該分類號相關的標準必要專利越多;節(jié)點之間的連線表示兩個分類號同時出現(xiàn)在一個標準必要專利中,連線越粗,代表兩個節(jié)點同時出現(xiàn)的次數(shù)越多,關系越密切。

社區(qū)發(fā)現(xiàn)是一種將網(wǎng)絡分成若干個社區(qū)的方法,根據(jù)其網(wǎng)絡中節(jié)點之間的聯(lián)系和相似性將節(jié)點劃分為不同的社區(qū),處于同一社區(qū)的節(jié)點之間更加相似、聯(lián)系更加緊密。

在社會網(wǎng)絡分析方法中,常見的衡量節(jié)點重要性的指標有點度中心度、中介中心度、接近中心度特征向量中心度,可以根據(jù)這些中心度計算綜合中心度從而確定某個節(jié)點在整個網(wǎng)絡的重要性,各個中心度的說明如下:

三、說應用場景

有了共現(xiàn)圖的構建方法及網(wǎng)絡中心度的測算方法,在產(chǎn)業(yè)研究領域主要應用場景有:

  • 找到某技術領域的頂尖人才團隊
  • 找到某技術領域的頂尖科研機構/企業(yè)
  • 找到某技術領域的核心技術

應用場景一 :找到某個技術領域的頂尖人才團隊

比如推薦人工智能領域5個頂尖人才團隊

實施步驟 將人工智能和IPC體系做映射(或者根據(jù)關鍵詞制定搜索策略)形成專利數(shù)據(jù)集,在數(shù)據(jù)集基礎上構建“專利發(fā)明人共現(xiàn)圖譜”,在共現(xiàn)圖譜中計算網(wǎng)狀人物中的綜合中心度,根據(jù)綜合中心度取TOP5作為團隊領頭人,再將領頭人到共現(xiàn)圖譜中找合作最緊密人物,最終形成以領頭人的領域團隊,流程如下圖所示:全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

應用場景二:找到某個技術領域的頂尖頂尖科研機構/企業(yè)

比如推薦人工智能領域的頂尖的科研機構團隊

方法同上,只不過這次換成“申請人”構建共現(xiàn)圖譜,這里可以分為二類:一類為研究機構、一類為企業(yè),流程如下:

全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

應用場景三:找某個技術領域的核心技術

比如人工智能領域的核心技術有哪些

方法同上,這次根據(jù)專利所屬“IPC分類號”構建共現(xiàn)圖譜,流程如下:

全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)

需要特別指出的是,如果需要對核心IPC進一步凝練成技術短語的化,可以利用大模型語義理解和抽取能力做進一步工作。

四、寫在后面的話

本文主要介紹了共現(xiàn)圖譜的構建方法、網(wǎng)絡中心度的測算方法,然后闡述了共現(xiàn)圖譜可以在產(chǎn)業(yè)研究領域的應用場景。需要注意一下幾點:

  1. 范圍可以不限于全球?qū)@?/strong>雖然講述的是全球?qū)@治鐾诰?,但該分析研究方法可以拓展到“頂刊”“全球項目”?shù)據(jù)的挖掘中。
  2. 在實際應用中可以保持靈活性:比如本文用的“綜合中心度”代表節(jié)點的重要性,實際可以根據(jù)情況選取任意一個中心度作為重要性指標。

本文由 @王海濤 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!