全球?qū)@麛?shù)據(jù)怎么玩才有趣?之 共現(xiàn)圖譜(二)
?本文介紹了從全球?qū)@麛?shù)據(jù)中構建共現(xiàn)圖譜并對網(wǎng)絡中心度進行測算方法,為產(chǎn)業(yè)研究提供了一種新的視角和工具,幫助用戶更有效地識別和分析技術領域的頂尖資源。
一、說職場故事
招才引智、科研合作、科技攻關都有以下需求:
- 找到某個技術領域的頂尖人才團隊
- 找到某個技術領域的頂尖科研機構/企業(yè)
如何通過大數(shù)據(jù)挖掘的方式幫客戶實現(xiàn)這些需求呢?以下我們從全球?qū)@暯墙o出對應答案。
二、共現(xiàn)圖譜構建、中心度的測算
接下來我們主要講解如何從全球?qū)@姓业巾敿鈭F隊、頂尖科研機構/企業(yè),在進入這個主題之前我們需要學習下共現(xiàn)圖譜知識。
從下圖我們可以看出,同一篇專利可能存在多個申請人、發(fā)明設計人、IPC分類號。
如果有100條專利,我們就可以根據(jù)這3個字段構建共現(xiàn)關系。比如,以IPC為例,就可以構建IPC共現(xiàn)圖譜:
在該圖中,節(jié)點的大小表示相應分類號出現(xiàn)的頻次,節(jié)點越大,說明100篇專利與該分類號相關的標準必要專利越多;節(jié)點之間的連線表示兩個分類號同時出現(xiàn)在一個標準必要專利中,連線越粗,代表兩個節(jié)點同時出現(xiàn)的次數(shù)越多,關系越密切。
社區(qū)發(fā)現(xiàn)是一種將網(wǎng)絡分成若干個社區(qū)的方法,根據(jù)其網(wǎng)絡中節(jié)點之間的聯(lián)系和相似性將節(jié)點劃分為不同的社區(qū),處于同一社區(qū)的節(jié)點之間更加相似、聯(lián)系更加緊密。
在社會網(wǎng)絡分析方法中,常見的衡量節(jié)點重要性的指標有點度中心度、中介中心度、接近中心度和特征向量中心度,可以根據(jù)這些中心度計算綜合中心度從而確定某個節(jié)點在整個網(wǎng)絡的重要性,各個中心度的說明如下:
三、說應用場景
有了共現(xiàn)圖的構建方法及網(wǎng)絡中心度的測算方法,在產(chǎn)業(yè)研究領域主要應用場景有:
- 找到某技術領域的頂尖人才團隊
- 找到某技術領域的頂尖科研機構/企業(yè)
- 找到某技術領域的核心技術
應用場景一 :找到某個技術領域的頂尖人才團隊
比如推薦人工智能領域5個頂尖人才團隊
應用場景二:找到某個技術領域的頂尖頂尖科研機構/企業(yè)
比如推薦人工智能領域的頂尖的科研機構團隊
方法同上,只不過這次換成“申請人”構建共現(xiàn)圖譜,這里可以分為二類:一類為研究機構、一類為企業(yè),流程如下:
應用場景三:找某個技術領域的核心技術
比如人工智能領域的核心技術有哪些
方法同上,這次根據(jù)專利所屬“IPC分類號”構建共現(xiàn)圖譜,流程如下:
需要特別指出的是,如果需要對核心IPC進一步凝練成技術短語的化,可以利用大模型語義理解和抽取能力做進一步工作。
四、寫在后面的話
本文主要介紹了共現(xiàn)圖譜的構建方法、網(wǎng)絡中心度的測算方法,然后闡述了共現(xiàn)圖譜可以在產(chǎn)業(yè)研究領域的應用場景。需要注意一下幾點:
- 范圍可以不限于全球?qū)@?/strong>雖然講述的是全球?qū)@治鐾诰?,但該分析研究方法可以拓展到“頂刊”“全球項目”?shù)據(jù)的挖掘中。
- 在實際應用中可以保持靈活性:比如本文用的“綜合中心度”代表節(jié)點的重要性,實際可以根據(jù)情況選取任意一個中心度作為重要性指標。
本文由 @王海濤 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務
- 目前還沒評論,等你發(fā)揮!