一種基于專利態(tài)勢分析的定量科研立項(xiàng)篩選方法與流程

文檔序號：40385362發(fā)布日期：2024-12-20 12:08閱讀：3來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及技術(shù)評價，尤其涉及一種基于專利態(tài)勢分析的定量科研立項(xiàng)篩選方法。

背景技術(shù)：

1、當(dāng)前科研立項(xiàng)論證主要以同行評議為主導(dǎo)結(jié)合申報(bào)材料的方式進(jìn)行，該方法屬于基于專家經(jīng)驗(yàn)的定性分析存在相應(yīng)弊端。首先，同行評議的結(jié)果往往取決于評審專家的個人知識、經(jīng)驗(yàn)、觀點(diǎn)和偏見，可能導(dǎo)致評估結(jié)果的主觀性較強(qiáng)，缺乏統(tǒng)一的標(biāo)準(zhǔn)和客觀性。其次，評審人員的選擇的公正性和合理性難以保證。最后，已經(jīng)享有盛譽(yù)和資源的學(xué)者更容易獲得認(rèn)可和支持，而新興學(xué)者或邊緣領(lǐng)域的學(xué)者則可能面臨更多的困難和挑戰(zhàn)。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的是要提供一種基于專利態(tài)勢分析的定量科研立項(xiàng)篩選方法。旨在通過先進(jìn)的語義理解的專利聚類方法，提供一個全面且高效的科研立項(xiàng)篩選方法，幫助快速篩選科研立項(xiàng)項(xiàng)目。

2、為達(dá)到上述目的，本發(fā)明是按照以下技術(shù)方案實(shí)施的：

3、本發(fā)明包括以下步驟：

4、s1：獲取專利數(shù)據(jù)，利用預(yù)訓(xùn)練的chinese-bert模型對專利文本進(jìn)行向量化處理；

5、s2：利用umap算法對專利文本特征向量進(jìn)行降維處理，并通過k-means++算法對降維后的特征向量進(jìn)行聚類分析，識別出專業(yè)技術(shù)主題和技術(shù)功效主題；

6、s3：去除停用詞，將同一聚類類別的文檔合并為一個文本單元，運(yùn)用tf-idf算法計(jì)算每個詞的重要性，從而提取出每個聚類的主題關(guān)鍵詞；

7、s4：基于聚類結(jié)果構(gòu)建“技術(shù)-功效”矩陣，通過計(jì)算技術(shù)生命周期、技術(shù)創(chuàng)新性評價及市場競爭力評估，得出科研項(xiàng)目的定量篩選結(jié)果。

8、本發(fā)明的有益效果是：

9、本發(fā)明是一種基于專利態(tài)勢分析的定量科研立項(xiàng)篩選方法，與現(xiàn)有技術(shù)相比，本發(fā)明通過以下關(guān)鍵技術(shù)點(diǎn)實(shí)現(xiàn)了基于專利態(tài)勢分析的定量科研立項(xiàng)：

10、(1)本發(fā)明旨在全面、客觀、定量地開展科研立項(xiàng)分析工作，避免了目前主流的同行評議等方法中的主觀性判斷導(dǎo)致的不確定性。是一種同時又兼顧技術(shù)、市場和技術(shù)發(fā)展階段三個層面的輔助分析手段。

11、(2)本發(fā)明采用了先進(jìn)的預(yù)訓(xùn)練模型，這些模型已經(jīng)在大規(guī)模語料庫上進(jìn)行了預(yù)訓(xùn)練，能夠更好地捕捉文本中的深層次語義信息，顯著提高了對專利文檔語義理解的準(zhǔn)確性。此外，在將專利摘要文本轉(zhuǎn)換為向量后，本發(fā)明運(yùn)用高效的聚類算法對這些向量進(jìn)行分析，自動識別出專利文本中的專業(yè)技術(shù)主題，為用戶提供更為精準(zhǔn)的技術(shù)領(lǐng)域劃分。

12、通過以上兩種技術(shù)，得到技術(shù)-功效矩陣，最后計(jì)算出創(chuàng)新性評價。

技術(shù)特征：

1.一種基于專利態(tài)勢分析的定量科研立項(xiàng)篩選方法，其特征在于，包括以下步驟：

2.根據(jù)權(quán)利要求1所述的基于專利態(tài)勢分析的定量科研立項(xiàng)篩選方法，其特征在于：所述步驟s1具體為：選取經(jīng)過清洗后的專利文本數(shù)據(jù)，對文本進(jìn)行分詞并創(chuàng)建掩碼語言的輸入格式，再使用chinese-bert模型進(jìn)行領(lǐng)域適應(yīng)微調(diào)操作，接著利用微調(diào)后的chinese-bert模型將專利摘要和技術(shù)功效語段轉(zhuǎn)換為密集的向量表示，文本經(jīng)過chinese-bert模型計(jì)算之后，得到文本的表示為：

3.根據(jù)權(quán)利要求2所述的基于專利態(tài)勢分析的定量科研立項(xiàng)篩選方法，其特征在于：所述步驟s2具體為：

4.根據(jù)權(quán)利要求3所述的基于專利態(tài)勢分析的定量科研立項(xiàng)篩選方法，其特征在于：所述步驟s3中tf-idf算法公式如下：

5.根據(jù)權(quán)利要求4所述的基于專利態(tài)勢分析的定量科研立項(xiàng)篩選方法，其特征在于：所述步驟s4中技術(shù)創(chuàng)新性評價：采用chinese-bert模型將科研項(xiàng)目創(chuàng)新點(diǎn)、專業(yè)技術(shù)主題以及技術(shù)功效主題文本向量化，并通過計(jì)算向量間余弦相似度來度量項(xiàng)目創(chuàng)新點(diǎn)與技術(shù)點(diǎn)之間的相似度，并選取與創(chuàng)新點(diǎn)相似度最高的技術(shù)點(diǎn)的主題作為該項(xiàng)目的研究細(xì)分方向，并定量計(jì)算科研項(xiàng)目創(chuàng)新性評價指標(biāo)q2，中間分值采用插值法計(jì)算，計(jì)算公式為：

技術(shù)總結(jié)
本發(fā)明公開了一種基于專利態(tài)勢分析的定量科研立項(xiàng)篩選方法，包括獲取專利數(shù)據(jù)，利用預(yù)訓(xùn)練的Chinese?BERT模型對專利文本進(jìn)行向量化處理；利用UMAP算法對專利文本特征向量進(jìn)行降維處理，并通過K?Means++算法對降維后的特征向量進(jìn)行聚類分析，識別出專業(yè)技術(shù)主題和技術(shù)功效主題，將同一聚類類別的文檔合并為一個文本單元，運(yùn)用TF?IDF算法計(jì)算每個詞的重要性，從而提取出每個聚類的主題關(guān)鍵詞；基于聚類結(jié)果構(gòu)建“技術(shù)?功效”矩陣，通過計(jì)算技術(shù)生命周期、技術(shù)創(chuàng)新性評價及市場競爭力評估，得出科研項(xiàng)目的定量篩選結(jié)果。旨在通過先進(jìn)的語義理解的專利聚類方法，提供一個全面且高效的科研立項(xiàng)篩選方法，幫助快速篩選科研立項(xiàng)項(xiàng)目。

技術(shù)研發(fā)人員：尹靜,裴佳寧,羅干,王潘,王偉,杜有德,何博逾
受保護(hù)的技術(shù)使用者：中鐵成都科學(xué)技術(shù)研究院有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/19

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：尹靜,裴佳寧,羅干,王潘,王偉,杜有德,何博逾
技術(shù)所有人：中鐵成都科學(xué)技術(shù)研究院有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于專利態(tài)勢分析的定量科研立項(xiàng)篩選方法與流程