技術編號:6518777
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明公開了一種基于Hadoop平臺的Deep?Web查詢接口聚類方法,包括通過本體對Deep?Web查詢接口進行語義擴展,并對Deep?Web查詢接口進行潛在語義分析;選取支撐分布式并行計算的聚類算法,將所選取的聚類算法進行并行化改造,分別設計map函數、combine函數和reduce函數。所述方法還包括配置用于減少網絡數據傳輸量的數據壓縮函數;搭建分布式平臺,在集群上運行。本發(fā)明通過構建集群,充分利用并行處理的優(yōu)勢,將待聚類的查詢接口分發(fā)到多臺機器上...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。