技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明涉及一種高效處理IP地址區(qū)域定位的方法和系統(tǒng),其方法包括:S1:通過日志文件收集單元收集包括IP地址的日志文件數(shù)據(jù)并存入文件池;S2:通過部署在Hadoop中的ETL對步驟S1中收集到的數(shù)據(jù)進(jìn)行包括過濾動作的預(yù)處理,并將預(yù)處理好的數(shù)據(jù)收集到Hadoop集群中并再次通過ETL對數(shù)據(jù)進(jìn)行壓縮處理;S3:通過hive的UDF功能對步驟S2中提取到的數(shù)據(jù)進(jìn)行進(jìn)一步提取并進(jìn)行分析處理以獲取IP地址定位信息。優(yōu)點在于:通過利用hive調(diào)用Hadoop進(jìn)行分布式計算,將IP地址定位功能通過hive的UDF功能開發(fā)集成,完成對IP地址區(qū)域定位的高效處理,提高IP地址的提取效率,降低資源的消耗。
技術(shù)研發(fā)人員:歐陽濤
受保護(hù)的技術(shù)使用者:上海斐訊數(shù)據(jù)通信技術(shù)有限公司
技術(shù)研發(fā)日:2017.05.11
技術(shù)公布日:2017.09.22