近日,數之聯首席算法官陳端兵和廣東外語外貿大學劉景發教授、南京信息工程大學東熠等人合作在SCI中科院二區期刊(Expert Systems With Applications)上合作發表題為《Applying ontology learning and multi-objective ant colony optimization method for focused crawling to meteorological disasters domain knowledge》的學術論文。劉景發教授為論文第一作者,陳端兵和東熠為論文通信作者。
Expert Systems With Applications 屬于Elsevier Science旗下的國際頂級學術期刊,期刊影響因子:6.594。
論文鏈接:https://www.sciencedirect.com/science/article/abs/pii/S095741742200210X
?
氣象災害占各種自然災害的70%以上,對人民的生命財產安全有著巨大的影響。例如,2016年,中國天津遭受“7?20”暴雨災害,受災人數超過14萬人,直接經濟損失超過2.5億元。2019年4月,巴基斯坦暴雨引發洪水,造成至少49人死亡,176人受傷。為了應對氣象災害的影響,除了災害發生時應急和災后重建,有效預警和預防措施也是必不可少的。
?
因此,獲取氣象災害的預警、預防措施和應急響應信息至關重要。由于互聯網具有巨大的數據資源,已成為獲取大量氣象災害信息的重要渠道。目前,互聯網上的網頁規模龐大且不斷增長,而氣象災害相關網頁信息稀疏,傳統的搜索引擎(如谷歌、百度)和網絡爬蟲(如Scrapy、Pyspider)在信息檢索的準確率方面面臨著巨大的挑戰。與這些方法不同的是,聚焦爬蟲能基于互聯網上網頁的價值來過濾網頁。對于用戶的特定搜索主題,聚焦爬蟲返回的結果更精簡、更準確。聚焦爬蟲的發展呈現出日益增長的趨勢。
?
目前,基于語義分析的聚焦爬蟲是信息檢索領域的研究熱點。
?
領域本體一般用于構建聚焦爬蟲的主題模型。為了克服人工構建本體過程中構建者知識儲備和主觀意識的局限性,該論文結合潛在Dirichlet分配和Apriori算法的領域本體半自動構建方法,提出了一種基于本體學習爬蟲技術。
?
在評價超鏈接與特定主題的相關性時,通常是采用綜合考慮網頁文本和鏈接結構的聯合評價方法。但傳統的加權算法難以合理界定這些評價指標的最優權重。針對這一問題,該論文提出了一種基于多目標的鏈路評價優化模型,并提出了一種基于多目標的蟻群優化算法(MOACO)。在該算法中,將最近鄰候選解(NFCS)方法與快速非支配排序方法相結合,選擇一組pareto最優超鏈接,并能指導爬蟲的搜索方向。
?
該論文還基于臺風災害和暴雨災害領域知識進行了聚焦爬行實驗,結果表明,文中所提出的聚焦爬蟲具有檢索主題相關網頁的能力。
資源中心
新聞資訊
公司新聞
媒體報道
品牌活動
關于我們
加入我們
合作熱線:028-86661321-817
川公網安備 51010702001879號 成都數之聯科技股份有限公司 Copyright? 2022, unionbigdata.com. All rights reserved 蜀ICP備13021642號-5
專業服務
讓制造更智能、城市更智慧
通用
敏捷智能BI平臺
分布式智能AI平臺
智慧工業
智慧監管
智慧法院
泛自然資源
智慧工業
智慧監管
智慧法院
泛自然資源
國土資源大數據解決方案
智慧應急大數據解決方案
生態河湖大數據解決方案
更多
實現感知、傳輸、協同、決策等綜合運營管理能力,優化資源配置、降低運營成本、提高運營效率。
由點至面、循序漸進的構建釀酒生產大數據分析應用體系;圍繞酒業營銷構建從營銷效能到消費轉化的全鏈分析體系。
智慧軍事大數據解決方案
專業服務
關于我們
智慧工業
新聞資訊
公司新聞
媒體報道
品牌活動
智慧監管
智慧法院
泛自然資源
建立比較完備的林業各類信息資源數據庫,滿足部門、政府日常數據需求和交互使用。
更多案例
核心關鍵詞:工業AI檢測,數據資產管理,司法數據中臺,遙感大數據,AOI設備