COMPUT GEOSCI-UK:基于XGBoost算法的地震、爆炸和礦震分類研究
由于高頻地震波受傳播路徑影響大,固定臺網(wǎng)記錄的低震級地震(M<3.0)的震源參數(shù)求解仍然困難,因此地震事件分類方法一般是從地震記錄中提取識別特征。單一特征的缺陷是分類能力的穩(wěn)定性及普適性較差,因而多特征綜合的人工智能方法在地震分類中得到了廣泛的應(yīng)用。近些年提出的極限梯度提升算法(Extreme Gradient Boosting, XGBoost)算法,是一種設(shè)計效率高、適用性強的新型提升決策樹算法,已應(yīng)用于不同領(lǐng)域,但在地震學(xué)研究中的應(yīng)用較少,值得進一步探索。
中國地震局地球物理研究所王婷婷助理研究員針對地震、爆炸與礦震的分類問題,基于時頻域地震記錄,量化提取了幅值比、高低頻能量比、拐角頻率、持續(xù)時間、復(fù)雜度、過零率、倒譜復(fù)雜度、瞬時頻率復(fù)雜度等8類36個特征,建立了特征提取數(shù)據(jù)集(圖1);作為對比,利用多窗口譜分析對地震記錄建立了201維波形譜數(shù)據(jù)集;利用XGBoost方法分別構(gòu)建了地震/爆炸、地震/礦震、爆炸/礦震的兩分類與三分類模型(圖2),通過混淆矩陣、ROC等指標對比了基于特征提取數(shù)據(jù)集和波形譜數(shù)據(jù)集的分類能力;利用研究區(qū)域內(nèi)和研究區(qū)域外數(shù)據(jù)進行了模型的泛化能力測試,并與SVM方法進行對比。本文得到特征提取方法可以突出不同類型地震事件之間的差異;分類模型的準確率均高于90%,其中地震與礦震、地震與爆炸分類準確率高于95%;泛化能力測試表明,基于特征提取數(shù)據(jù)集構(gòu)建的分類模型對不同區(qū)域事件的泛化能力強;XGBoost構(gòu)建的分類模型的不同性能指標均高于SVM,表明XGBoost在地震事件分類中有較好的應(yīng)用前景。
圖1 特征分布圖,P/S幅值比(a);S拐角頻率(b);高低頻能量比(c);持續(xù)時間(d)
圖2 地震/爆炸(a)、地震/礦震(b)、爆炸/礦震(c)、三分類(d)模型分類準確率
本研究的創(chuàng)新點包括:
1. 特征提取數(shù)據(jù)集與波形譜數(shù)據(jù)集,基于天然地震、人工爆炸、礦震三類地震記錄的時頻特征差異,量化提取了最大振幅比、高低頻能量比、譜比、拐角頻率、持續(xù)時間等判據(jù),建立了36維特征提取數(shù)據(jù)集;作為模型泛化能力對比,同時基于多窗口譜分析建立了201維波形譜數(shù)據(jù)集。
2. XGBoost構(gòu)建分類模型,XGBoost是Chen and Guestrin提出的新型提升決策樹算法,增加了正則化項防止過擬合,支持并行計算,已應(yīng)用于不同領(lǐng)域。本文在地震分類中引入了XGBoost方法,并與應(yīng)用廣泛的SVM方法進行了對比。
本文構(gòu)建的地震、爆炸、礦震的兩分類與三分類模型可直接應(yīng)用于區(qū)域地震記錄中的非天然地震分類與編目中,研究方法也可應(yīng)用于礦區(qū)微震分類。一方面建立準確的天然地震目錄有利于進行活斷層劃分、強震預(yù)測、地震危險性評估等地震學(xué)研究,另一方面,確定完整的爆炸、礦震等非天然地震目錄有助于評估突發(fā)爆炸災(zāi)害以及采礦誘發(fā)地震的風險性。研究成果2022年發(fā)表于學(xué)術(shù)期刊《Computers and Geosciences》(Wang Tingting, Bian Yinju, Zhang Yixiao, et al., Classification of earthquakes, explosions and mining-induced earthquakes based on XGBoost algorithm. Computers and Geosciences, 2022,170,105242)。
【作者介紹】
王婷婷,非天然地震研究室,助研,主要從事特殊事件監(jiān)測、爆炸當量估算、天然地震與非天然地震事件分類識別等研究。



