-
0 引言
-
随着中国基础设施建设的不断推进,中国对铜、铁等资源的需求正在不断增长,除了加大国外进口之外,也在积极进行国内相关资源的勘查工作,因此提高找矿预测精度意义重大(谭静等, 2021)。
-
成矿预测是应用地质成矿理论和科学方法,如地球化学、地球物理和遥感地质等地质找矿信息,剖析成矿地质条件,总结成矿规律,建立成矿模式 (方维萱等,2021;李伟等,2021;王冶等,2021;周荣辉等,2021)。大量的地质矿产勘查工作积累了丰富的化探、航磁、遥感影像等原始数据,随着大数据时代的来临,将大数据思想引入地质矿产勘查领域,利用数学工具进行找矿预测,有助于实现地质找矿的智能化、高效化和精确化(陈发恩等,2020; 苏特等,2020;樊文鑫等,2021;高田,2021)。构造是影响矿床形成和分布的重要因素之一,在地质成矿过程中起着不可替代的作用,对矿产资源的研究离不开对地质构造的研究,开展地质构造研究对于矿产资源勘查起到决定性的作用(许令兵和刘国华,2021;张贺然等,2021)。
-
深度学习为地学大数据分析提供了切实有效的工具,深度学习包含多个分支,如卷积神经网络 (Convolutional Neural Network,简称 CNN)、生成式对抗网络(Generative Adversarial Network,简称 GAN)、递归神经网络(Recursive Neural Network,简称 RNN)和孪生神经网络(Siamese Neural Network,简称 SNN)等(左仁广,2019;左仁广等,2021)。其中CNN模型在地质找矿预测中最为常见,通过CNN 模型学习和预测,可以在众多复杂地质数据中提取有效特征。但在应用过程中,很多时候仅考虑了区域大断裂的存在,对于次级断裂缺乏足够的考虑,制约了找矿的精度和可靠性。因此在利用 CNN 模型对化探数据、航磁数据及地质数据进行训练和预测前,有必要对地质构造进行更为详细的解释,从而提升找矿预测精度(刘艳鹏等,2018,2020;蔡惠慧等,2019;李忠潭等,2022)。
-
本文首先利用 GAN 模型对遥感影像数据的断裂构造进行训练和预测,得到断裂构造数据,然后基于研究区化探数据、航磁数据、地质数据以及断裂构造,采用CNN模型对多种数据结合进行矿产预测,以期能为智能化地质找矿提供新的思路和方法。
-
1 研究区地质概况
-
研究区位于甘肃省某地,大地构造位置属华北板块阿拉善地块龙首山基底杂岩带,出露地层为第四系(松散洪积砾石、砂、黏土)、古近系(砖红色砾岩、含砾砂岩、砂岩、粉砂岩、泥岩和石膏),古生界白垩系(紫红色泥岩、粉砂岩、砂岩)、侏罗系(浅灰色粗砂岩、砂砾岩、灰色细砂岩、砂质泥岩呈韵律夹薄煤层),元古宇蓟县系(变粒岩、浅粒岩、变砂岩、石英岩、片麻岩、大理岩)等。研究区构造比较复杂,主要为窑泉北逆断层系(以近 EW—NWW 向为主),宽度20~60 m。研究区已知铜矿点4个,主要为斑岩型铜矿点(处于中酸性斑岩体附近)、矽卡岩型铜矿点(分布于大理岩和花岗闪长岩侵入接触形成的矽卡岩中)和裂隙浸染型铜矿点(分布于青磐岩化、钾化蚀变带裂隙中),成矿时代为华力西期(图1)。
-
2 基于卷积神经网络找矿预测方法
-
2.1 方法步骤
-
卷积神经网络(Convolutional Neural Network,简称 CNN)是深度学习的一种代表性算法模型,具有计算量小、稳定性好,且对数据没有额外的特征工程要求,在诸多领域得到广泛应用。本文基于处理过的化探数据、航磁数据以及断裂构造数据,利用CNN训练生成模型,并将其应用到研究区铜矿找矿预测,具体步骤为:①收集数据与处理数据;②采用步长平移数据增强方法来生成训练集样本,并对训练集样本进行验证;③构建铜矿预测卷积神经网络模型;④采用训练及样本对模型进行训练和验证;⑤利用训练好的 CNN 模型,通过滑动窗口的方式对研究区的铜矿区进行预测和圈定(图2)。
-
图1 研究区大地构造位置图(a)与地质矿产简图(b,据董国强等,2020①修改)
-
1—第四系;2—古近系白杨河组;3—下白垩统庙沟组;4—中侏罗统龙凤山组;5—蓟县系墩沟子群;6—新太古界—古元古界龙首山岩群; 7—晚二叠世花岗闪长岩;8—晚二叠世英云闪长岩;9—晚二叠世闪长岩;10—晚二叠世正长花岗岩;11—中奥陶世正长花岗岩;12—中奥陶世英云闪长岩;13—中奥陶世二长花岗岩;14—断层;15—地质界限;16—角度不整合界线;17—铜矿床及编号;18—地名
-
2.2 参数选择
-
利用卷积神经网络(CNN)对研究区进行铜矿预测时,需事先输入数据参数,如数据维度、窗口大小、卷积核数量、步长及单次训练所抓取的数据样本数量等,这些参数均会对预测结果产生较大影响。原数据维度为 28,计算机运算太过冗杂,同时会造成预测区域复杂等问题,通过多次尝试,将数据维度压缩至24时,预测结果与实际地质情况更加符合。窗口大小对训练数据集和预测精度有一定影响,窗口越小,所获取训练样本数据越少,预测范围相对更大,增加了预测计算复杂度,通过多次尝试,将窗口大小设置为48×48时,预测精度最高。卷积核数量越多,提取得到的局部特征越多,但同时也会增加计算复杂度,当卷积核数量为 48 时,预测区的范围相对较小,且预测结果与实际地质情况更加相符。步长越大,所得预测结果精细程度越低,将步长设置为1时可信度最高。合适的单次训练所抓取的数据样本数量可使梯度更加准确,增加预测精度,当单次训练所抓取的数据样本数量为 64 时,预测结果与实际情况最相符(表1)。
-
图2 基于CNN铜矿预测流程
-
3 数据预处理
-
3.1 化探数据处理
-
利用研究区内 Au、Ag、Gu、Ti、Li、Hg 等 25 种元素的 1∶5 万水系沉积物化探测量数据(董国强等, 2020①),采用克里格插值法对化探数据进行网格划分,网格单元划分大小为100 m×100 m,将25种元素的水系沉积物化探测量数据划分为 136512 个单元网格。选择其中的铜元素作为分析对象,做出 1∶ 50000 比例下等值线见图3。由铜元素地球化学图可知,铜元素主要集中于盘头山和窑泉北。
-
图3 铜元素地球化学图
-
3.2 航磁数据处理
-
利用克里格插值法对研究区1∶50000航磁数据进行网格划分(董国强等,2020①),再利用Geosoft软件对网格化的数据进行延拓处理,分别得到△T 化极航磁异常图上延 50 m、上延 100 m、上延 150 m 的延拓结果。为了展现航磁异常存在的方向性变化特征,对网格化后的数据分别进行 0°、45°、90°和 135° 4个方向求导(图4),磁异常主要集中在研究区中西部和西南部,且磁异常基本呈NW向。
-
3.3 遥感影像数据处理
-
对研究区 HDF 格式遥感数据(董国强等, 2020①;周荣辉等,2021)进行图像处理(辐射校正→ 几何校正→图像增强处理→卫星遥感影像),建立解译标志,并利用GAN模型对研究区的断裂构造进行预测(图5)。遥感影像数据共解译出 432 条断裂构造,而地质图上仅见 160 条断裂构造,基于 GAN 预测共得到 255 条断裂构造,且大部分断裂构造均呈近 EW—NWW 向,与地质图中构造走向基本一致。
-
图4 航磁数据处理效果
-
a—△T化极航磁异常图;b—上延50 m异常图;c—上延100 m异常图;d—上延150 m异常图;e—0°方向导数异常图;f—45°方向导数异常图; g—90°方向导数异常图;h—135°方向导数异常图
-
图5 断裂构造解译结果
-
a—地质图断裂;b—GAN预测断裂;c—遥感影像图; d—遥感解译断裂
-
4 预测结果分析
-
4.1 基于化探-航磁数据
-
将 25种化学元素的网格化数据、△T 化极航磁异常数据、向上延拓 50 m 航磁数据以及向上延拓 100 m航磁数据作为输入数据层,首先通过Surfer 软件将28种数据转换为432×316 的网格数据层,然后利用离差标准化方法进行处理,再利用主成分分析法将28维数据降至24维,其余参数按照表1中进行设置。采用数据增强法共获得 22944 个训练数据,将其中 70%(16061 个)的数据用于训练模型,将剩余30%(6883个)数据用作模型验证,对CNN模型进行 200 轮训练和验证,基于化探-航磁数据得到的 CNN模型训练与铜矿预测结果见图6。
-
由图6a可知:当训练次数小于 50次时,训练精度波动较大,当训练次数达到 50 次后,训练精度逐渐趋于稳定,模型的稳定训练精度达到了 98%。由图6b 可知:基于化探-航磁数据训练模型预测得到的铜矿有利区有 5 个,主要分布于山头窑—窑泉— 大青山北一带、窑泉北东部地区、盘头山附近、研究区西南部以及南部区域,这些区域内存在铜元素化探的异常高值,具备找矿的潜力,预测面积为研究区面积的 27.3%。其中,山头窑—窑泉—大青山北一带属于斑岩型铜矿床;窑泉北东部地区属于裂隙浸染型铜矿床;盘头山附近、研究区西南部以及南部区域属于矽卡岩型铜矿床。
-
4.2 基于原始地质数据
-
在28维度的输入数据层基础上,将研究区收集到的原始地质数据作为补充数据集进行训练和预测,基于原始地质数据得到的CNN模型训练与铜矿预测结果见图7。由图7a可知:当训练次数小于 60 次时,训练精度波动幅度较大,特别是在40~60次训练时,波动幅度最大,当训练次数达到60次后,训练精度逐渐趋于稳定,模型的稳定训练精度达到了 99.7%,训练精度高于基于化探-航磁数据的训练精度。由图7b 可知:在添加地质数据作为训练样本后,铜矿预测结果与基于地化航磁数据预测结果有些差异,具体表现在:①铜矿有利区位置有所变化, 3.1小节预测的盘头山铜矿床并没有在本次预测结果中,同时研究区南部铜矿有利区位置向北有所迁移;②基于地质数据的铜矿预测面积(12.1%)相较于基于化探-航磁数据预测面积有较大的幅度降低 (27.3%)。
-
图6 基于化探航磁数据的铜矿预测结果(黄色代表预测区,紫色代表无矿区)
-
a—训练精度;b—铜矿预测结果
-
图7 基于地质数据的铜矿预测结果(黄色代表预测区,紫色代表无矿区)
-
a—训练精度;b—铜矿预测结果
-
4.3 基于断裂构造数据
-
将基于遥感影像数据预测得到的研究区断裂构造数据作为数据输入层的补充数据进行训练和预测,基于断裂构造数据得到的CNN模型训练与铜矿预测结果见图8。由图8a 可知:当训练次数小于 50 次时,训练精度波动幅度较大,当训练次数达到 50 次后,训练精度逐渐趋于稳定,模型的稳定训练精度达到了 99.3%,略低于基于地质数据的训练精度,略高于基于化探-航磁数据的训练高度。由图8b 可知:当采用基于断裂构造数据进行预测时,盘头山这一重点找矿区被重新圈定,同时铜矿预测区的面积相比基于地质数据预测时有增大,面积占研究区面积的19.7%。
-
4.4 预测结果对比
-
基于化探-航磁数据、地质数据以及断裂构造数据3种方法预测得到的铜矿区在面积和位置上有所差异,具体表现在:①基于化探-航磁数据、地质数据以及断裂构造数据3种方法预测的铜矿区面积分别占研究区面积的27.3%、12.1%和19.7%;②地质数据中仅仅包含主干断裂从而导致地质数据精度较低使得原本在盘头山附近的找矿区未被圈定; ③当采用基于 GAN 网络训练得到的断裂构造数据进行预测时,盘头山附近这一重点找矿区被重新圈定,但是面积相比基于化探-航磁数据的预测时,有较大的幅度降低。从 3 种方法预测结果来讲,基于断裂构造数据的预测结果与现场实际地质情况更加相符,将其应用到找矿预测中,可信度较高。
-
图8 基于断裂构造数据的铜矿预测结果(黄色代表预测区,紫色代表无矿区)
-
a—训练精度;b—铜矿预测结果
-
5 结论
-
(1)原始化探数据和航磁数据需要经过克里格插值法进行网格划分和预处理,才可应用到找矿预测中;由于原始的地质数据在断裂构造解译中不够详细,在利用生成式对抗网络(GAN)模型对遥感数据进行处理之后,可获得相对更加详细的断裂构造数据。
-
(2)在利用卷积神经网络模型(CNN)对各种地化数据进行找矿预测前,需要对数据维度、窗口大小、卷积核数量、步长、单次训练所抓取的数据样本数量等参数进行合理设置,避免造成运算冗杂而影响找矿预测效率。
-
(3)基于化探-航磁数据、基于原始地质数据以及基于断裂构造数据的模型预测精度分别为 98%、 99.7%和99.3%,均有较高的可信度;铜矿预测面积分别占研究区面积的27.3%、12.1%和19.7%,由于地质数据仅包括主干断裂,导致盘头山附近的找矿区未被圈定,采用基于GAN网络对断裂构造数据进行训练预测后,盘头山附近找矿区被重新圈定。
-
(4)将基于GAN网络进行断裂构造预测之后的数据应用到 CNN 的铜矿预测模型当中,并结合化探-航磁数据,开展找矿预测,具备更高的可信度,可在今后予以合理运用。
-
注释
-
① 董国强,把建业,张炜.2020. 甘肃省高台县臭泥墩—西小口子地区三幅 1∶5 万矿产远景调查 2020 年度设计报告[R]. 兰州:甘肃省地质调查院.
-
参考文献
-
蔡惠慧, 朱伟, 李孜轩, 刘园园, 李龙斌, 刘畅 . 2019. 基于深度学习的钨钼找矿靶区预测方法研究[J]. 地球信息科学学报, 21 (6): 928-936.
-
陈发恩, 刘建中, 谭礼金, 蒙明华, 王泽鹏, 王大福, 万大学. 2020. 黔西南包谷地金矿区构造控矿特征及找矿预测[J]. 矿产与地质, 34(4): 673-681.
-
樊文鑫, 李光明, 梁生贤. 2021. 西藏扎西康铅锌多金属矿床控矿构造的电性特征及找矿预测[J]. 吉林大学学报(地球科学版), 51 (6): 1709-1719.
-
方维萱, 王寿成, 贾润幸, 李天成, 王磊, 郭玉乾 . 2021. 大比例尺构造岩相学填图理论创新、技术研发与发展方向[J]. 矿产勘查, 12(7): 1488-1518.
-
高田. 2021. 基于构造叠加晕找矿法的陕西略阳杨家坝深埋铜矿磁测及找矿靶区定位[J]. 中国锰业, 39(6): 30-33.
-
李伟, 张革利, 王雷, 王欣, 张旭涛, 董君鹏, 马双宝. 2021. 陕西省凤太矿集区铅锌矿床特征及找矿预测地质模型[J]. 矿产勘查, 12 (9): 1907-1915.
-
李忠潭, 薛林福, 冉祥金, 李永胜, 董国强, 李玉博, 戴均豪. 2022. 基于卷积神经网络的智能找矿预测方法——以甘肃龙首山地区铜矿为例[J]. 吉林大学学报(地球科学版), 52(2): 928-936.
-
刘艳鹏, 朱立新, 周永章. 2018. 卷积神经网络及其在矿床找矿预测中的应用——以安徽省兆吉口铅锌矿床为例[J]. 岩石学报, 34 (11): 3217-3224.
-
刘艳鹏, 朱立新, 周永章. 2020. 大数据挖掘与智能预测找矿靶区实验研究——卷积神经网络模型的应用[J]. 大地构造与成矿学, 44(2): 192-202.
-
苏特, 钱建平, 周伟蛟, 喻菊阳, 张果, 关显东, 吴正鹏. 2020. 湖南安化渣滓溪钨锑矿床成矿构造分析及找矿预测[J]. 金属矿山, (9): 147-158.
-
谭静, 熊强青, 喻兵良, 陈杰, 袁兴赋, 郭冬, 陆三明, 兰学毅 . 2021. 反射地震勘探在南陵—宣城矿集区地质找矿中的应用研究 [J]. 工程地球物理学报, 18(6): 848-855.
-
王冶, 董峰, 张坤, 梁坤, 王东暄 . 2021. 黑龙江省漠河地区 1∶5万水系沉积物地球化学特征及找矿方向[J]. 矿产勘查, 12(9): 2374-2384.
-
许令兵, 刘国华 . 2021. 豫西栾川县潭玉沟银矿床构造叠加晕特征及找矿靶区预测[J]. 矿产勘查, 12(12): 2385-2392.
-
张贺然, 魏子鑫, 王俊, 王旭, 阮怡箫, 马久菊, 李惠, 孙凤舟, 刘振锋, 侯文强. 2021. 构造叠加晕找矿方法在青海哈西哇金矿床深部找矿预测中的应用[J]. 矿产勘查, 12(3): 755-763.
-
周荣辉, 阳正勇, 周文博, 邓福理 . 2021. 大青山盆地遥感解译信息与成矿预测[J]. 矿产勘查, 12(5): 1207-1215.
-
左仁广. 2019. 基于深度学习的深层次矿化信息挖掘与集成[J]. 矿物岩石地球化学通报, 38(1): 53-60, 203.
-
左仁广, 彭勇, 李童, 熊义辉 . 2021. 基于深度学习的地质找矿大数据挖掘与集成的挑战[J]. 地球科学, 46(1): 350-358.
-
摘要
为提高地质找矿精度,本文结合研究区化探、航磁、地质以及断裂构造数据,运用卷积神经网络(CNN)模型,对基于多种数据的铜矿床预测结果进行了对比分析。结果表明:在运用卷积神经网络(CNN)模型进行找矿预测前,需要利用克里格插值法对化探和航磁数据进行预处理;同时传统地质数据断裂构造解释不详细的问题,需利用生成式对抗网络(GAN)模型对遥感影像数据进行断裂构造数据的解译,从而获得多种地质数据。基于化探、航磁、地质以及断裂构造数据预测得到的铜矿床面积分别占研究区的27. 3%、 12. 1%和19. 7%;由于地质数据仅包括研究区的主干断裂,导致在预测过程中某些重点找矿区未被圈定,而采用GAN模型对断裂构造数据进行训练预测后,未被圈定的区域被重新圈定,将断裂构造数据+化探航磁数据相结合应用到铜矿床预测模型中,具有更好的预测效果和可信度。
Abstract
In order to improve the accuracy of geological prospecting, the convolutional neural network (CNN) model is used to compare and analyze the prediction results of copper deposits based on various data combined with geochemical exploration, aeromagnetic, geological and fault data in the study area. The results show that before using convolutional neural network (CNN) model for prospecting prediction, it is necessary to use Kriging interpolation method to preprocess geochemical exploration and aeromagnetic data. At the same time, the fault interpretation of traditional geological data is not detailed, so it is necessary to use generative adversarial network (GAN) model to interpret the fault data of remote sensing image data, so as to obtain a variety of geological data. The predicted copper deposit area based on geochemical exploration, aeromagnetic, geological and fault data accounts for 27. 3%,12. 1% and 19. 7% of the study area, respectively. Due to the fact that the geological data only included the main faults in the study area, some key prospecting areas were not delineated in the prediction process. However, after the training and prediction of fault data by using GAN model, the undelineated areas were re-delineated. The combination of fault data and geochemical exploration aeromagnetic data was applied to the cop- per deposit prediction model, which has better prediction effect and reliability.