固体岩盐体重-品位的多元线性回归分析——以淮安盐盆西南部矿区为例
doi: 10.20008/j.kckc.202504017
吴进飞1,2,3 , 胡新兆3 , 丁婷4 , 赵亚男2 , 朱卫琴3 , 李小明3 , 何金先5 , 马丽6 , 袁媛7
1. 中国地质大学(武汉),湖北 武汉 430074
2. 淮安市地矿建设工程有限公司,江苏 淮安 223001
3. 淮安市地质矿产勘查院,江苏 淮安 223001
4. 东华理工大学,江西 南昌 330013
5. 中国矿业大学资源与地球科学学院,江苏 徐州 221116
6. 中国建筑材料工业地质勘查中心山西总队,山西 太原 030031
7. 山西省煤炭地质一一五勘查院有限公司,山西 大同 037000
基金项目: 本文受江苏省地质勘查专项资金“江淮生态经济区核心地带(淮安)地质调查”(苏财建[2018]96号)资助
Multiple linear regression analysis of volumetric weight-grade of halite: Taking the southwest mining area of Huai'an Salt Basin as an example
WU Jinfei1,2,3 , HU Xinzhao3 , DING Ting4 , ZHAO Yanan2 , ZHU Weiqin3 , LI Xiaoming3 , HE Jinxian5 , MA Li6 , YUAN Yuan7
1. China University of Geosciences (Wuhan), Wuhan 430074 , Hubei, China
2. Huai'an Geological and Mineral Construction Engineering Co., Ltd., Huai'an 223001 , Jiangsu, China
3. Huai'an Geological and Mineral Exploration Institute, Huai'an 223001 , Jiangsu, China
4. East China University of Science and Technology, Nanchang 330013 , Jiangxi, China
5. School of Resources and Geosciences, China University of Mining and Technology, Xuzhou 221116 , Jiangsu, China
6. Shanxi Branch of China National Geological Exploration Center of Building Materials Industry, Taiyuan 030031 , Shanxi, China
7. Shanxi Provincial Coal Geology 115 Exploration Institute Co., Ltd., Datong 037000 , Shanxi, China
摘要
岩盐矿石体重是资源量估算的重要参数,其预测值关系着资源量估算的精确性。以往淮安盐盆地区采用的是体重与NaCl含量的一元线性回归模型,由于选择的元的单一性、片面性,使得一元线性回归模型的预测值在局部失真较为严重,给岩盐资源量估算造成困扰。为此,笔者根据淮安盐盆岩盐矿石所含离子及矿物组分特征,分析了岩盐矿石所含离子及化合物之间相关性,认为Na+ 与SO4 2- 离子同时赋存于多种化合物中,与其他离子含量值之间存在线性关系,相对应的化合物Na2SO4与CaSO4、NaCl与Na2SO4之间亦存在线性关系,多元自变量间较高相关性会使岩盐矿石体重回归模型的预测值失真,相关的离子组合或矿物组分不合适不加筛选而全部引入多元回归模型中。基于 SPSS软件逐步回归分析(Step-wise)算法,Cl-离子、Ca2+ 离子或NaCl、CaSO4与岩盐矿石体重值相关且不存在高度自相关性,可引入岩盐体重值预测的线性回归模型。
Abstract
The volumetric weight of halite ore is an important parameter for resource estimation, and its predicted value is related to the accuracy of resource estimation. In the past, the univariate linear regression model for volumetric weight and NaCl content is used in Huai'an salt basin area. Due to the singularity and one-sidedness of the selected elements, the predicted values of the univariate linear regression model are severely distorted locally, causing difficulties in estimating halite resources. For this reason, the authors analyzed the correlation between ions or compounds of halite ores. It is believed that Na+ and SO4 2- coexist in multiple compounds and have a linear relationship with the grade values of other ions, there is also a linear relationship between the corresponding compounds Na2SO4 and CaSO4, NaCl and Na2SO4. Based on the regression analysis (Step wise) algorithm of SPSS, Cl- , Ca2+ or NaCl, CaSO4 are correlated with the weight value of rock salt ore and there is no high autocorrelation, the linear model can be introduced to predict the weight value of halite ores.
0 引言
在岩盐矿床资源量估算过程中,矿石体重是一个重要参数,矿石体重拟合与预测精确度,直接影响了岩盐矿床资源量估算(冯适安,1983王玉中, 1993)。精确地预测矿石体重是一项重要工作,采用合适的数理统计方法确定的矿石体重值可以提高矿石资源储量估算的准确性(张景平和李社, 2011唐攀等,2013)。前人基于 Excel 及 SPSS 等数据分析软件,已开展了诸多金属矿产体重的多元线性回归研究,计算出相关数学推导公式及数学模型,并阐述多元线性回归效果显著性的评价标准等 (曹春祥和李能强,2005宋宇辰等,2015范廷宾和王明,2017严利伟等,20172020马楠等,2019朱俊宏等,2022)。
目前,针对淮安盐盆地区岩盐矿石体重与品位的关系,主要采用主矿物含量(品位)与体重一元线性回归拟合,即采用其主要NaCl矿物组分含量与所测定的样品体重进行一元线性拟合(吴进飞等, 2014;张善进等,2023);此种方法在淮安盐盆乃至周边的洪泽盐盆都得到广泛应用。岩盐体重与基本分析测试结果显示,研究区岩盐组分主要有可溶的 NaCl、Na2SO4、CaSO4及难溶的黏土质矿物,各类化合物质量百分比占总质量的98.70%,涵盖了岩盐主干,NaCl∶Na2SO4 ∶CaSO4 ∶黏土质矿物的质量百分比为 0.52∶0.12∶0.08∶0.28。为分析岩盐主要组分对岩盐体重的影响及各主要组分之间的约束条件,弥补以往采用NaCl含量与矿石体重一元线性模型, NaCl含量作为唯一自变量,拟合的代表性不足的问题,本文利用 SPSS 多元回归分析法,对所测定的岩盐矿石体重值与各离子或化合物含量进行数学拟合,并对其显著性进行分析检验,以期得出一个有关岩盐体重与岩盐主要组分之间的多元函数模型,提高岩盐资源量估算过程中参数的可靠性。
1 地质背景
1.1 区域构造
晚二叠世—中三叠世的印支运动,晚白垩世— 古近纪的燕山运动和喜马拉雅运动,将苏北盆地切割成了众多的箕状小盆地(王巍等,1999孟凡巍等,2011),为研究区盐类物质的沉积提供良好的场所。淮安盐盆构造位置属扬子准地台东北部的苏北凹陷(苏北盆地),系在古生代台缘凹陷(古盆地) 枢纽部位上发展起来的大型中、新生代沉积盆地,北邻鲁苏隆起,南接苏南隆起,西以郯庐断裂为界,东部与南黄海凹陷相邻(龚与觐和孔庆玉,1989舒福明,2004赵彦彦等,2004张建等,2010;吴进飞等,2014;张善进等,2023)。苏北—黄海海盆地近东西向的“坳-隆-坳”构造带,被区内 NE 向多组盆内断裂分割,大致塑造了苏北盆地古地理环境 (图1)。
1淮安盐盆区域构造纲要图
1.2 区域地层
根据区域地层资料,研究区属扬子地层区苏北地层分区,区内元古宇—新生界均有分布。中元古界(海州群)为区域中、浅变质岩系,构成了扬子准地台的基底。震旦系及以后的地层组成了盖层,区内白垩系、新近系最为发育,为一套中、新生代盆地沉积建造,淮安盐盆含矿地层赋存于上白垩统浦口组中(吴进飞等,2014;张善进等,2023表1)。
1淮安盐盆地层简介
1.3 研究区主要地质特征
研究区位于淮安盐盆西南部,揭露的岩盐矿体埋藏于淮安盐盆白垩系浦口组中,属典型蒸发沉积型矿床,区内盐岩矿床可分为上盐亚段、淡化亚段和下盐亚段共计 3 个亚段,研究区内勘探工程揭露至上盐亚段中下部(张善进等,2023),岩盐矿体主要岩性特征如下:
上部以灰色薄层状、团块状岩盐夹泥岩、钙芒硝泥岩及泥质粉砂岩为主。岩盐层之间的淡化层主要为灰色钙芒硝泥岩、泥岩及咖啡色粉砂质泥岩、泥质粉砂岩;下部以灰色薄层状、中厚层状、少量团块状岩盐,夹泥岩、钙芒硝岩和薄层、团块状粉砂岩为主。岩盐层之间的淡化层主要为灰色钙芒硝泥岩,少量灰色、咖啡色粉砂质泥岩、泥质粉砂岩、泥岩。
研究区岩盐矿体可以分28个矿层,其中具有工业价值的矿层 27 个。岩盐矿石主要矿物组分为: NaCl(石盐)、Na2SO4·CaSO4(钙芒硝)、CaSO4(硬石膏)等矿物。
2 体重样品采集及分析测试
本文样品依托淮安市地质矿产勘查院对淮安盐盆西南部进行盐岩地质勘查项目采集,样品为岩盐等(图2)。按照岩盐矿石类型及矿层分布情况于研究区内6口资料孔(图3)均匀取样,共计采集体重样 409 件,测定体重同时进行基本分析测试。平面上 6 口资料孔分布呈规则四边形,基本上覆盖研究区,纵向上样品采集涵盖了 6口资料孔 28个岩盐矿层,由表2可知,单位长度内样品采集密度为 0.42~0.98 件/m,样品代表性及均匀程度满足研究区岩盐矿石体重的评价要求。
2岩盐岩样品来自于深度连续的钻孔取心岩样
3研究区6口勘查孔平面位置示意图
2体重样品采集代表性一览
样品分析由江苏地质矿产设计研究院完成,测试仪器采用电子天平(型号 BSA124S、BSA125S、 BSA127S)、原子吸收分光光度计(型号AA-6880)等进行,测试方法严格按照盐类矿石(岩盐)分析规程 (DZG93-08)进行实验,共选取409组典型样品进行实验测试,仪器分析精度满足相关规范规程要求 (表3)。
研究区岩盐矿石主要有可溶的 NaCl、Na2SO4、 CaSO4和难溶的黏土质矿物构成,NaCl(石盐,体重值 2.16 g/cm3 左右)相较于 CaSO4(硬石膏,体重值 2.8~3.0 g/cm3)、Na2SO4(无水芒硝,体重值 2.68 g/cm3左右)及难溶的黏土质矿物(体重值 2.5~2.7 g/cm3)较轻,表象显示为 NaCl 含量高,CaSO4、Na2SO4及难溶的黏土质矿物含量低,则岩盐矿石体重值低;反之,则岩盐矿石体重值高(图4)。本研究已对明显不符合这一规律的样品测试数据进行了筛选和剔除。
3选用的分析仪器、检测方法及检出限
注:允许误差值带%为相对偏差,不带%为绝对误差。
4岩盐主要组分与体重一元线性回归模型
a—黏土质矿物与岩盐体重一元线性回归模型;b—CaSO4与岩盐体重一元线性回归模型;c—Na2SO4与岩盐体重一元线性回归模型;d—NaCl与岩盐体重一元线性回归模型
3 岩盐体重与矿物组分特征
研究区经筛选后的252组样品(表4),岩盐矿石体重测试结果显示:最大 2.48 g/cm3,最小值 2.01 g/ cm3,平均 2.27 g/cm3,体重检测值*100 后,方差为 64.34,均方差为8.02;基本分析测试结果显示,主要常量元素的离子组合主要有4种:Na+、Ca2+、Cl-、SO4 2- 等,其它则为微量元素和难溶的黏土质矿物,化合物主要为:NaCl、CaSO4、Na2SO4,主要矿物为:石盐 (NaCl)、硬石膏(CaSO4)、钙芒硝(Na2SO4·CaSO4),3 种矿物平均含量分别为:51.30%、3.82%、16.00%,3 种主要矿物质量约占矿石的71.12%。
4 岩盐体重一元统计分析
研究区岩盐矿石体重值为 2.01~2.48 g/cm3,极差值为 0.47,极差值范围较窄,数据区分度不足,为增加体重数据显著性,研究工作对岩盐矿石体重值进行了“体重检测值*100”处理。目前,在一系列的区域性勘查报告中,评价淮安盐盆地区岩盐矿石体重与品位的关系,主要采用NaCl含量与所测定的样品体积质量进行一元线性拟合;矿石体重的大小与本身的 NaCl 含量有密切关系。即使是同一矿层或相同品位的矿石,体积质量也不相同,有的相差较大,无明显规律,因此采用均方差公式分别计算出研究区岩盐矿品位系数,根据不同品位含量,计算出岩盐矿石体重与NaCl含量关系式:
b=XY-XY/nX2-X2/n,a=y--bx-
(1)
一元线性回归方程 :y100=249.8388-0.4392x
(2)
式(1~2)中:x 为 NaCl 含量(%),y 为岩盐体重 (g/cm3),a 为常量系数(区域性常数,此值相当于不含 NaCl 的泥岩体重值*100),b 为拟合系数(不同 NaCl含量条件下岩盐体重值*100的补偿系数)。
岩盐矿石体重检测值为 2.01~2.48 g/cm3。由表5可知,一元线性模型预测值为 2.08~2.45 cm3,体重检测值*100 的协方差为 15.03,标准差 3.88,总体上拟合程度较高;但由于岩盐矿石由多种矿物组成,虽然其中 NaCl平均含量达 51.30%,占主导地位,但由于选择的“NaCl”单一性,不具有足够的代表性,使得一元线性回归模型在局部失真较为严重(图5,图中红色方框为失真较为严重部分)。
4岩盐样品体重与基本分析检出值
续表1
续表2
注:体重单位为g/cm3,黏土质、NaCl、CaSO4、Na2SO4 含量单位为 %。
5一元回归模型评价
5一元线性预测值与检测值对比图
5 岩盐体重多元统计分析
虽可溶的 NaCl、Na2SO4、CaSO4化学沉积时,微观尺度上可能服从一定的分配规律,但由于可溶矿物的摩尔质量各不相同,直接将可溶性矿物含量相加作一元线性回归模型,淡化化合物摩尔质量权重等影响因素,并不是可取的线性回归方式。
本研究工作基于SPSS数据分析软件,采用逐步回归分析(Step-wise)法,通过计算非随机变量的偏回归平方和大小及其显著性检验,按照其重要性逐步选入回归方程,对小体重测试结果(因变量)与可溶的 NaCl、Na2SO4、CaSO4及难溶的黏土质矿物化学分析结果作为4个自变量进行多元回归分析。
根据逐步回归分析设定的变量进入和移出条件,当 F 统计量的显著性概率≤0.050 的变量引入模型和显著性概率≥0.100变量移出模型,由表6可知,先后分别将NaCl、CaSO4两个变量引入模型中,而将 Na2SO4、难溶的黏土质矿物两个变量移出,最终模型由NaCl、CaSO4两个变量构成。
协方差分析对模型进行显著性检验,由表7可知,回归效果极为显著,构建的岩盐矿石体重-品位模型可用。
6输入/除去的变量
注:因变量为体重(g/cm3)。
7方差分析
注:a—因变量:体重*100;b—预测变量:(常量),NaCl;c—预测变量:(常量),NaCl,CaSO4
根据表7表8综合得出,在显著水平低于 0.05 时,模型是显著的,可作为最优回归模型,用于岩盐矿石体重值的预测。但在预测时,应该注意取值范围(如超出范围,应进行外推性检查-利用已知样品进行检查),通过对比残差与岩盐矿石体重检测值容许的关系,说明该模型是否适用于预测岩盐矿石体重值,如果残差值<检测容许误差,则模型可用于预测岩盐矿石体重值;否则,需进行更详细的矿石类型划分等,再建立相应模型。
化合物多元线性回归方程:
y100=247.297-0.417x1+0.122x2
(3)
式(3)中:x1为 NaCl 含量(%),x2为 CaSO4含量 (%),y—体重预测值。
8化合物回归模型系数
6 分析与讨论
6.1 自变量相关性分析
岩盐矿石中,Na+ 参与 SO4 2-、Cl-分配,SO4 2- 参与了 Ca2+、Na+分配,与之相对于的化合物 Na2SO4 与 CaSO4、NaCl与 Na2SO4一般具有一定比例的关系,同时引入 NaCl、Na2SO4、CaSO4作为自变量参与回归,而不加以判别删选,相当于重复引入自变量,自变量之间较高的相关性,会使岩盐矿石体重多元线性回归模型预测值失真。
当岩盐矿石中 Na+、SO4 2- 离子同时赋存于多种化合物中的时候,其含量实际可以通过这些矿物中其它离子(Cl-、Ca2+)进行反算得出,为了避免相关离子含量值与其它离子含量值之间存在已知的线性关系。因此,可以依据上述分析,对自变量进行预筛选及预处理,确定Cl-离子、Ca2+ 离子与岩盐矿石体重值相关且不存在高度自相关性。
基于SPSS回归分析(Step-wise)法,采用对Na+、 Ca2+、SO4 2-、Cl-共 4种离子含量(自变量)与岩盐矿石体重(因变量)进行多元线性拟合(表9),与前段分析结果基本一致,判定Cl-、Ca2+ 与岩盐矿石体重值有显著的线性关系。
9离子回归模型系数
离子多元线性回归方程:
y100=247.304-0.688x1+0.419x2
(4)
式(4)中:x1为Cl-含量(%),x2为Ca2+ 含量(%),y 为体重预测值。
6.2 不同方式回归模型讨论
一元回归模型体重检测值*100的协方差/标准差为15.03/3.88(表5),多元回归模型的为14.94~14.96/ 3.87(表10),且一元回归模型相较于多元回归模型,岩盐矿石体重预测值与检测值之间存在较多失真,多元线性模型的拟合程度更高,优于一元线性模型(图5图6)。
采用化合物多元线性回归与离子多元线性回归模型(表10),2种模型的协方差与标准差基本相同,化合物多元线性回归与离子多元线性回归模型均达到较为理想拟合效果(图6,但亦有部分失真,红色方框标注位置),在今后的实际操作中,采用其中一种方案即可。
10模型总体判别
62种不同模型拟合程度与检测值对比图
7 结论
(1)岩盐矿石体重与NaCl含量一元回归分析模型,虽 NaCl 是岩盐矿石主要成分,但由于采用选用的自变量 NaCl 单一性和排他性,覆盖不够全面,造成一元线性模型体重的预测值有较多的失真,存在缺陷,潜在影响了岩盐资源量估算的精确性。
(2)岩盐矿石中 Na+ 与 SO4 2- 离子赋存于多种化合物中,与其他离子品位值之间存在线性关系,相对应的化合物,如Na2SO4与CaSO4、NaCl与Na2SO4亦具有这一特征,不加判别而全部引入模型中,自变量之间较高的相关性使多元线性回归模型体重预测值失真。
(3)基于SPSS软件逐步回归分析(Step-wise)算法,分别对离子、化合物进行多元线性分析,Cl-离子、Ca2+ 离子或 NaCl、CaSO4与岩盐矿石体重值相关且不存在高度自相关性,可引入体重值预测的相关线性模型。
(4)研究区岩盐矿石中NaCl较CaSO4、Na2SO4及难溶的黏土质矿物轻,主要表现为NaCl含量与岩盐矿石的体重值呈负相关性,而CaSO4、Na2SO4、黏土质矿物与之呈正相关性;可考虑用NaCl与黏土质矿物含量的比值,作为自变量分析研究岩盐矿石体重线性模型。
注释
① 吴进飞,刘兆成,李小明,江辉.2014. 江苏省淮安市朱桥矿区石塘块段勘探报告[R]. 淮安:淮安市地质矿产勘查院.
② 张善进,李小明,刘兆成,吴进飞,赵坤,陈宁,张睿,孙正,邹昭银,包晓峰,许鹏,朱培,郑瑜,姜芹芹,赵亚男 .2023. 江苏省淮安市清江浦区谢碾矿区周高块段岩盐矿勘探报告[R]. 淮安:淮安市地质矿产勘查院.
1淮安盐盆区域构造纲要图
2岩盐岩样品来自于深度连续的钻孔取心岩样
3研究区6口勘查孔平面位置示意图
4岩盐主要组分与体重一元线性回归模型
5一元线性预测值与检测值对比图
62种不同模型拟合程度与检测值对比图
1淮安盐盆地层简介
2体重样品采集代表性一览
3选用的分析仪器、检测方法及检出限
4岩盐样品体重与基本分析检出值
5一元回归模型评价
6输入/除去的变量
7方差分析
8化合物回归模型系数
9离子回归模型系数
10模型总体判别
曹春祥, 李能强. 2005. 小块体重的多元线性回归方程在锡铁山铅锌矿床储量计算中的应用[J]. 矿产与地质,19(2):177-183.
范廷宾, 王明. 2017. 火烧云铅锌矿矿石小块体重多元线性回归模型建立及检验[J]. 地质学刊,41(3):409-414.
冯适安. 1983. 多金属矿床中矿石体重与金属品位的关系[J]. 湖南地质,(2):58-62.
龚与觐, 孔庆玉. 1989. 苏北淮安凹陷白垩系浦口组成盐条件的讨论[J]. 石油实验地质,11(2):134-144.
马楠, 马玉辉, 张金玲, 杨启安, 吴树宽. 2019. 东昆仑某铜镍矿床矿石体重与品位回归模型探讨[J]. 中国锰业,37(1):72-75.
孟凡巍, 倪培, 严贤勤, 王天刚, 燕夔, 王国光, 赵超, 宋伟民. 2011. 江苏金坛盐矿形成时期盐湖水体成分: 来自石盐包裹体的证据[J]. 微体古生物学报,28(3):75-79.
舒福明. 2004. 洪泽凹陷赵集次凹阜宁组四段盐岩沉积特征及成因[J]. 安徽地质,14(2):81-85.
宋宇辰, 刘占宁, 孟海东, 张朋伟. 2015. 矿石体重取值方法对储量估算的影响——以某铁铜矿为例[J]. 金属矿山,(8):106-109.
唐攀, 唐晓倩, 林彬, 方向, 王勤, 林鑫, 杨欢欢. 2013. 特高品位和小体重对资源/储量估算的影响及处理[J]. 矿物学报,33(S2):962-963.
王巍, 陈高, 王家林, 吴健生. 1999. 苏北—南黄海盆地区域构造特征分析[J]. 地震学刊,(1):49-57.
王玉中. 1993. 确定矿石体重的回归预测法[J]. 新疆地质,(3):268-273.
严利伟, 王昌南, 唐高林, 刘琪. 2017. 多元线性回归计算矿石体重方法的优化——以某铜锌矿为例[J]. 四川地质学报,37(2):331-334.
严利伟, 唐高林, 梁鲸. 2020. 基于多元线性回归方法的中咀铜矿体体重修正[J]. 矿产勘查,11(11):2484-2490.
张建, 龚耀冲, 高雨根. 2010. 淮安盐盆张兴块段石盐矿床成因及含盐系韵律特征[J]. 中国井矿盐,41(2):21-24.
张景平, 李社. 2011. 基于 SPSS 的矿石小体重与品位的多元回归分析模型的构建[J]. 东华理工大学学报(自然科学版),34(1):62-66.
赵彦彦, 林春明, 汪亚军, 牟荣, 张浩东. 2004. 苏北淮阴凹陷上白垩统浦口组盐岩成因探讨[J]. 高校地质学报,10(3):468-476.
朱俊宏, 贾新勇, 李昭琦, 吴永虎. 2022. 徽县向阳山铅锌矿石小体重多元线性回归模型应用分析[J]. 甘肃冶金,44(3):115-118.