地统计学是以具有空间分布特点的区域化变量理论为基础,研究自然现象的空间变异与空间结构的一门学科。它针对像矿产、资源、生物群落、地貌等有着特定的地域分布特征而发展的统计学,由于最先在地学领应用,故称为地统计学。
中文名地统计学
内容研究自然现象的空间变异与空间结构
基础空间分布特点的区域化变量理论
范围矿产、资源、生物群落、地貌
定义自然现象存在空间变异性和空间自相关性。地统计学作为研究变量空间分布规律的理论与方法,成为定量分析自然现象空间特征的有效手段,并逐渐引入生态学研究中。[1]
地统计学的主要理论是法统计学家G.Matheron创立的,经过不断完善和改进,目前已成为具有坚实理论基础和实用价值的数学工具。地统计学的应用范围十分广泛,不仅可以研究空间分布数据的结构性和随机性、空间相关性和依赖性、空间格局与变异,还可以对空间数据进行最优无偏内插,以及模拟空间数据的离散性及波动性。
地统计学由分析空间变异与结构的变异函数及其参数和空间局部估计的Kriging插值法两个主要部分组成,目前已在地球物理、地质、生态、土壤等领域应用。气象领域的应用目前还不多见,主要使用Kriging法进行降水、温度等要素的最优内插的研究及气候对农业影响方面的研究。
区域化变量理论地统计学处理的对象为区域化变量,即在空间分布的变量。通常一个区域化变量具有两个性质:
①在局部的某一点,区域化变量的取值是随机的;
②对整个区域而言,存在一个总体或平均的结构,相邻区域化变量的取值具有该结构所表达的相关关系。区域化变量的两大特点是随机性和结构性。基于此,地统计学引入随机函数及其概率分布模型为理论基础,对区域化变量加以研究。区域化变量可以看作是随机变量的一个现实(realization)。对于随机变量而言,必须在已知多个现实的前提下,才可以总结出其随机函数的概率分布。
而对地学数据来讲,往往我们只有一些采样点,它们可以看作随机变量的一个现实,所以也没有办法来推断整个概率分布情况。为此,必须制定一些假设,即平稳性假设,假定在某个局部范围内空间分布是均匀的。
理论核心地统计学的主要用途,是研究对象空间自相关结构(或空间变异结构)的探测以及变量值的估计和模拟。不管哪一种用途,地统计学分析的核心是根据样本点来确定研究对象(某一变量)随空间位置而变化的规律,以此去推算未知点的属性值。这个规律,就是变异函数。
通常,利用采样点及变异函数的计算公式得出样本点的实验变异函数(experimental variogram),拟合后的曲线为经验变异函数。观察该变异函数的分布图像,寻找地统计学提供的某一种理论模型或者多个理论模型(basic model)的线性组合进行拟合。常见的理论模型有:线性模型、球状模型、指数模型、高斯模型、幂指数模型等。
分析步骤运用地统计学进行空间分析基本包括以下几个步骤,即数据探索性分析,空间连续性的量化模型,未知点属性值的估计,对未知点局部及空间整体不确定性的预测。用户可根据自己的需要截止到中间某一项。数据探索性分析,主要是通过频率分布图、散点图、位置图等对数据的统计分布特征做一个初步的考察。这个过程最容易发现的问题就是数据的集聚,以及异常点极值的出现。通常,可利用适当的变换,如对数变换来解决。
研究方法地统计学的研究方法包括局部估值、不确定性预测、随机模拟及多点地统计学四部分。
估值地统计学最初应用是在矿产部门,作为矿产储量计算的基本方法取得了相当丰硕的成果。在地统计学领域,克里格(Kriging)是大家公认的估计方法的总称。实际上,它也是一种广义的最小二乘回归算法,而其最优目标定义为误差的期望值为0,方差达到最小。包括简单克里格(Simple Kriging)、普通克里格(Ordinary Kriging)、趋势克里格(Kriging with a trend model)、因子克里格(Factorial Kriging)、协同克里格(Co Kriging)、块状克里格(Block Krigin-g)等等。
局部不确定性预测地统计学的估计功能主要是求得一个无偏的最优估值,同时给出每个估值的误差方差,用以表示其不确定性。
这种方法的优点是比较简单,只需要主变量之间的关联关系。但其缺点是:
①认为误差的分布是对称的,但在实际情况中,低值区往往被高估,而高值区往往被低估。
②认为误差的方差只依赖于真实值的形状,而不考虑具体每个值的影响,即所谓的同方差性。
但实际上被一个大值和小值包围的点,其估值的误差一般要比被两个同规模小值包围估值点的误差要大。所以,应确实考虑到所估计点周围样本点本身值的影响,即利用条件概率模型来推断不确定性。通常有两种方法:参数法(众高斯方法)及非参数方法(指示克里格方法)。
众高斯方法(MultiGaussianapproach):到目前为止,这是应用最广泛的参数化方法。它假定所研究区域的概率分布可以用一个统一的公式表达,最终的概率依赖于相关参数。对应于众高斯方法,即是均值和方差。我们利用克里格方法来估计这两个参数,同时利用光滑样本点频率分布图方式来平滑、增加其概率分布函数。
由于众高斯方法要求多点分布必须是标准正态的,且没有考虑极大值与极小值间的关联关系。对于样本点的指示变异函数不支持双高斯分布,或者作为关键的辅助信息与主变量之间不满足众高斯分布,这时需采用指示克里格方法。
指示克里格(IndicatorKriging):利用指示克里格方法估计未知点的不确定性,首要的一步是将各种来源的信息进行指示编码。即利用不同的阈值将原数据分为合适大小的间隔,考虑该间隔内点的关联关系及其不同的关联之间的关系。这样,就有效地解决了众高斯方法的缺点。
随机模拟克里格方法完成了空间格局的认知,但没能使其再现。通过克里格方法,可以获得唯一的估计结果,而且极值点都被光滑下去。根据随机变量的定义,每个变量可以有多个现实,也就是说每个未知点的估值可以有多种情况,但前提是总体趋势的正确性,这种方法就是随机模拟。
随机模拟可以利用各种不同类型数据(如“硬”的采样点数据,“软”的地震数据)再现已知的空间格局。“硬数据”指在采样点精确测量的变量值。“软数据”指关于该变量各种类型的间接测量值。随机模拟可以生成众多的现实,每一个现实展现同一种格局,但不同的表现方式。在单变量分布模型中,通过随机变量的系列结果来统计其不确定性,与此类似,一系列随机产生的现实,作为模型的输入也可以表达输出结果的不确定性。这些随机现实是等概率的,即没有哪一个现实是最好的。
多点地多点地统计学的发展主要得益于地统计学在石油领域的应用。早期,地统计学多用于煤炭问题,通过块状估值得出可开采储量。但在对石油储区的研究中,人们发现单纯的某个点的渗透性是没有意义的,而应该以流的观点来看待渗透性问题。这就使得对渗透性的连通性或其空间格局的量化比得到某局部点的精确值更为重要,而不是光滑的估计。
传统的地统计学借助于煤炭科学的思想,利用变异函数来量化空间格局。但变异函数只能度量空间上两个点之间的关联,所以表现空间格局有很大的局限性。对于关联性很强的情况,或所研究对象具备较为明显的曲线特征,这时要想量化其空间格局需要包含多个空间点。在图像分析中,通过多点模板或者窗口来量化其格局。意识到变异函数在表达地质连续性上的局限性后,地统计学家将图像分析中的思路借鉴过来,一个新的领域在地统计学中升起:多点地统计学。
原本地统计学模拟包括认知和再现两部分。认知通过变异函数来完成,而再现通过序列高斯模拟的多个现实来完成。多点地统计学进一步改善了认知部分,即通过多个点的训练图像来取代变异函数,更有效地反映了研究目标的空间分布结构。而对于图像分析而言,它只注重认知部分,但没有再现功能。
多点地统计学的核心是训练图像。由于在地统计学中也出现过多点信息,但从未被量化过,而一般是将信息隐含的应用到具体问题模型中去。但如通过图像的方式,可全面量化原数据各阶的信息,因此我们可采用非条件的布尔方法得到训练图像再进行分析。这种方法主要是在由于石油领域的问题引出,因此也主要应用在这个领域。包括理论本身,还有待于进一步完善。
GISGIS是对空间数据进行搜集、存储、检索、转换、显示及分析的一门技术。它可以将具有地理坐标的数据信息作为一个专题层,或地图文档来进行管理。作为一个强大的数据库系统,它可以存储具有同样空间范围的多种专题信息。编辑、操作这些空间数据,对于现有的GIS软件已不成问题,但对空间数据分布格局进行建模,抽取其特征还很欠缺。
这就需要像地质统计(geostatistics)这类空间分析的统计软件包。地统计学近年来在国际上发展迅猛,特别是GIS的发展,对空间分析功能提出了一个新的要求,使得地统计学成为多个学科重视的焦点。但到目前为止,二者之间的结合还很少,或非常欠缺。如大型软件ArcGis,从8版本以后加入了扩展模块,其中即有地统计学。
但内容仅限于克里格系列方法,而对于模拟方法还是一片空白。所以,未来将两者结合起来将是一种必然的趋势。一种比较快捷的方式是利用组件式思想,将地统计学软件内嵌到GIS软件内部。这种结合方式要考虑到两个原本不同系统的融合,所以稍显繁琐,且二者关系较为松散。但针对目前强大的需求,这无疑是一种多快好省的方法。
参考资料本文发布于:2023-06-04 12:51:23,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/92/197254.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:地统计学(研究自然现象的学科).doc
本文 PDF 下载地址:地统计学(研究自然现象的学科).pdf
留言与评论(共有 0 条评论) |