解读地震

更新时间:2024-03-14 16:55:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

2011年赣南师院数学建模竞赛选拔赛

题 目

解读地震

摘 要:

本文针对地震的12个指标以及地震预测问题进行了探讨。结合地震前兆的数据特征,建立模型,在较合理的假设下,对各个模型进行求解,得到较合理的结果。由于地震的相关因素很复杂,且观测数据非常多且精细,我们应用EXCEL,matalb软件对模型进行求解。 ? 针对任务一,本文采用灰色关联分析法对地震与题中所给的12个影响因素进行分析比较。 12个影响因素对地震的敏感程度大小为:雨量>斜仪NS>磁波幅度EW>电磁波幅度NS>地温>气氡>气温,电压>水温>气压>水位倾斜仪EW。

? 针对任务二,我们选取了10个指标进行主成分进行分析,为了消除各指量纲的不统一我们使用了相关系数矩阵。最终确定了5个五个主成分作为反映地震发生前综合指标,发现电磁波、气温、气压等因素的异常与地震的发生有密切的关系。

? 针对任务三,我们使用了多元统计模型中的线性回归法,假定样本数据只来源于两个总体,即地震前兆的数据总体和正常的数据总体。考虑到地震前兆的样本数据均表现出显著的起伏波动特征,因此我们选取了标准差作为判别变量。在地震前兆的数据总体中抽取七组,在正常的数据总体中抽取七组为学习和检验样本进行分析并进行线性回归,得出了各指标在地震前的数据特征。得出的线性回归方程为:

z??0.1582x1?0.148x2?0.1607x4?0.6582x5?0.2117x6?0.9792x8?4.2589 ? 针对任务四,本文阐述了对地震数据的分析处理步骤,指出了地震数据分析平台建立的作用与意义。 ? 针对任务五,本文结合以上的四个任务提出了一些可行性的设想,如观测站应在分布于不同地域覆盖整个区域,加强对空地结合,使预测达到更好的效果,加强对震例总结和地震前兆时空分布特征的研究等。

关键词:灰色关联分析法 主成分分析 方差 线性回归

参赛队员 蔡辉洪 周新连 朱海燕 参赛密码 (由组委会填写) 参赛队号 01

一、 问题重述

1.1 背景分析

地震是地壳快速释放能量过程中造成的振动。虽然预测地震是世界性难题,但迄今科学界普遍认为,有可能反映地震前兆特征的指标可能不少于10个。已经有专业仪器在多个定点实时按秒记录这些指标的数据,期望通过对记录数据的分析研究找到地震的前兆特征。

现已采集到某地2005年1月1日至2010年6月30日按小时观测的10多个指标的数据,和该地区该时期内已发生地震的时刻、经纬度、震级及震源深度的数据。这些数据中隐藏着地震发生的前兆特征。科学地截取这些数据的有用片段,对数据进行合理地预处理,用数学方法揭示地震前兆的数据特征,是一项很有意义的研究工作。

题给数据中的这10多个指标,究竟哪些与地震的发生有关,有何种关系,是单一关系还是复合关系;除这10多个指标外还有哪些因素及含题给指标在内的哪些指标的哪种数学模型更能反映地震的前兆特征等等,人们迄今仍不很清楚,需要进行深入地研究。地震数据的观测是持续进行的,随着时间的推移数据的规模会不断扩大。从中挖掘地震的前兆特征,必须有合理的数学模型,也必须有科学高效的算法分析平台。因此,请参赛队结合附件中给出的实际记录数据,尝试完成以下任务。 1.2 任务的提出

任务一:分析数据特征,建立数学模型以度量各指标对地震发生

的敏感程度。

任务二:构造由某些或全部指标构成的综合指标,使其尽可能地

集中反映地震发生前的数据特征的统计规律。

任务三:结合题给数据,广泛查阅与地震相关的其它指标的数据

和分析方法,建立数学模型来研究地震发生前的数量特征。 任务四:将前述各项任务的计算程序集结成地震数据分析平台,

使其能够完成形如题给数据的其它地震数据的分析,并能自动输出前述任务的重要的分析结果。

任务五:对于进一步的研究设想写一篇切实可行的报告。

1

二、 模型假设

? 地震监测点的监测设施能正常运转;

? 地震监测设施周围不存在影响其工作效能的干扰源,如飞机场、发电厂等; ? 由于题目中所监控到的地震均不属于强震,因此不考虑有余震的情况; ? 对于监测记录中出现的个别数值极大预测量均当作极端异常值予以剔除; ? 没有地震的时刻假设为1级地震;

三、 符号说明

第i个被评价对象的第K个指标与第K个最优指标的关联系数。 ?i(k):

*:为第k个指标的最优值 jkCki:第i个指标的无量纲指标 Ri:第i个指标的与地震的关联度 Yi:原观测值时间序列,i?1,2?;

xij:为第i个指标第j个样本的原始数据;

?i:特征值,i?m; fi:第i个指标的贡献率;

zp:表示第p个主成分,p?12;

Y:样本综合评价值;

Ci:特征值?i对应的特征向量。

) ki:异常的特征量(i?1,2....7,

2

四、 问题分析

根据问题重述,可以知道这是一个地震数据分析与预测问题。该问题的实质是根据附录中的数据判断出哪些指标能更能反映出地震发生,哪种模型更能反映地震发生的前兆特征。对此问题我们从五个方面出发,

分别建立数学模型来度量各指标对地震发生的敏感程度、综合某些或全部指标使其尽可能地集中反映地震发生前的数据特征的统计规律、建立数学模型来研究地震发生前的数量特征、将计算程序集结成地震数据分析平台、对于进一步研究设想写一篇切实可行的报告。

根据问题重述,可以知道这是一个地震数据分析与预测问题。该问题的实质是根据附录中的数据判断出哪些指标能更能反映出地震发生,哪种模型更能反映地震发生的前兆特征。对此问题我们从五个方面出发,分别建立数学模型来度量各指标对地震发生的敏感程度、综合某些或全部指标使其尽可能地集中反映地震发生前的数据特征的统计规律、建立数学模型来研究地震发生前的数量特征、将计算程序集结成地震数据分析平台、对于进一步研究设想写一篇切实可行的报告。

对于任务一,要分析附件中所给的数据,建立数学模型以度量各指标对地震发生的敏感程度。附件中已给的10多个指标是按小时给出的,为了更直观的显示各指标与地震的关系,首先剔除极端异常数据,对这些数据进行日平均处理。再对各个指标在地震前后七天进行灰色关联度分析法 ,分析后得到各指标对地震发生的敏感程度,进行各项影响指标的比较。

任务二运用主成分分析法找出由10多个指标的线性组合而成的综合指标。这些主成分可以尽可能地反映原来指标的信息 ,以达到集中反映地震发生前数据特征的主要统计规律。在所给的检测数据指标中,有些指标在地震发生前出现较明显的异常,而另一些指标并不出现异常,这些都会给考虑指标与地震关系带来困难。主成分分析法正是解决这一问题的理想工具。

任务三中要结合题给数据,从地震单项前兆观测值中识别地震异常,即地震发生前后的数据与没发生地震时有突变或规律发生变化,则认为是异常值。并将异常与正常进行比值计算,比值大小则反映了指标的数值特征。主要运用标准差进行回归建模分析,对已给数据进行对照分析。

3

任务四要将计算程序集结成地震数据分析平台,能够完成其它地震数据的分析,并能自动输出前任务的重要分析结果。

任务五是针对进一步的研究设想写一篇切实可行的报告。

五、模型的建立与求解

5.1 任务一的分析与解答

影响地震发生的因素是多方面的,从多种因素中确定主要影响因素以及各因素之间的主次关系.是进行系统性分析的一个重要内容。本文以灰色理论中的灰关联分析对题中所给的12项数据与地震的震级进行分析。

由于数据量比较大,所以本文把所给的数据进行平均值处理。没有地震的本文假设发生1级地震。

灰色综合评价主要是依据以下模型:R=Y×W

式中,R为M个被评价对象的综合评价结果向量;W为N个评价指标的权重向量;

1n ?i(k)为第i个被评Ri???i(k)价对象的第K个指标与第K个最

ni?1优指标的关联系数。根据R的数值大小,进行排序。

(1)确定最优指标集

***F?[j,j,?j],式中j*为第k个指标的最优值。其中k为题中所给12n设k的12种指标分别为:电压,电磁波幅度EW,电磁波幅度NS,地温,气温,水位,气压,水温,气氡雨量,倾斜仪NS,倾斜仪EW。此最优序列的每个指标值可以是诸评价对象的最优值。选定最优指标集后,可构造矩阵D。

4

式中jki为第i个时间段第k个指标的原始数据。 (2)指标的规范化处理

由于评判指标间有不同的量纲和数量级,故不能直接进行比较,为了保证结果的可靠性,因此需要对原始指标进行规范处理。设第k个指标的变化区间为[jk1,jk2],jk1为第k个指标在所有被评价对象中的最小值,jk2为第k个指标在所有被评价对象中的最大值,则可以用下式将上式中的原始数值变成无量纲值Cki?(0,1)。

ijk?jk1,i?1,2,?m,k?1,2,?,n C?ijk2?jkik(3)计算综合评判结果

**根据灰色系统理论,将{C*}?[C1*,C2,?,Cn]作为参考数列,将ii{C}?[C1i,C2,?,Cn]作为被比较数列,则用关联分析法分别求得第i个

被评价对象的第k个指标与第k个指标最优指标的关联系数,即

?(ik)?**minminCk?Cki??maxmaxCk?CkiiC?C??maxmaxC?Cikk*kiikk*kik

式中??0.5。

1nRi???i(k)

ni?1R1?0.998328,R2?0.999864,R3?0.999746,R4?0.998949,R5?0.99865,R6?0.33978,R7?0.939934,R8?0.992569,R9?0.998892,R10?0.999981,R11?0.999904,R12?0其中?R1??R12?分别代表电压,电磁波幅度EW,电磁波幅度NS,地温,气温,水位,气压,水温,气氡,雨量,倾斜仪NS,倾斜仪EW

关联度R10,R12最大,说明雨量, 倾斜仪NS对于地震发生的敏感程度最大,其他影响的敏感度大小如下:

5

电磁波幅度EW>电磁波幅度NS>地温>气氡>气温,电压>水温>气压>水位倾斜仪EW。 5.2 任务二的分析与解答

主成分分析法旨在力保原始数据信息丢失最小的情况下,对高维变量空间进行降维处理,即在保证原始数据信息损失最小的前提下,经过线性变换和舍弃部分信息,以少数的综合变量取代原有的多维变量。

基于主成分分析法的地震前综合指标评价模型 1、主成分分析原理及计算过程

(1)将样本数据标准化,得到标准化后的数据矩阵为

?X11?X12???X??????,

?X??n1?Xnn?Xij?xij?xj其中:

xij?j1n?j?xj??xijnj?1,,

1n(xij?xj)2?n?1j?1,

为原始样本数据。

(2)计算相关系数矩阵:

?r11?r1m???R?????? ?r??m1?rmm?(3)计算R的特征方程R??I?0的m个非负特征值

?1??2????m?0。

12mC?C,C,?,C??,?iiiim个(4)计算对应特征值i的相应的特征向量

特征向量成的特征向量矩阵;

6

?C1?1m??C?C??11C??Ci??2??????????1m?C?C???mm???Cm?

(5)由特征向量C组成个新因子

Z??z1,z2,?,zm?r,有Z?XC。

(6)选择(p(p?m)个主分量,这p个主分量的累积方差贡献率

?p??m????i?/???i??85%大于等于85%以上,即?i?1??i?1?。

(7)根据Z=XC,计算p个主成分的值z1,z2,?,zp。 (8)计算样本综合评价值

Y??fizii?1p,式中

fi??i/??ii?1m。

2、地震发生前数据特征的主成分分析评价

根据前面问题的分析,在众多指标中降雨量受到外界因素影响很大,倾斜仪所得数据依赖仪器精确度较高,故我们选取除这些指标外的9个指标x1?x9构成综合指标,表2为通过主成分分析法得到的各参数在各主成分中的特征值及贡献率。由表2可以看到,取5个主成分时累计贡献率已达到90.58%,取6个主成分时累计贡献率已达到97.87%。这表明前5个主成分已包含了样本中的绝大部分信息量。

表2 各参数在各主成分中的特征值、贡献率 项目 z1 2.94079 z2 2.37578 0.264 0.5907 z3 1.14318 0.127 0.7178 z4 0.894617 0.0994 0.8172 z5 0.797719 0.0886 0.9058 z66 z7 0.25563 0.0284 0.9787 z8 0.165627 0.0184 0.9971 z9 0.0261514 0.0029 1 ?i 0.40050fi 0.3268 0.0445 0.9503 Y 0.3268 表3为所选指标在5个主成分中的系数(特征向量),由表3可知主成分1中的X2电磁波幅度EW值、X3电磁波幅度NS值、X6气温

7

值、X7气压值系数较大,是构成主成分1 的主要参数;主成分2中X5水位值、X6气温值、X9气氡值系数较大,是构成主成分2 的主要参数;主成分3中X1电压值、X4地温值系数较大,是构成主成分3的主要参数;主成分4中X1电压值、X4地温值、X7气压值系数较大,是构成主成分4的主要参数;主成分5中X4地温值、X8气氡值系数较大,是构成主成分5的主要参数。

表3 5个主成分的载荷 标 主 成 分 指 z1 z2 z3 z4 z5 x1 x2 x3 x4 x5 x6 x7 x8 x9 -0.0855 -0.7048 0.8361 0.2686 -0.3119 0.8076 -0.7268 -0.0414 0.6214 -0.2422 0.293 0.2834 -0.0185 -0.8706 -0.4892 0.4675 -0.74 0.6222 0.7664 0.085 0.0642 0.6992 0.0374 -0.1042 0.1484 0.0286 0.1428 -0.4807 -0.3522 0.184 0.477 0.0076 -0.2279 0.3405 0.262 -0.2037 0.3011 -0.3141 0.1424 -0.4431 -0.1435 -0.1507 0.3037 0.4671 0.1953 8

综合指标 的时间序列图0.200.150.10综合指标0.050.00-0.05-0.10月三月年2005九月三月2006九月三月2007九月三月2008九月三月2009九月三月2010 图5-2-1 综合指标的时间序列图

由于前五个主成分的贡献率已经高达90.58%,因此这五个主成分就可以集中地反映地震发生前的数据特征的统计规律。即电磁波幅度EW、电磁波幅度NS、气温、气压、水位、气氡、电压、地温这七个指标就可较好地反映地震发生前数据特征的综合特征。 5.3 任务三的分析与解答

查阅与地震相关的其他指标如震级,频率等,由于标准差是表示数据特征的一个重要标志,二标准差在本问题中可以很好的反映各指标是否发生异常和其异常程度,即其敏感程度。根据第二问我们选取x2电磁波幅度EW、x3电磁波幅度NS、x6气温、x7气压、x5水位、x8气氡、x1电压、x5地温这八个指标在地震前15天和地震后的5天的的数据进行标准差求取作为变量,震级作为因变量用线性回归建立模型。

地震活动是一种复杂现象,各种观测数据之间缺乏对比性,难以利用

9

统一的物理场进行描述。为了将各种观测量的异常信息进行表达,可把各前兆异常量转化为无量纲量以便进行对比。各种地震前兆观测量虽然是不同的物理量,但其共同的特点都是随时间变化的数值,即都是时间函数,各种地震前兆异常也都表现为各种观测量随时间的突出变化,异常形态虽多种多样,但究其本质共同点都是观测曲线随时间的变化。因此,观测各指标的标准差也是重要的指标。

由以上分析从各种前兆数据中提取地震信息量的方法应具以下特点:

(1)地震信息是一个无量纲量;

(2)选取地震时间点的前15天,后五天的数据计算出个指标的标

准差在,作为异常值,同样选取其他年份的相同年份的同一时间段进行对照分析,求出其不发生地震时的对应时间的标准误差,作为其对应的正常值。

(3)、用前兆观测量的异常值与正常情况下的比值作为反映观测值

得变化,一般情况下,比值越大,异常量就越大,由此把这七个量也化为了无量量纲。

原理和方法

从地震单项前兆观测值中识别地震异常,即地震发生前后的数据与没发生地震时有突变或规律发生变化,则认为是异常值。并将异常与正常进行比值计算,比值大小则反映了指标的数值特征。 并计算它属于地震异常的程度,需要遵循的基本条件是: (1)、观测本身内在质量要好;

10

(2)、“异常”出现的频次要低,且出现“异常”与“地震”之间

对应程度要高;

(3)、“异常”与“正常”相比,有明显的差异性,且界限要清楚。 按照地震前兆异常的普适性和上述基本条件,提出如下地震前兆异常特征量:

SDi??xij?xj?n?12

ki?SDi 'SDi其中SDi表示的是异常(地震)时第i个指标的数值的标准差,SDi'表示的是正常(与地震同时刻其他年份)时第i个指标的数值的标准差其中附录已给出七次地震信息,ki为异常的特征量(i?1,2....7,) 用Matlab将其进行线性回归出其误差,结果如下:

z??0.1582x1?0.148x2?0.1607x4?0.6582x5?0.2117x6?0.9792x8?4.2589

4.543.532.521.510.50-0.5 1234567回归误差z

如上图可知回归误差很小,即回归还是可行的,根据回归结果可知这

11

几个指标共同反映地震发生前的数量特征。 5.4 任务四的分析与解答

地震无疑是当今世界上最具破坏力的灾难之一。一次大地震,能给人们的生产生活带来难以估计的损失。发生地震成因复杂、影响因素众多,可预测性不大。是迄今为止最难有效预防的天然灾害之一。为了降低地震灾害给国家和人民所带来的生命财产损失,我们应该完善预警机制,加强地震的预测工作。因而建立一个比较有效的地震数据分析平台就显得十分重要。在了解数据分析平台的整体功能前,我们首先要了解整个的分析过程。

本平台进行数据分析的总体步骤如下:

1. 拥有准确可行的数据是分析地震发生的首要条件,才能进行数据的分析及较为准确的预测。首先,要对各地震监测站的数据进行收集与整理,并且要确保数据能够被系统所读取。这是我们进行后续处理的前提。

2. 在把数据导入系统后,观察数据变化的整体趋势和数据变化的特点,来发现数据项之间的依存关系,帮助我们进行直观判断,为进一步的分析提供思路,接着可以通过灰色关联分析法,分析影响地震发生的敏感程度,对于敏感因素的数据再进行深入的分析,提出有效的预测方案。

3. 对于繁多的数据,对问题的分析往往比较复杂。因此,我们希望变量个数较少而得到的信息较多。利用主成分分析将多

12

个变量通过线性变换以选出较少个数重要变量的一种统计分析方法,可以很好地处理这个问题。

4. 通过主成分分析,我们可得到主要的几个能集中反映地震发生前的数据特征,而对于地震的这些前兆指标的数据,它们必定会呈现与正常时各指标所体现出来的数值特征。因此,正常的数据来地震前兆的数据应该来自于两类不同的总体。

5. 通过对已经划分好组别的样本数据进行学习分析,求出它们

的比值作为因变量的值,然后我们可以对这些指标变量进行线性回归,对结果进行判别,得出其震级,误差范围内,实现了较好的地震前兆数据分析与得出重要的分析结果。

5.5 任务五的分析与解答

纵观全世界,当代的地震预报仍处于比较低的水平阶段。尚无把握预报准确的发震地点和时间。也由于地震的发生过程十分复杂,地壳深部也不可入,地震事件发生的概率较小,所以决定地震预测是个全球性的科学难题。

地震前异常变化与地震关系的不唯一,各局部地区异常变化关系复杂,不同地震前异常现象的存在差异,临震异常的短暂,都使得预测地震异常艰难。

研究表明短期前兆对地震时间的预报是必要的,但它的性质在许多情况下我们还是不清楚。对各指标对于地震发生的预兆程度进行粗略地估计,我们采用了灰色关联度分析法来分析。凭经

13

验企图查明短期前兆出现时间对震级和震中距方面的依赖关系看来是并不可靠。考虑到强烈地震发生较少,预报工作也就更加艰巨,需要相当长的时间,精密的技术装备,系统化的野外观测和对观测结果的反复比较,才有可能事先发出预报。观测应在分布于不同地域的许多台站同时进行。而题中给出的数据是非常有限的,仅仅给出一个观测点12个指标的数据。若有更多地震前兆指标的更多数据,我们应该建立更加精确的模型,从而能够比之前更精确地预测地震的发生。但是我们仍然无法预报地震发生的时间、地点、震级的大小和震源的深度。

于是我们研究设想找到更多的地震前兆特征指标,并揭示各指标的内在联系,然后根据经验和对地震孕育与发生过程的认识进行地震预报。今后,不仅应在对各单项观测结果进行分析的基础上,进一步加强震例总结和地震前兆时空分布特征的研究,同时应大力加强有关的基础性研究工作,加强各种预报方法的研究攻关。也需关注一些先进科学的预测方法,如我国预测地震的方法有:卫星红外异常预测短临地震,这是我国科技工作者首先开发

研究试用的开创性新方法。

还要确保各指标观测数据的真实性、准确性。数据是供人们研究的平台,其真实性、准确性直接关乎研究方向的正确性及研究结果的实效性。

优化数据分析方法。从各指标对事件的函数图像可知,各指标值振荡频繁,然而不是所有的振荡都是因为地震的发生而引起

14

的,如电磁波的振荡容易受太阳黑子等因素影响而发生明显振荡。如何采取科学、合适的数据分析方法关系到所得模型预测预报的准确率。

六、模型的评价

1、在地震分析中经常要分析各个变量间相互依存关系,本文模型只能分析每一个变量对因变量的直接影响,且要求其余自变量之间相互独立。事实上,变量之间的关系错综复杂,一个自变量可能对一个因变量有直接影响,也可能通过其他的自变量对因变量有间接地影响,显然本模型无能为力。

2,主成分分析时忽略了各指标间的相关性,导致主成分之间有重叠,不利于进行更广的分析。同样的,回归分析模型还是有些欠缺,用最小二乘法求的线性参数与预想的有所偏差。

七、参考文献

【1】 姜启源,谢金星,叶俊.数学模型[M],北京:高等教育出版社,2003. 【2】赵静,但琦.数学建模与数学实验(第三版),高等教育出版社,

2008.

【3】 魏宏儒,地震成因和地震短临预测预报及其物理机制

15

的,如电磁波的振荡容易受太阳黑子等因素影响而发生明显振荡。如何采取科学、合适的数据分析方法关系到所得模型预测预报的准确率。

六、模型的评价

1、在地震分析中经常要分析各个变量间相互依存关系,本文模型只能分析每一个变量对因变量的直接影响,且要求其余自变量之间相互独立。事实上,变量之间的关系错综复杂,一个自变量可能对一个因变量有直接影响,也可能通过其他的自变量对因变量有间接地影响,显然本模型无能为力。

2,主成分分析时忽略了各指标间的相关性,导致主成分之间有重叠,不利于进行更广的分析。同样的,回归分析模型还是有些欠缺,用最小二乘法求的线性参数与预想的有所偏差。

七、参考文献

【1】 姜启源,谢金星,叶俊.数学模型[M],北京:高等教育出版社,2003. 【2】赵静,但琦.数学建模与数学实验(第三版),高等教育出版社,

2008.

【3】 魏宏儒,地震成因和地震短临预测预报及其物理机制

15

本文来源:https://www.bwwdw.com/article/gbe8.html

Top