正态分布在实际生活中的应用

更新时间:2024-04-25 06:58:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

《概率论与数理统计》

论文

正态分布在实际生活中的应用

正态分布在实际生活中的应用

摘要:

正态分布是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。其密度函数为:f(x)?221由μ、e?(x??)/(2?),

?2?σ决定其性质。生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;还有智力测试、填报志愿等问题。

关键词:正态分布 实际应用 预测 正文:

正态分布(normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。则其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。

正态分布的密度函数 :f(x)?221e?(x??)/(2?) ?2?? f(x)为与x对应的正态曲线的纵坐标高度; ? μ为总体均数即数学期望决定了其图像位置 ? σ为总体标准差决定了分布的幅度; ? π为圆周率,即3.14159;

? e 为自然对数的底,即2.71828。

我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。

服从正态分布的变量的频数分布由μ、σ完全决定,他还具有如下特征: 1、集中性:正态曲线的高峰位于正中央,即均数所在的位置。

2、对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。

5、u变换:为了便于描述和应用,常将正态变量作数据转换。μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ。

6、σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。 也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。

7、3σ原则:P(μ-σ

(μ-3σ

正态分布随处可见,处处显现着他神秘的身影。对于某一件事或者某个要达到的目标,很多很多的个体发挥出来的水平大致上服从正态分布。也就是说,对于大量个体的发挥统计,常常能看到正态分布“冥冥之中”束缚着整体的状态。

对于某个单独的单位,一般来说,对于“发挥出来的水平”这件事,也往往有波动的效果,不管是机器、工具还是我们人本身:有的时候,超水平发挥了;有的时候正常发挥;有的时候又会发挥失常。这种东西应该也可以抽象为围绕期望水平的正态分布。

而对于若干数据,包括发挥水平、排位情况,但是没有整体数据的时候,如果能推测是正态分布的情形,就可以近似计算出分布函数来,然后去估计其他的分布情况。这是反向推导的过程。

生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。

例如测试智力问题:

理查德·赫恩斯坦 [(Richard J. Herrnstein 1930.05.20-1994.09.13),美国比

较心理学家]和默瑞(Charles Murray)合著《正态曲线》一书而闻名,在该书中他们指出人们的智力呈正态分布。以某校的入学新生的智力测试为例:

假设某校入学新生的智力测验平均分数与方差分别为100与12。那么随机抽取50个学生,他们智力测验平均分数大于105的概率?小于90的概率?

本例没有常态分配的假设,还好中心极限定理提供一个可行解,那就是当随机样本长度超过30,样本平均数x近似于一个常态变量,因此标准常态变量Z = (x–μ) /σ/ √n。

平均分数大于105的概率p = p(Z> (105 – 100) / (12 /√50))= p(Z> 5/1.7) = p( Z > 2.94) = 0.0016.

平均分数小于90的概率p = p(Z< (90 – 100) / (12 /√50))= p(Z < 5.88) = 0.0000. 理查德·赫恩斯坦和默瑞他们利用应募入伍者的测试结果证明,黑人青年的智力低于白人和黄种人;而且,这些人的智力已经定型,对他们进行培训收效甚微。因此,政府应该放弃对这部分人的教育,把钱用于包括所有种族在内的启蒙教育,因为孩子的智力尚未定型,开发潜力大。由于此书涉及黑人的智力问题,一经出版便受到来自四面八方的围攻。

例如高考填报志愿的问题:

高考后,考生填报志愿时,下列两个问题就显得很重要:(1)高考后(或前)希望能准确估计自己的标准分和“百分位”(百人中所处的位置);(2)希望从考生手册中。往年高校第一志愿实际录取的最高、最低、平均分三个数据获取更多更准确的信息。不以人们意志而转移的统计规律——正态分布理论,就可以帮助我们估计,实现这两个目的。

一个学校在正常情况下,同类考生都有一、二百人以上规模,这已经算大样本容量了。一个学校、二百个以上考生成绩在全省里面有较高相对稳定性。所以只有把每一个考生考后所估比较真实的成绩放在整个学,以大样本来分析才能保

证用总体正态的特征来判断考生绩所处位置的科学性。

这里以1998年西安电子科大在福建实录第一志愿40名考生为例,当时最低、最高、平均分分别是634、714、660分,现计算分析如下:

(1) 把[634,714]隔10分分为8个段.把分点换算为实际标准分; X0=(634—500)/100=1.34.Xl=1.44??x8=2.14

(2) 查标准正态分布表算出大“曲边梯形”面积: S=Φ(0.24)-Φ(1.23)=0.07394

(3) 查标准正态分布表算出8个小“曲边梯形”面积: S=Φ(1.44)一Φ(1.34)=0.01519

S1=0.01315,S2=0.00128.S3=0.00957, S4=0.00805, S6=0.00669. S7=0.010551, S8=0.00450

(4)算出落在80分数段的(理论)录取人数40Si/S。要注意的是,根据标准正态分布的特征.8个数据40Si/S。均应采用去尾法.所得整数作为所估实录人数,但考虑到最高分数段录取人数往往手步一人.所以如果最高分数段录取人数出现0<40Sa

总结:

正态分布广泛存在于自然现象、生产、生活及科学技术的许多领域之中, 正态布在概率和统计中占有重要地位. 统计是不可忽视的重要工具,因此我们要认真学习《概率论与数理统计》这门课程,善于利用这个工具,解决好实际生活中的问题。

参考文献:

《概率论与数理统计》 浙江大学 盛骤等主编 百度百科 维基百科

《趣味随机问题》 孙荣恒

本文来源:https://www.bwwdw.com/article/g3gp.html

Top