如何理解方差和标准差的意义

更新时间:2024-04-25 03:56:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

如何理解方差和标准差的意义? 随机变量X的方差为:D(X)?E(X-E(X))2 ,方差的平方根D(X)称为标准差,它描述

随机变量取值与其数学期望值的离散程度,描述随机变量稳定与波动,集中与分散的状况。标准差大,则随机变量不稳定,取值分散,预期数学期望值的偏离差大,在量纲上它与数学期望一致。

在实际问题中,若两个随机变量X,Y,且E(X),E(Y)E(X)?E(Y)或E(X)与E(Y)比较接近时,我们常用D(X)与D(Y)来比较这两个随机变量。方差值大的,则表明该随机变量的取值较为离散,反之则表明他较为集中。同样,标准差的值较大,则表明该随机变量的取值预期期望值的偏差较大,反之,则表明此偏差较小。

随机变量X的数学期望和方差有何区别和联系?

1. 随机变量X的数学期望E(X)描述的是随机变量X的平均值,而方差D(X)刻画的是随

机变量X与数学期望E(X)的平均离散程度。方差D(X)大,则随机变量X与数学期望E(X)的平均离散程度大,随机变量X取值在数学期望附近分散;方差D(X)小,则随机变量X与数学期望E(X)的平均离散程度小,随机变量X取值在数学期望附近集中。

2. 方差D(X)?E(X-E(X))2是用数学期望来定义的,方差D(X)是随机变量X函数

(X-E(X))的数学期望,所以,由随机变量函数的数学期望的计算公式我们得到:

2(1) 若X为离散型,则有(2.3) (2) 若X为连续型,则有(2.4)

3. 在实际问题中,我们经常用D(X)?E(X-E(X))2来计算方差。由此可以得到:随机变

量X与数学期望E(X)不存在,则方差一定不存在。 4. 若随机变量X与数学期望E(X)存在,方差也可能不存在。

切比雪夫不等式的意义是什么?有哪些应用?

切比雪夫不等式有两种等价形式的表达形式:P(X?E(X)??)?1?P(X?E(X)??)?1?D(X)D(X)D(X)?2或

?2。它反映了随机变量在数学期望的?邻域的概率不小于

。如果随机变量的分布不知道,只要知道它的数学期望和方差,我们就可以利用2?切比雪夫不等式估计概率。

它的应用有以下几个方面:

(1) 已知数学期望和方差,我们就可以利用切比雪夫不等式估计在数学期望的?邻域的

概率。

(2) 已知数学期望和方差,对确定的概率,利用切比雪夫不等式求出?,从而得到所需

估计区间的长度。 (3) 对n重贝努力试验,利用切比雪夫不等式可以确定试验次数。 (4) 它是推导大数定律和其他定理的依据。

解题的具体步骤:

首先,根据题意确定恰当的随机变量X,求出数学期望E(X)与D(X); 其次,确定??0的值,

最后,由切比雪夫不等式进行计算和证明。

注:(一)相关系数的含义

1.相关系数刻画随机变量 X和Y之间的什么关系? (1)相关系数也常称为“线性相关系数”。这是因为,实际相关系数并不是刻画了随机变量X和Y之间的“一般”关系的程度,而只是“线性”关系的程度。这种说话的根据之一就在于,当且仅当X和Y有严格的线性关系是才有|?XY|达到最大值1.可以容易举出例子说明:即使X和Y有严格的函数关系但非线性关系,|?XY|不仅不必为1,还可以为0.

(2)如果0?|?XY|?1,则解释为:随机变量X和Y之间有一定程度的“线性关系而非严格的线性关系”

2.相关系数?XY刻画了随机变量X和Y之间的“线性相关”程度. 3. |?XY|的值越接近1, Y与X的线性相关程度越高; 4. |?XY|的值越近于0, Y与Y的线性相关程度越弱. 5. 当|?XY|?1时, Y与X的变化可完全由X的线性函数给出. 6. 当?XY?0时, Y与X之间不是线性关系.

7. 上面谈到的“线性相关”的意义还可以从最小二乘法的角度解释:(p95)

2设e?E[Y?(aX?b)],称为用aX?b来近似Y的均方误差,则有下列结论.

设D(X)?0,D(Y)?0, 则a0?小.

cov(X,Y)D(X),b0?E(Y)?a0E(X)使均方误差达到最

注: 我们可用均方误差e来衡量以aX?b近似表示Y的好坏程度, e值越小表示aX?b2与Y的近似程度越好.且知最佳的线性近似为a0X?b.而其余均方误差e?D(Y)(1??XY).

从这个侧面也能说明. |?XY|越接近1, e越小.反之, |?XY|越近于0, e就越大.Y与X的线性相关性越小.

8. 由于相关系数只能刻画随机变量线性关系的程度,而不能刻画一般的函数相依关系的程度。在概率论中还引进了另外 相关性指标,以补救这个缺点。但是,这些指标都未能在应用中推开。究其原因,除了这些指标在性质上比较复杂外,还有一个重要原因:在统计学应用上,最重要的而为分布是二维正态分布。而对二维正态分布而言,相关系数是X和Y的相关性的完美的刻画,没有上面指出的缺点。

本文来源:https://www.bwwdw.com/article/bogp.html

Top