计量经济学英文版附录B 翻译 - 图文

更新时间:2024-01-14 11:05:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

附录B

复习概率相关概念:

学习目标:

基于这个附录的材料,你应该能够: 1、 解释一个随机变量和它的值之间的不同,并给出一个例子。 2、 解释离散型随机变量与连续型随机变量之间的不同,并分别给出一个例子。 3、 描述离散型随机变量的概率密度函数的特征,并给出一个例子。 4、 在给定的离散型概率函数中计算事件的概率。 5、 解释下面语句的涵义:在离散型随机变量中取值2时所对应的概率为0.3。 6、 解释连续型随机变量的概率密度函数与离散型随机变量的密度函数之间的不同。 7、 怎样用代数的方法计算给定的连续型随机变量的概率。 8、 直观的解释一个随机变量的均值或者期望值的概念 9、 结合离散型随机变量的期望值概念,在B.9给定的概率密度函数f(x)和函数g(x)来

计算期望。

10、 理解离散随机变量的方差的定义,并解释当方差值越大时随机变量取值更分散的意

义。

11、 运用一个联合概率密度函数(表格)表示两个离散型随机变量并且计算联合事件的

概率,并且找到每个单独随机变量的边缘概率密度函数。

12、 在给定另外一个离散型随机变量取值和他们的联合密度函数的情况下会找出一个离

散型随机变量的条件概率密度函数。

13、 给出一个关于两个随机变量相互独立的直观的解释,并且给出两个随机变量独立的

条件。举出两个随机变量相互独立和不独立的实例。

14、 定义两个随机变量的协方差和相关性,并且在给定两个离散型随机变量的联合概率

函数的情况下计算协方差和相关性。

15、 找出随机变量和的均值和方差。

16、 结合表1和电脑软件计算正态分布的概率。

关键词:

二进制变量 自由度 众数 二进制随机变量 离散型随机变量 正态分布 连续型概率分布函数 期望值 概率密度函数 ?分布 试验 概率 条件概率密度函数 F分布 概率密度函数 条件概率 联合概率密度 随机变量 连续随机变量 函数 标准差 相关性 边缘分布 标准正态分布 协方差 均值 独立 累积分布 中数 方差

我们假定你已经学过一些基本概率统计的课程,在这章附录中我们将复习一些关于概率统计的基本概念,B.1部分我们回顾离散和连续型随机变量;在B.2部分复习概率分布;B.3部分介绍联合概率分布、定义了条件概率和独立的概念;在B.4部分我们将复习概率分布的一些特性,重点复习期望和方差;在B.5部分总结一些重我们常用的概率分布的重要特征:正态分布、t分布、F分布。

2B.1 随机变量

俗话说世界上只有死亡和纳税是确定的。虽然不是这句话的本意,但这个观点还是指出我们在生活中遇到的大部分事情是不确定的。我们不知道我们球队在下一个赛季会赢多少场,你肯定不知道在第一次考试中会得多少分,我们不知道明天的股指是多少。这些事情或是结果都是不确定的或者说是随机的。概率给了我们一个讨论可能性结果的方法。

一个随机变量是在观察前取值未知的量,换句话说就是它是不能准确预测的变化量。每一个随机变量都有一组可能取的值。如果用W代表我们球队下赛季赢球的场数,如果最多只有13场比赛的话,那么W可以取0、1、2、……13。这是个离散型随机变量,因为它只可取有些可数的实数值。另外关于离散型随机变量的实例有随机挑选的家庭中拥有电脑的数量以及下一年你看医生的次数。如果一个试验只有两个结果发生,比如,在电话问卷中,别人问你你是否有大学学历,你的回答只能“是”或者“不是”这样的事件我就说它符合二项分布。用“1”代表“是”用“0”代表“不是”。二项分布是离散型的,用来代替性别(男或女)、种族(白人,非白人)等性质、特征。

美国的GNP是另一例随机变量,因为它的数值在观察到之前是不确定的。在2007年的第二季度,它的值是$138394亿 美元(季度调整的年增长率)。诚然,GNP是用美元来衡量的,并且可以整美元来计算,但是这个值太过巨大以至于计算个人的美元收入变得毫无意义。从实际角度看,GNP可以取从零至无限间的任意值,它是一个连续性随机变量。其他一般的宏观经济随机变量如利率、投资、消费,也看被认作连续性随机变量。在经济学中,股市指数,像道—琼斯指数一样,也认为是连续的。使这些变量得以连续的关键特性是它们可以取区间内的任意值。

B.2 概率分布

概率通常用试验来定义。转骰子是一个试验,我们可以得到六种结果。如果骰子是均匀的,那么每种可能将以1/6的概率出现,假设试验进行无数次的话。1/6这个概率的得出是因为有六种等可能性的结果。然而,如果骰子不是均匀的。设X是当掷骰子时出现的值,那么说X=1的概率就是当大量掷骰子时“一”出现的次数占总数的比重。总之,一个事件的概率就是“限制性的相对频率”,或说在长期中它发生的比重。

在收集调查数据时,人员的学历常常是感兴趣的项目。令X=1表示随机被调查者有大学或更高层次学历;令X=0表示相反情况。在2002年,美国25岁及以上人口中,有27%至少有大学的学历。因而,在总人口中,X=1的概率为0.27, 写作P(X=1)=0.27。概率一定是正的并且总和是1,所以P(X=0)=1—P(X=1)=0.73。在这个例子中随机变量是离散的,因此谈论取某个具体值的概率是有意义的。

我们可以用概率密度函数(pdf)来总和所有概率结果。离散型随机变量的概率密度函数是指每个可能结果的概率值。对离散型随机变量X,概率密度f(x)是随机变量X取值x的概率,f(x)=P(X=x)。因为f(x)是概率,因此一定有0≤f(x)≤1, 如果X可以取n个值x1....,

xn,那它们的总和一定是1。

f(X1)+f(X2)+?+f(Xn)=1.

对于离散性随机变量,pdf可能以表格、公式、或者图表的形式表现,以指明一个人是否拥有大学学历的二项分布,我们可以用像表B.1中的列表来表示。

概率同样可以等式的形式来表示,如:

f(x)=(0.27)(0.73)1x1?x

1?1这样得出f(1)=(0.27)(0.73)-1 = 0.27, f(0)=(0.27)(0.73)01?0 = 0.73

Table B.1 Probabilities of a College Degree

College x f(x) Degree

No 0 0.73 Yes 1 0.27

如另一个例子,令X表示一年中大学生找到工作的那个季度。X五个取值的概率是X=0,1,2,3,4, f(x)=0.05, 0.50, 0.10, 0.10, 0.25. 我们可以用柱状图来表示这个离散型随机变量的pdf, 这样我们可以直观地看到各种可能的结果,如表B.1

概率分布函数(cdf)是另一种表示概率的方法。随机变量X的cdf,用F(x)表示,表示X小于或者等于某个特定的值x。即:

F(x) = P(X≤x)

X的值,pdf, cdf, 如表B.2

利用pdf我们可以计算一个学生工作超过两个季度的概率, P(X>2)=1-P(X≤2)=1- F(2)=1-0.65=0.35

对于标准概率分布,统计学软件已经整合cdf函数,这样计算概率时较为省力。

例如,二项随机变量X是n次独立试验中成功概率为p的成功次数。给定总事件次数n与成功概率p的数值,二项分布概率就可以表示如下

?n?xn?xP(X?x)?f(x)???x??p(1?p)

?? 表B-2 概率分布函数和累积分布函数

?n?n!??= ?x?x!(n-x)!??上式的意思是“n个联合的数字一次取x个”,n!读作n的阶乘,用公式表示即n!=n(n-1)…(2)(1)。假设有13场比赛,LSU老虎队比赛相互独立而且每场比赛他们获胜的概率p=0.7。

那么他们一个赛季至少赢8场的概率是多少?答案是 P(X≥8)=

=1-p(X≤7)=1-F(7) ?f(x)x?813我们可以用表B1强力估计这个概率,但是这太单调。用Eviews 命令@cbinom求二项随机

分布的累积分布函数,将会非常容易。 1-@cbinom(7,13,0.7)=0.8346 别的一些软件也有相似的强有力的功能。 连续随机分布可以取任意一个值,并且可以取无数的数值。结果任何一个特定值的概率都是0.对于连续随机变量,我们讨论一个某一特定区间的结果。图B.2描述了连续随机分布X的概率分布函数f(x)从0取到无穷大。曲线下边的区域达标X落在一个区间时的概率。对于这个分布,P(X≤20)=0.294以及P(X≤40)=0.649.然后我们可以估算p(20≤X≤40)=0.355

这些区域是如何获得的?积分给出了曲线下面的区域的表示方法,因此P(20≤X≤40)

40=f(x)dx=0.355

20x?分布函数是P(X≤x)=

-??f(t)dt=F(x)

图B.2 一个连续型随机变量的概率密度函数

F(x)是X的累积分布函数。概率计算结果是P(20≤X≤40)= F(40)-F(20) = 0.649-0.294=0.355

我们不再这本书中计算积分。我们将用电脑和简单的软件命令来计算累积分布函数值。

B.3 联合,边缘和条件概率分布

处理超过一个随机变量需要一个联合概率密度函数。一个联合概率密度函数描述了变量取值的组合的概率值。在2002年的美国,有185183000人至少25岁。假定我们对从这些人中随机选择上过四年大学和在2002年已经有收入的人的概率有兴趣。定义两个随机变量:X,描述一个人的所获学历,和Y,他们在2002年是否有收入。 1 高中文凭或更低

X = 2 一些专科学校 3 大学学位 4 更高的学位

表 B.3 联合概率函数 f(x,y)

0 如果在2002年没有收入 Y = 1 如果在2002年有正向的收入

随机选择有这些特征的某人的概率已经由X和Y的联合概率密度函数给出了,记作f(x,y),它们由表B.3给出。随机选择的某个人,他有4年大学学历和在2002年有收入的概率是0.14,即P(X=3,Y=1)=f(3,1)=0.14 和一元随机变量的概率密度函数一样,联合概率的总和是1.

??xyf(x,y)=1.

B.3.1 边际分布

给定一个联合概率密度函数,我们可以获得各个随机变量的概率分布,也被称为边际分布。如果X和Y是两个离散随机变量,

fX(x)??f(x,y) 对任意的X

y (B.2) fY(y)??f(x,y) 对任意的Y

x

注意到在(B.2)的和不含另一个随机变量—我们从联合概率密度函数里消除的那个。这种运算有时叫做在联合概率表里加除不需要的变量。例如,运用表B.3,

4 fY(y) =

?f(x,y) y=0,1

x?1 fY(0) =0.19+0.06+0.04+0.02=0.31

联合和边际分布被记述就像在表B.4.

如果随机变量是连续的,(B.2)的概念也生效,但是积分号代替了求和符号。

B.3.2 条件概率

表 B.4 X和Y的边缘分布

随机选择一个人,考虑到他有一个四年的本科学历,他有收入的概率是多少呢?这个问题就是求已知X=3时,Y=1的条件概率是多少。条件确立的功能就是为了减少可能出现的结果。在这个例子中,我们考虑只有18%的人有本科学历,对于离散随机变量,随机变量Y在X=x的条件下的概率可以写作P(Y?y|X?x)。条件概率可由条件概率密度函数f(y|x)得出:

f(y|x)?P(Y?y|X?x)?P(Y?y,X?x)f(x,y)? (B.3)

P(X?x)f(x)X根据边缘概率P(X?3)?0.18,Y在X=3的条件下的条件概率密度为:

只要是大学毕业,随机选取一个人得到正向的工资的概率是0.78(条件概率密度),但是从全部人随机选取的一个人得到正向工资水平的概率是

fY(1)?0.69(边缘概率密度)。了解

教育的程度告诉我们一个人获得高薪酬的概率,这些随机变量依赖于统计学意义。如果Y=y在X=x的条件下的条件概率等于Y=y非条件下得概率,那么这两个随机变量在统计学上讲是独立的。知道X的值不会改变Y的概率分布,这意味着,如果X和Y是相互独立的随机变量,那么

P(Y?y|X?x)?P(Y?y) (B.4)

同样的,如果X和Y是相互独立的,在X=x条件下Y的条件概率密度和Y的非条件、边缘概率密度相同。

f(y|x)?f(x,y)fX(x)?fY(y) (B.5)

反之亦然,所以说如果(B.4)或(B.5)对每一对x和y的值都成立,那么X和Y是相对独立的。 求解(B.5)联合概率密度,如果说X和Y的边缘概率密度之积等于联合概率密度,那么X和Y相对独立。

f(x,y)?fX(x)fY(y) (B.6)

如果(B.6)对每对x和y的值都成立,那么X和Y是相对独立的。这个结果可以推广至两个以上的随机变量。如果X,Y,Z是相对独立的,那么他们的联合概率密度函数可以被分解写为

f(x,y,z)?fX(x)fY(y)fZ(z)。

B.3.3 简单试验

让我们举例说明在一个简单试验中联合概率、边缘概率和条件概率的应用。把表B.5中的值当做有趣的样本空间。如果从表中随机选择一个(假设把表中的数字分别写在10等份的纸上,把它们卷起,然后随机抽取一个来看),这就可以组成一个随机试验。根据这个随机试验我们可以定义一些随机变量。例如,让X为我们所画的纸片所表示的数值,让Y为这些纸片的颜色所代表的离散随机变量,让Y=1代表有颜色的,Y=0代表白的。这两个随机变量的概率分布如表B.6和表B.7,我们同样可以指定X和Y的联合概率分布,列在表B.8。通过这个联合概率分布,我们可以得出一张纸片的颜色是白色(Y=0)并且数字是2(X=2)的概率是P(X?2,Y?0)?0.1。

通过这个简单试验我们也可以说明条件概率的意义。在给定纸片是暗色(Y=1)的条件下,纸片上数字是2 的概率是多少?如果我们限定只注意暗色纸片,我们重新定义样本空间。每个数字有同样的机会出现在新的(暗的)总体,所以

P(X?x|Y?y)?0.25 x=1,2,3,4 或者用公式(B.3)

P(X?1|Y?1)?P(X?1,Y?1)0.1??0.25

P(Y?1)0.4

其中有一个关键的前提条件就是我们计算的条件概率是在其它条件不变的的特殊前提下原总体样本下的一个子集中进行计算的。由于条件概率P(X=1|Y=1)=0.25是不等于X的边缘分布P(X=1)=0.1的。从总的样本空间来看,通过B-4和B-5式子可知,数值X和颜色Y不是相互独立的随机变量。

B.4概率分布的性质

图B.1和B.2让我们了解了随机变量取值出现的频率。分布的两个基本特征就是中心和宽度。中心的度量方法主要有期望、中位数和众数;宽度的描述主要有方差和它的平方根—标准差。

B.4.1 期望、中位数和众数

一个随机变量的均值是通过数学期望给出来的。如离散型随机变数X取量X的数学期望即期望值为

x------x1n,那变

E(X)=

xP(X=x)+x112P(X=

x2)+-----------+

xnP(X=

xn),(B.7)

期望值或均值是各事件值的加权平均值,权数就是事件发生的概率。均值常用字母?或?x表示。在一个无限重复次数为基础的试验中,均值或期望等于所有取得值得平均数。对于表

B-中0-1分布

E(x)=0×0.73+1×0.27=0.27,

这有什么涵义?当我们随机从样本中去一个人时,X的期望值并不是我们期望获得的X的值,因为我们规定X只取0或1。X的期望值E(X),是当我们从样本空间中抽取多个个体时的X的平均值。同样的,如果随机变量X是掷骰子得到的数字,则随机变量的X的期望值就是3.5,如果掷的次数无限多的话,所有取到的X值的平均值就会是3.5. 对于一个离散的随机变量,X取x的概率是通过概率分布函数P(X=x)=f(x)给出的,X在B.7中的的期望值就可以等价的表示为

?= E(x)=x1f(x1)?x2f(x2)???xnf(xn)=?xif(xi)=?xf(x) (B-8)

i?1nX对于连续型随机变量随机变量X的期望值的概念是不变的。当试验无限重复发生时,所有发生值得平均数就等于期望值,然而对于连续随机变量可取无穷多个值,所以我们用积分代替原有的传统求和,故对一个连续随机变量X期望值

?= E(x)=?xf(x)dx。

???而期望的这种算法可能对事件概率分布中心地带的估量有一定的缺陷,因为他可能会受到某个极端事件值的影响,例如,随机变量X只能取1,2,1000000,概率分别为0.5 0.49 0.01,则X的期望值是10001.48,它可以代表事件的密度中心吗?或许不能。 另外两个衡量分布中心的的参数是中位数和众数。对于连续型随机变量,X的中数m是使P(X>m)=P(X

众数是使X的概率取最大值时的值。在图B-1中,X的众数是1,。对于连续型随机分布B-2中众数为X=17.09.

B.4.2随机变量函数的期望

随机变量函数也是随机的,期望值同样可以用类似式子(B.8)来获得。如果随机变量X是散

离的,g(x)是变量X的函数,则 E[g(x)]=

?g(x)f(x) (B.9)

x这个式子依然适用于变量X是连续的时候,但我们要用积分代替代数求和,利用式子B-9我们可以归纳一些对于离散或者连续随机变量均适用的常用法则,一般的E[g(x)]?g[E(X)]

像E(X2)?,但在某些情况下,求他们的期望很容易,若a是常数时, ??E(X)2E(aX)?aE(X) (B.10)

运用式子B_9我们看看推导过程,

E?g(X)???g(x)f(x)??axf(x)?a?xf(x)?aE(X)

最后一步我们依据定义E(x)替代了

?xf(x)。类似的,若a、b均为常数时,那么我们可以得

?aE(X)?b (B.11) 到E(aX?b)如果

g(x)、g12(x)是X的函数,则

E?g1(X)?g2(X)??E?g1(X)??E?g2(X)? (B.12)

这个法则可以延伸到函数的任何值,记住一个和的期望等于期望的和。 一个离散或连续的随机变量的方差是 g(x)=

(x?E(X))的期望值,方差在测量

22概率分布偏离均值的程度上很有意义,我们常用?表示,读作“sigma”.用代数方法,令E(X)=?,

var(X)??2?E(X??)2?EX2??2 (B.13) 随机变量的方差是随机变量的X的平方的期望和期望的平方的差额,方差越大,变量偏离

均值的幅度就越大。在表B-3中显示的两种分布,期望值均为3,就像我们看到的方差越小的随机变量的分布就越聚集到均值附近。

??

表B-3 不同方差的概率分布

方差的平方根叫做标准差;可以记作?。它也可以用来测量一个分布的离散程度 所以它可以作为一个随机变量的计量单位。

下面是一个方差的有用的性质。假定a和b是常数。则有

Var(aX+b)=avar(X) (B.14) 我们通过利用方差的定义和期望的法则得到这个结果,如下 Var(aX+b)=E[aX+b-E(aX+b)]=E(aX+b-a?-b) =E[a(X-?)]=aE(X-?)=avar(X)

概率分布的另外两个特征值是偏度和分度。他们的定义为: 偏度=

2222222E[(X-?)3]?3 峰度=

E[(X??)4]?4

偏度测量一个分布的对称的偏离度。 如果一个分布是对称的。那么它的偏度=0. 分布左边有不对称的部分称为负的偏离 偏度<0。分布右边有不对称的部分成为正的偏离 偏度>0。峰度测量一个分布的“峰值”。有较大的分度的一个分布会有更多的值集中在期望和类似的高峰值的附近。一个相对均匀的分布有一个低的峰度。峰度的基准值是3.这是正态分布的分度。我们会在以后的附录里来研究正态分布。(B.5.1)

B.4.3 多个随机变量的期望值

对于多个随机变量函数,存在一个类似于(B.9)的法则。令X和Y为离散型随机变量。它们的联合概率密度函数为pdf f(x.y)。若g(X.Y)是它们的函数。则有 E[g(X.Y)]=

??g(x.y)f(x.y) (B.15)

xy通过(B.15)我们可以得到

E(X+Y)=E(X)+E(Y) (B.16) 通过(B.15)的定义和期望的法则来证明: E(X+Y)= =

??(x?y)f(x,y)=??xf(x,y)+??yf(x,y)

xyxyxy?x?f(x,y)+?y?f(x,y)=?xf(x)+?yf(y)

xyyxxy =E(X)+E(Y)

在第二行我们用(B.2)来获取X和Y的边际分布。求和的顺序无关紧要。用同样的逻辑方法我们可能得到

E(aX+bY+c)=aE(x)+bE(y)+c (B.17)

若X和Y独立,利用(B.15)我们还可以得到E(XY)=E(X)E(Y)。同样可以得到f(x.y)=f(x)f(y).证明如下:

E(XY)=E[g(X,Y)]=

??xyf(x)f(y)=?xf(x)?yf(y)=E(X)E(Y)

xyxy这些法则可以延伸到更多的随机变量中

(B.15)的一个特殊应用是引出X和Y的协方差。定义协方差函数为变量X减去它的期望与变量Y减去它的期望的乘积。

g(X.Y)=(X-?x)(Y-?y) (B.18)

在数据B.4中我们绘制X和Y的数据以使E(X)和E(Y)都等于0.数值大部分都在一、三象限。所以平均来说协方差值g(x.y)=(x-?x)(y-?y)>0

我们定义两个随机变量的协方差是他们输出的期望 Cov(X,Y)=?xy=E [(X-?x)(Y-?y)]=E(XY)-?x?y (B.19)

在数据B.4中随机变量协方差?xy是正的,这告诉我们当x的值大于它们的期望时,y的值也同样趋向于大于它们的期望;当x的值小于它们的期望时,y的值也同样趋向于小于它们的期望。 如果随机数组主要分布在二和四象限,那么g(x,y)趋于小于0.那么?xy也将小于0 如果数据均匀的分布在4个象限中,那么将显示不出任何正的和负的相关性,则协方差为0.总体而言,?xy告诉我们俩个变量是正的相关还是负的相关。 确定

?xy的主要取值是困难的。因为X和Y可能有不同的取值组合。通过标准差来计算变

cov(X,Y)var(X)var(Y)量的协方差需要去除一些数组。所以我们定义X和Y的相关系数

?=

=

?XY (B.20)

?X?Y和协方差一样,两个随机变量的相关性?也用来测量变量间的相关性的。然而,不同于协方差,相关性必须在-1和1之间,如果 X和Y线性正相关或者负相关,那么X和Y的相关性是1或者-1。如果X和Y之间没有相关性。那么cov(X,Y)=0且?=0.对于检验相关性的其他指标,相关性?的绝对值的大小可以表明随机变量数值间的相关性的强度。在数据B.4中X和Y的相关性为?=0.5

如果X和Y是相互独立的随机变量。那么它们间的协方差和相关系数均为0.但这个命题的逆命题是不争确的。独立随机变量X和Y协方差为0,表明它们之间没有线性关系。然而,两个随机变量只是协方差或者相关系数为0并不能说明他们一定相互独立。他们间可能有更复杂的非线性关系,比如X+Y=1.

22在(B.16)中我们得到一个随机变量和的期望。对于协方差我们可以得到相似的结论。如果a和b是常数,那么

Var(aX+bY)=avar(X)+bvar(Y)+2abcov(X,Y) (B.21) Var(X+Y)= Var(X)+ Var(Y)+2cov(X,Y) (B.22) Var(X-Y)=Var(X)+ Var(Y)-2cov(X,Y) (B.23) 若a.b相互独立,或者协方差为0,那么

Var(aX+bY)=avar(X)+bvar(Y) (B.24) Var(X?Y)= Var(X)+ Var(Y) (B.25) 这些法则可以运用到多个随机变量的情况。例如,若X,Y和Z是独立的,或者不相关的随机变量,那么它们和的相关性可表示为: Var(X+Y+Z)= Var(X)+ Var(Y)+Var(Z)

2222B.4.4 再次使用那个简单的试验

在B3.3中,我们通过介绍一个简单的例子来引出了随机变量X和Y的分布,分别列在表B.6和B.7中,他们的联合分布列在表B.8中。让我们再用这个例子来回顾这个部分提及的一些基本概念吧。

使用

4B.7的概率分布,随机变量x的期望值是

E(X)??xf(x)?(1?0.1)?(2?0.2)?(3?0.3)?(4?0.4)?3??X

x?1这是什么意思呢?从表格B.5中随机选取一个单元格,构成了一个随机试验。观察x的数值,如果我们重复这个实验很多次,x值出现1,2,3和4的概率分别是10%,20%,30%和40%。当选取的数字很多时,所有数值的平均值将会接近?X?3。关键的信息是随机变量的期望值是这个实验重复很多次所得到的平均值。

同样的,随机变量X的方差是

2?X?E(X??X)2

(1-3)?0.1 =

?2??(?2-3)?0.2??(?3-3)?0.3??(?4-3)?0.4?

2222 =(4×0.1)+(1×0.2)+(0×0.3)+(1×0.4) =1

在许多次重复试验中,用数字表示的?X-3? 的平均值是1。平均值的平方不同于自由变量的方差。

B.5 一些重要的概率分布

B5.1 正态分布

在先前的部分中,我们简单地讨论了随机变量和他们的概率密度函数。在真正的经济学背景中,一些概率分布函数是非常有用的。最重要的是正态分布函数。如果X是一个服从正态分布函数的随机变量,拥有均值?和方差?,可以被简写为X~N(?,?),X的概率密度函数是

22f(x)?12??2??(x??)2?exp??,???x?? (B.26) 2?2??a2Exp[a]指的是指数函数e。均值?和方差?是这个分布的参数,而且决定了它的中心和离散程度。随机变量的取值范围从负无穷到正无穷。不同均值和方差的正态分布的概

率密度函数图象是表格B.5。我们注意到正态分布的图像是堆对称的,因此他的偏度为0,峰度为3。

和所有的连续随机变量一样,正态分布的概率密度函数属于概率密度函数的一种。在计算概率时,电脑软件和列表取值都可以利用普通正态分布和它的等价标准形式间的关系。如果X~N(?,?2),那么Z?X???~N(0,1) (B.27)

图表B.5 (a)方差为1均值为?的正态分布的概率密度函数

(b)均值为0方差为?的正态分布的概率密度函数

连续标准正态分布概率密度函数的变量Z应用的很广泛,给予他一个特殊的符号,

2?(z)?P(Z?z)。电脑软件和这本书最后的表格1中给出了?(z)的数值。为了计算服

从正态分布变量的概率,须记住它的分布是对称的,因此P(Z>a)=P(Z<-a),同时P(Z>a)=P(Z?a),因为对于连续的随机变量来说任何一点的概率为0.如果X~N(?,?),a和b是固

2

定值,那么P(X?a)?P?

a???a???X??a???? ?) (B.28)??P?Z????(????????a??a??P?x?a??P(x????a????)?P(Z??)?1??(?) (B.29)

P(a?x?b)?P(a??x?????b???)??(b???)??(a???) (B.30)

例如:如果X~N(3,9),那么

P(4?x?6)?P(0.33?x?1)??(1)??(0.33)?0.8413?0.6293?0.2120

一个有趣而且有用的事实是正态分布的随机变量权重的和仍然是一个正态分布。即:如果

X1~N(?1,?1) X2~N(?2,?2),那么

22Y?a1X1?a2X2~N(?Y?a1?1?a2?2,?Y?a1?1?a2?2?2a1a2?12) (B.31)

22222B.5.2 ?2分布

?2随机变量指标准正态分布随机变量的平方。如果Z1,Z2,….,Zm表示m个独立的

标准正态分布N(0,1)随机变量,然后 V?Z1?Z2?????Zm~这个记号V~222?2(m) (B.32)

这个参数自?2(m)表示随机变量V是服从一个自由度为m的?2分布。

由度m表示了独立标准正态分布N(0,1)的数目,并且由N(0,1)的平方和形成的V。m的值也决定了?分布的大体形状,包括它的期望和方差。

2E(V)?E(?2(m))?m

var(V)?var(?(m))?2m (B.33)

在表B.6中,?分布中的自由度已经给出了。V的值必须大于等于0,因为V是由m个标准正态分布的随机变量的平方和形成的。分布有个很长的后尾,向右方倾斜。然而,随着m自由度的增大,分布变的更加对称和成钟形的凸起。事实上,随着m的增长,?分布聚合起来,并且变成一个正态分布。

222?2分布的值对选择自由度为0.9 、0.95、0.99在课本最后的图3中给出了。这些值在

假设检验中是经常出现的。

表 B.6 ?2 分布

B.5.3 t分布

T分布是由一个标准正态分布Z~N(0,1)除以?分布的平方根,其中?分布须除以其自由度m.若Z~N(0.1)且V~?,Z和V相互独立,那么有 (m) t=

222ZV/m~t(m) (B.34)

t分布的形状完全由自由度m决定和分布可以表示为t(m)

在图表B.7中展示了m=3自由度的t分布和标准正态分布N(0,1)。可以看出t分布比正态分布峰值更低但是比标准正态分布更加平坦。t分布是对称的,

Et?m??0 vart?m??m?m?2?。随着自由度m趋于无穷大,t(m)越来越趋向于标准正态分布。

????

表 B.7 标准正态分布和t?3?分布函数

计算机有个功能直接运用t随机变量的概率密度函数去计算概率。既然某个特定的概率经常使用,在课本后边的图2中或者前面的封面上包含了t分布频繁使用的一些,叫做分布的临界值。例如,在值为0.95,自由度为20的时候,t?0.95,20??1.725。t分布是对称的,因此,图2中只展示了右侧的尾部。

B.5.4 F分布

F随机变量是由两个独立的?分布除以他们的自由度的比率所形成的。如果:V1~2?2?m?1??

V2~?2?m2? 并且他们是独立的,那么 F?V1m1 (B.35) ~F(m1,m2)V2m2F分布有两个自由度m1.m2。他们的值决定了分布函数的形状,大体上看起来像图B.8一样。随机变量的变化是?0,??,右侧有一个很长的尾部。例如在F分布两个自由度,分子自由度

m1=8,分母自由度m2=20时,概率0.95对应F分布的值为 F?0.95,8,20??2.45。在图4

和图5中给出了概率为0.95和0.99的对应值。

表 B.8 F(8,20)随机变量的概率密度函数

本文来源:https://www.bwwdw.com/article/i0mo.html

Top