概率论与数理统计第1讲 2.23

更新时间:2023-09-13 12:44:01 阅读量: 教学研究 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

概率论与数理统计第1讲

概率论介绍

我们以前研究和讨论的都是确定性现象。如:自由落体、同性电荷相斥、异性电荷相吸等。但是在自然界还存在大量的不确定性现象。我们在生活中不时地要与偶然性大交道。如:抛硬币、弹着点等。不期而遇的偶然性,可以帮助人们度过难关,也可能使人陷入困境,甚至决定一个人一生的命运。至于偶然性影响重大事件进程的例子,在历史与现实中更是屡见不鲜。对偶然性的认识,是一个现代青年知识结构中应具备的成分,是一个人人文素质的一部分。

概率在我们的生活中随处可见,但是如何理解呢?如抛硬币。这种规律性,就是统计规律性。如天气预报,北京明天降雨概率80%。

值得注意的是,偶然性发生作用的规律往往与我们的直觉是相悖的。

抛一枚质量均匀的硬币,出现反面和正面的机会应当相等,这样的判断是有道理的,因为如果我们连续抛掷硬币,最终我们会发现出现正面和反面的次数大致相等。现在考虑我们连续抛掷4次,如果前3次都是正面,那么第4次出现反面的机会是否就会大一些呢?

进一步的问题是,如果同时抛掷4枚硬币,最可能出现的结果是什么?我们可以根据上面的逻辑推断,任何一枚质量均匀的硬币出现正面和反面的机会应当相等,所以抛掷4枚硬币最可能的结果就是两个正面朝上和两个反面朝下。

纸牌游戏。三张纸牌

这个卡片游戏是沃德·威弗设计的,沃德是著名的数学家,信息论的建立者之一。他曾在1950年10月《科学美国人》关于“概率”一文中介绍过这个内容。

下面是对这个赌戏的真实情况的—种说明。三张卡片中有两张是两面圈点一样的。如果你从帽子中随机地取卡片,那么你得到这种两面圈点一致的卡片的概率是2/3。因此,抽出的卡片与上面圈点相同的概率就是2/3。

卡片游戏是称为伯特纳德箱的悖论的翻版。在伯特纳德以后,一位德国数学家将它写进一本书中,于1889年发表。伯特纳德设想有三个箱子。一个装着两枚金币,一个装着两枚银币,一个装一枚银币一枚金币。三个箱子混杂,然后随意取一个箱子,显然这个箱子里装着两个一样的钱币的概率是2/3。

然而,假定我们从选出的箱子中拿出一枚钱币,看到它是金的。这就是说,箱子里的不可能是两枚银币。因此,它必然是两枚金币;或一枚金币,一枚银币。由于这两个箱子中任何一个被选中的机会相等,看起来似乎我们取得两枚同样钱币的概率降到了1/2。如果我们取出的是银币,也会得出同样的结论。

取出箱中的一枚钱币看一看,怎么就改变了箱中装两枚同样钱币的概率呢?显然这是不可能的,这样就说明了上面错在哪里。

这里有一个相关的悖论学生们是会觉得很有意思的。如果你抛掷三枚硬币,它们掉下来后完全一致的概率是什么?三个当中至少有两个是—样的,另外那个要么与这两个一样,要么就是不同的。由于它出现这两种情况的机会均等,故它与另两个硬币是否一致的机会就是相等的。这样,看起来所有三个硬币都一样的概率就是1/2。

我们只要将八种可能的情况列表如下,就可表明这种推论是错的:

H H H T H H H H T T H T H T H T T H H T T T T T

看得出来,只有两种情况是三个硬币都取同样花纹。因此正确的概率应是2/8=1/4。 另一个出人意料的小悖论也是由于在考虑所有可能的情况时发现错误而引起的。说的是一个男孩有一个玻璃球,一个女孩有两个玻璃球。他们向竖在地上的一根立柱弹球,玻璃球

1

最接近立柱者胜。假定男孩和女孩技巧完全相同,测量也足够精确而不会引起纠纷。女孩赢的概率是什么?

观点一:女孩弹两个玻璃球,男孩只弹一个,因此女孩赢的概率是2/3。

观点二:把女孩的玻璃球叫做A和B,把男孩的叫做C,就有四种可能的情况:

(1)A和B都比C更接近立柱。 (2)仅A球比C球接近立柱。 (3)仅B球比C球接近立柱。 (4)C球比A和B都接近立柱。

这四种情况中三种都是女孩赢,所以女孩赢的概率是3/4。

为了解决这个问题,我们列出全部可能的情况,它是六种而不是四种。按三个球接近立柱的次序,使最近者在前,列表如下:

A B C 、A C B、B A C、B C A、C A B、C B A

在六种情况中有四次是女孩赢。这就证明了第一种观点对,女孩赢的机会是4/6=2/3。

概率实际上就是偶然性的数量化,因此,也有人称概率为“机会的数学”。具体说,概率论所研究的偶然性,是这样的一类不确定性现象。这类现象事先不可预知,但在大量重复实验或观察下,它的结果却呈现出某种规律性。

我们把这种在个别实验中其结果呈现出不确定性,但在大量重复实验中其结果又具有统计规律性的现象,叫做随机现象。研究随机现象的规律性理论,就构成了随机理论,包括概率论和数理统计两部分。也就是说

概率论与数理统计是研究和揭示随机现象统计规律性的一门数学学科。

其中,概率论研究的是随机现象最基本的规律性。它给出刻画随机变量的方法,然后在某些假设条件下研究随机变量的变化规律。

数理统计则是通过实验数据的观测,根据概率论的有关原理进行推断分析,并做出预测。因此,数理统计研究的是怎样有效地收集、整理和分析带有随机性的数据以及对考察的现象做出推断或预测,并最终为采取一定的决策和行动提供科学的依据和建议。

一、概率论的发展历史 同其他科学发展一样,概率论也是为满足人类社会实践活动的需要而产生的。它起源于16世纪,成型于17世纪中叶,经历了三个发展时期。

1、17世纪到18世纪的古典概率时期 法国的Pascal,Fermat和Huygens等人研究了大量的赌金分配问题,逐步建立了概率、条件概率、数学期望等重要的概念及其基本性质。其中Huygens的《论赌博中的计算》可以说是概率论发展历史上的第一部专著,也是概率论产生的标志之一。

18世纪,瑞士数学家Bernouli出版了他的巨著《猜度术》,也称为〈推论法〉,从而为使概率论逐步形成一个数学分支奠定了基础。

Bernouli是公认的概率论的主要创始人。

2、18世纪末到20世纪40年代的分析概率时期

其标志是1812年Laplas发表的著作《分析概率论》,他把已经相当成熟的数学分析方法引入到概率论的研究。这一时期研究主要集中于随机变量方面,许多重要分布在此阶段相继问世。其中德国的Gauss发现了正态分布(也称为高斯分布),法国的Legendre以及Laplas则建立了最小二乘理论。这时的法国处于领先地位。

此后一段时间概率论发展停滞不前,打破这一局面的是一批以俄罗斯“三夫”为代表的数学家,即切比雪夫,马尔可夫和李雅普诺夫。他们的成就再次创造了概率发展史的辉煌,并将概率论的研究向前推进了一大步。

20世纪20年代以后,法国的Levy,美国的Feller,前苏联的辛钦、柯尔莫哥洛夫等先驱者们在极限理论方面作出了杰出的贡献,使得概率论获得突破性的发展,这一时期被称

2

为概率论发展史上的英雄时代。

3、20世纪50年代之后的现代概率论时期

这一时期主要在随机过程领域进行了广泛而深入的研究,这一部分构成了现代概率论的核心,并以随机分析和鞅论的发展为标志。这一进展形成了与传统的确定性分析法相对应的随机分析法这一研究工具。更重要的一点是,这一时期概率论在工程技术和社会经济中的应用日益广泛,出现了理论概率和应用概率比翼齐飞的局面。

二、概率概念本身的发展

其发展也经历了一个相当长的时期。从最初的直观描述到以后的几何概率,发展到19世纪Laplas的古典概率,到20世纪米塞斯给出的统计定义,都在不同的范围内发挥了一定的作用,但也都暴露了各自的局限性。1933年,柯尔莫哥洛夫成功地建立了概率的公理化体系,这也就最终给出了概率的科学含义。这一定义为将概率论的基本概念完全置于集合论、函数论、测度论的研究方法之上铺平了道路。这标志着概率论的发展经历了一次深刻的变革,成为概率论发展史上一个新的里程碑。

严格说来,我们应当使用概率的公理化定义,但对一个特定问题,我们也会使用古典概率的定义。我们也可以用统计概率的概念来解释公理化的定义。

三、数理统计的发展

数理统计的发展也经历三个历史时期。20世纪以前为萌芽时期。这时的数理统计仅仅是初步的和描述性的。此后Gauss和Legendre将最小二乘法用于误差分析,将数理统计研究向前推进了一大步。这一时期最重要的发展,首先在于确定了这样一种观点,即数据来自于服从一定概率分布的母体,而统计就是用数据去推断这个分布。

这一时期的主要成果是比利时人凯特历第一个将法国古典概率论引入到社会统计,英国的高尔顿和皮尔逊引进了矩估计和频度分布、回归、相关、拟合度等重要概念。德国的Helmert发现了?2分布。

第2个时期为20世纪初到二战结束。这一时期是数理统计蓬勃发展到成熟的时期,称为近代统计时期。许多重要的观点,方法及主要分支都是在这个时期建立和发展起来的。这个时期的成就包含了至今仍在广泛使用的大多数统计方法,并是我们数理统计教科书的主要内容。

其中以Fisher和Pearson为代表的英国学派起了主导作用。他们构造了数理统计的基本框架并开创一系列重要研究领域的先河。主要成果有K.Pearson的卡方检验,Gosset的t分布,Fisher的极大似然估计、实验设计、方差分析、统计推断,Neyman和Pearson的假设检验,Wald的序贯概率比检验等都是这一时期研究出来的。而我国的许宝碌在多元统计分析和线性模型的研究方面作出了开创性的工作。

第三个时期是战后至今的现代统计时期。这其中有2个标志:一是贝叶斯学派的崛起;再一是电子计算机在数理统计上的应用。

四、概率论与数理统计的应用 两个例子:

1943年以前,盟军在大西洋的船只被德军潜艇击沉的危险性大小与船队数目(批次)和船队规模(数量)之比成正比。

如今概率与数理统计不仅渗透到许多自然科学和技术科学领域,而且渗透到许多社会科学领域,其中最突出的是经济学和军事学。

它应用于许多基础学科,不仅成功地解决了这些学科的一系列重大课题,而且还与这些基础学科相结合产生了一系列边缘学科,如统计物理,生物统计,医学统计,气象统计,地质统计等。

3

它还是许多新学科的基础,如信息论、控制论、弹道学,信号与系统,人工智能等等。对于这些学科,掌握概率论与数理统计不仅是深入研究的基础,而且还是入门的首要条件。

总之,凡是研究不确定性问题的地方,就要应用到概率论与数理统计。

第一章 概率论的基本概念

第一节 随机试验

我们这里所说的试验是一个广泛的概念,它包括各种各样的科学实验,也包括对某一具体事物的观察,我们举一些例子:

E1:抛一枚硬币,正面用H表示,反面用T表示; E2:抛一枚硬币3次,观察正面H,反面T出现的情况;

E3:抛一枚硬币3次,观察出现正面H的次数; E4:掷一颗骰子,观察出现点数的情况;

E5:记录电话交换台一分钟接到的呼唤次数; E6:抽验一批灯泡一个,测其寿命;

E7:记录某地一昼夜的最高温度和最低温度

以上7个实验有什么共同特点? 1、 可以在相同的条件下重复进行;

2、 每次实验可能结果不止一个,但能事先明确实验所有可能的结果; 3、 进行一次实验前,不能确定哪个结果会出现。

我们把具有上述性质的试验,称之为随机试验,也简称试验。通过随机试验,我们就可以研究随机现象。记住,我们是通过随机试验来研究随机现象的。

第二节 样本空间、随机事件

一、样本空间

随机试验我们用E来表示,并将随机试验所有可能结果组成的集合称为试验E的样本空间,记为S。样本空间的元素,即E的每个结果,称为样本点。我们给出上述7个试验的样本空间。

S1:?H,T?;

S2:?HHH,HHT,HTH,THH,HTT,THT,TTH,TTT?;

S3:?0,1,2,3?; S4:?1,2,3,4,5,6?;

S5:?0,1,2,3,??;

4

S6:?tt?0?;

?x,y?T0?x?y?T1?,这里x表示最低温度,y表示最高温度,并设这一地区S7:?的温度不会小于T0,也不会大于T1。

从上面的例子可以看出,样本空间的元素是与试验相关的,即使是同一个试验,目的不同,样本点也不同。如E2,E3。

二、随机事件

在很多情况下,我们会对由某些特定的样本点组成的集合感兴趣。如骰子大于3点,灯泡寿命大于500小时等等。这样一些样本点就构成了样本空间的一个子集。如:

A??点数?3?,B??tt?500?等。

一般地,我们称试验E的样本空间S的子集为E的随机事件,简称事件。在每次试验中,当且仅当这一子集中的一个样本点出现时,称这一事件发生。(需要强调说明这一概念)。

特别地,由一个样本点组成的单点集,称为基本事件。如E1有两个基本事件?H??,T?;

E4有6个基本事件??1,?,?6?。基本事件也可以看作为不能或不必再分解的随机事件。

样本空间S包含所有的样本点,它是S自身的子集,因此以所有样本空间元素为集合的事件在每次试验中总是要发生的,我们称之为必然事件。空集?也作为样本空间的子集,它不包含任何样本点,在每次试验中都不会发生,称为不可能事件

例1,写出下列随机试验的样本空间:(1)袋中有3只白球和2只红球,从袋中任取2只球,且每次取1只,取后不放回,观察取得球的颜色(考虑如果一次取2球的样本空间);(2)将a,b两球随机放到3个不同盒子中。

解:随机实验的样本空间,是试验的所有基本事件的集合。所以只要根据条件,分析基本事件的特性,则样本空间为S?ee是试验的基本事件

(1)将白球编号为1,2,3,红球编号为4,5,则基本事件是从5个不同元素中取出

22个元素的排列,共有A5?20种可能的结果,所以,样本空间是

????1,2???2,1??? S???3,1???4,1?????5,1??1,3??2,3??3,2??4,2??5,2??1,4??2,4??3,4??4,3??5,3??1,5???2,5????3,5??? ?4,5????5,4???(2)在这个试验中,基本事件可以分为两类,一类是a,b两球放在同一盒中,共有

1A3?3种可能结果:?ab,0,0?,?0,ab,0?,?0,0,ab?;另一类是a,b两球分别放在两个不同盒

中,共有A3?6种可能结果:?a,b,0??b,a,0??a,0,b??b,0,a??0,a,b??0,b,a?,所以样本空间

2共由9个样本点构成(也可以考虑矩阵结构)。

5

本文来源:https://www.bwwdw.com/article/t4hh.html

Top