统计学模期末复习-参考

更新时间:2024-06-18 08:25:02 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

期末复习题

一、填空题

1、数据分析所用的方法可分为 描述统计 方法和 推断统计 方法。

2、按照采用计量尺度的不同,统计数据分为分类数据、顺序数据和数值型数据。 3、如果要检验一批灯泡的寿命,则总体是一批所有灯泡,个体是每一个灯泡。 4、统计量是用来描述样本特征的概括性数字度量。

5、统计数据主要自两个渠道:一是数据的间接来源;一是数据的直接来源。 6、抽样采集数据的方式可分为:概率抽样、 非概率抽样 。

7、在某城市随机抽取11个家庭,调查得到每个家庭的人均月收入数据如下:1020、750、960、1800、1250、1020、760、1020、950、1020、660,则其众数为1020,中位数为1020,下四分位点为757.5,上四分位点为1020,平均数为1019.091。

8、当总体服从正态分布N(?,?2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x的期望为

? ,方差为 ?2/n 。

9、若身高与体重的线性相关系数为0.90,则体重与身高存在正相关关系,产量与单位成本的线性相关系数为-0.85,则产量与单位成本存在负相关关系。

10、参数估计的方法有 点估计 和 区间估计 。

11、进行假设检验时可能存在的两类错误是 弃真错误 和 取伪错误 。 12、对回归系数的显著性检验,通常采用的是 t 检验。 14、对线性相关性的显著性检验,通常采用的是 F 检验。 13、变量主要可分为 分类型变量、顺序型变量和数值型 变量。 14、线性相关系数的取值范围是 [-1,1]。

15、区间估计是在 点估计 的基础上,给出总体参数估计的一个区间范围。 16、进行假设检验时对假设的陈述有 原假设和 备择 假设。 17、组间平方和包括随机误差和系统误差。

18、卡方分布是一种连续型随机变量的概率分布,它是由标准正态分布派生出来的。 19、?分布的图形随着自由度的增加而渐趋 对称 。

20、设X1,X2,?,Xn是来自同一个总体的样本,则不含未知参数的函数2T?T(X1,X2,?,Xn)称为样本统计量。

21、若事件A和事件B不能同时发生,则称A和B是 互斥 事件。

22、总体均值?,总体比例?及总体方差?2的无偏估计量分别是样本均值x、样本比例p、样本方差s2 。

23、在其他条件不变得情况下,如果允许误差缩小为原来的1/2,则样本容量将增加为原来的 4 倍。

二、判断题,正确打“√”;错误打“×”。

1、进行区间估计,置信水平不是预先给定的。(× ) 2、概率抽样不是依据随机原则进行抽样。(× )

3、直方图主要用于分类数据的展示。(× )

4、进行抽样调查时,样本均值统计量总是服从正态分布的。(× ) 5、假设检验中要使?和?同时减少的唯一方法是减少样本容量。(× )

6、不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于正态分布。(√ )

7、分组数据的偏态系数越接近于0,则数据分布的偏斜程度越大。(× ) 8、概率抽样是随机原则进行抽样。(√ )

9、茎叶图主要用于品质数据的展示。(× ) 10、可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-?)”。( × ) 11、方差分析中组间平方和与组内平方和之比总是大于1。(× )

12、离散系数越大,数据的离散程度越小。(× )

13、若数据的分布为尖峰分布,则峰态系数小于0。(× ) 14、对于连续型随机变量,讨论某一点取值的概率是没有意义的。 ( √ ) 15、把随机现象的全部结果及其概率,或者把随机现象的或几个结果及其概率列举出来,就可以称作概率分布。(√)

16、一组数据经标准化后得到的新数据的方差是0。( × ) 17、条形图既可用展示分类数据,也可用于展示数值型数据。( √ ) 18、概率为0的事件一定是不可能事件。( × ) 19、若事件A与B相互独立,则一定互斥。( ×)

20、若X1,X2,?,Xn是从总体X中取出的样本,E(X)是总体的期望,则

?(Xi?1ni( × ) ?E(X))2是一个样本统计量。

三、选择题

1、一组数据的均值为10, 离散系数为0.2, 则该组数据的标准差为( B )。 A. 50 B. 2 C. 0.02 D. 10.2 3、设A,B为两个事件,若概率P(A)=

111,P(B)=,P(A∩B)=,则( D )。

428A. 事件A,B互斥 B. 事件A,B互斥但不对立

C. 事件A,B对立 D. 事件A,B相互独立

4、设X,Y为随机变量,已知随机变量X的标准差等于12,随机变量Y的标准差等于5,若随机变量X,Y相互独立,则随机变量X?Y的标准差等于( C )。

A. 17 B.

17 C. 13 D. 7

5、1.设X1,X2,?,Xn~N(?,?),则下列统计量中是t分布的是( C )。

2n(X??)n(X??)n(X??) C. D. 22?SS?226、设X1,X2,?,Xn~N(?,?),则下列统计量中是?分布的是( B )

A.

B.

n(X??)?2??2227、设X1,X2,?,Xn~N(?1,?1),Y1,Y2,?,Yn~N(?2,?2)是两个样本,则下列

?212A.

S2 B.

(n?1)S2 C.

nS2 D.

(n?1)S2

统计量中是F分布的是( D )

2222SxSx/?1Sx?12SxA. 2 B. 2 C. 22 D. 2SySy?2SySy/?2?12 2?28、如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是(C )估计。

A 有效 B 一致 C 无偏 D 精确

9、虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个( B )的估计量。

A 有效 B 一致 C 无偏 D 精确

10、估计量的( D )指统计量的抽样分布集中在真实参数周围的程度。

A 有效性 B 一致性 C 无偏性 D 精确性

11、用简单随机重复抽样方法抽样,如果要使抽样误差降低50%,则样本容量需要扩大到原来的( C)。

A 2倍 B 3倍 C 4倍 D 5倍

12、对于大样本,置信区间的大小主要由(D)这两个量所决定。 A Z和? B ?和s C s和? D Z和s

13、H0:μ=μ0,选用Z统计量进行双侧检验,接受原假设H0的标准是( B )。

A.|Z|?Z? B. |Z|?Z?/2 C. Z?Z?/2 D. Z??Z? 14、H0:μ=μ0,选用t统计量进行双侧检验,接受原假设H0的标准是( B )。 A.|t|?t? B. |t|?t?/2 C. t?Z?/2 D. t??t?

15、H0:μ≤μ0,选用t统计量进行右侧检验,接受原假设H0的标准是( D )。 A.|t|?t? B. |t|?t?/2 C. t?t? D. t?t?

16、若??1,??2都是总体参数?的无偏估计量,那么??1比??2更有效是指( D )。

?)?E(??) B.D(??)?D(??) C.D(??)?D(??) D.D(??)?D(??) A.E(?1212121217、当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y

之间存在( A )关系。

A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 18、评价直线相关关系的密切程度,当r在0.5~0.8之间时,表示(D)。 A 无相关 B 低度相关 C 中等相关 D 高度相关

19、相关分析和回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A在相关分析中,相关的两变量都不是随机的;

B在回归分析中,自变量是随机的,因变量不是随机的; C在回归分析中,因变量和自变量都是随机的; D在相关分析中,相关的两变量都是随机的。 20、关于相关系数,下面不正确的描述是( B )。 A当0?r?1时,表示两变量不完全相关;

B当r=0时,表示两变量间无相关; C两变量之间的相关关系是单相关;

D如果自变量增长引起因变量的相应增长,就形成正相关关系。

四、计算题

1、设离散型随机变量X的概率分布如下表

X14c22c36c

P求:(1)常数c值;(2)概率P{0?X?2};(3)数学期望E(X);

426???1,故c=12; ccc41(2) P{0?X?2}??;

c342626(3) E(X)?1??2??3??.

ccc122、某城镇每天用电量X万度是连续型随机变量,其概率密度为

?kx3(1?x3),0?x?1,?(x)??

0,x?0,x?1?求:(1)常数k值;

提示:(1)

(2)当每天供电量为0.7万度时,供电量不够的概率; (3)当每天供电量为0.9万度时,供电量过剩的概论。 提示:(1)故k?283?????43k171,?(x)dx??kx3(1?x3)dx?k?(x3?x6)dx?k(1x?47x)|0?28?10011;

10.70.904171; kx(1?x)dx?k?(x3?x6)dx?k(14x?7x)|0.704170.9. kx3(1?x3)dx?k(14x?7x)|0331?(3) 所求概率为P(X?0.9)??(2)所求概率为P(X?0.7)?23、某省文凭考试高等数学成绩X分是一个离散型随机变量,近似认为连续型随机变量,它服从正态分布N(59,10),规定考试成绩达到或超过60分为合格,求: (1)任取1份高等数学试卷成绩为合格的概率;

(2)任取3份高等数学试卷中恰好有2份试卷成绩为合格的概率.

?59提示:(1)P(X?60)?1?P(X?60)?1?P(X10?60?5910)?1??(0.1);

(2)用Ai(i?1,2,3)表示第i份试卷合格,则所求概率为

P(A1A2A3?A1A2A3?A1A2A3)?3(1??(0.1))2?(0.1)。

4、某企业有职工1385人,现从中随机抽出50人调查其工资收入情况如下: 月收入(元) 220 工人数(人) 4 285 6 310 6 330 8 375 10 405 7 440 4 495 3 530 2 试以0.99的置信度估计该企业职工的月平均工资收入所在范围。 提示:x?z0.01/2s。 n5、如果认为该市农民工参保率是35%,若要求在95%的置信水平上保证这一比例的估计误差不超过5%,试问调查的样本容量应该有多大?

2(z0.05)?(?1?)/2提示:

E26、某工厂妇女从事家务劳动时间服从正态分布N(?,0.662)。根据36人的随机抽样

调查,每天平均从事家务劳动时间X为:X=2.65小时。求?的双侧置信区间(置信水平为0.95)。

提示: x?z0.05/2?n?2.65?z0.05/20.66 367、市场上供应的某种商品由甲厂、乙厂及丙厂生产,甲厂占40%,乙厂占40%,丙厂占20%,甲厂产品的正品率为85%,乙厂产品的正品率为75%.丙厂产品的正品率为70%,求:

(l)从市场上任买1件这种商品是正品的概率; (2)从市场上已买1件正品是甲厂生产的概率。 提示:设A1=“产品由甲厂生产”;A2=“产品由乙厂生产”;A3=“产品由丙厂生产”。 (1)记B=“任买1件商品是正品”,则由全概论公式

P(B)??P(Ai)P(B|Ai)?0.4?0.85?0.4?0.75?0.2?0.70。

i?13(2)由贝叶斯公式

P(A1|B)?P(A1B)P(A1)P(B|A1)0.4?0.85?3?

P(B)0.4?0.85?0.4?0.75?0.4?0.7?P(Ai)P(B|Ai)i?18、某公司生产的某种零件的直径服从正态分布。该公司称它的标准差??0.0042厘米,现随机抽取6个部件,测得它们的直径为1.34,1.52,1.36,1.4,1.44,1.42。取??0.05,问我们能否认为该公司生产的发动机部件的直径的标准差确实是??0.042厘米?

提示:H0:??0.042;H1:??0.042.

n=6, ??0.05.x?(1.34+1.52+1.36+1.4+1.44+1.42)/6?1.4133。

2222

本文来源:https://www.bwwdw.com/article/zql3.html

Top