统计学习题集(附答案)

更新时间:2024-01-30 01:35:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

统计学习题集

目录

第一章 导论 ..................................................................................... 1 第二章 数据的搜集 ......................................................................... 6 第三章 数据的整理与显示 ........................................................... 9 第四章 数据分布特征的测度 ................................................... 14 第五章 第六章 第七章 第八章 第九章 第十章

概率与概率分布 ......................................................... 24 抽样与参数估计 ......................................................... 28 假设检验 ..................................................................... 33 相关与回归分析 ......................................................... 37 时间序列分析和预测 ................................................. 45 指数 ............................................................................. 55

第一章 导论

【重点】了解统计的科学涵义,明确统计学的学科性质及基本研

究方法,掌握统计数据的特点及其不同类型,牢固掌握统计学的基本概念。

【难点】准确掌把数据不同类型,牢固掌握统计学的基本概念并

结合实例分析。

思考题

1.1

什么是描述统计学、推断统计学?怎样理解描述统计学和推断统计学在探索事物数量规律性中的地位和作用? 1.2 1.3 1.4 1.5 1.6

统计学发展史上有哪几个主要学派? “统计学”一词有哪几种含义?

什么是统计学?怎样理解统计学与统计数据的关系? 统计数据可分为哪几种类型?不同类型的数据各有什么特点? 举例说明总体、样本、参数、统计量、变量这几个概念。

练习题

一、单项选择题

1、指出下面的数据哪一个属于分类数据( ) A、年龄 数值型 B、工资

C、汽车产量 D、购买商品的支付方式(现金、信用卡、支票) 2、指出下面的数据哪一个属于顺序数据( ) A、年龄 B、工资

C、汽车产量 D、员工对企业某项制度改革措施的态度(赞

成、中立、反对)

3、某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是( ) A、2000个家庭 B、200万个家庭

C、2000个家庭的人均收入 D、200万个家庭的人均收入 4、了解居民的消费支出情况,则( )

A、居民的消费支出情况是总体 B、所有居民是总体 C、居民的消费支出情况是总体单位 D、所有居民是总体单位 5、统计学研究的基本特点是( ) A、从数量上认识总体单位的特征和规律 B、从数量上认识总体的特征和规律 C、从性质上认识总体单位的特征和规律 D、从性质上认识总体的特征和规律

6、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。这里的“月收入”是( ) A、分类变量 B、顺序变量 C、数值型变量 D、离散变量

7、要反映我国工业企业的整体业绩水平,总体单位是( ) A、我国每一家工业企业 B、我国所有工业企业 C、我国工业企业总数 D、我国工业企业的利润总额 8、一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是( )用来描述总体特征的概括性数字度量

A、1000个消费者 B、所有在网上购物的消费者 C、所有在网上购物的消费者的平均消费额 D、1000个消费者的平均消费额

9、一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于( ) A、分类数据 B、顺序数据

C、截面数据 D、时间序列数据2000~2010

10、一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。他注意到,雇员要么从家里带饭,要么在公司餐厅就餐,要么在外面的餐馆就餐。他收集数据的方法属于( ) A、访问调查 B、邮寄调查 C、个别深度访问 D、观察调查

二、多项选择题

1、 欲了解某地高等学校科研情况( BD )

A、 该地所有高等学校所有的科研项目是总体 B、 该地所有的高等学校是总体

C、 该地所有高等学校的每一科研项目是总体单位 D、 该地每一所高等学校是总体单位 E、 该地所有高等学校的所有科研人员是总体

2、下表是《财富》杂志提供的按销售额和利润排列的500强公司的一个样本数据: 公司名称 Banc One CPC Intl. 销售额(百万美元) 利润额(百万美元) 10272 9844 1427.0 580.0 行业代码 8 19

Tyson Foods ….…. Woolworth 6454 …. …. 8092 87.0 …..… 168.7 19 ….….. 48 在这个例子中( BC )

A、总体是500强公司,总体单位是表中所列的公司 B、总体是500强公司,总体单位是其中每一家公司 C、总体是500强公司,样本是表中所列的公司

D、总体是500强公司,样本是表中所列公司的销售额和利润额 E、总体是表中所有的公司,总体单位是表中每一家公司

3、一家具制造商购买大批木材,木材不干会影响家具的尺寸和形状。家具制造商从每批货中随机抽取5块木材检验湿度,如果其中任何一块木材的湿度超过标准,就把整批货退回。这个问题中( BDE )

A、样本是从所有木材批次中随机抽取的部分批次木材 B、样本是从每批木材中随机抽取的5块木材

C、总体单位是从所有木材批次中随机抽取的部分批次木材 D、总体单位是购买的每一块木材 E、总体是购买的全部木材

三、判断分析题(判断正误,并简要说明理由)

统计运用大量观察法必须对所有的总体单位进行观察。( × )

四、简答题

1、报纸上报道一项民意调查的结果说:“43%的美国人对总统的整体表现感到满意。”报道最后写到:“这份调查是根据电话访问1210位成人所得,访问对象遍布美国各地。”这个调查的总体是什么?总体单位是什么?样本是什么?

答:总体是电视台覆盖范围内的所有成年观众;总体单位是电视台覆盖范围内的每一位成年观众;样本是受到电话采访的所有成年观众。

2、一个公司正致力于测试一种新的电视广告的效果。作为测试的一部分,广告在某市的当地新闻节目中下午6:30播出。两天以后,一市场调查公司进行了电话采访以获取记忆率信息(观众记得看过广告的百分比)和对广告的印象。这一研究的总体是什么?总体单位是什么?样本是什么?这种情况下为什么使用样本?简要解释原因。

答:总体是所有在6:30看到广告的观众;总体单位是每一位在6:30看到广告的观众;样本是受到电话采访的观众。

答案:

一、D,D,C,B,B;C,A,C,C,D。 二、BD,BC,BDE。

三、×,统计运用大量观察法的目的是消除个别事物的差异,显现想象总体的数量特征。只要部分单位对总体有代表性,只要对足够多的总体单位进行观察,也能达到这个目的。

四、1、答:总体是电视台覆盖范围内的所有成年观众;总体单位是电视台

覆盖范围内的每一位成年观众;样本是受到电话采访的所有成年观众。 2、答:总体是所有在6:30看到广告的观众;总体单位是每一位在6:

30看到广告的观众;样本是受到电话采访的观众。

第二章 数据的搜集

【重点】 了解统计数据的不同渠道来源,掌握调查方案设计要领,

学会调查问卷的设计,掌握抽样调查的特点及其基本的 组织方式和方法。

【难点】调查问卷的设计及应用。

思考题

2.1 2.2 2.3 2.4 2.5 2.6

数据的来源有哪几种渠道? 常用的统计调查方式有哪些?

普查、抽样调查、重点调查和典型调查有何区别? 简述普查和抽样调查的特点。 调查方案包括哪几个方面的内容? 什么是问卷?它由哪几个部分组成?

练习题

一、单项选择题

1、从含有N个元素的总体中抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为( )

A、简单随机抽样 B、分层抽样 C、系统抽样 D、整群抽样 2、为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是( )

A、简单随机抽样 B、分层抽样 C、系统抽样 D、整群抽样 3、为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列

后,每隔50名学生抽取一名进行调查,这种调查方式是( )

A、简单随机抽样 B、分层抽样 C、系统抽样 D、整群抽样 4、在一项调查中,调查单位和填报单位( )

A、无区别,是一致的 B、有区别,是不一致的 C、无区别,是人为确定的 D、有区别,但有时是一致的 5、对家用电器的平均寿命进行调查,应该采用( )

A、普查 B、重点调查 C、典型调查 D、抽样调查

二、多项选择题

1、下列属于原始数据的是( )

A、统计部门掌握的数据 B、说明总体单位特征的数据 C、说明总体特征的数据 D、还没有经过分组汇总的数据 E、直接向调查单位登记得到的数据 2、统计调查方案的内容包括有( )

A、确定调查目的 B、确定调查对象、调查单位和报告单位

C、确定调查项目和调查表 D、确定调查方法和调查时间 E、确定调查人员、经费等

3、重点调查的“重点”单位指( )

A、在国民经济中作用重要的单位

B、标志值在总体标志总量中所占比重比较大的单位 C、全部单位中的一小部分单位 D、在国民经济中地位显赫的单位 E、能反映总体基本情况的单位

三、简答题

1、抽样调查与重点调查、典型调查有哪些主要区别?

答:选取调查单位的方式不同;调查的目的和作用不同;对代表性误差的处理不同。

2、进行产品质量调查和市场占有率调查,你认为采用什么调查方法最合适?简要说明理由。

3、简述普查和抽样调查的特点。

答:(1)普查:周期性;数据准确;规定统一时间;范围比较窄等; (2)抽样调查:经济性;时效性强;适应面广;准确性高等等。

答案:

一、A,D,C,D,D。 二、BDE,ABCDE,BCE。

三、1、答:选取调查单位的方式不同;调查的目的和作用不同;对代表性

误差的处理不同。

2、答:抽样调查,理由略。

3、答:(1)普查:周期性;数据准确;规定统一时间;范围比较窄等; (2)抽样调查:经济性;时效性强;适应面广;准确性高等等。

第三章 数据的整理与显示

【重点】了数据整理的全过程,掌握分组方法及变量数列编制的

原则,灵活设计统计表和统计图。

【难点】针对不同类型的数据进行图、表的设计,区分不同图、

表的应用。

思考题

3.1 3.2 3.3 3.4 3.5

分类数据和顺序数据的整理和图示方法各有哪些? 数值型数据的分组方法有哪些?简述组距分组的步骤。 直方图与条形图有何区别? 茎叶图与直方图相比有什么优点? 统计表由哪几个主要部分组成?

一、单项选择题

1、在累计次数分布中,某组的向下累计次数表明( )

A、大于该组上限的次数是多少 B、大于该组下限的次数是多少 C、小于该组上限的次数是多少 D、小于该组下限的次数是多少 2、数据筛选的主要目的是( )

A、发现数据的错误 B、对数据进行排序 C、找出所需要的某类数据 D、纠正数据中的错误 3、样本或总体中各不同类别数值之间的比值称为( )

A、频率 B、频数 C、比例 D、比率 4、将比例乘以100得到的数值称为( )

A、频率 B、频数 C、比例 D、比率

5、下面的哪一个图形最适合描述结构性问题( )

A、条形图 B、饼图 C、雷达图 D、直方图

6、下面的哪一个图形适合比较研究两个或多个总体或结构性问题( )

A、环形图 B、饼图 C、直方图 D、茎叶图

7、将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为( )

A、单变量值分组 B、组距分组 C、等距分组 D、连续分组

8、下面的哪一个图形最适合描述大批量数据分布的图形( )

A、条形图 B、茎叶图 C、直方图 D、饼图 9、由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的,反映原始数据分布的图形,称为( )

A、环形图 B、茎叶图 C、直方图 D、箱线图 10、10家公司的月销售额数据(万元)分别为72,63,54,54,29,26,25,23,23,20。下面哪种图形不宜用于描述这些数据( )

A、茎叶图 B、散点图 C、条形图 D、饼图

二、多项选择题

1、下列属于定性变量的有( )

A、职业 B、居住区域 C、体重 D、身高 E、汽车产量

2、下面的数列属于( )

身高(厘米) 150~155

155~160 160~165 合计 人数 40 100 60 200

比重(%)

20 50 30 100

A、变量数列 B、品质数列 C、等距数列 D、异距数列 E、闭口数列

三、简答题

1、数值型数据的分组方法有哪些? 2、直方图与条形图有何区别? 3、茎叶图与直方图相比有什么优点?

四、应用题

1、下面是一个班50个学生的经济学考试成绩: 88 98 83 68 84

56 85 64 74 62

91 34 65 94 81

79 74 69 81 83

69 48 99 67 69

90 100 64 81 84

88 75 45 84 29

71 95 76 53 66

82 60 63 91 75

79 92 69 24 94

(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。

(2)用茎叶图将原始数据表现出来。

2、下表中的数据为2001年全国研究生入学考试报考某专业的12名考生的5门课程的成绩。 考生编号 英语 政治 专业课1 专业课2 专业课3

1 66 69 54 90 81

2 44 66 25 62 56

3 39 58 20 85 45

4 58 56 36 81 62

5 52 68 21 64 70

6 34 40 4 54 63

7 74 73 82 73 76

8 71 65 42 78 86

9 51 62 28 68 65

10 41 48 35 66 21

11 64 58 39 80 74

12 51 64 19 75 73

对英语和政治两门课程做直方图。

答案:

一、B,C,D,B,B;A,B,C,D,B。 二、AB,ACE。

三、1、答:主要有单变量值分组,这种分组方法通常只适合于离散变量,

且在变量值较少的情况下使用;在连续变量或变量值较多的情况下,通常采用组距分组,它是将全部变量值依次划分成若干个区间,并将这一区间的变量作为一组。

2、答:(1)条形图用条形的长度表示各类别频数的多少,其宽度则是

固定的;直方图是用面积表示各组频数多少,矩形高度表示每一组的频数或频率,宽度表示各组组距,宽度和高度均有意义。(2)直方图的各矩形通常是连续排列;条形图则是分开排列。(3)条形图主要用于分类数据;直方图主要用于数值型数据。

3、答:茎叶图是由“茎”“叶”两部分组成、反映原始数据分布的图

形,其图形是由数字组成。通过茎叶图,可以看数据的分布形状及数据的离散状况,与直方图相比,茎叶图既能给出数据的分布状况,又能给出一个原始数据,即保留了原始数据的信息,而直方图不能给出原始数值。 四、1、解:(1)

组距

20~30 30~40 40~50 50~60 60~70 70~80 80~90 90~100 100 合计

频数 2 1 2 2 13 8 12 9 1 50

百分比(%)

4.00 2.00 4.00 4.00 26.00 16.00 24.00 18.00 2.00 1

累积百分比(%)

4.00 6.00 10.00 14.00 40.00 56.00 80.00 98.00 100.00

141210频8数642021221312981000000000~1~3~4~5~6~7~8~920304050607080按分数分组 (2) 茎 2 3 4 5 6 7 8 9 10 合计 4 4 5 3 0 1 1 0 0 9 8 6 2 4 1 1 3 4 1 1 4 5 2 2 4 5 3 4 5 6 3 4 叶 6 9 4 5 7 8 9 9 9 9 9 4 4 5 8 8 8 9 90100

频数 占总数的比重 2 1 2 2 13 8 12 9 1 50 4.00% 2.00% 4.00% 4.00% 26.00% 16.00% 24.00% 18.00% 2.00% 1.00 2、 解:

3.532.5频2数1.510.5030~3535~4040~4545~5050~5555~6060~6565~7070~75英语成绩英语成绩分布直方图

4.543.53频2.5数21.510.50第四章 数据分布特征的测度

【重点】掌握各类统计指标的计算方法和应用原则,并进行初步

的分析。

【难点】结合实例准确进行集中趋势和离散程度的测度及分析。

思考题

4.1 偏度和峰度是描述频数分布的哪些特征的方法? 4.2

一组数据的分布特征可以从哪几个方面进行侧度?

4.3 简述众数、中位数和均值的特点及应用场合。 4.4 简述异众比率、四分位差、方差或标准差的适用场合。 4.5 4.6

标准分数有哪些用途? 为什么要计算离散系数?

30~3535~4040~4545~5050~5555~6060~6565~7070~75政治成绩政治成绩分布直方图

练习题

一、单项选择题

1、一组数据排序后处于25%和75%位置上的值称为( )

A、众数 B、中位数 C、四分位数 D、均值 2、如果一个数据的标准分数是–2,表明该数据( )

A、比平均数高出2个标准差 B、比平均数低2个标准差 C、等于2倍的平均数 D、等于2倍的标准差 3、经验法则表明,当一组数据对称分布时,在均值加减1个标准差的范围内大约有( )

A、68%的数据 B、95%的数据 C、99%的数据 D、100%的数据 4、离散系数的主要用途是( )

A、反映一组数据的离散程度 B、反映一组数据的平均水平 C、比较多组数据的离散程度 D、比较多组数据的平均水平 5、离散系数( )

A、只能消除一组数据的水平对标准差的影响 B、只能消除一组数据的计量单位对标准差的影响

C、可以同时消除数据的水平和计量单位对标准差的影响 D、可以准确反映一组数据的离散程度

6、峰态通常是与标准正态分布相比较而言的,如果一组数据服从标准正态分布,则峰态系数的值( )

A、等于0 B、大于0 C、小于0 D、等于1 7、如果峰态系数K>0,表明该组数据是( )

A、尖峰分布 B、扁平分布 C、左偏分布 D、右偏分布 8、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有

320名学生,理学院有200名学生。在上面的描述中,众数是( )

A、1200 B、经济管理学院 C、200 D、理学院 9、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。描述该组数据的集中趋势宜采用( )

A、众数 B、中位数 C、四分位数 D、均值 10、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用( )

A、众数 B、中位数 C、四分位数 D、均值 11、对于分类数据,测度其离散程度使用的统计量主要是( )

A、众数 B、异众比率 C、标准差 D、均值 12、甲、乙两组工人的平均日产量分别为18件和15件。若甲、乙两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重下降,则两组工人总平均日产量( )

A、上升 B、下降 C、不变 D、可能上升,也可能下降 13、权数对平均数的影响作用取决于( )在统计计算中,用来衡量总体中各单位标志值在总体中作用大小的数值叫权数。

A、各组标志值的大小 B、各组的次数多少 C、各组次数在总体单位总量中的比重 D、总体单位总量 14、当各个变量值的频数相等时,该变量的( )

A、众数不存在 B、众数等于均值 C、众数等于中位数 D、众数等于最大的数据值 15、有8名研究生的年龄分别为21,24,28,22,26,24,22,20岁,则他们的年龄中位数为( )

A、24 B、23 C、22 D、21

16、下列数列平均数都是50,在平均数附近散布程度最小的数列是( )

A、0 20 40 50 60 80 100 B、0 48 49 50 51 52 100 C、0 1 2 50 98 99 100 D、0 47 49 50 51 53 100

17、下列各项中,应采用加权算术平均法计算的有( )

A、已知计划完成百分比和实际产值,求平均计划完成百分比 B、已知计划完成百分比和计划产值,求平均计划完成百分比 C、已知各企业劳动生产率和各企业产值,求平均劳动生产率 D、已知生产同一产品的各企业产品单位成本和总成本,求平均单位成本

18、如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?( )

A、算术平均数 B、几何平均数 C、中位数 D、众数 19、假定某人5个月的收入分别是1800元,1840元,1840元,1840元,1840元,8800元,反映其月收入一般水平应该采用( )

A、算术平均数 B、几何平均数 C、众数 D、调和平均数 20、某组数据分布的偏度系数为正时,该数据的众数、中位数、均值的大小关系是( )

A、众数>中位数>均值 B、均值>中位数>众数 C、中位数>众数>均值 D、中位数>均值>众数

二、多项选择题

1、变量数列中,各组变量值与频数的关系是( )

A、各组变量值作用的大小由各组频数的多少反映 B、各组变量值作用的大小由各组变量值的大小反映 C、频数越大的变量值对总体一般水平的影响也越大 D、频数越大的变量值对总体一般水平的影响越小 E、频数越大,变量值也越大

2、应该用加权算术平均法计算平均数的有( ) A、已知各组职工工资水平和各组职工人数,求平均工资 B、已知各组职工工资水平和各组工资总额,求平均工资

C、已知各组计划完成百分数和各组计划产值,求平均计划完成百分数 D、已知各组计划完成百分数和各组实际产值,求平均计划完成百分数 E、已知各组职工的劳动生产率和各组职工人数,求平均劳动生产率 3、下列应该用几何平均法计算的有( )

A、生产同种产品的三个车间的平均合格率 B、平均发展速度 C、前后工序的三个车间的平均合格率 D、平均劳动生产率 E、以复利支付利息的年平均利率 4、下列说法那些是正确的?( )

A、应该用均值来分析和描述地区间工资水平 B、宜用众数来描述流行的服装颜色

C、考试成绩中位数的含义是有一半考生的成绩超过此数

D、在数据组高度偏态时,宜用中位数而不是用众数来作为平均数 E、一般常用算术平均法来计算年平均增长率

三、填空题

1、某班的经济学成绩如下表所示: 43

55

56

56

59

60

67

69

73

75

77 84

77 86

78 87

79 88

80 88

81 89

82 90

83 90

83 95

83 97

该班经济学成绩的平均数为 ,众数为 ,中位数为 ,上四分位数为 ,下四分位数为 ,四分位差为 ,离散系数为 。从成绩分布上看,它属于 ,你觉得用 描述它的集中趋势比较好,理由 。 2、在某一城市所做的一项抽样调查中发现,在所抽取的1000个家庭中,人均月收入在200~300元的家庭占24%,人均月收入在300~400元的家庭占26%,在400~500元的家庭占29%,在500~600元的家庭占10%,在600~700元的家庭占7%,在700元以上的占4%。从此数据分布状况可以判断:

(1)该城市收入数据分布形状属 (左偏还是右偏)。 (2)你觉得用均值、中位数、众数中的 ,来描述该城市人均

收入状况较好。理由是 。 (3)从收入分布的形状上判断,我们可以得出中位数和均值中 数值较大。上四分位数所在区间为 ,下四分位数所在区间为 。

四、判断分析题(判断正误,并简要说明理由)

1、 并非任意一个变量数列都可以计算其算术平均数、中位数和众数。

( )

2、 某企业某年各季度销售额和利润资料如下:

季度 销售额(百万元) 利润率(%) 1 150 30 2 180 32 3 200 35 4 210 36 则该年各季度平均利润率为(30%+32%+35%+36%)/4=33.25%。( )

3、假设A、B为两个互斥事件,则下列关系中,不一定正确的是( )。

A、P(A+B)=P(A)+P(B) B、P(A)=1-P(B) C、P(AB)=0 D、P(A|B)=0

4、同时抛3枚质地均匀的硬币,巧合有2枚正面向上的概率为( )。

A、0.125 B、0.25 C、0.375 D、0.5 5、下列由中心极限定理得到的有关结论中,正确的是( )。

A、只有当总体服从正态分布时,样本均值才会趋于正态分布 B、只要样本容量n充分大,随机事件出现的频率就等于其概率 C、无论样本容量n如何,二项分布概率都可以用正态分布近似计算 D、不论总体服从何种分布,只要样本容量n充分大,样本均值趋于正态分布

二、多项选择题

1、下列关于随机变量的数学期望的表述中正确的是( )。

A、它又称为随机变量的均值

B、它表示该随机变量所有可能取值的平均水平 C、它度量的是随机变量的离中趋势

D、任一随机变量都存在一个有限的数学期望

E、它与加权算术平均数的不同之一是它以概率或分布密度为权数 2、下列关于几种概率分布之间的关系的陈述中,正确的有( ):

A、二点分布(0-1分布)是二项分布的特例

B、当n很大而p又很小时,二项分布可用参数λ=np的泊松分布近似

C、当N很大而M / N很小是,超几何分布趋于二项分布

D、当n>30时,不管p大小,二项分布的概率都可用正态分布来近似计算

E、当n无限增大时,二项分布趋近于正态分布

三、判断分析题(判断正误,并简要说明理由)

1、频率的极限是概率。

2、若某种彩票中奖的概率为5?,那么随机购买1000注彩票将有5注中奖。

四、简答题

1、全概率公式与逆概率公式分布用于什么场合?

五、计算题

1、某厂生产的某种节能灯管的使用寿命服从正态分布,对某批产品测试的结果,平均使用寿命为1050小时,标准差为200小时。试求: (1)使用寿命在500小时以下的灯管占多大比例? (2)使用寿命在850~1450小时的灯管占多大比例? (3)以均值为中心,95%的灯管的使用寿命在什么范围内? 五、1、(1)P{X<500}=Φ(

500?1050)=Φ(-2.75)

200=1-Φ(2.75)=1-0.99702=0.00298

(2)P{850≤X≤1450}=Φ(

850?10501450?1050)- Φ()

200200=Φ(2)- Φ(-1)=0.97725-0.15865=0.8186

(2) 由标准正态函数分布表可知,P{|Z|≤1.96}=0.95,即有: P{|Z|=|

X?1050|≤1.96}= P{|X-1050|≤392}=0.95

200所以95%的灯管的使用寿命在均值左右392小时(658~1442小时)的范围内。

答案:

一、A,D,B,C,D; 二、ABE; ABCE

三、1、错误。当观察次数n很大时,随机事件发生的频率的稳定值就是概率,频率可作为概率的近似值。但是并不能认为概率就是频率的极限。因为当n很大时,频率稳定地在概率附近摆到,二者出现显著偏差的可能性极小,但并不意味着二者的偏差肯定越来越小。

2、错误。中奖的概率为5?,意味着在试验次数非常多的情况下,平均每1000注彩票大约有5注会中奖。并不意味着每1000注彩票必然有5注中奖。

四、1、全概率公式:某一事件B的发生有各种可能的原因Ai(i=1,2,?,n),每一Ai都可能导致B发生,求B发生的概率。

逆概率公式:在事件B已发生的条件下,寻找导致A发生的每个原因Ai的概率。

五、1、(1)P{X<500}=Φ(

500?1050)=Φ(-2.75)

2001450?1050850?1050)- Φ()

200200=1-Φ(2.75)=1-0.99702=0.00298

(2)P{850≤X≤1450}=Φ(

=Φ(2)- Φ(-1)=0.97725-0.15865=0.8186

(3) 由标准正态函数分布表可知,P{|Z|≤1.96}=0.95,即有: P{|Z|=|

X?1050|≤1.96}= P{|X-1050|≤392}=0.95

200所以95%的灯管的使用寿命在均值左右392小时(658~1442小时)的范围内。

第六章 抽样与参数估计

【重点】深刻理解抽样分布的概念及中心极限定理的意义,灵活

掌握均值和比例的区间估计方法的应用。

【难点】在不同条件下的区间估计。

思考题

6.1 什么是抽样误差?影响抽样误差的主要因素有哪些?

6.2 确定必要的抽样数目(样本容量)有何意义?必要抽样数目受哪些因

素影响?

6.3 什么叫统计量?什么是参数?评价统计量优劣有哪些标准? 6.4 分层抽样与整群抽样的分组作用及方法各是什么? 6.5 解释抽样推断的含义。

6.6 解释简单随机抽样、分层抽样、系统抽样和整群抽样的含义。 6.7 什么是抽样分布?

6.8 样本统计量的分布与总体分布的关系是什么?

6.9 样本均值抽样分布的两个主要特征值是什么? 它们与总体参数有什

么关系?

练习题

一、单项选择题

1、某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( )

A、样本容量为10 B、抽样误差为2 C、样本平均每袋重量是估计量 D、498是估计值

2、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于( )

A、N(100,25) B、N(100,5/n) C、N(100/n,25) D、N(100,25/n)

3、在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加( )

A、一半 B、一倍 C、三倍 D、四倍 4、在其他条件不变时,置信度(1–α)越大,则区间估计的( )

A、误差范围越大 B、精确度越高 C、置信区间越小 D、可靠程度越低

5、其他条件相同时,要使抽样误差减少1/4,样本量必须增加( )

A、1/4 B、4倍 C、7/9 D、3倍 6、在整群抽样中,影响抽样平均误差的一个重要因素是( )

A、总方差 B、群内方差 C、群间方差 D、各群方差平均数 7、在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使( )尽可能小

A、总体层数 B、层内方差 C、层间方差 D、总体方差 8、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是( )

A、简单随机抽样 B、分层抽样 C、等距抽样 D、整群抽样

9、为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的

与100有很大差异。

2、有个研究者猜测,某贫困地区失学儿童中女孩数是男孩数的3倍以上(即男孩数不足女孩数的1/3)。为了对他的这一猜测进行检验,拟随机抽取50个失学儿童构成样本。那么原假设可以为:H0:P≤1/3。

四、简答题

1、采用某种新生产方法需要追加一定的投资。但若根据实验数据,通过假设检验判定该新生方法能够降低产品成本,则这种新方法将正式投入使用。

(1)如果目前生产方法的平均成本是350元,试建立合适的原假设和备择假设。

(2)对你所提出的上述假设,发生第一、二类错误分别会导致怎样的后果?

五、计算题

1、某种感冒冲剂的生产线规定每包重量为12克,超重或过轻都是严重的问题。从过去的资料知σ是0.6克,质检员每2小时抽取25包冲剂称重检验,并做出是否停工的决策。假设产品重量服从正态分布。 (1)建立适当的原假设和备择假设。

(2)在α=0.05时,该检验的决策准则是什么? (3)如果x=12.25克,你将采取什么行动? (4)如果x=11.95克,你将采取什么行动?

答案:

一、1、C 2、C 3、B 4、A 5、B 二、1、CD 2、CE

三、1、错误。“拒绝原假设”只能说明统计上可判定总体均值不等于100,

但并不能说明它与100之间的差距大。

2、错误。要检验的总体参数应该是一个比重,因此应该将男孩和女孩的人数的比率转换为失学儿童中女孩所占的比例P(或男孩所占的比例P*)所以原假设为:H0:P=3/4(或P≤3/4);H1:P>3/4。

也可以是:H0:P*=1/4(或P≥1/4);H1:P*<1/4。 四、1、(1)H0:x≥350;H1:x<350。

(2)针对上述假设,犯第一类错误时,表明新方法不能降低生产成本,但误认为其成本较低而被投入使用,所以此决策错误会增加成本。犯第二类错误时,表明新方法确能降低生产成本,但误认为其成本不低而未被投入使用,所以此决策错误将失去较低成本的机会。 五、1、(1)H0:μ=120;H1:μ≠12。 (2)检验统计量:Z=

x??0?/n。在α=0.05时,临界值zα/2=1.96,故

拒绝域为|z|>1.96。 (3) 当x=12.25克时,Z=

x??0?/n=

12.25?120.6/25=2.08。

由于|z|=2.08>1.96,拒绝H0:μ=120;应该对生产线停产检查。 (4) 当x=11.95克时,Z=

x??0?/n=

11.95?120.6/25=-0.42。

由于|z|=-0.42<1.96,不能拒绝H0:μ=120;不应该对生产线停产检查。

第八章 相关与回归分析

【重点】明确相关关系,函数关系,因果关系,掌握基本的回归

分析和预测方法,能应用实际资料构建一元线性回归模型,并借助计算机进行系统分析。

【难点】多元线性回归分析和预测方法的准确运用。

思考题

8.1 什么是函数关系?什么是相关关系?它们有何区别与联系? 8.2 8.3 8.4 8.5 8.6

相关关系有哪些分类? 相关系数与判定系数的关系。

解释相关关系的含义,说明相关关系的特点。 简述相关系数的取值及其意义。

解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。 8.7 8.8

在回归分析中,F检验和t检验各有什么作用? 什么是置信区间估计和预测区间估计?二者有何区别?

练习题

一、单项选择题

1、下面的关系中不是相关关系的是( )

A、身高与体重之间的关系 B、工资水平与工龄之间的关系 C、农作物的单位面积产量与降雨量之间的关系 D、圆的面积与半径之间的关系

2、具有相关关系的两个变量的特点是( )

A、一个变量的取值不能由另一个变量唯一确定 B、一个变量的取值由另一个变量唯一确定

C、一个变量的取值增大时另一个变量的取值也一定增大 D、一个变量的取值增大时另一个变量的取值肯定变小 3、下面的假定中,哪个属于相关分析中的假定( ) A、两个变量之间是非线性关系 B、两个变量都是随机变量

C、自变量是随机变量,因变量不是随机变量 D、一个变量的数值增大,另一个变量的数值也应增大

4、如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称这两个变量之间为( )

A、完全相关关系 B、正线性相关关系 C、非线性相关关系 D、负线性相关关系 5、根据你的判断,下面的相关系数取值哪一个是错误的( ) A、–0.86 B、0.78 C、1.25 D、0

6、设产品产量与产品单位成本之间的线性相关关系为–0.87,这说明二者之间存在着( )

A、高度相关 B、中度相关 C、低相关 D、极弱相关 7、在回归分析中,描述因变量y如何依赖于自变量x和误差项ε的方程称为( )

A、回归方程 B、回归模型 C、估计回归方程 D、经验回归方程 8、在回归模型y=?0??1x??中,ε反映的是( ) A、由于x的变化引起的y的线性变化部分

B、由于y的变化引起的x的线性变化部分

C、除x和y的线性关系之外的随机因素对y的影响 D、由于x和y的线性关系对y的影响

9、如果两个变量之间存在负相关关系,下列回归方程中哪个肯定有误( )

A、y=25–0.75x B、y= –120+ 0.86x C、y=200–2.5x D、y= –34–0.74x 10、说明回归方程拟合优度的统计量是( C )

A、相关系数 B、回归系数 C、判定系数 D、估计标准误差 11、判定系数R2是说明回归方程拟合度的一个统计量,它的计算公式为( )

????SSRSSRSSESSTA、SST B、 C、 D、

SSESSTSSR12、已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R2=( )

A、97.08% B、2.92% C、3.01% D、33.25% 13、一个由100名年龄在30~60岁的男子组成的样本,测得其身高与体重的相关系数r=0.45,则下列陈述中不正确的是( )

A、较高的男子趋于较重 B、身高与体重存在低度正相关 C、体重较重的男子趋于较高 D、45%的较高的男子趋于较重 14、下列回归方程中哪个肯定有误( )

?yA、=15–0.48x,r=0.65 B、y= –15 - 1.35x,r=-0.81

?C、y=-25+0.85x,r=0.42 D、y=120–3.56x,r=-0.96

??

本文来源:https://www.bwwdw.com/article/gc1w.html

Top