统计学全本 习题及参考答案(期末复习完整版资料)

更新时间:2023-10-07 09:03:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

一、单项选择题

【 】1、若住宅房地产“评估的房地产价值X”与“销售价格Y”之间建立的直线回归方程为yt??1.98?3.1x,则二者的相关系数可能是 ..

A、-1.98 B、+3.1 C、+0.9237 D、-0.8963 【 】2、单因素方差分析中,误差项离差平方和SSE实质上反映了 A、多种因素的综合作用带来的影响 B、系统因素带来的影响 C、随机因素带来的影响 D、随机因素和系统因素带来的影响

【 】3、单项式变量数列中,如果各标志值都扩大1倍,而频数都减少为原来的四分之一,则平均数 A、不变 B、扩大1倍 C、减少1/4 D、无法判断大小

【 】4、如果用P表示商品的价格,用q表示商品销售量,则?p1q1??p0q1综合反映

A、商品价格和商品销售量变动引起销售额变动的绝对值 B、商品销售额变动的相对数 C 、多种商品价格变动使商品销售额变动的绝对值 D、多种商品销售量变动使商品销售额变动的绝对值 【 】5、某研究人员发现,举重运动员的体重与他能举起的重量之间的相关系数为0.6,则 A、举重能力的60%归因于其体重

B、平均来说,运动员能举起其体重60%的重量

C、如果运动员体重增加10公斤,则可多举6公斤的重量 D、运动员体重和能举起的重量之间有正相关关系

【 】6、某企业最近几批产品的优质品率P分别为80%、85%、90%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选

A、90% B、85% C、80% D、82%

【 】7、原始资料平均法计算季节指数时,计算各年同期(月或季)的平均数,其目的是消除各年同一季度(或月份)数据上的

A、季节变动 B、循环变动 C、长期趋势 D、不规则变动

【 】8、为了分析我校不同专业学生的某次统计学测验成绩是否有显著差异,可运用方差分析法。在1%的显著性水平下, 在12个专业中共计随机抽取60个学生进行调查,拒绝原假设的区域是 A、 F0.01(11,59),??) B、F0.005(11,59),??) C、F0.01(11,48),??) D、F0.005(11,48),??)

【 】9、一项对一所大学学生上课出勤情况及成绩的研究指出,一般来说,出勤率较高的学生,成绩也较好。若上课出勤率说明了成绩变异的36%,则

A、上课出勤率与成绩之间的相关系数是0.36 B、上课出勤率与成绩之间的可决系数是0.36 C、根据上课出勤率与成绩建立的回归方程中回归系数(斜率)是0.36 D、根据上课出勤率与成绩建立的回归方程中的常数项是0.36

【 】10、若一组数据的均值为28,众数为31,中位数为29,则大体上可断定数据的分布形态为 A、正态分布 B、左偏分布 C、右偏分布 D、尖峰分布

二、多项选择题

【 】1、可决系数r2=86.49%时,意味着

A、自变量与因变量之间的相关关系密切 B、因变量的总变差中,有86.49%可通过回归直线来解释 C、因变量的总变差中,有13.51%可由回归直线来解释 D、相关系数绝对值一定是0.93 E、相关系数绝对值一定是0.8649

【 】2、下列那些属于测度数据离散程度的指标

A、极差 B、内距 C、方差 D、标准差 E、离散系数 【 】3、假设检验中,关于两类错误与显著性水平,下列说法正确的有

A、第Ⅰ类错误称为弃真错误,犯第Ⅰ类错误的概率记为?

B、第Ⅱ类错误称为取伪错误,犯第Ⅱ类错误的概率记为?

?C、当?增大时,?减小;当?增大时,?减小 D、要使?和?同时减小的唯一办法是增加样本容量

E、犯第Ⅰ类错误的概率?被称为显著性水平

【 】4、在参数估计中,统计学家给出了评价估计量的一些标准,主要有以下几个:

A、相合性 B、有效性 C、均衡性 D、时效性 E、无偏性 【 】5、下列那些属于拉氏指数公式 A、Lq?pq??pq0010 B、Lppq???pq1000 C、Pppq???pq1101

D、Pqpq???pq11 E、Hq10pq??q?qpq1101

11三、填空题

1、单因素方差分析问题中,F=12.24,P-value=0.0056,表示拒绝原假设的概率为 。 2、如果物价指数上涨了18%,则现在1元钱只值原来的 元。 3、可决系数r2的取值范围为 。

4、均值的缺点主要是易受数据极端值的影响,对于偏态分布的数据,均值的代表性较 。

?D(?2),?2都是总体参数的无偏估计量,若D(?1)5、?1、则?1是比?2更有效的一个估计量。在无偏估计的

??????条件下,估计量方差越 估计也就越有效。

6、线性趋势的特点是其逐期变化量或趋势线的 基本保持不变。 7、偏态系数SK的值小于零时,可判断数据分布为 偏。 8、简单相关系数r 的取值范围为 。

9、显著性水平?=0.05,表示拒绝原假设的概率为 %。 10、总指数的计算形式有综合指数和 指数两种。 四、判断题

【 】1、四水平的单因素方差分析,每个水平下的样本容量是5,则SSE的自由度必定为20。 【 】2、数据无需排序,位置在最中间的数值称为中位数。

【 】3、当峰度系数K的值大于0时,可判定该组数据为平峰分布 。 【 】4、x分布的形式与原有总体 的分布和样本容量n的大小有关。【 】5、无论单侧检验还是双侧检验,用P值进行决策的准则都是:如果P值??,拒绝H0 ;P值??,不拒绝H0 。

【 】6、当总体服从正态分布且?2已知时,或者总体不是正态分布但为大样本时,样本均值x的分布均为t 分布。

【 】7、方差分析中,如果根据样本计算的统计量F=12.25,而临界值F=3

,那么因素的作用不显

著。

【 】8、假设检验具有100%的准确率。

【 】9、某企业产值2004—2006年3年的环比发展速度分别为102%、110%、115%,则2006年产值比2003年增长了29.03%。

【 】10、已知基期总值指标及个体指数时,可使用加权算术平均指数编制总指数。 五、简答题

1、一组数据的分布特征可以从哪几个方面进行测度?

2、某商店采用三种不同的方式推销商品。从三个总体中随机抽取容量相同的样本,得到12个销售量数据。方差分析表如下: 差异源 SS df MS F P-value F crit 组间 618.92 309.46 0.040877 4.256495 组内 66.44 总计 1216.92 11 完成上面的方差分析表,若显著性水平为0.05,检验三种不同推销方式对销售量的影响是否显著? 六、计算分析题

1、某车间两种产品的生产情况如下: 产品 计量 单位成本(元/件、台) 产量 名称 单位 基期 报告期 基期 报告期 甲 万吨 6 8 4 6 乙 万套 8 12 3 5 要求:建立适当的指数体系(V=Lq·Pp),从相对数和绝对数两方面对总成本的变动进行因素分析。

(10分)

2、甲、乙两单位各抽取了若干工人进行生产情况调查,测得有关资料如下: 日产量(件/人) 甲单位工人数(人) 乙单位工人数(人) 2 4 6 4 6 8 5 8 4 试通过计算分析:(1)哪个单位工人的平均日产量水平高?(2)哪个单位工人的日产量水平均衡?(10分) 3、一种汽车配件的平均长度要求为10cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验,结果平均长度x?9.89cm ,样本标准差S=0.43 。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?(Z??1.96,t?(n?1)?t0.025(9)?2.262)(10分)

224、研究某市1990-2001年地方预算内财政收入(Y)与国内生产总值(X)的关系。通过Excel计算得到下面的有关结果(??0.05):(10分) 回归统计 Multiple R 0.99589674 R Square 0.99181032 Adjusted R Square 0.990991355 方差分析表 变差来源 df SS MS F 回归 1 68712.89 68712.88884 1211.049291 残差 10 567.3831 56.73830895 总计 11 69280.27 参数估计表 Coefficients 标准误差 t Stat P-value Intercept -3.6111514 4.16179 -0.86769197 0.405903604 X Variable 1 0.1345817 0.003867 34.80013 9.0975E-12 要求(1)计算地方预算内财政收入与国内生产总值的简单相关系数;

(2)建立地方预算内财政收入对国内生产总值的直线回归方程,并对回归系数?作出解释;(3)对回归直线的

?拟合优度作出评价; (4)对回归系数?作t检验;(t0.025(12?2)?2.2281) (5)对回归系数?作P值检验并与(4)作比较。第一章 绪 论

一、 单项选择题

1、在整个统计工作过程中处于基础地位的是( )

A、统计学 B、统计数据搜集 C、统计分析 D、统计数据的整理 2、统计学的核心内容是( )

A、统计数据的搜集 B、统计数据的整理 C、统计数据的发布 D、统计数据的分析

3、某班三名学生期末统计学考试成绩分别为78分、84分和95分,这三个数字是( ) A、指标 B、标志 C、变量 D、变量值

4、某管理局有20个下属企业,若要调查这20个企业全部职工的工资收入情况,则统计总体为( ) A、20个企业 B、20个企业的每个职工 C、20个企业的全部职工 D、20个企业每个职工的工资 5、现代统计学的主要内容是( )

A、描述统计 B、理论统计 C、应用统计 D、推断统计 6、( )是整个统计学的基础。

A、理论统计 B、描述统计 C、推断统计 D、应用统计 二、多项选择题

1、统计学( )

A、主要特征是研究数据 B、研究具体的实际现象的数量规律 C、研究方法为演绎与归纳相结合 D、研究抽象的数量规律 E、研究有具体实物或计量单位的数据 2、数学( )

A、为统计理论和统计方法的发展提供数学基础 B、研究具体的数量规律 C、研究抽象的数量规律 D、研究方法为纯粹的演绎 E、研究没有量纲或单位的抽象的数 三、填空题

1、_________和_________是统计方法的两个组成部分。

2、统计过程的起点是_________,终点是探索出客观现象内在的______________。

3、统计数据的分析是通过___________和___________的方法探索数据内在规律的过程。

四、联系实际举例说明,为什么统计方法能够通过对数据的分析找出其内在的规律性?(要求举三个例子且不与教科书上的例子雷同)

第一章 参考答案 一、单项选择题

1、 B 2、D 3、D 4、C 5、D 6、B 二、多项选择题

1、ABCE 2、ACDE 三.填空题

1、描述统计、推断统计 2、数据搜集、数量规律性 3、统计描述、统计推断

第二章 统计数据的搜集与整理

一、单项选择题

1、某种产品单位成本计划比基期下降3%,实际比基期下降了3.5%,则单位成本计划完成相对数为( D )

A、116.7% B、100.5% C、85.7% D、99.5%

2、计算结构相对数时,总体各部分数值与总体数值对比求得的比重之和( C ) A、小于100% B、大于100% C、等于100 %: D、小于或大于100% 3、将全班学生划分为“男生”和“女生”,这里采用的数据计量尺度位( C ) A、定比尺度 B、定距尺度 C、定类尺度 D、定序尺度 4、将全班学生期末统计学考试成绩划分为优、良、中、及格、不及格,这里采用的数据计量尺度为( C ) A、定类尺度 B、定距尺度 C、定序尺度 D、定比尺度

5、昆明市的温度为260C与景洪市的温度310C相差50C,这里采用的数据计量尺度位( A ) A、定距尺度 B、定类尺度 C、定比尺度 D、定序尺度

6、张三的月收入为1500元,李四的月收入为3000元,可以得出李四的月收入是张三的两倍,这里采用的数据计量尺度位( B )

A、定序尺度 B、定比尺度 C、定距尺度 D、定类尺度 7、一次性调查是指( C )

A、只作过一次的调查 B、调查一次,以后不再调查 C、间隔一定时间进行一次调查 D、只隔一年就进行一次的调查 8、在统计调查中,调查单位和填报单位之间( D )

A、无区别 B、是毫无关系的两个概念 C、不可能是一致的 D、有时一致,有时不一致 9、下列中,属于品质标志的是( B )

A、工人年龄 B、工人性别 C、工人体重 D、工人工资 10、商业企业的职工人数、商品销售额是( C )

A、连续变量 B、前者是连续变量,后者是离散变量 C、前者是离散变量,后者是连续变量 D、离散变量

11、对昆明市所有百货商店的工作人员进行普查,调查对象是( B )

A、昆明市所有百货商店 B、昆明市所有百货商店的全体工作人员 C、昆明市的一个百货商店 D、昆明市所有百货商店的每一位工作人员 12、在全国人口普查中,调查单位是( B )

A、全国人口 B、每一个人 C、每个人的性别 D、每个人的年龄 13、对某城市工业企业的设备进行普查,填报单位为( C )

A、全部设备 B、每台设备 C、每个工业企业 D、全部工业企业

14、某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是( D )

A.普查 B、典型调查 C、抽样调查 D、重点调查 15、人口普查规定统一的标准时间是为了( A )

A、避免登记的重复和遗漏 B、确定调查的范围 C、确定调查的单位 D、登记的方便 16、( C )是对事物最基本的测度。

A、定序尺度 B、定比尺度 C、定类尺度 D、定距尺度 17、下列中,最粗略、计量层次最低的计量尺度是( A )

A、定类尺度 B、定序尺度 C、定比尺度 D、定距尺度 18、下列中,计量结果只能进行加减运算的计量尺度是( A )

A、定距尺度 B、定比尺度 C、定类尺度 D、定序尺度 二、多项选择题

1、某企业职工工资情况如下: 按月工资分组(元) 职工人数(人) 660——680 150 680——700 250 700——820 200 合 计 600 表中( C E ) A、变量是150、250、200 B、变量是660、680、700、820

C、工资是变量 D、变量有3个 E、组中值有3个 2、下列各项中,属于统计指标的是( A C E )

A、某地区2004年GDP1000亿元 B、某工人月工资850元 C、某地区2004年货物运输量2000万吨 D、某地区明年小麦预计产量21万吨 E、某地区去年人口自然增长率7? 3、抽样调查与重点调查的主要区别是( B C D )

A、抽选调查单位的多少不同 B、抽选调查单位的方式方法不同 C、取得资料的方法不同 D、在对调查资料的使用时所发挥的作用不同 E、原始资料的来源不同 4、某地区进行工业企业的现状调查,则每一个工业企业是( C E )

A、调查对象 B、统计总体 C、调查单位 D、调查项目 E、填报单位 5、搜集统计数据的具体方法主要有( A B C D E )

A、访问调查 B、邮寄调查 C、电话调查 D、座谈会 E、个别深度访问

6、某地区对集市贸易个体户的偷税漏税情况进行调查,1月5日抽选5%样本,5月1日抽选10%样本检查,这种调查是( A B D )

A、非全面调查 B、一次性调查 C、定期调查 D、不定期调查 D、经常性调查

7、为了研究全国乡镇工业企业的发展情况,国家决定对全国乡镇工业企业进行普查,则每一个乡镇工业企业是( B C E )

A、调查总体 B、调查单位 C、报告单位 D、调查对象 E、既是调查单位又是报告单位 8、在某一组距数列中( A B C E )

A、组数的确定应以能够显示数据的分布特征和规律为目的 B、组距大小与组数的多少成正比 C、组距大小与组数的多少成反比 D、组距宜取5或10的倍数 E、第一组的下限应低于最小变量值;最后一组的上限应高于最大变量值 三、 填空题

1、数量型统计数据通常有两种基本的形式,即__________和___________。

2、统计的原始数据都有一定的计量单位。绝对数的计量单位有__________、___________和_____________三种。

3、数字变量根据其取值的不同,可以分为___________和_____________。

4、离散变量只能取_________个值,而且其取值都以________断开,可以一一列举。 5、连续变量可以取________个值,其取值是___________的,不能一一列举。

6、从使用者的角度看,统计数据主要来源于两种渠道:一是来源于________________,二是来源于___________________。

7、根据对比的数量不同,相对数可分为_________和__________两种基本形式。

8、访问调查又称__________,它是调查者与被调查者之间通过________________而得到所需资料的调查方法。

9、在市场调查中,基本上都是采用_______调查方式,调查对象是确定_______框的基本依据。

10、调查表是用来登记调查数据的一种表格,一般由________、________和______________三部分组成。 11、调查时间包括_________________和___________________。

12、数据整理通常包括数据的________、____________、_______等几个方面的内容,它是__________之前的必要步骤。

13、数据的预处理是______________的先前步骤,内容包括数据的______与______、______等。 14、对于通过直接调查取得的原始数据应主要从_________和________两个方面去审核。 15、审核数据准确性的方法主要有____________和_____________。

16、对于其它渠道取得的第二手数据,除了对其_________和________进行审核外,还应着重审核数据的__________和___________。

17、按数量标志分组的方法主要有___________和_____________。 18、频数密度=_____________÷_________________。 19、闭口组组中值=(______+_______)÷2

20、直方图是用__________和__________来表示频数分布的图形 四、判断题

1、调查单位可以是调查对象的全部单位,也可以是调查对象的部分单位。( √ )

2、人口普查的调查单位是每一个人。( √ )

3、调查项目是调查的具体内容,它可以是调查单位的数量特征,也可以是调查单位的某种属性或品质特征。( √ )

4、消费者购买某种产品的动机的调查,常用“座谈会”调查方法。( x ) 5、搜集与研究课题有密切关系的少数人员的倾向和意见,常用个别深度访问。( x ) 6、品质标志实际上就是定类尺度和定序尺度。( √ ) 7、数量标志实际上就是定距尺度和定比尺度。( √ ) 8、组距可以根据全部数据的最大值和最小值及所分的组数来确定。( √ ) 9、组数越多,数据分布越集中,组数越少,数据分布就越分散。( x ) 10、组距分组时,为了解决“不重”问题,习惯上规定“上组限不在内”。( x )

11、若一个班的统计学考试成绩的最高分为99分,最低分为2分,则在组距分组时宜采用“××以下”和“××以上”这样的开口组。( √ ) 12、用组中值作为一组数据的代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组中值两侧称对称分布。( √ )

13、从变量值小的一方向变量值大的一方累加频数,称为向下累计。( x ) 14、从变量值大的一方向变量值小的一方累加频数,称为向上累计。( x ) 15、人和动物的死亡率分布近似服从正态分布。( x ) 16、经济学中的供给曲线呈现为正J型分布。( √ ) 五、简答题

1、普查作为一种特殊的调查方式具有哪些特点? 2、组距分组需要经过哪几个步骤? 六、计算分析题

1、某行业管理局40个企业1999年的产品销售收入统计数据如下(单位:万元):

152 124 129 116 100 103 92 95 127 104 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120

136 117 108 97 88 123 115 119 138 112 146 113 126 要求:

① 对上面的数据资料进行适当的分组,编制频数分布表,并绘制频数分布的直方图和折线图。 ② 根据频数分布表计算累计频数和累计频率。

③ 如果按企业成绩规定:销售收入在125万元以上为“先进企业”;115~125万元为“良好企业”;105~115万元为“一般企业”;105万元以下为“落后企业”。试按先进企业、良好企业、一般企业和落后企业进行分组。 6.1[解]:

(1)分组得出的“频数分布表”如下:(仅供参考) 按销售收入分组(万企业数(个) 频率(%) 累计频数 累计频率(%) 元) (个) 95以下 3 7.32 3 7.32 95——110 12 29.27 15 36.59 110——125 15 36.59 30 73.18 125——140 8 19.50 38 92.68 140以上 3 7.32 41 100.00 合 计 41 100.0 —— ——— 频数分布的折线图和直方图(略) (2)计算频数分布的累计频数和累计频率。(见上表) (3)分组如下: 按企业规定的销售成绩分组 企业数(个) 落后企业(105万元以下) 9 一般企业(105——115) 9 良好企业(115——125) 11 先进企业(125万元以上) 11 合 计 41 ④ 2、某车间按工人日产量分组资料如下: 日产量(件) 工人人数 (人) 50——60 6 60——70 12 70——80 18 80——90 10 90——100 7 合 计 53 要求:根据上表指出:①上表变量数列属于哪一种变量数列;②上表中的变量、变量值、上限、下限、次数(频数);③计算各组组距、组中值、频率。 6.2[解]:(1)该变量数列为“数量型变量数列”。 (2)表中:“变量”为“日产量”和“工人人数”;

“变量值”为:50-60,60-70,80-90,90-100和6,12,18,10,7。 上限分别为:60,70,80,90,100; 下限分别为:50,60,70,80,90;

各组次数(频数)为:6,12,18,10,7; (3)有关计算如下表: 日产量(件) 工人人数各组组各组组中值 各组频率(%) (人) 距 50——60 6 10 55 11.32 60——70 12 10 65 22.64 70——80 18 10 75 33.96 80——90 10 10 85 18.87 90——100 7 10 95 13.21 合 计 53 ——————— — 100.00 3、某商店有职工20人,月工资额(单位:元)分别如下: 550 550 640 640 660 660 680 680 700 700 720 720 740 740 690 690 698 698 590 590

要求:利用分组法,将上述20人的工资分成三个组,并说明该商店职工工资的分布特征。 6.3[解]:有关分组如下(参考): 按月工资分组(元) 工人人数 频率(%) (人) 525——625 4 20 625——725 14 70 725——750 2 10 合 计 20 100 从上表分组数据可以看出:该商店20名职工中有70%的职工月工资在625元至725元之间,且这20名职工的月工资额数据大致呈“右偏分布”,有90%的职工月工资额低于725元。 4、请用“√”或“×”完成下表(其中“√”说明具有某种数学特征,“×”说明不具有某种数学特征)。 计量尺定类尺度 定序尺度 定距尺度 定比尺度 度 数学特征 分类( = ,≠ ) 排序( < ,> ) 间距( + ,-) 比值( × ,÷) 6.4[解]:完成的表格如下: 定类尺度 定序尺度 定距尺度 定比尺度 分类(=,≠) √ √ √ √ 排序(<,> ) √ √ √ 间距(+,—) √ √ 比值(×,÷) √ 5、某地区人口统计资料如下表,请计算此表中空白处的数字,并填入表中。 按年龄人口数组组中频 率 向上累积 向下累积 分 组(人) 距 值 (%) 频数频率(%) 频数频率(%) (周岁) (人) (人) 0—4 192 5 —17 459 18—24 264 25—34 429 35—44 393 45—64 467 65及以 318 上 合 计 6.5[解]:填表完成的表格如下: 按年龄分人口数 组距 组中频率 向上累计 向下累计 组(周岁) (人) 值 (%) 频数频率(%) 频数频率(%) (人) (人) 0—4 192 5 2.5 7.61 192 7.61 2522 100.00 5—17 459 13 11.5 18.20 651 25.81 2330 92.39 18—24 264 7 21.5 10.47 915 36.28 1871 74.19 25—34 429 10 30 17.01 1344 53.29 1607 63.72 35—44 393 10 40 15.58 1737 68.87 1178 46.71 45—64 467 20 55 18.52 2204 87.39 785 31.13 65以上 318 — — 12.61 2522 100.00 318 12.61 合 计 2522 —— —— 100.00 ———— —————————— — — *6、兹有下列调查:A、为了了解钢材积压情况,上级机关向单位颁发一次性调查表要求填报。B、一批商品运到商业仓库,在这批商品中选出10件进行仔细检查,以判断和记录其质量。C、某乡在春播期间每隔5天向上级主管部门提交播种进度报告。D、为了了解科技人员分配、使用状况,有关部门向各单位布置调查表,要求填报。E、对大中型基本建设项目投资效果进行调查。F、选取部分企业进行调查,以了解扩大企业自主权试点后的成果及问题。 要求:(1)指出上述各项调查按组织方式分类各属于哪种调查?(2)指出上述各项调查按登记事物的连续性分类各属于哪种调查?(3)指出上述各项调查按调查对象的范围分类各属于哪种调查?(4)指出各项调查按收集资料的方法分类各属于哪种调查? 6.6[解]:属于该类“调查”的业务打“★”。 组织方式分连续性分类 对象的范围分 搜集资料的方法分类 类 类 统计 报表 业务1 ★ ★ 业务2 业务3 ★ ★ 业务4 ★ 业务5 ★ ★ 业务6 ★ 第二章 参考答案 一、单项选择题 1、D 2、C 3、C 4、C 5、A 6、B 7、C 8、D 9、B 10、C 11、B 12、B 13、C 14、D 15、A 16、C 17、A 18、A 二、多项选择题

1、CE 2、ACE 3、BCD 4、CE 5、ABCDE 6、ABD 7、BCE 8、ABCE 三、填空题

1、绝对数、相对数 2、实物单位、价值单位、复合单位 3、离散变量、连续变量 4、有限,整数位 5、无穷多、连续不断的 6、直接的调查和科学试验(第一手或直接的统计数据);别人调查或实验的数据(第二手或间接的统计数据) 7、比例、比率 8、派员调查、面对面地交谈 9、抽样调查、抽样 10、表头、表体、表外附加 11、调查数据所属的时间、调查工作的期限 12、预处理、分类或分组、汇总;统计分析 13、数据分组整理、审核、筛选、排序 14、完整性、准确性 15、逻辑检查法、计算检查法 16.完整性、准确性、时效性、适用性 17、单变量值分组、组距分组 18、频数、组距 19.下限值、上限值 20、矩形的宽度、高度 四、判断题

1、 √ 2、√ 3、 √ 4、× 5、× 6、 √ 7、 √ 8、√ 9、 × 10、√ 11、√ 12、 √ 13、 × 14、 × 15、 × 16、 √ 五、(略) 六、计算题

第三章 数据分布特征的描述

一、单项选择题

1、经验表明,当数据分布近似于正态分布时,则有95%的数据位于区间( B ) A、X?? B、X?2? C、X?3? D、X?4?

2、实际中应用最广泛的离散程度测度值是( C )

A、极差和平均差 B、平均差和四分位差 C、方差和标准差 D、异众比率和四分位差 3、集中趋势的测度值中,最主要的是( C )

A、众数 B、中位数 C、均值 D、几何平均数

4、有10个数据,它们对数据6的离差分别为:-3,-2,-2,-2,0,0,4,4,5,5。由此可知这10个数据的( D )

A、均值为0 B、均值为1 C、均值为6 D、均值为6.9

5、某生产小组由36名工人,每人生产的产量数量相同,其中有14人生产每件产品耗时8分钟;16人生产每件产品耗时10分钟;6人生产每件产品耗时5分钟,计算该生产小组生产每件产品的平均耗时应采用( C )

A、简单算术均值 B、简单调和算术均值 C、加权算术均值 D.、加权调和均值

6、某敬老院里有9位百岁老人的岁数分别为101、102、103、104、108、102、105、110、102 ,据此计算的结果是( B )

A、均值=中位数=众数 B、均值>中位数>众数 C、众数>中位数>均值 D、中位数>均值>中数 7、几何均值主要适合于( C )

专门 经常一次全 面 非全调查 性 性 调 查 面 调查 调 查 调 查 ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ 直 接 观察法 ★ ★ ★ 采访报告法 法

A、具有等差关系的数列 B、变量值为偶数的数列 C、变量值的连乘积等于总比率或总速度的数列 D、变量值之和等于总比率或总速度的数列

8、加权算术均值不但受变量值大小的影响,也受变量之出现的次数多少的影响,因此下列情况中对均值不发生影响的是( A ) A、 变量值出现次数相等时 B、变量值较小、次数较多时 C、变量值较大、次数较少时 D、变量值较大、次数较多时 9、一组数据的均值为350,众数为200,则( D )

A、中位数为275,数据呈右偏分布 B、中位数为275,数据呈左偏分布 C、中位数为300,数据呈左偏分布 D、中位数为300,数据呈右偏分布 10、一组数据的均值为5,中位数为3,则( A )

A、数据呈右偏分布 B、数据呈对称分布 C、数据呈左偏分布 D、数据呈正态分布 11、经验表明,当数据分布近似于正态分布时,则变量值落在区间X??的概率为( B ) A、95% B、68% C、99.86% D、95.45%

12、当众数(Mo)中位数(Me)和均值(X)三者的关系表现为:Mo=Me=X,则( C ) A、数据有极小值 B、数具有极大值 C、数据是对称分布 D、数据是左偏分布 E、数据右偏分布

13、在单项式数列中,假定标志值所对应的权数都缩小1/10,则算术平均数( A ) A、不变 B、无法判断 C、缩小1/100 D、扩大10倍

14、若单项式数列的所有标志值都减少一倍,而权数都增加一倍,则其算术平均数( B ) A、增加一倍 B、减少一倍 C、不变 D、无法判断 15、各变量值与其算术平均数的离差之和( C )

A、等于各变量值之和的平均数 B、等于最大值 C、等于零 D、等于最小值 16、各变量值与其算术平均数的离差平方之和( D )

A、等于各变量值之和的平均数 B、等于最大值 C、等于零 D、等于最小值 二、多项选择题

1、当众数(Mo)、中位数(Me)和均值(X)三者的关系表现为:X<Me<Mo,则( A D ) A、数据是左偏分布 B、数据是右偏分布 C、数据是对称分布 D、数据存在极小值 E、数据存在极大值

2、当众数(Mo)、中位数(Me)和均值(X)三者的关系表现为:Mo<Me<X,则( A D ) A、数据是右偏分布 B、数据是对称分布 C、数据是左偏分布 D、数据有极大值 E、数据有极小值 3、 数据分布的两个重要特征是( B E )

A、正态分布 B、集中趋势 C、t分布 D、?分布 E、离散程度

24、利用组距分组数据计算众数时,有一些基本假定,即( B D )

A、假定数据分布具有明显的离中趋势 B、既定数据分布具有明显的集中趋势

C、假定众数组的频数在该组内是正态分布 D、假定众数组的频数在该组内是均匀分布 E、假定众数组的频数在该组内是二项分布 5、众数( A B C D E )

A、是一组数据分布的最高峰点所对应的数值 B、可以不存在 C、也可以有多个 D、是位置代表值 E、不受数据中极端值的影响。 6、极差( A C D E )

A、是描述数据离散程度的最简单测度值 B、不易受极端值影响 C、易受极端值影响 D、不能反映出中间数据的分散状况 E、不能准确描述出数据的分散程度

7、一组数据为17、19、22、24、25、28、34、35、36、37、38。则( A B D E )

A、该组数据的中位数为28 B、该组数据的第一个四分位数为22 C、该组数据的众数为38

D、该组数据无众数 E、该组数据的第三个四分位数为36

8、下列标志变异指标中,与变量值计量单位相同的变异指标有( A B C ) A、全距 B、平均差 C、标准差 D、标准差系数 E、平均差系数 9、下列标志变异指标中,用无名数表示的有( D E )

A、全距 B、平均差 C、标准差 D、标准差系数 E、平均差系数 10、比较两个单位的资料发现,甲的标准差大于乙的标准差,甲的平均数小于乙的平均数,由此可推断( A D )

A、甲单位标准差系数大 B、乙单位标准差系数大 C、甲单位平均数代表性大 D、乙单位平均数代表性大 E、无法判断两单位平均数代表性大 11、已知100个零售企业的分组资料如下: 销售利润率(%) 企业数 销售额(万元) 10 60 800 15 40 200 这100个企业的平均销售利润率正确计算公式是 ( C E )

10%?60?15%?40 B、10%×60%+15%×40% C、10%?80%+15%?20%

60?4010%?15%?800?15%?200D、 E、

2800?200A、

三、填空题

1、中位数将全部数据分为两部分,一部分数据_____________,另一部分数据则________________。 2、根据未分组数据计算中位数时,若数据个数N为奇数时,则中位数Me=_____________;若数据个数为N为偶数时,则中位数Me=________________。

3、几何平均数是适用于特殊数据的一种平均数,它主要用于计算___________的平均;在实际应用中,几何平均数主要用于计算社会经济现象的___________________。

4、均值的主要缺点是易受数据___________的影响,对于_________的数据,均值的代表性较差。

5、均值的变形主要有_______________和_______________。前者主要用于__________________的数据,后者主要用于计算____________的平均数。

6、方差是__________与其均值___________的平均数。

7、极差也称_______,它是一组数据的___________和_________之差。

8、众数是一组数据中____________的变量值,从分布的角度看,它是具有明显_______________的数值。 四、 判断题

1、在均值加减3个标准差的范围内几乎包含了全部数据。( √ )

2、样本方差与总体方差在计算上的区别是:总体方差是通体数据个数或总频数减1去除离差平方和,而样本方差则是用样本数据个数或总频数去除离差平方和。( X )

3、从统计思想上看,均值是一组数据的重心所在,是数据误差相互抵消后的结果。( √ )

4、由于中位数是一个位置代表值,其数值的大小受极大值和极小值的影响,因此中位数据有稳健性的特点。( X )

5、中位数与各数据的距离最长。( X ) 6、?i?1NXi?Me?min(最小) ( √ )

7、从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而均值则是全部数据的算术平均。( √ )

8、几何平均数的对数是各变量值对数的算术平均。( √ ) 9、根据Mo、Me和X之间的关系,若已知Me=4.5,X=5,则可以推算出Mo=3.5。 ( √ ) 10、对于具有偏态分布的数据,均值的代表性要好于中位数。( X )

11、当数据分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比均值要好。( √ ) 五、 简答题

1、权数的实质内容是什么?

2、数据集中趋势的测度值与离中趋势的测度值各有哪些? 3、试比较众数、中位数和均值三者的特点及应用场合。 4、什么是离散系数?为何要计算离散系数? 5、均值具有哪些重要的数学性质? 6、离散特征数在统计分析中的作用? 7、实际中几何平均数应用于哪些场合? 六、计算分析题 1、根据要求计算:

(1)已知X?500,V=0.3 , 求方差σ2。

(2)已知X?5.5 ∑X2=385, N=10 , 求离散系数V?。 (3)已知σ=20 ,X?60 ,求各数据值对50的方差。 (4)已知X?350 ,V=0.4 ,求各数据值对400的标准差。

(5)已知?X?810,?X2?65770,N=10,求标准差?和离散系数V?。 (6)已知:σ=100,X2?2600,求离散系数V?

(7)已知:样本方差S2n-1=16,∑(X-X)2=784,求样本容量n。

2、某车间生产三批产品的废品率分别为1%、2%、1.5%,三批产品的产量占全部产量的比重分别为25%、35%、40%,试计算该车间三批产品的平均废品率。

3、某产品精加工车间加工零件5000件,其中合格品4500件,不合格品500件。 要求:计算是非标志的平均数、方差、标准差及离散系数。

4、有两个教学班进行《统计学》期中测验,甲班有45个学生,平均成绩为78分,标准差为8分;乙班有50个学生,平均成绩为72分,标准差额为10分。要求计算两个教学班总的平均成绩和标准差。

5、某厂长想研究星期一的产量是否低于其他几天,连续观察六个星期,所得星期一日产量(单位:吨)为:100 150 170 210 150 120 同期非星期一的产量整理后的资料如下表: 日产量(吨) 天数(天) 100——150 8 150——200 10 200——250 4 250以上 2 合 计 24 根据资料:(1)计算6个星期一产量的均值和中位数;(2)计算非星期一产量的均值、中位数、众数;(3)分别计算星期一和非星期一产量的标准差;(4)比较星期一和非星期一产量的离散程度哪一个大一些?(5)计算非星期一产量数据分布的偏态系数和峰度系数。

6、甲工厂工人的工资的离差的绝对值之和是乙工厂工人工资离差绝对值之和的3倍,即:而乙工厂工人工资的平均差却是加工厂工人工资平均差的3倍,即:A.D乙?2A.D甲,?x甲?x甲?3?x乙?x乙;

求:通过计算判断上述情况在什么情况下可能会发生?

7、从某地区抽取120家企业按利润额进行分组,结果如下: 按利润额分组(万元) 企业数(个) 200—300 19 300—400 30 400—500 42 500—600 18 2

______600以上 11 合 计 120 要求:(1)计算120家企业利润的众数、中位数、和均值。 (3)计算分布的偏态系数和峰度系数,并作简要分析说明。

8、抽取10名成年人和10名幼儿进行身高(厘米)调查,结果如下: 成年组 166 169 172 177 180 170 172 174 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75 要求:(1)若要比较成年组和幼儿组的身高差异,应采用什么样的指标测度值?为什么?(文字回答即可)

(2)试通过计算,比较分析哪一组的身高差异大? 9、甲、乙两个企业生产三种产品的有关资料如下: 产品名称 单位成本 总成本(元) (元) 甲企业 乙企业 A 15 2100 3255 B 20 3000 1500 C 30 1500 1500 试比较哪个企业的总平均成本高,并分析其原因。 10、甲、乙两单位各抽取了若干工人进行生产情况调查,测得有关资料如下: 日产量(件/人) 甲单位工人数(人) 乙单位总产量(件) 2 4 12 3 8 24 5 6 20 合 计 18 56 试通过计算分析:(1)哪个单位工人的平均日产量水平高? (2)哪个单位工人的日产量水平均衡? 11、已知某地区农民家庭按年人均收入分组的资料如表所示: 按人均收入分组(元) 家庭户数占总户数比重(%) 100以下 2.3 100—200 13.7 200—300 19.7 300—400 15.2 400—500 15.1 500—600 20.0 600以上 14.0 合 计 100.0 要求:(1)计算该地区平均每户家庭人均年收入的中位数、均值及标准差。 (2)根据计算结果回答,该地区平均每户家庭人均年收入与其平均数相比,平均相差多少元?(即是问标准差)

12、在某城市抽取100户家庭所做的一项抽样调查结果如下: 按月收入分组(元) 家庭户数占总户数比重(%) 300—400 24 400—500 27 500—600 28 600—700 10 700—800 7 800以上 4 你认为要分析该城市家庭的人均收入情况,用均值、众数和中位数哪一个测度值更好?试说明理由。(提示:用中位数。因为收入分布为右偏,且频数较多的几个组的家庭百分比相差不大,众数不十分明显。)

13、某厂两个主要生产车间工人某月奖金资料如下: 工人按奖金额分组 工人数(人) (元) 甲车间 乙车间 20以下 4 1 20—30 8 6 30—40 50 30 40—50 16 55 50以上 2 8 要求:(1)计算甲车间的众数、中位数和均值。根据计算结果描述众数、中位数及均值的关系,并据此判断甲车间数据分布的形态。

(2)通过计算判断哪个车间工人平均奖金额的代表性强? 14、某县两个乡在不同地块的粮食产量资料如下: 甲乡 乙乡 地块编号 平均亩产 粮食产量 平均亩产 播种面积 (公斤/亩) (公斤) (公斤/亩) (亩) 1 100 2500 100 125 2 150 15000 150 50 3 400 50000 400 75 试比较哪个乡的平均亩产高?并进一步分析原因。(提示:从两个乡产量水平不同的地块所占比重差异来分析)

15、某企业某种产品须经过4个车间的流水作业才能完成,如果第一车间的产品合格率为90%,第二车间的产品合格率为97%,第三车间的产品合格率为95%,第四车间的产品合格率为98%,求平均合格率。 16、某种产品的生产须经过10道工序的流水作业才能完成,有2道工序的合格率都为90%,有3道工序的合格率都为92%,有4道工序的合格率都为94%,有1道工序的合格率为98%,试计算平均合格率。 17、某班共有60名学生,在期末的统计学考试中,男生的平均考试成绩为75分,标准差为6分;女生的平均考试成绩为80分,标准差为6分。根据给出的条件回答下面的问题:

(1)如果该班的男女学生各占一半,全班考试成绩的平均数是多少?标准差又是多少?

(2)如果该班中男生为36人,女生为24人,全班考试成绩的平均数是多少?标准差又是多少? (3)如果该班中男生为24人,女生为36人,全班考试成绩的平均数是多少?标准差又是多少? (1) 比较(1)、(2)和(3)的平均考试成绩有何变化,并解释其变化的原因。 (2) 比较(2)和(3)的标准差有何变化,并解释其原因。

(6)如果该班的男女学生各占一半,全班学生中考试成绩在64.5分~90.5分的人数大概有多少? 18、某企业购进四批不同规格的原材料,每批价格及采购金额如下表所示,求这四批材料的总平均价格。 批次 价格(元/公斤) 采购金额(元) 第一批 35 10000 第二批 40 20000 第三批 45 15000 第四批 50 5000 合 计 — 50000 (提示:总平均价格?采购总金额)

采购总数量19、已知某公司下属三个工厂的实际产值及计划完成程度资料如下: 工厂 计划完成程度(%) 实际产值(万 元) 甲 95 99.75 乙 105 210.00 丙 115 339.25 合计 — 649

试求:三个工厂的平均计划完成程度。

(提示:计划完成程度?实际产值平均实际产值?100%;平均计划完成程度??100%计划产值平均计划产值

实际产值?3实际产值????100%??100%)?计划产值?3?计划产值第3章 数据分布特征的描述

一、单项选择题

1、B 2、C 3、C 4、D 5、C 6、B 7、C 8、A 9、D 10、A 11、B 12、C 13、A 14、B 15、C 16、D 二、多项选择题

1、AD 2、AD 3、BE 4、BD 5、ABCDE 6、ACDE 7、ABDE 8、ABC 9、DE 10、AD 11、CE 三、填空题

1、大于中位数、小于中位数 2、Me?X?N?1????2?,Me?1??N??X??2???2?X?N???1??2??? ?3、比率或速度、年平均发展速度 4、极端值、偏态分布 5、调和平均数、几何平均数、不能直接计算均值、比率数据 6、各变量值、离差平方 7、全距、最大值、最小值 8、出现次数最多、集中趋势 四、判断题

1、 √ 2、 × 3、√ 4、× 5、× 6、√ 7、 √ 8、√ 9、√ 10 × 11、√ 五、(略) 六、计算题 6.1[解]:

?(1)∵ V? ∴ ??V?X?500?0.3?150

X?2=22500

385?X22(2)???X2???5.5??38.5?30.25?8.25?2.872

N10V??X?2.872?0.5222?52.22% 5.522(X?X0)??(X?X)?NC2?(3)(P.37)因为

??(X?X)?N(X?X0)22

22(X?X0)(X?X)??22??(X?X0)??2?(X?X0)得:

NN(上式左边即是各数据对X0的方差) 若令X0?50,则各数据对50的方差为:

2(X?X0)?22??2?(X?X0)?202?(60?50)?500

N(4) ??V?X?350?0.4?140 各数据对400的标准差为:

??X?400?22??2??X?400??1402??350?400??148.66

N265770?810??X2?X2???(5)????6577?6561?16?4 N10?10?2V??X_____???XN?4?0.0494?4.94% 81_____22X???2600?100?2500?50

(6)?2?X2?X2...?....X?V??X?10010??0.2 505022(7)S2n?1??x?x???x?x??...?...n?1?.. 2n?1Sn?12784??x?x?n??1??1?50 Sn2?1166.2[解]:设X废品率

F为产量比重,则该车间三批产品的平均废品率:?FX??X?F?1%?25%?2%?35%?1.5%?40%?1.55% ?F6.3[解]:N?5000,N1?4500,N0?500 是非标志的平均数P?N14500??0.9?90% N5000是非标志的方差P?1?P??0.9?0.1?0.09 是非标志的标准差P?1?P??0.09?0.3

是非标志的离散系数V?P?1?P?0.3??0.3333?33.33% P0.96.4[解]:依题意N甲?45 X甲?78 ?甲?8 N乙?50 X乙?72

?乙?10

78?45?72?507110N?N??74.84(分) 于是两个教学班总的平均成绩X?X甲甲X乙乙??45?5095N甲N乙?X2?X2 ∴根据已知条件得出方程组 ∵ ??N2??X甲2?64?45?6084?276660??X甲 解得: ??22???X乙?264200?100?X乙?518450?2于是两个教学班总的标准差:

22??X乙276660?264200?X甲2???X2???74.84??9.604(分)

45?50N甲?N乙5.[解]:

(1)6个星期一产量的均值

100?150?170?210?150?120900???150 (吨) x1666个星期一产量的中位数

排序后产量为:100 120 150 150 170 210

N?16?1??3.5,即:中位数在第3个数据和第4个数据之间的中间位置,亦即:中为数的位置=22Me?150?1502?150 (吨) (2)非星期一产量的均值、中位数和众数的计算: 日产量(吨) 组中值(x) 天数(天)f xf 向上累计频数 100——150 125 8 1000 8 150——200 175 10 1750 18 200——250 225 4 900 22 250以上 275 2 550 24 合 计 ??. 24 4200 ?? ∴ 非星期一产量的均值x??xf4200?f?24?175(吨) 中位数的位置=

?f2?242?12 因为:向上累计频数18刚好大于12 所以150——200这一组即为“中位数所在组”, 于是: L?150 Sm?1?8 fm?10 i?50 则:非星期一产量的中位数为:

?f?Sm?1 Me?L?2f?i?150?12?8?50?170 m10因为:f?10出现次数最多,所以他所在组150——200这一组即为“众数组”,于是:f?1?8 f?1?4 i?50 则:非星期一产量的众数为: M??1O?L?f?ff?ff?f?i?150?10?8?50?162.5

?1????1??10?8???10?4?(3)星期一和非星期一产量的标准差的计算: 星期一产量的标准差的计算表:(x1?150) 变量值 100 150 170 210 150 120 ? x?x -50 0 20 60 0 -30 ??.. L?150f?10

??x?x? 22500 0 400 3600 0 900 7400 所以星期一产量的标准差为: 7400??x?x????35.12 (吨) ?1n62非星期一产量的标准差的计算表:(xx?x 组中值天数f (x) 125 8 -50 175 10 0 225 4 50 275 2 100 24 ?? ? 所以,非星期一产量的标准差为: ?175) ?x?x? 2 ?x?x?f 2?x?x?3f ?x?x?4f 2500 0 2500 10000 ??? 20000 0 10000 20000 50000 -1000000 0 500000 2000000 1500000 50000000 0 25000000 200000000 275000000 50000??x?x?f??45.64 (吨) ?2?24?f2(3)星期一产量的离散系数:V1??1?35.12?0.2341

x1150 非星期一产量的离散系数:V2??2?45.64?0.2608

x2175因为:V1?V2,所以非星期一产量的离散程度要大一些。 (4)非星期一产量数据的偏态系数和峰度系数:

3(x?x)f??fa3??3415000001500000??x?x?f=0.66>0 呈“右偏分布” ???3324??45.64?2281645.396?f??3275000000275000000??x?x?f???2.64<3 呈“扁平分布” a4?44f?104134295.924???45.64??6.6[解]:A?D甲??X甲?X甲?X甲?X甲 ....?N甲?N甲A?D甲??X甲?X甲?3?X乙?X乙因为:?

?2....................A?D甲?A?D乙所以:N甲??X甲?X甲A?D甲?3?X乙?X乙3?N乙?A?D乙??6N乙

11A?D乙A?D乙22表明:只有在甲工厂的工人人数是乙工厂工人人数6倍的条件下,上述情况才能发生。

6.7[解]:有关计算表(见后面)

因为:400——500这一组出现次数42为最多,故它为“众数组” 于是:L?400 f?42 f?1?30

f?1?18 i?100

则:这120家企业利润的众数为:

MO?L?f?f?142?30?i?400??100?433.33(万元)

?f?f?1???f?f?1??42?30???42?18?企业数 F 19 30 42 18 11 120 累计频数 19 49 91 109 120 —————— 附表1: 按利润分组(万元) 组中值X 200——300 300——400 400——500 500——600 600以上 合 计 ?F120?中位数位置=22 250 350 450 550 650 —— ?60 因为累计频数91>60 所以其所在组400-500这一组就是“中位数所在组”,于

是L?400 Sm?1?49

fm?42 i?100

则这120家企业利润的中位数为:

?F?Sm?160?492?i?400??100?426.19(万元 Me?L?42fm附表2:(接附表1) 组中值(X) 企业数(F) 250 19 350 30 450 42 550 18 650 11 合 计 120 XF 4750 10500 18900 9900 7150 51200 X?X ?X?X?2F ?X?X?3F ?X?X?F 4 -176.67 -76.67 23.33 123.33 223.33 593033.4891 176348.667 22860.1338 273785.2002 548639.1779 1614666.668 -104771226.5 -13520652.3 533326.9216 33765928.74 122527587.6 38534964.4616 18509933000 1036628412 12442517.08 4164351992 27364086000 51087441921.08 所以:这120家企业利润的均值为:X?这120家企业利润的标准差为:

?XF51200??426.67(万元) 120?F??1614666.668??X?X?F??115.998?116

120?F2这120家企业利润数据分布的偏态系数为:

.461638534964.4616??X?X?F38534964????0.2057?0.21>0 a333187307520120??116??F??3故:该组数据呈“正(右)偏分布”。

这120家企业利润数据分布的峰度系数为:

1.0851087441921.08??X?X?F5108744192???2.35<3 a4?24F?21727672000120???116??4故:该组数据呈“扁平分布”。

1、某电池的寿命(单位:分钟)的95%置信区间是430<μ<470。假设这个结果是根据一个样本容量为100的样本得出的。试问:

(1) 样本的均值是多少 (2) 样本的标准误差是多少

(3) 如果置信区间419<μ<481是从相同样本数据得出的,置信度是多少(置信度为68.27% 90%

95% 95.45% 99.73%时,正态分布概率值分别是(1 1.645 1.96 2 3)

2、调查公司想要估计全日制的大学生每周花在看电视上的时间(单位:小时)平均有多少小时。当极限误差为0.25小时时,计算估计均值所需要的样本容量。(假设想要达到的置信度为95%。标准差估计为1.87小时。)

3、一个样本中包含75台若干年前购买的电视机。这些电视机的置换时间为12.2年,标准差为1.1年。试对那一时期所有电视机的平均置换时间构建一个95%的置信区间。怎样才能减小这一区间。 4、一个样本容量为400的随机样本取自均值μ和标准差σ均未知。已算出

?x?2280,

?x2?38532。求μ的95%的置信区间。

5、当你选购一种商品时,考虑得最多的是什么?是价格还是商品的质量?某市场调查公司调查了2000名成年人,结果又64%的人说他们主要根据价格做出购买决策。

(1) 试对根据价格做出购买决策的成年人的真正百分率构造95.45%的置信区间。 (2) 对此区间做出解释

(3) 如果将置信度从95.45%降到90%,(1)中的置信区间将会发生什么变化。

6、一个研究者想要估计年龄在12-18岁之间、在学校使用计算机的学生比例。如果他想要99.73%的把握程度相信极限误差为5%,必须要对多少名随机选择的学生进行调查? (1) 假设我们将先前的一项研究中得出的百分比82%作为p的估计值 (2) 假设我们事先没有信息可以提供p的可能值 7、某厂对当年生产的产品进行质量检查,从50000件产品中随机抽取200件产品,发现其中有15件不合格,试应用恰当的方法在95.45%(Z=2)的概率保证下,对全部不合格产品作可能范围估计。

8、某进出口公司出口一种名茶。按规定这种茶叶每包重量应不低于150克,现用不重复抽样的方法抽取1%进行检验,其结果如下

每包重量(克) 包数(包) 148—149 149—150 150—151 151—152 合计 要求: ①试以0.9973的概率(Z=3)估计这批茶叶平均平均每包的重量范围。以便确定是否达到规定要

求。

②以95%的把握程度估计这批茶叶包装合格率的范围

9、某地区粮食播种面积共8000亩。随机抽取100亩进行调查,结果平均亩产量为580公斤,亩产量的标准差为40公斤,试以99.73%的置信度(Z=3)估计该地区粮食平均亩产量的可能范围和粮食总产量的可能范围。

10、一个容量为n=16的随机样本来自总体均值和方差未知的正态分布总体。如果样本有均值x?27.9和标准差s=3.23,则总体均值的95%的置信区间是多少?在重复研究中,n多大时,才能使得总体的允许误差为1.25?这个样本容量数,对于95%的置信区间要求的允许误差为1.25能达到吗? 11、一个从事市场研究的公司想知道某市内至少有一个成员看过某种报纸广告的家庭占多大比例。为了估计这个比例,首先要确定抽多少个家庭做调查。该公司希望以90%的置信水平对这个比例作出估计,并使估计值处在真正比例附近0.04范围内。在一个由15个家庭组成的样本中,有35%的响应者指出他们家中有某个

10 20 50 20 100 人看过这种广告,试问应取多大的样本?

12、设已知某果园某种果树单株产量按正态分布。随机抽取6株计算其年产量(单位:kg)为:221.2 190.4 201.9 205 256.1 236

试以95%的置信水平,估计全部果树的平均年产量的置信区间。

13、某灯泡厂为了使生产的螺丝口和卡口灯泡的比例能很好地适应用户需要,从全市所有电灯中随机抽出1500盏灯作为样本。查得其中螺丝口灯头占15%,试以95%的置信度系数求卡口灯头的真正百分比的置信区间。

第8章 参考答案 一、单项选择题

1、B 2、C 3、C 4、B 5、A 6、D 7、B 8、C 二、多项选择题

1、ABCD 2、BCE 3、ABE 4、ABC 5、ACE 6、 ABCD 7、BD 三、填空题

1、随机 2、4 3、正态 四、判断题

1、× 2、√ 3、√ 4、× 5、√ 6、× 7、× 8、× 9、× 10、√ 11、√ 12、√ 13、× 14 、× 15、√ 16、√ 17、√ 18、× 19、√ 五、(要点)

1、抽样框是包含全部抽样单位的名单框架。主要有三种形式:名单抽样框;区域抽样框;时间表抽样框。 2、样本估计量的标准差定义为抽样平均误差;抽样平均误差的平方为抽样方差;一定概率下抽样误差的可能范围,称为极限误差 3、(1)总体方差(或总体标准差) (2)允许误差范围 (3)置信度 (4)抽样方法

(5)抽样组织形式

4、样本指标又称样本统计量与或估计量。 标准为:无偏性;有效性;一致性

5、一是矩估计法。其基本思想是:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,样本矩依概率收敛与总体矩。因此,只要总体x的k阶原点矩存在,就可用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的估计量。

二是极大似然估计法。其基本思想是:设总体分不函数形式已知,但又未知参数,未知参数可以取很多值,在未知参数的一切可能取值中选一个使样本观测值出现的概率为最大的参数作为估计量。 六、计算题

1、(1)x??x?430,?x?(470?430)/2?20, x?20?430 解得:x?450

(2)?x?Z??(x),即:20?1.96??(x)

2解得:样本的标准误差?(x)?10.204

(3)如果置信区间419<μ<481是从相同样本数据得出的,

则:?x?(481?419)/2?31,?x?Z??(x),即31?Z??10.204

22解得:Z??3.04?3,即:置信度是99.73%。

22、条件分析:本题为估计总体均值时所需的样本容量。由于N不知,视为重复抽样。

z2?21.962?1.872n???214.94?215(人) 22?x0.253、条件分析:总体方差不知,但为大样本。此时样本均值近似服从正态分布。由于N不知,视为重复抽样。 所有电视机平均置换时间的置信区间为:

x?Z??(x)???x?Z??(x)222即:12.2?1.96?1.11.1???12.2?1.96?75752

即:[11.95105,12.44895]年

怎样减小区间——降低置信度或者增加样本容量!

4、条件分析:总体方差不知,但为大样本。此时样本均值近似服从正态分布。由于N不知,视为重复抽样。

?x?s2x2280??5.7n40022?2280???x?238532??x? 400n???64n?1399?s264?(x)???0.4n400置信区间为:5.7?1.96?0.4?5.7?0.784即: [4.916;6.484] 5、(1)P=64%,Z?2?2

64%?36% 2000置信区间:P?p?Z??(P)?64%?2?2即:[61.85%,66.15%](2)我们有95.45%的把握相信从61.85%到66.15%这个区间实际包含了p的真实值。

(3)此时区间变窄

6、解题分析:此题为估计总体比例时所需的样本容量。由于N不知,故视为重复抽样。

Z?/2P(1?P)32?82%?18%(1)n???531.36?532(名) ?2p5%2Z?/2P(1?P)32?0.5?0.5(2)n???900(名)?2p5'、条件分析:由于N已知,视为不重复抽样。

首先求不合格产品率的置信区间:

7.5%?92.5 0?(1?)

20050000即:[3.85%;11.15%]7.5%?2?则全部不合格产品的可能范围为:[3.85%×50000;11.15%×50000],即[1925;5575]件

8、条件分析:总体方差不知,但为大样本。此时样本均值近似服从正态分布。由于N可推知,故视为不重复抽样。N=100/1%=10000(包) 样本标准差:

s??(x?x)2?n?1(148.5?150.3)2??(151.5?150.3)2?0.8762整批茶叶平均每包重量范

100?1围为:

??x?Z??(x)?x?Z?22?2n(1?)nN

?150.3?3?0.87622100?(1?)?150.3?0.2610010000即:[150.04;150.56],达到了规定要求

(2)样本包装合格率:p?70?70%

100整批茶叶包装合格率的范围为:

P?p?Z??(P)?p?Z?22P(1-P)n(1?)nN

70%?300?70%?1.96??(1?)?70%?8.94010000即:[61.06%;78.94%]

9、条件分析:总体方差不知,但为大样本。此时样本均值近似服从正态分布。由于N已知,故视为不重复抽样

平均亩产量的可能范围:402100??x?Z??(x)?580?3?(1?)?580?11.9210080002即:[568.08;591.92]公斤总产量的可能范围:[568.08×8000;591.92×8000],即:4544640~4735360公斤之间

10、(1)条件分析:正态总体、总体方差不知,且为小样本。此时样本均值服从自由度为16-1的t分布。由于N不知,故视为重复抽样 总体均值的置信区间为:

??x?t??(x)?x?t?22s3.232?27.9?2.1315??27.9?1.72 16n即:[26.18;29.62](2)样本容量:

z2?21.962?3.232n???25.7?2622?x1.25(3)如果n?26 则

??2.0595?3.232?1.3 ?1.2526“允许误差为1.25”不能达到。

11、解题分析:此题为估计总体比例时所需的样本容量。由于N不知,故视为重复抽样。

2Z?1?P)1.6452?35%?65% /2P(n???384.76?385(个)22?p0.0412、条件分析:正态总体、?未知、小样本。此时样本均值服从自由度为6-1的t 分布。 经计算得:x2??xn?218.43kg;s??(x?x)2n?1?24.39kg

全部果树平均年产量的置信区间:

s??x?t??(x)?x?t?n22

24.39?218.43?2.5706??218.43?25.596即:[192.84;244.02]公斤

13、p?85%,Z??1.96,由于N未知,故视为重复抽样

2卡口灯头真正百分比的置信区间:

P?p?Z??(p)?p?Z?22P(1-P)85%?15%?85%?1.96?n1500

即:[83.19%,86.81%]第九章 统计指数

(一)单选题

1、如果销售额增加10%,零售物价指数下降5%,则销售量( )

A、增加5% B、增加10% C、增加15.79% D、无法判断 2、综合指数是依据以下方式来编制的

A、先对比,后平均 B、先综合,后对比 C、先除后乘 D、先加后除 3、平均指数是依据以下方式来编制的

A、先对比,后平均 B、先综合,后对比 C、先除后乘 D、先加后除 4、通常在指数体系的完整框架中,质量指标指数是以( )计算的。

A、拉氏公式 B、帕氏公式 C、马-埃公式 D、费雪公式 5、通常在指数体系的完整框架中,数量指标指数是以( )计算的。

A、拉氏公式 B、帕氏公式 C、马-埃公式 D、费雪公式 6、某商店销售多种商品,报告期与基期相比销售额未变,但销售量增长了15%,则销售价格指数为( ) A、115% B、100% C、85% D、86.96% 7、编制平均指数的基本问题之一是( )

A、指数化指标的选择问题 B、合理加权问题 C、同度量因素的固定问题 D、以上答案均错

8、用于比较不同地区或国家各种商品价格综合差异程度的指数是( )

A、个体价格指数 B、时间价格指数 C、空间价格指数 D、平均价格指数 9、我国的消费者价格指数(CPI)是采用( )来编制的。

A、固定加权算术平均的形式 B、固定加权调和平均的形式 C、固定加权几何平均的形式 D、简单算术平均的形式

10、采用标准比值法编制综合评价指数时,个体指数的计算方法为( )

A、参评指标标准值比相应指标报告期值 B、参评指标报告期值比相应指标基期值 C、参评指标计划值比相应指标标准值 D、参评指标实际值比相应指标标准值

11、P表示商品价格,q表示商品销售量,则?p1q1??p0q1的意义是综合反映多种商品的( ) A、销售量变动的绝对额 B、价格变动的绝对额

3 400 50000 74.08 100.00 合计 —— 67500 100.0 ——— 125 400 75 30000 60 50000 100 100 ——— 250 —— 250 — 甲乡的平均亩产:x1??m67500??270 (公斤/亩) m250?x1乙乡的平均亩产:x2??x2f50000??200 (公斤/亩) 250?f结果表明:甲乡的平均亩产量明显高于乙乡。主要原因是:平均亩产量偏低的1号和2号地块的产量累计比

重甲乡仅为25.92%,而乙乡则高达40%;反之,平均亩产量最高(400公斤/亩)的3号地块的产量比重甲乡高达74.08%,而乙乡则只达到60%,从而导致甲乡的平均亩产高于乙乡。

6.15[解]:由于4个车间属于流水线作业,每一个车间的产品合格率的高低,对后续车间产品的合格率至关重要。该企业产品总合格率是4个车间产品合格率的连乘积。因此,宜采用“简单几何平均法”。于是该企业产品的平均合格率为:

4GM?NX1?X2?....?XN?90%?97%?95%?98%?94.95%

6.16[解]:此题属于“加权几何平均法”。该产品的平均合格率为:

fff?fGM?X11?X22?...?XNN?10?90%???92%???94%???98%?

2341 =92.97%

6.17[解]:依题意知:N?60 X男?75 ?男?6 X女?80 ?女?6 (1)当N男?N女?N?30时,则: 2?N男?X女?N女75?30?80?30全班的平均成绩X?X男??77.5

?60N男N女?X2因为:标准差???X2

N所以:

22?X男?X男2对于男生而言:?男??X男......?6??752

30N男2解此方程得:?X男 ?16983022?X女?X女2对于女生而言:?女??X女........?6??802

30N女2?193080 解此方程得:?X女于是,全班考试成绩的标准差为:

22??X女169830?193080?X男???X2??77.52?6.5(分)

60N男?N女(2)当N男?36 N女?24时,则全班考试成绩的平均数为:

?N男?X女?N女75?36?80?24X?X男??77(分)

36?24N男?N女与前面相同的道理,可以推导出:

2?36?36?752?36?1296?202500?203796??X男 ?22?36?24??24?864?153600?15446480??X女于是全班考试成绩的标准差为:

22??X女203796?154464?X男???X2??772?6.48(分)

36?24N男?N女(3)当N男?24 N女?36 时,则全班考试成绩的平均数为:

75?24?80?36N?NX?X男男X女女??78(分)

24?36N男?N女2?36?24?752?24?864?135000?135864??X男同理可以推导出:? 22??X女?36?36?80?36?1296?230400?231696则全班考试成绩的标准差为:

22??X女135864?231696?X男???X2??782?6.48(分)

24?36N男?N女(4)比较:当“男女生人数各占一半”时,全班平均成绩为(70+80)÷2=77.5由于“男生的平均成绩”

低于“女生的平均成绩”,因而当“男生人数”多于“女生人数”时,则势必会拉低全班的平均成绩;而当“女生人数”多于“男生人数”时,则又会拉高全班的平均成绩。

(5)情况(2)和(3)相比,二者的“标准差”均等于6.48。这是因为:“男生考试成绩的标准差”等于“女生考试成绩的标准差”,均为6分,改变“男女生的人数比例”并不会改变“标准差的大小”。 (6)根据情况(1)计算可知:在“男女生人数各占一半”的条件下,全班考试成绩的均值X?77.5,标准差??6.5。又根据经验可知:全部数据落在“X?2?”范围内的“概率=95%”。于是本题中:

X?2??77.5?2?6.5?77.5?13,即:(64.5,90.5),进而表明当“男女生人数各占一半”时,全部考试

成绩有95%的人数考试成绩在64.5分至90.5分之间。

则:当男女生人数各占一半时,全班学生考试成绩在54.5分至90.5分之间的大致人数=60?95%?57人。 18、解:列计算表如下: 批次 价格(元/公斤) 采购金额(元) 采购量(公斤) x m m/x 第一批 35 10000 286 第二批 40 20000 500 第三批 45 15000 333 第四批 50 5000 100 合 计 — 50000 1219 平均每公斤价格为:xH

m?==50000/1219=41.02(元/公斤)

m?x19、解:此题不能直接计算加权均值,故变形为调和平均数。

平均计划完成程度?649?108.17`0?实际产值?100%??m?99.75?210?339.25m99.75210339.25?计划产值???x0.951.051.15

?第4章 假设检验

一、单项选择题

1、假设检验的基本思想是( )

A、带有概率性质的反证法 B、小概率事件的出现是合理的 C、对总体均值的检验 D、对总体方差的检验 2、假设检验的显著性水平?的一般取值为( )

A、大于0.10 B、大于0.01 C、小于0.80 D、不超过0.10 3、样本容量不变,犯第一类错误的概率减小,则犯第二类错误的概率( ) A、增大 B、减小 C、不变 D、变化不定

4、正态总体方差未知,且样本容量小于30,检验总体均值的统计量应取( ) A、Z?x??0Sn~N(0,1) B、Z?2x??0?n~N(0,1)

C、??2(n?1)S?02~?(n?1) D、t?2x??0Sn~t(n?1)

5、假设检验中的P值的意义为( )

A、拒绝原假设的最小显著性水平 B、拒绝原假设的最大显著性水平 C、接受原假设的最小显著性水平 D、接受原假设的最大显著性水平 二、多项选择题

1、实际推断原理的要件是( )

A、实验的次数 B、实验的次数以一次为限 C、事件发生的概率很小 D、事件不发生是主观的认定 E、事件不发生是客观事实

2、关于假设检验的显著性水平?,以下说法正确的是( ) A、原假设H0为真却被拒绝的概率 B、原假设H0不真被拒绝的概率 C、?改变检验的结论必随之改变 D、?减小,拒绝原假设的概率减小 E、?减小,犯采伪的错误必随之增大

3、关于假设检验中第一、第二类错误的概率?,?,以下的说法正确的是( ) A、同时减小?,?的方法是增大样本容量 B、????1

C、拒真的代价大,取较小的?而容忍较大的? D、(1??)成为检验功效 E、采伪的代价大,取较大的?以求较小的?

4、以下属于参数假设的有( )

A、H0:??100 B、H0:X~N(10,25) C、H0:??1 D、总体X ,Y 有相同的分布 E、总体X ,Y 相互独立 5、对于假设H0:??5,H0:??5的检验,以下说法正确的有( ) A、这是一个单侧检验 B、这是右侧检验 C、这是左侧检验 D、这是双侧检验 E、检验统计量的数值大于上侧位临界值时拒绝原假设 6、关于假设检验中的P 值,以下说法正确的是( )

A、P为拒绝原假设的最小显著性水平 B、接受原假设的最大显著性水平

2C、如果??P,在显著性水平?下拒绝原假设 D、P 值越小拒绝原假设的理由越充分 E、如果?≤P ,则在显著性水平?下接收原假设 三、填空题

1、某一假设检验为左侧检验,其原假设是H0:??10,则备择假设为_________________________________。

2、原假设拒绝域和接受域的分界点坐标值,称为_______________________________________________。

3、假设检验的四种情况是:____________________________、_______________________、__________________________和___________________。

4、双侧检验的拒绝域位于统计量分布曲线的____________________________,右侧检验的拒绝域位于___________________________________,左侧检验的拒绝域位于统计量分布曲线的_________________________________。 5、“接受原假设”的含义是_______________________________________________________________________。

6、如果我们希望提高“拒绝原设”的说服力,那么应该_________________________________?的数值。 7、双侧检验的P值等于_____________________________________________________________________________________________________。

8、如果改变显著性水平?,假设检验的结论_________________________________________,因此假设检验又称为__________________________________________________。 四、判断题

1、假设检验一定有犯错误的风险。 ( ) 2、假设检验的结论具有100%的准确率。 ( ) 3、显著性水平?=0.10,表示拒绝原假设的概率为10%。 ( ) 4、?减小?必然增大,故而假设检验中的犯第一、第二类错误互为逆事件。 ( )

5、建立假设时遵行的原则是“不轻易拒绝原假设”。 ( ) 6、改变假设检验的显著性水平,检验的结论有可能改变。 ( )

7、在假设检验中,减小一类错误的概率势必以另一类错误的概率增加为代价,除非扩大样本容量。 ( )

8、假设检验控制错误的方法是,先固定?,然后选择(1??)最小的检验方法。( )

9、要提高“拒绝原假设”的说服力,应增大显著性水平?的数值。 ( ) 10、“拒绝原假设”和“接受原假设”具有相同的可靠程度。 ( )

11、在显著性水平?=0.05之下,接受原假设等价于统计量的数值落入置信度为0.95的置信区间。 ( )

12、假设检验中的P值越大,拒绝原假设的理由越充分。 ( ) 五、简答题

1、假设检验的思想及步骤 2、假设检验中的错误

3、假设检验的显著性水平 4、假设检验的局限性

5、误用Z 统计量检验替代T 统计量的后果 六、计算分析题

1、已知某种零件的尺寸服从正态分布N(23.02,1.52),现从这一批零件中任抽七件进行测量,测得尺寸数据(单位:mm)如下:

21.00 22.04 22.32 24.01 24.68 25.02 21.63 能否认为这批零件的平均尺寸仍为23.02mm(??0.05)。

2、假设英语四级考试中学生成绩服从正态分布。现随机抽取25名学生的考试成绩,算得平均分为67分,标准差为10分。在显著性水平??0.01下,可否认为全体学生的平均考试成绩为72分?

3、某市统计局调查了30个集市上的鸡蛋价格,测得平均价格为6.50元/千克,已知以往的鸡蛋价格一般为5.80元/千克。假定该市的鸡蛋售价服从正态分布N(?,0.64),假定方差不变,能否认为当前鸡蛋的平均价

格高于以往?(??0.01)。

4、从一批保险丝种抽取8根,测得其熔化时间X(单位:毫秒),得如下数据: 50 48 50 53 51 55 52 51

设X 服从正态分布,质量标准为?=35。问这批产品是否合格(??0.05)?

5、某市声称人口普查的差错率为0.52?,为了检验该结果是否可靠,随机抽查了了2000人,结果发现漏登2人,问可否认为原来的差错率正确(??0.05)?

第4章 参考答案 一、 单项选择题

1、A 2、D 3、A 4、D 5、A 二、多项选择题

1、BCD 2、ADE 3、ACDE 4、AC 5、ABE 6、ACDE 三、填空题

1、H1 :??10 2、临界值

3、H0真,被接受、H0不真,被接受、H0真,被拒绝、H0不真,被拒绝 4、左右两侧、右侧、左侧 5、“无法否定原假设”或“无法拒绝原假设”

6、减小 7、显著性水平的一半 8、可能改变、显著性检验 四、判断题 1、(√) 2、(×) 3、(√) 4、(×) 5、(√) 6、(√) 7、(√) 8、(√) 9、(×) 10、(×) 11、(√) 12、(×) 五、简答(略) 六、计算题 1、H02:??23.02;H1:??23.02

因为,|Z|=|-0.1058|=0.1058

因为,|t|=|-2.5|=2.50<2.797=t0.005(24),所以,接受H0,可以认为平均分是72分。 3、H0:??5.8;H1:??5.8

因为,t=4.7912>2.33=z0.01 ,所以,拒绝H0,可以认为鸡蛋的平均价格高于以往。 4、H0:?2?35;H1:?2?35

2因为,?5、H0?0.8999?2.167,所以,拒绝H0,可以认为产品质量合格。

:P?0.52%;H1:P?0.52

?1.96,所以,接受H0,可以认为原来的差错率正确。

第5章 方差分析

2因为,|Z|=0.6792

1、方差分析是对多个正态总体( )这一假设进行检验。

A、方差相等 B、方差相异 C、均值相等 D、均值不等 2、方差分析使用的统计量F( )

A、是正态分布 B、是正偏态的 C、是负偏态的 D、取值小于零

3、设单因素方差分析中误差项离差平方和为125.00,水平项离差平方和为375,那么总离差平方和为( )

A、250 B、125.00 C、375.00 D、500

4、因素A 共4个水平,每个水平下重复5次实验,数据的平方和为1250,数据总和为150,A、125 B、-125 C、无法计算 D、1400

5、在单因素方差分析中,已知总离差平方和的自由度为24,水平项离差平方和的自由度为7,那么误差项离差平方和的自由度为( )

A、17 B、24 C、7 D、31

6、在一个双因素方差分析中,FA =2.300,FB =4.55相应的P- value依次为0.11和0.0018, 那么结论是( )

A、A的作用显著,B的作用不显著 B、A的作用不显著,B的作用显著 C、A的作用不显著,B的作用不显著 D、A的作用显著,B的作用显著 7、已知SST?1440,SSA?700,SSB?560,fT?30,fA?6,fB?8,那么FA=( ) A、1440 B、700 C、116.67 D、10.37

8、如果MSA?12.25,fA?4,MSB?8.00,fB?5,MSE?2.25,fE?16,那么SST( ) A、无法计算 B、22.5 C、25 D、125 二、多项选择题

1、方差分析假定的内容有( )

A、数据来自正态总体 B、数据来自二项总体 C、各总体相互独立 D、各总体不相关 E、各总体方差相等

2、一个单因素方差分析中,因素的水平为5,每个水平下的样本容量是6,SST =120,SSA=75 那么以下正确的是( )

A、n=30 B、dfA = 4 C、MSE=1.8 D、dfT =29 E、F=10.42

3、在一个单因素方差分析问题中,因素的水平为4,每个水平下的样本容量是5,那么下列说法正确的是( )

A、检验的原假设为H0:?1??2??3??4 B、检验的临界值为F?(4,5) C、检验的原假设为H0:?1??2??3??4??5 D、检验的临界值为F?(3,16) E、检验的统计量为F?SSA3 SSE164、一个因素A有6水平,因素B有4水平的双因素方差分析中,以下正确的有( ) A、数据共24个 B、误差平方和的自由度为15 C、SSA的自由度为6 D、SST的自由度为3 E、SST=SSA+SSB+SSE

5、一个因素A有7水平,因素B有8水平的双因素方差分析中,SST=225,SSA=78,SSB=140以下正确的有( )

A、SSE=2 B、SSE=7 C、FA?78 D、MSE=0.1667 E、因素A的作用显著 三、填空题

1、方差分析的英文缩写为:_____________________________________________________。

2、方差分析认为数据间的差异来自:__________________________和_________________________________________________ 。

3、单因素方差分析中,A共6个水平,SSA=___________________________;自由度df=______________________________。 4、单因素方差分析问题中,F= 12.24,P-value=0.00566,表示拒绝原假设的概率为____________。 5、因素A设4水平,因素B设6水平的双因素方差分析中,SSE的自由度为____________________。

6、某一双因素方差分析的计算结果为:F A =3.2101,FB=4.2254,P-value依次为0.1213,0.01023,那么结

论应为_________________________________________________________________________________。 四、判断题

1、水平间的方差只包含有系统性因素。 ( ) 2、F分布的第一自由度越小,它右偏态的程度越大。 ( )

3、方差分析,将总离差平方和分解为水平项离差平方和与误差项平方和,同时也将总的自由度分解为各个平方和的自由度之和。 ( )

4、单因素方差分析的检验统计量为 F?SSASSE ( )

5、方差分析输出结果总的P-value越大,越应该拒绝原假设。 ( ) 6、方差分析每个水平下设置的样本容量都必须相等。 ( ) 7、双因素方差分析的两个因素间不会产生交互作用。 ( ) 8、因素A共6个水平,因素B共5个水平,那么随机误差项的自由度为20 ( ) 9、如果方差分析的结论是拒绝原假设的话,意味着所有水平之间存在着显著差异。 ( ) 10、如果统计量F =12.25 ,而F crit为3.054,那么因素的作用不显著。 ( ) 五、简答题

1、方差分析的原理 2、方差分析的原假设及其被拒绝的意义。

3、双因素方差分析中SSA 、SSB、SSE与SST的内容及关系 4、方差分析的步骤 六、计算分析题

1、设有五种治疗荨麻疹的药,为了比较它们的治疗效果,将30个病人随机分为5组,每组6人进行试验,结果如下: 药物A A1 A2 A3 A4 A5 治 6 4 6 7 9 愈 8 6 4 4 4 总和 T=169 天 7 6 4 6 5 数 7 3 5 6 7 总评均 x?5.63 xij 10 5 3 3 7 8 6 2 5 6 和Ti 46 30 24 31 38 平均xi 平方和 7.675.004.005.176.33 362 158 106 171 256 1053 试检验五种药物的疗效有无显著差异(??0.01)

2、对四种小麦进行产量(单位:kg/小区)的对比实验,假设各小区地力相同,在同样的管理条件下,得如下数据: 品种 A1 A2 A3 A4 序号 1 32.3 33.3 30.8 29.3 2 34.0 33.0 34.3 26.0 3 34.3 36.3 32.3 29.8 4 35.0 36.9 5 36.5 分析不同小麦品种小区产量有无显著差异(??0.01)。

3、某种商品不同的装潢,在五个地区销售,资料如下: 地区(因素 装潢(因素A) B) A1 A2 A3 B1 41 45 34 B2 B3 B4 B5 53 51 44 54 48 46 55 43 45 43 39 51 检验商品的不同装潢和在不同地区销量之间是否有显著差异(??0.05) 第5章 参考答案 一、单选择题

1、C 2、E 3、D 4、A 5、A 6、B 7、D 8、D 二、多项选择题

1、ACE 2、ABCDE 3、ADE 4、ABE 5、BCDE 三、填空题

1、ANOVA 2、系统误差、随机误差 3、??(xj?x)、5

4、0.00566 5、15 6、A的作用不显著,B的作用显著 四、判断题 1、(×) 2、(√) 3、(√) 4、(×) 5、(×) 6、(×) 7、(×) 8、(√) 9、(√) 10、(×) 五、简答(略) 六、计算题

1、因为,FA?5.55?4.18?F0.01(4,25),所以,不同药物的疗效间存在显著差异。 2、因为,F?289.3471663?9.0576?3.59?F0.05(3,11),所以不同品种小麦的小区产量将存在显著差异。

36.1688341174.13352?1.32?4.46?F0.05(2,8),所以,不同装潢间的销量差异不显著。

224.594383、因为,FA?又因为,FB?191.00554?1.7010?3.84?F0.05(4,8),所以,不同地区间的销量差异不显著。

224.59438第6章 相关与回归分析

一、单项选题题

1、当自变量X减少时,因变量Y随之增加,则X和Y之间存在着( ) A、线性相关关系 B、非线性相关关系 C、正相关关系 D、负相关关系 2、下列属于函数关系的有( )

A、身高与体重之间 B、广告费用支出与商品销售额之间 C、圆面积与半径之间 D、施肥量与粮食产量之间

3、下列相关程度最高的是( )

A、r=0.89 B、r=-0.93 C、r=0.928 D、r=0.8 4、两变量x与y的相关系数为0.8,则其回归直线的判定系数为( ) A、0.80 B、0.90 C、0.64 D、0.50 5、在线性回归模型中,随机误差项被假定服从( )

A、二项分布 B、t分布 C、指数分布 D、正态分布 6、物价上涨,销售量下降,则物价与销售量之间的相关属于( )

A、无相关 B、负相关 C、正相关 D、无法判断 7、相关分析中所涉及的两个变量( )

A、必须确定哪个是自变量、哪个是因变量 B、都不能为随机变量 C、都可以是随机变量 D、不是对等关系

8、单位产品成本y(元)对产量x(千件)的回归方程为:yt?100?0.2xt,其中“—0.2”的含义是( )

A、产量每增加1件,单位成本下降0.2元 B、产量每增加1件,单位成本下降20% C、产量每增加1000件,单位成本下降20% D、产量每增加1000件,单位成本平均下降0.2元 E、产量每增加1000件,单位成本平均下降20% 二、多项选择题

1、下列说法正确的有( )

A、相关分析和回归分析是研究现象之间相关关系的两种基本方法 B、相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况 C、回归分析可以不必确定变量中哪个是自变量,哪个是因变量 D、相关分析必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量 E、相关分析中所涉及的变量可以都是随机变量,而回归分析中因变量是随机的,自变量是非随机的

2、判定现象之间有无相关关系的方法有( )

A、计算回归系数 B、编制相关表 C、绘制相关图 D、计算相关系数 E、计算中位数

3、相关关系按相关的形式可分为( )

A、正相关 B、负相关 C、线性相关 D、非线性相关 E、复相关 4、在直线回归方程yt=?1+?2Xt中,回归系数?2的数值( )

A、表明两变量之间的平衡关系 B、其正、负号表明两变量之间的相关方向 C、表明两变量之间的密切程度 D、表明两变量之间的变动比例 E、在数学上称为斜率 5、下列那些项目属于现象完全相关( )

A、r=0 B、r= —1 C、r= +1 D、y的数量变化完全由X的数量变化所确定 E、r=0.98

6、在回归分析中,要求所涉及的两个变量x和y( )

A、必须确定哪个是自变量、哪个是因变量 B、不是对等关系 C、是对等关系

D、一般来说因变量是随机的,自变量是非随机变量 E、y对x的回归方程与x对y的回归方程是一回事

7、下列有相关关系的是( )

A、居民家庭的收入与支出 B、广告费用与商品销售额 C、产量与单位产品成本 D、 学生学习的时间与学习成绩 E、学生的身高与学习成绩 8、可决系数r2=86.49%时,意味着( )

A、自变量与因变量之间的相关关系密切 B、因变量的总变差中,有80%可通过回归直线来解释 C、因变量的总变差中,有20%可由回归直线来解释 D、相关系数绝对值一定是0.93 E、相关系数绝对值一定是0.8649 三、填空题

1、相关系数r的取值范围为 。 2、可决系数的取值范围为 。

3、客观现象之间的数量联系存在着两种不同的类型:一种是 关系;另一种是 关系。 4、已知r=0.90,x=20,y=40,又知?y是?x的3倍,则Y对X的回归直线方程为 。 5、若已知?(x?x)2是?(y?y)2的2倍,?(x?x)(y?y)是?(y?y)2的1.2倍,则相关系数r等于 。 四、判断题

1、当自变量X按一定的数量变化时,因变量Y也相应随之等量变化,则X和Y之间存在着线性相关关系。

?????( )

2、可决系数是判断回归模型拟合优度优劣最常用的数量指标,但不是最佳指标。( ) 3、样本相关系数是总体相关系数的一致估计量。( ) 4、若有线性回归方程Y(元)=34.5+7.8X(元),则表明当X增加一元时,Y增加7.8元。( ) 5、若有线性回归方程Y(元)=160-52.5X(件),则表明当X增加一件时,Y平均减少52.5元。( ) 6、可决系数越大,则模型对样本的拟合程度越差。( ) 7、可决系数r2=0时,SSE=SSR。( ) 8、数学上可以证明,S

2?e=

2tn?2是?2的无偏估计。( )

9、回归估计标准误S越小,表明实际观测点与所拟合的样本回归线的离差程度越大,即回归线的代表性较

差。( )

10、r=0时,表明两个变量之间不存在任何形式的相关关系。( ) 11、对于简单线性回归模型,相关系数r的平方等于可决系数。( ) 12、变量间的相关关系也就是函数关系。( )

13、逻辑上没有关系,但却在数值上相互依存的相关关系称为“伪相关”。( ) 14、最小二乘法估计的样本回归直线yt=?1+?2Xt一定通过点(X,Y)。( ) 15、所有样本观测点全部在最小二乘法估计的样本回归直线yt=?1+?2Xt上。( )

16、最小二乘法适用的前提是Y与X之间的关系确为Y=a+bX。( ) 17、对于可划为线性模型的非线性回归问题,一般先划为线性模型,然后再用最小二乘法估计参数。( ) 18、一元线性回归方程的回归系数?2的符号与相关系数的符号完全一致。正号表示正相关,负号表示负相关。( )

19、Y倚X的回归方程与X倚Y的回归方程是一回事。( )

20、r=0时,只是表明两变量之间不存在线性相关关系,有可能存在非线性相关关系。( ) 21、相关分析中,所涉及的两个变量都可以是随机变量。( )

22、相关系数是在所有情况下,用来说明两个变量相关关系密切程度的统计分析指标。( ) 23、两个变量中不论假定哪个变量为自变量X,哪个变量为因变量Y,都只能计算出一个相关系数。( ) 五简答题

1、试举例说明什么是相关关系?什么是函数关系? 2、试述回归分析中误差项的标准假定。

3、什么是单相关、复相关和偏相关?什么是线性相关和非线性相关?请各举一个你熟悉的例子说明。 4、相关分析与回归分析之间的联系与区别? 六、计算分析题 1、某商店想了解职工工龄长短与月工资的关系,调查了10名售货员的工龄和月工资情况。设工龄为X(年),月工资为Y(元)。经计算,已得到以下结果: ?y=640, ?x2=532 , ?xy=4754 ?y2=42816,?x=70,要求:(1)计算相关系数r;(2)拟合以月工资为因变量的直线回归方程,并指出其回归系数的意义;(3)计算判定系数,并评价拟合优度。

2、设销售收入X为自变量,销售成本Y为因变量。现根据某百货公司10个月的有关资料计算出以下数据:(单位:万元)

????????(Xt-X)2=4250, X=6.5, ?(Yt-Y)2=2620, Y=5.5, ?(Yt-Y)(Xt-X)

=3300

要求;(1)计算简单相关系数,拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释;(2)计算可决系数和回归估计标准误差;(3)对?2进行显著性水平为5%的显著性检验。

3、从某大学统计系的学生中随机抽取16人,对数学和统计学的考试成绩(单位:分)进行调查,结果如下: 学生编号 数学成绩 统计学成绩 学生编号 数学成绩 统计学成绩 1 81 72 9 83 78 2 90 90 10 81 94 3 91 96 11 77 68 4 74 68 12 60 66 5 70 82 13 66 58 6 73 78 14 84 87 7 85 81 15 70 82 8 60 71 16 54 46 要求:(1)根据上表数据绘制散点图,判断数学考试成绩与统计学考试成绩之间的关系形态;(2)计算数学考试成绩与统计学考试成绩之间的简单相关系数;(3)对相关系数的显著性进行检验(取?=0.05),并说明数学考试成绩与统计学考试成绩之间的关系密切程度;(4)拟合统计学考试成绩对数学考试成绩的回归直线;(5)对回归方程的线性关系和回归系数进行显著性检验(取?=0.05);(6)确定数学考试成绩为80分时,统计学考试成绩置信度为95%的预测区间。

4、某企业生产某种产品的产量和单位成本资料如下: 月 份 1 2 3 4 5 6 产量(千件) X 4 6 8 7 8 9 单位成本(元/件) Y 73 72 71 72 70 69 要求:(1)计算简单相关系数;(2)确定单位成本对产量的一元线性回归模型,并指出其回归系数的意义;(3)对该模型拟合优度进行评价;(4)分别对回归系数?2及回归方程进行显著性水平为5%的显著性检验;(5)计算估计标准误差,并以95%的置信度求产量为10000件时单位成本的预测区间。 5、随机抽取某地12个居民家庭为样本,调查得到有关人均收入与食品支出的资料如下: 单位:元 编号 家庭人均生活费收入 人均食品支出 1 82 75 2 93 85 3 105 92 4 130 105 5 144 120 6 150 120 7 160 130 8 180 145 9 200 156 10 270 200 11 300 200 12 400 220 要求:(1)分析判断人均生活费收入与人均食品支出之间是否存在相关关系?其相关程度如何? (2)检验其相关系数(?=0.05);

(3)拟合适当的回归模型,并对该模型的拟合优度作出评价。

6、在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关。现对给定时期内的价格与需求量进行观察,得到如下一组数据: 价格x (元) 10 6 8 9 12 11 9 10 12 7 需求量y(吨) 60 72 70 56 55 57 57 53 54 70 要求:(1)计算价格与需求量之间的简单相关系数; (2)拟合需求量对价格的回归直线,并解释回归系数的实际意义; (3)计算判定系数r2和估计标准误S,分析回归直线的拟合程度;

(4)对回归方程的线性关系和回归系数进行显著性检验(取?=0.05),并对结果作简要分析。

7、某农业科学院研究院在土质、面积、种子完全相同的条件下。测得8块试验田种植的小麦产量Y(千克)与化肥施用量X(千克)的数据如下表: 小麦产量Y(千克) 266 340 356 372 389 404 420 435 化肥施用量X(千克) 15 18 21 24 27 30 33 36 要求:(1)建立小麦产量Y对化肥施用量X的直线回归方程; (2)求方差?2的无偏估计(即求S2); (3)检验回归效果是否显著(取?=0.05)

(4)求X=40千克时,小麦产量Y的预测区间。

8、从某项n=20的资料中已经求得: x=124.00(m2); y=67.80(千元); Lxx=?(x?x)2=2080; Lyy=?(y?y)2=71.20; Lxy=?(x?x)(y?y)=296.00

要求:(1)计算相关系数r;(2)估计回归系数?1、?2; (3)计算估计标准误差。

9、已知两个变量,即亩产量(y)和施肥量(x)。假定两变量间存在线性关系,并已知:n=10,x=27, y=380,

222?xy=985.5, ?x=101.2,?y=12995,

???(y?y)

t?2=33897,t?=t0.10=1.86

22要求:(1)建立亩产量对施肥量的线性方程,并说明回归系数的含义; (2)计算估计标准误S,并说明其含义;

(3)计算相关系数r及判定系数r2,并说明其含义;

(4)当施肥量Xf=35时,试以90%的置信度预测亩产量的区间。

10、下面是7个地区2000年的人均GDP和人均消费水平的统计数据: 地 区 人均GDP(元) 人均消费水平(元) 北京 22460 7326 辽宁 11226 4490 上海 34547 11546 江西 4851 2396 河南 5444 2208 贵州 2662 1608 陕西 4549 2035 要求:(1)以人均GDP做自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态; (2)计算两个变量之间的线性相关关系,说明两个变量之间的关系强度;

(3)利用最小二乘法求人均消费水平对人均GDP的线性回归方程,并解释回归系数的实际意义; (4)计算判定系数,并解释其意义;

(5)检验回归方程线性关系的显著性(?=0.05);

(6)如果某地区的人均GDP为5000元,预测其人均消费水平(点预测); (7)求人均GDP为5000元时,人均消费水平在95%置信水平下的预测区间。 *11、某农场通过试验取得早稻收获量与春季降雨和春季温度的如下数据: 收获量(公斤/公顷)y 1500 2300 3000 4500 4800 5000 5500 降雨量(mm)x1 温度(℃)x2 25 6 33 8 45 10 105 13 110 14 115 16 120 17 要求:确定早稻收获量对春季降雨和春季温度的二元线性回归方程,并解释回归系数的实际含义。

第6章 参考答案 一、单项选择题

1、D 2、C 3、B 4、C 5、D 6、B 7、C 8、D 二、多项选择题

1、ABE 2、BCD 3、CD 4、BCDE 5、BCD 6、ABD 7、ABCD 8、ABD 三、填空题

1、-1≤r≤+1 2、0≤ r2 ≤1 3、函数 相关 4、-14+2.7X 5、

1.2 2四、判断题

1、√ 2、√ 3、√ 4、× 5、√ 6、× 7、× 8、√ 9、× 10、× 11、√ 12、× 13、√ 14、√ 15、× 16、√ 17、√ 18、√ 19、× 20、√ 21、√ 22、× 23、√

五、1、答:相关关系是指当一个或几个相互联系的变量取一定值时,与之相对应的另一变量的值虽然不确定,但它仍按一定规律在一定范围内变化。相关关系是一种非确定性的关系。例如收入与支出的关系。函数关系是指当一个或几个变量取一定的值时,另一个变量有确定值与之相对应。函数关系是一种确定性的关系。例如圆面积与半径之间的关系。

2、答:在回归分析中,对误差项共有五条标准假定:(1)误差项的期望值为0;(2)误差项的方差为常数;(3)误差项之间不存在序列相关关系,其协方差为0;(4)自变量是给定的变量,与随机误差项线性无关;(5)随机误差项服从正态分布。

3、答:单相关,是指两个现象的相关,即一个变量对另一个变量的相关关系,例如销售量与销售价格之间的关系;复相关,是一个变量对两个或两个以上其它变量的相关关系,例如商品销售量与销售价格及其广告支出额之间的关系;偏相关,是指在某一现象与多种现象相关的场合,当假定其它变量不变时,其中两个变量的相关关系,例如假定销售价格不变,商品销售量与广告支出额之间的关系。

当两种相关现象之间的关系大致呈现为线性关系时,称之为线性相关,例如居民收入与储蓄之间的关系;当两种相关现象之间的关系不表现为线性关系而是近似于某种曲线方程的关系,称为非线性相关,例如失业率和通货膨胀率之间的关系。

4、答:所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度和方向。相关分析和回归分析有着密切的联系,它们不仅有共同的研究对象,而且在具体应用时互相补充。相关分析依靠回归分析表明现象数量相关的具体形式,回归分析依靠相关分析表明现象数量变化的相关程度。相关分析与回归分析都是定量分析的手段。

相关分析和回归分析在研究目的和方法上有明显区别。(1)相关分析研究变量之间相关的方向和相关的程度,不指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析研究变量之间相互关系的具体形态,选择一个合适的数学模型,从而为估算和预测提供一个重要的方法。(2)相关分析中的变量不必区分哪个是自变量,哪个是因变量,可以都是非随机的;而回归分析要确定哪个是自变量,哪个是因变量,一般而言因变量是随机的,自变量是非随机的。

六、计算题

1、解:(1)r =

n?xy??x?yn?x?(?x)22n?y?(?y)22

=

10?4754?70?64010?532?(70)210?42816?(640)2=0.9814

1(2)?2=(10×4754-70×640)/(10×532-702)=6.5238

???=(640/10)-6.5238×(70/10)=18.3334

yt =18.3334+6.5238 xt

?回归系数表示:工龄每增加一年,月工资将平均增加6.5238元。

(3)判定系数r2=(0.9814)2=0.9631, 这说明在月工资的总变差中,有96.31%可由工龄与月工资之间的线性关系来解释,二者之间有较强的线性关系,回归直线拟合的较好。

2、解:(1)r =

?(x?x)(y?y)=

22(x?x)(y?y)??3300=0.9889

42502620?2=

??(x?x)(y?y)=3300=0.7765

4250?(x?x)2??=5.5-0.7765×6.5=0.4528

yt =0.4528+0.7765 xt

?回归系数表示:销售收入每增加一万元,销售成本将平均增加0.7765万元。 (2)r2=0.98892=0.9779 由r2=1-S=

SSE,推出SSE=57.902 SSTSSE57.902==2.69(万元) n?210?2(3)回归系数的检验: H0:?2=0, H1:?2?0 t?=

?2?2?0S???=

0.7765S=0.7765÷(2.69/4250)=18.82

2i?(x?x)2t?=18.82>t?=2.306,拒绝H0,回归系数显著。

?23、解:(1)略;(2)r =0.78476;(3)t=4.737> t?=2.1448,r 显著;(4)

2yt =5.422+0.9427xt ;(5)F=2.4445>F?=4.60,回归关系显著;t?=4.737>t?=2.1448,回归系数

?2?2显著;(6)预测区间:[61.9;99.7]分。

4、解:(1)?x=42, ?y=427, ?x2=310 ,?y2=30399, ?xy=2977 n=6 r=

n?xy??x?yn?x?(?x)22n?y?(?y)22=-0.9115

n?xy??x?y?(2)?2?=-0.75 22n?x???x????1??y?n??2?x=76.42

nyt =76.42-0.75xt,回归系数表示产量每增加1千件,单位成本平均下降0.75元。

(3)r2=(-0.9115)2=0.8308,这说明在单位成本的总变差中,有83.08%可由产量与单位成本之间的线性关系来解释,二者之间有较强的线性关系,回归直线拟合的较好。 (4)对回归系数的检验:

H0:?2=0, H1:?2?0 S=

?y2??1?y??2?xyn?2??=

30399?76.42?427?(?0.75)?2977=0.32(元/件)

6?2S???2S?(xt?x)0.3222?0.32?x2?(?x)/n2

==0.08

310?(42)/6?

t??

?2

?2?0

S?

?2

=-0.75/0.08 =-9.375

|t|=9.375>t0.025(4)=2.7764,拒绝原假设,表明产量对单位成本的影响是显著的 对回归方程的检验: H0:?2=0, H1:?2?0

r2(n?2) F==19.65>F0.05(1,4)=7.71,拒绝H0,表明产量与单位成本之间的线性关系是显著的,回

1?r2归方程有效

(5)S=

?y2??1?y??2?xyn?2??=0.32(元/件)

222(x?x)?x?(x)?t?t?t/n=310-(42×42)/6=16

本文来源:https://www.bwwdw.com/article/ha6d.html

Top