统计学导论第二版习题详解(1)

更新时间:2024-04-22 09:06:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

统计学导论(第二版)习题详解

第一章

一、判断题

一、 判断题

1.统计学是数学的一个分支。

答:错。统计学和数学都是研究数量关系的,两者虽然关系非常密切,但两个学科有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起。特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。。从研究方法看,数学的研究方法主要是逻辑推理和演绎论证的方法,而统计的方法,本质上是归纳的方法。统计学家特别是应用统计学家则需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统计的方法,而且还要掌握某一专门领域的知识,才能得到有意义的成果。从成果评价标准看,数学注意方法推导的严谨性和正确性。统计学则更加注意方法的适用性和可操作性。

2.统计学是一门独立的社会科学。

答:错。统计学是跨社会科学领域和自然科学领域的多学科性的科学。 3. 统计学是一门实质性科学。

答:错。实质性的科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供数量分析的方法。 4.统计学是一门方法论科学。

答:对。统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以帮助人们正确认识客观世界数量规律的方法论科学。

5.描述统计是用文字和图表对客观世界进行描述。

答:错。描述统计是对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用信息。描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。

6.对于有限总体不必应用推断统计方法。

答:错。一些有限总体,由于各种原因,并不一定都能采用全面调查的方法。例如,某一批电视机是有限总体,要检验其显像管的寿命。不可能每一台都去进行观察和实验,只能应用抽样调查方法。

7.经济社会统计问题都属于有限总体的问题。

答:错。不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。

8. 理论统计学与应用统计学是两类性质不同的统计学。

答:对。理论统计具有通用方法论的性质,而应用统计学则与各不同领域的实质性学科有着非常密切

1

的联系,具有复合型学科和边缘学科的性质。 二、单项选择题

1.社会经济统计学的研究对象是( A )。 A.社会经济现象的数量方面 B.统计工作 C.社会经济的内在规律 D.统计方法

2.考察全国的工业企业的情况时,以下标志中属于不变标志的有( A )。 A.产业分类 B.职工人数 C.劳动生产率 D.所有制 3.要考察全国居民的人均住房面积,其统计总体是(A )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户

4.最早使用统计学这一学术用语的是( B)。

A.政治算术学派 B.国势学派 C.社会统计学派 D.数理统计学派 三、分析问答题

1.试分析以下几种统计数据所采用的计量尺度属于何种计量尺度:人口、民族、信教人数、进出口总额、经济增长率。

答:定类尺度的数学特征是“=”或“?”,所以只可用来分类,民族就是定类尺度数据,它可以区分为汉、藏、回等民族。定序尺度的数学特征是“>”或“<”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度属于定序尺度。定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,所以,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“?”或“?”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据。

2.请举一个实例说明品质标志、数量标志、质量指标、数量指标之间有怎样的区别与联系。 答:例如考察全国人口的情况,全国所有的人为统计总体,而每个人就是总体单位,每个人都有许多属性和特征,比如民族、性别、文化程度、年龄、身高、体重等,这些就是标志,标志可以分为品质标志和数量标志,性别、民族和文化程度都是品质标志,年龄、身高、体重等则是数量标志;而指标是说明统计总体数量特征的,用以说明全国人口的规模如人口总数等指标就是数量指标,而用以说明全国人口某一方面相对水平的相对量指标和平均量指标如死亡率、出生率等指标就是质量指标,质量指标通常是在数量指标的派生指标。

3.请举一个实例说明统计总体、样本、单位的含义,并说明三者之间的联系。

答:例如考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本。

2

第二章

一、单项选择题

1. 统计调查对象是(C)。

A. 总体各单位标志值 B. 总体单位 C. 现象总体 D. 统计指标 2. 我国统计调查体系中,作为“主体”的是(A)。

A. 经常性抽样调查 B. 必要的统计报表 C. 重点调查及估计推算等 D. 周期性普查

3. 要对某企业的生产设备的实际生产能力进行调查,则该企业的“生产设备”是(A)。 A. 调查对象 B. 调查单位 C. 调查项目 D. 报告单位

二、多项选择题

1. 下面哪些现象适宜采用非全面调查? (A.B.C.D)

A. 企业经营管理中出现的新问题 B. 某型号日光灯耐用时数检查 C. 平均预期寿命 D. 某地区森林的木材积蓄量 2. 抽样调查(A.D)。

A. 是一种非全面调查 B. 是一种不连续性的调查 C. 可以消除抽样误差 D. 概率抽样应遵循随机原则 3. 洛伦茨曲线(A.B.C)。

A. 是一种累计曲线 B. 可用于反映财富分布的曲线 C. 用以衡量收入分配公平与否 D. 越接近对角线基尼系数越大

三、分析判断题

1. 有人说抽样调查“以样本资料推断总体数量特征”肯定比全面调查的误差大,你认为呢? 答:这种说法不对。

从理论上分析,统计上的误差可分为登记性误差、代表性误差和推算误差。无论是全面调查还是抽样调查都会存在登记误差。而代表性误差和推算误差则是抽样调查所固有的。这样,从表面来看,似乎全面调查的准确性一定会高于统计估算。但是,在全面调查的登记误差特别是其中的系统误差相当大,而抽样调查实现了科学化和规范化的场合,后者的误差也有可能小于前者。我国农产量调查中,利用抽样调查资料估算的粮食产量数字的可信程度大于全面报表的可信程度,就是一个很有说服力的事例。

2. 过去统计报表在我国统计调查体系中占据统治地位多年,为什么现在要缩小其使用范围? 答:经济体制改革以前,统计报表制度是我国统计调查最主要的方式,它在我国统计调查体系中占据统治

3

地位多年。近年来,随着社会主义市场经济的发展,统计调查单位变动频繁,再加上决策主体和利益主体的多层次化,各方面对统计报表数字真实性的干扰明显增加,从而不仅给报表调查带来不少困难,同时也影响了统计数据的准确性,统计报表的局限性日渐暴露。所以,为适应社会主义市场经济日新月异发展变化的需要,提高统计数据的准确性和时效性,现行的统计调查体系以抽样调查为主体,也就缩小了统计报表制度的使用范围。

3. 对足球赛观众按男、女、老、少分为四组以分析观众的结构,这种分组方法合适吗?

答:这种分组方法不合适。统计分组应该遵循“互斥性原则”,本题所示的分组方式违反了“互斥性原则”,例如,一观众是少女,若按以上分组,她既可被分在女组,又可被分在少组。

4. 以一实例说明统计分组应遵循的原则。

答:统计分组必须遵循两个原则:穷尽原则和互斥原则。穷尽原则要求总体中的每一个单位都应有组可归,互斥原则要求总体中的任何一个单位只能归属于某一组,而不能同时归属于几个组。

例如,把从业人员按文化程度分组,分为小学毕业、中学毕业(含中专)和大学毕业三组,那么,文盲或识字不多的以及大学以上的学历者则无组可归,这就不符合穷尽原则。应该分为文盲或识字不多、小学毕业、中学毕业(含中专)和大专、大学以及研究生毕业四组,才符合穷尽原则。

又如,商场把鞋子分为男鞋、女鞋和童鞋,这就不符合互斥原则,因为童鞋也有男、女鞋之分,一双女童鞋既可归属于童鞋组,又可属于女鞋。可以先按男鞋、女鞋分组,再分别对男鞋、女鞋分为成人鞋和童鞋,形成复合分组,这才符合互斥原则。

四、计算题

抽样调查某地区50户居民的月人均可支配收入(单位:元)数据资料如下:

886

928

999 978 954 800 895

946 816 890 938 967

950

864

1050 927 1040 854 900 863 821

999 981 924

949

852

1027 928 866 893 946

要求:(可利用Excel)

905 900 926

1000 918 1006 926 864 921

919 978

1100 900 886 916 651

1120 818 850

(1)试根据上述资料编制次(频)数分布和频率分布数列。 (2)编制向上和向下累计频数、频率数列。

(3)绘制直方图、折线图、曲线图和向上、向下累计图。 (4)根据图形说明居民月人均可支配收入分布的特征。

解:(1)编制次(频)数分布和频率分布数列。

4

次数分布表

居民户月消费品支出额(元) 800以下 800~850 8509~00 900~950 950~1 000 1 000~1 050 1 050~1 100 1 100以上 合计

(2)编制向上和向下累计频数、频率数列。

(3)绘制直方图、折线图、曲线图和向上、向下累计图。 主要操作步骤:

①次数和频率分布数列输入到Excel。

②选定分布数列所在区域,并进入图表向导,在向导第1步中选定“簇状柱形图”类型,单击“完成”,即可绘制出次数和频率的柱形图。

③将频率柱形图绘制在次坐标轴上,并将其改成折线图。

主要操作步骤:在“直方图和折线图”基础上,将频率折线图改为“平滑线散点图”即可。 主要操作步骤:

①将下表数据输入到Excel。

组限 750 800 850 900 950 1000 向上累计 0 1 5 17 35 43 向下累计 50 49 45 33 15 7 次(频)数 1 4 12 18 8 4 1 2 50 频率(%) 2 8 24 36 16 8 2 4 100.00 5

1050 1100 1150

47 48 50 3 2 0 ②选定所输入的数据,并进入图表向导,在向导第1步中选定“无数据点平滑线散点图”类型,单击“完成”,即可绘制出累计曲线图。

(4)曲线图说明居民月人均可支配收入分布呈钟型分布。

五、案例分析

收集有关统计数据,对我国近年来居民收入分配的状况进行统计分析。 答:略

第三章

一、 单项选择题

1. 由变量数列计算加权算术平均数时,直接体现权数的实质的是( D )。 A 总体单位数的多少 B 各组单位数的多少 C各组变量值的大小 D各组频率的大小

2. 若你正在筹划一次聚会,想知道该准备多少瓶饮料,你最希望得到所有客人需要饮料数量的( A )。 A 均值 B中位数 C众数 D四分位数

3.2004年某地区甲、乙两类职工的月平均收入分别为1060和3350元,标准差分别为230和680元,则职工平均收入的代表性( B )。 A甲类较大 B 乙类较大

6

C两类相同 D 在两类之间缺乏可比性

4.假如学生测验成绩记录为优、良、及格和不及格,为了说明全班同学测验成绩的水平高低,其集中趋势的测度( B )。

A可以采用算术平均数 B 可以采用众数或中位数 C只能采用众数 D 只能采用四分位数

5.一组数据呈微偏分布,且知其均值为510,中位数为516,则可推算众数为( A )。 A 528 B 526 C 513 D 512 6.当分布曲线的峰度系数小于0时,该分布曲线称为( C )。 A 正态曲线 B尖顶曲线 C平顶曲线 D. U型曲线

二、判断分析题

1.有人调查了456位足球运动员某年的收入,发现他们的年收入以24.7万元为分布中心,但超过24.7万元的只有121人。试问,这里的24.7万元指的是哪一种集中趋势指标?你认为球员收入分布呈什么形状?为什么?

答:均值。呈右偏分布。由于存在极大值,使均值高于中位数和众数,而只有较少的数据高于均值。 2.任意一个变量数列都可以计算其算术平均数、中位数和众数,并用以衡量变量的集中趋势吗? 答:不是。每个变量数列都可以计算其算术平均数和中位数,但众数的计算和应用是有前提条件的,存在极端值时,用算术平均数测度数据的集中趋势也有局限性。

3.设一组数据的均值为100,标准差系数为10%,四阶中心矩为34800,是否可认为该组数据的分布为正态分布?

答:峰度系数K?m4?4?3?34800?3?0.48,属于尖顶分布。 4(100?10%)4.某段时间内三类股票投资基金的年平均收益和标准差数据如下表:

股票类别 A B C 平均收益率(%) 5.63 6.94 8.23 标准差(%) 2.71 4.65 9.07 根据上表中平均收益和标准差的信息可以得出什么结论?假如你是一个稳健型的投资者,你倾向于购买哪一类投资基金?为什么?

答:高收益往往伴随着高风险。稳健型的投资者应倾向于购买A类投资基金,因为其标准差最小,也就是风险最小。

5.一般说来,一个城市的住房价格是高度偏态分布的,为了了解房屋价格变化的走势,应该选择住房价格的平均数还是中位数?如果为了确定交易税率,估计相应税收总额,又应该做何种选择?

7

答:为了了解房屋价格变化的走势,宜选择住房价格的中位数来观察,因为均值受极端值影响;如果为了确定交易税率,估计相应税收总额,应利用均值,因为均值才能推算总体有关的总量。

6.某企业员工的月薪在1000到4000元之间。现董事会决定给企业全体员工加薪。如果给每个员工增加200元,则:

(1)全体员工薪金的均值、中位数和众数将分别增加多少?

(2)用极差、四分位差、平均差和方差、标准差分别来衡量员工薪金的差异程度,加薪前后各个变异指标的数值会有什么变化?

(3)加薪前后员工薪金分布的偏度和峰度会有无变化?

(4)如果每个员工加薪的幅度是各自薪金的5%,则上述三个问题的答案又有什么不同?

答:(1)都是增加200元。(2)都不变。(3)均无变化。

(4)如果每个员工加薪的幅度是各自薪金的5%,则均值、中位数和众数都将增加5%;极差、四分位差、平均差和标准差也会相应增加5%,方差将增加10.25%;偏度和峰度都不变。

三、计算题

1.某公司下属两个企业生产同一种产品,其产量和成本资料如下:

基期 单位成本(元) 产量(吨) 甲企业 乙企业 600 700 1200 1800 单位成本(元) 产量(吨) 600 700 2400 1600 报告期 试分别计算报告期和基期该公司生产这种产品的总平均成本,并从上述数据说明总平均成本变化的原因。

解:基期总平均成本=

600?1200?700?1800=660

1200?1800600?2400?700?1600报告期总平均成本==640

2400?1600总平均成本下降的原因是该公司产品的生产结构发生了变化,即成本较低的甲企业产量占比上升而成本较高的乙企业产量占比相应下降所致。

2.设某校某专业的学生分为甲、乙两个班,各班学生的数学成绩如下: 甲60,79,48,76,67,58,65,78,64,75,76,78,84,48,25,90,98,70,77,78,68,74,95,85,68,80,92, 班 88,73,65,72,74,99,69,72,74,85,67,33,94,57,60,61,78,83,66,77,82,94,55,76,75,80,61 乙91,74,62,72,90,94,76,83,92,85,94,83,77,82,84,60,60,51,60,78,78,80,70,93,84,81,81,82, 班 85,78,80,72,64,41,75,78,61,42,53,92,75,81,81,62,88,79,98,95,60,71,99,53,54,90,60,93 要求:(1)分别计算描述两个班成绩分布特征的各种统计指标,并进行比较分析;(2) 分别绘制两个班成绩分布的箱线图。

解:利用EXCEL的“描述统计”可得两个班及全体学生的成绩分布特征的各种统计指标如下表(注:其中方差、标准差、峰度和偏度都是样本统计量)。

8

平均 中位数 众数 标准差 方差 峰度 偏度 区域 最小值 最大值 求和 观测数 甲班 72.704 74.5 78 14.681 215.53 1.6636 -0.83 74 25 99 3926 54 乙班 76.018 78.5 60 14.257 203.25 -0.305 -0.59 58 41 99 4257 56 全部 74.391 76.5 78 14.496 210.13 0.685 -0.699 74 25 99 8183 110 3. 根据第2小题的数据,试求该专业全部学生的总平均成绩和方差,并利用本题数据验证:分组条件下,总体平均数与各组平均数的关系,以及总体方差与各组方差、组间方差的关系。 n解:根据总体方差的计算公式?2?i?12(xi?x)?n可得:

11423.259311178.9821?211.5418;?2乙??199.6247

545622904.1932全部学生成绩的方差?全部??208.2199

k1102??ini211.5418?54?199.6247?56?2?i?1k??205.4749 k1102ix)nni(72.7037?74.3909)2?54?(76.0179?74.3909)2?56?(xi?i??12=2.745 ???i?1k110?n?2甲?B总体方差(208.2199)=组内方差平均数(205.4749)+组间方差(2.745)

4. 根据第2小题的数据,分别编制两个班成绩的组距数列(组距为10),然后由组距数列计算反映数据分布特征的各个指标,并观察与第2题所得到的计算结果是否相同?为什么?

解:两个班成绩的组距数列如下表所示:

成绩 40以下 40-50 50-60 60-70 70-80 80-90 90以上 甲班人数(人) 乙班人数(人) 2 2 3 13 19 8 7 0 2 4 9 14 15 12 i?1i 9

合计 54 56 由上述组距数列计算的主要分布特征指标如下表所示:

甲班 乙班 平均成绩 72.963 77.857 方差 207.614 186.895 标准差 14.409 13.671 与第2题所得到的两个班的平均数都不相同,这是因为由组距数列计算时,用组中值代替组平均数,假定组内变量值均匀分布或对称分布,与实际分布情况有出入,所以计算结果是近似值。方差和标准差也与第2~3题所得到的计算结果不相同,这主要是因为由组距数列计算时,用组中值代替组内各变量值,忽略了组内差异,只考虑了组间差异;此外第2题利用EXCEL的“描述统计”得到的方差、标准差是样本统计量,与总体方差、标准差的计算公式有差异。

5.某商贸公司从产地收购一批水果,分等级的收购价格和收购金额如下表,试求这批水果的平均收购价格。

收购单价 水果等级 甲 乙 丙 合计 解: X?(元/千克) 2.00 1.60 1.30 收购额(元) 12700 16640 8320 37660 12700?16640?8320 ?1.6268(元)k(Xf)12700166408320ii???2.001.601.30i?1Xi6.某中学校正在准备给一年级新生定制校服。男生校服分小号、中号和大号三种规格,分别适合于身

i?1收购总额?收购总量?(Xifi)k—— ?高在160 cm以下、160~168cm之间和168cm以上的男生。已知一年级新生中有1200名男生,估计他们身高的平均数为164cm,标准差为4cm。试由此粗略估算三种规格男生校服应该分别准备多少套(按每人1套计算)?

解:身高分布通常为钟形分布,按经验法则近似估计结果如下:

规格 小号 中号 大号 合计

7.平均数和方差一般只能对数值型变量进行计算。但若将是非变量(也称为是非标志)的两种情况分别用1和0来表示,则对是非变量也可以计算其平均数和对应的方差、标准差。试写出有关计算公式。

身高 160以下 160-168 168以上 —— 分布范围 均值±1*标准差 —— 比重 数量(套) 0.1585 190.2≈190 0.6830 819.6≈820 0.1585 190.2≈190 1.0000 1200 10

C. -1.645 D. ±1.645

4.若算得检验统计量的样本值为1.50,电子元件的实际废品率是3.5‰,则会出现( D )。 A.接受了正确的假设 B.拒绝了错误的假设 C.弃真错误 D.取伪错误

5.使用者偏重于担心出现取伪错误而造成的损失。那么他宁可把显著性水平定得(A )。 A.大 B.小

C.大或小都可以 D. 先决条件不足,无法决定 二、问答题

1.某县要了解该县小学六年级学生语文理解程度是否达到及格水平(60分)。为此,从全体六年级学生中用简单随机放还抽样方法抽取了400人进行测试,得到平均成绩61.6分,标准差14.4分。要根据样本数据对总体参数的论断值(语文理解程度的期望值60分)作显著性检验,显著水平先后按α=0.05和

α=0.01考虑。请就上面的工作任务回答下列问题:

(1)指出由样本数据观测到何种差异; (2)指出出现这种差异的两种可能的原因;

(3)针对这两种可能的原因提出相应的两种假设(原假设和备择假设),指出所提出的假设对应着单侧检验还是双侧检验,说明为什么要用单侧检验或者双侧检验;

(4)仿照式(6.7)构造检验统计量(如在那里说明过的:这个检验统计量服从t–分布。不过,由于我们在这里所使用的是一个400人的足够大的样本,因而可以用标准正态分布作为t–分布的近似); (5)计算检验统计量的样本值;

(6)根据上述样本值查表确定观测到的显著性水平;

(7)用观测到的显著性水平与检验所用的显著性水平标准比较(注意:如果是单侧检验,这个标准用?值,如果是双侧检验,这个标准用?/2值),并说明,通过比较,你是否认为得到了足以反对“观测到的差异纯属机会变异”这一论断(或是足以反对原假设)的足够的证据?为什么?

(8)根据提出的显著性水平建立检验规则,然后用检验统计量的样本值与检验规则比较,重新回答上条的问题;

(9)根据上面所做的工作,针对本题的研究任务给出结论性的表述。 答:

(1)由样本数据观察到的差异

样本平均数61.6分,不同于对总体平均值的猜想(60分)。 (2)出现这种差异的两种可能的原因

第一种可能:总体平均值的确为60分,样本平均数与60分的差异纯属于抽样所产生的机会变异。 第二种可能:总体平均值不是60分,样本平均数与60分的差异反映了总体平均值不同于60分的这种真实存在的差异。

16

(3)建立假设

①若想了解学生的语文理解程度是否为60分(后来通知学生改为这样写)

H0:??60 等价于真实情况为第一种情况

H1:??60 等价于真实情况为第二种情况

上述一组假设对应着双尾检验。

用双尾检验的理由是:我们所关心的仅仅是,?是否等于60(将?=60设为原假设)。若检验统计量的样本值落在检验统计量的概率分布曲线的左尾部(这意味着?<60)或右尾部(这意味着?>60),都属于我们所关心的情况的对立情况,都需要拒绝原假设。因而要把拒绝域同时放在左、右两个尾部,即,进行双尾检验。

②若想了解学生的语文理解程度是否达到或超过60分(教材中原来只写“是否达到”,在理解上容易产生歧义,应加上“或超过”)

H0:??60 其中的等于60等价于真实情况为第一种情况,其中的大于60

等价于真实情况为第二种情况

H1:??60 等价于真实情况为第二种情况

上述一组假设对应着左单尾检验。

用左单尾检验的理由是:我们所关心的是,?是否大于或等于60(将?≥60设为原假设)。若检验统计量的样本值落在检验统计量的概率分布曲线的左尾部(这意味着?<60),这属于我们所关心的情况的对立情况,需要拒绝原假设;至于检验统计量的样本值落在右尾部(这意味着?>60)时,这属于我们所关心的情况,不需要拒绝原假设。因而只把拒绝域放在左尾部,即,进行左单尾检验。

(4)构造检验统计量 在原假设H0:??60成立的条件下,有下列检验统计量服从自由度为n–1=400–1

t?y?60~t(400?1) snn=400 y=61.6 s=14.4 y?6061.6?60t???2.22

s14.4的t?分布。由

于自由度相当大,故这个分布同标准正态分布非常接近。

(5)计算检验统计量的样本值

(6)观察到的显著水平(P-值)

n400查标准正态分布表,z=2.22时阴影面积值为0.4868。故

右尾P-值=P(2.22z>–∞)=0.5+0.4868=0.9868

(7)用P-值检验规则做检验

①学生的语文理解程度是否为60分(H0:?=60 ;H1:?≠60)——双尾检验 ⅰ)若规定?=0.05

检验用的显著水平标准为?/ 2=0.05 / 2=0.025

17

由于右尾P-值=0.0132<0.025,故拒绝原假设。 ⅱ)若规定?=0.01

检验用的显著水平标准为?/ 2=0.01 / 2=0.005 由于右尾P-值=0.0132>0.025,故不能拒绝原假设。

②学生的语文理解程度是否达到或超过60分(H0:?≥60 ;H1:?<60)——左单尾检验 ⅰ)若规定?=0.05

检验用的显著水平标准为?=0.05

由于左尾P-值=0.9868>0.05,故不能拒绝原假设。 ⅱ)若规定?=0.01

检验用的显著水平标准为?=0.01

由于左尾P-值=0.9868>0.01,故不能拒绝原假设。 (8)用临界值值检验规则做检验

①学生的语文理解程度是否为60分(H0:?=60 ;H1:?≠60)——双尾检验 ⅰ)若规定?=0.05

查标准正态分布表,z?域为??1.96,1.96?。

由于z=2.22>1.96,检验统计量的样本值落在拒绝域,故拒绝原假设。 ⅱ)若规定?=0.01

查标准正态分布表,z?受域为??2.575,2.575?。

由于z=2.22<2.575,检验统计量的样本值落在接受域,故不能拒绝原假设。

②学生的语文理解程度是否达到或超过60分(H0:?≥60 ;H1:?<60)——左单尾检验 ⅰ)若规定?=0.05

查标准正态分布表,在左尾部有z?= z0.05 =–1.645,故,拒绝域为???,?1.645?,接受域为

/ 2= z0.01 / 2 = z0.005 =2.575,故,拒绝域为/ 2= z0.05 / 2 = z0.025 =1.96,故,拒绝域为

???,?1.96?和?1.96,??,接受

???,?2.575?和?2.575,??,接

??1.645,??。

由于z=2.22>–1.645,检验统计量的样本值落在接受域,故不能拒绝原假设。 ⅱ)若规定?=0.01

查标准正态分布表,在左尾部有z?= z0.01 =–2.325,故,拒绝域为???,?2.325?,接受域为

??2.325,??。

由于z=2.22>–2.325,检验统计量的样本值落在接受域,故不能拒绝原假设。 (9)检验结论

①学生的语文理解程度是否为60分 ⅰ)若规定?=0.05

样本数据显著地表明,学生的语文理解程度并非恰好为60分。上述结论的双尾显著水平为0.05。

18

ⅱ)若规定?=0.01

样本数据提供的证据不足以推翻学生的语文理解程度恰好为60分的假设,也就是说,学生的语文

理解程度有可能恰好为60分。上述结论的双尾显著水平为0.01。

②学生的语文理解程度是否达到或超过60分 ⅰ)若规定?=0.05

样本数据提供的证据几乎完全没有理由推翻学生的语文理解程度达到或超过60分的假设,也就是

说,可以认为学生的语文理解程度达到或超过了60分。上述结论的单尾显著水平为0.05。

ⅱ)若规定?=0.01

样本数据提供的证据几乎完全没有理由推翻学生的语文理解程度达到或超过60分的假设,也就是说,可以认为学生的语文理解程度达到或超过了60分。上述结论的单尾显著水平为0.01。

2. 是否?+?=1?(这里的?是犯弃真错误的概率,?是犯取伪错误的概率)请说明为什么是或为什么不是?

答:

?是在H0成立的总体中检验统计量分布的概率密度曲线属于拒绝域的尾部(一个或两个)面积;?是H0不成立的另外某个总体中与前述检验统计量相对应的另外一个统计量分布的概率密度曲线伸入接受域

的尾部面积。由于?和?二者分别属于两个概率密度曲线,因此不会存在二者之和等于1的必然规律。

人们熟知的必然关系是:在H0成立的总体的检验统计量分布的概率密度曲线下,有?+(1–?)=1。这里,?和(1–?)是上述同一概率密度曲线下分别属于拒绝域和接受域的两个部分的面积。

(说明:拒绝域和接受域是实数轴的两个部分,而不是概率密度曲线下的这一部分面积或那一部分面积)

3. 据一个汽车制造厂家称,某种新型小汽车耗用每加仑汽油至少能行驶25公里,一个消费者研究小组对此感兴趣并进行检验。检验时的前提条件是已知生产此种小汽车的单位燃料行驶里程技术性能指标服从正态分布,总体方差为4。试回答下列问题:

(1)对于由16辆小汽车所组成的一个简单随机样本,取显著性水平为0.01,则检验中根据x来确定是否拒绝制造家的宣称时,其依据是什么(即,检验规则是什么)?

(2)按上述检验规则,当样本均值为每加仑23、24、25.5公里时,犯第一类错误的概率是多少?

答:

(1)拒绝域(??,?2.33];(2)样本均值为23,24,25.5时,犯第一类错误的概率都是0.01。 三、计算题 1.一台自动机床加工零件的直径X服从正态分布,加工要求为E(X)=5cm。现从一天的产品中抽取50个,分别测量直径后算得x?4.8cm,标准差0.6cm。试在显著性水平0.05的要求下检验这天的产品直径

19

平均值是否处在控制状态(用临界值规则)?

解: (1)提出假设

H0:??5

H1:??5

(2)构造检验统计量并计算样本观测值

在H0:??5成立条件下:

?4.8?5??2.357

22s0.6(3)确定临界值和拒绝域 n50Z0.025?1.96

Z?x??∴拒绝域为

???,?1.96???1.96,???

(4)做出检验决策

∵Z?2.357?Z0.025?1.96

检验统计量的样本观测值落在拒绝域。

∴拒绝原假设H0,接受H1假设,认为生产控制水平不正常。

2.已知初婚年龄服从正态分布。根据9个人的调查结果,样本均值x?23.5岁,样本标准差(以9-1作为分母计算)s?3岁。问是否可以认为该地区初婚年龄数学期望值已经超过20岁(?界值规则)?

解:

(1)提出假设

?0.05,用临

H0:??20

H1:??20

在H0(2)构造检验统计量并计算样本观测值

:??20成立条件下 x??23.5?20 t???3.5

22s3(3)确定临界值和拒绝域 n9 t0.05(8)?1.86

拒绝域为

?1.86,???

(4)做出检验决策

∵t?3.5?1.86 检验统计量的样本观测值落入拒绝域

∴拒绝H0,接受H1,即可以认为该地区初婚年龄数学期望值已经超过20岁。

3.从某县小学六年级男学生中用简单随机抽样方式抽取400名,测量他们的体重,算得平均值为61.6

20

步骤三:计算点预测值Cf

在H8中输入公式“=MMULT(Xf,B)”,按回车键即可。 步骤四:计算预测估计误差的估计值Se

f先计算

Xf(X?X)?1X?f,在H9中输入如下公式:

=MMULT(MMULT(Xf,MINVERSE(MMULT(TRANSPOSE(X),X))),TRANSPOSE(Xf)) 然后按Ctrl+Shift+Enter组合键即可,表示输入的是数组公式。 再计算Sef,在H10中输入公式“=H6*SQRT(1+H9)”。 步骤五:计算t临界值

在H11中输入公式“=T.INV.2T(1-0.95,22-3)”,按回车键即可。 步骤六:计算置信区间上下限

在H12、H13中分别输入公式“=H8-H11*H10”和“=H8+H11*H10”。结果为:

最终得出Cf的区间预测结果:56375.37?Cf?58658.07

第九章

一、选择题

1.下列时间序列中属于时期序列的是( c )。

A.某年各季度末的从业人数 B.历年年末居民储蓄存款余额 C.历年秋季高校招生人数 D.历年年初粮食库存量

2.某储蓄所今年9~12月月末居民储蓄存款余额分别为480,460,520和560万元。则第四季度居民储蓄存款的平均余额为( A )万元。

A .500 B. 513.3 C. 515 D. 520

3.若侧重于考察各期发展水平的总和,计算平均发展速度应采用( B )。 A.几何平均法 B.方程式法 C .算术平均数 D.移动平均法

4.某地区居民用电量呈逐年上升趋势,某月用电量的季节指数为120%,表明本月居民用电量( B )。 A.比上月增加20% B.比本月用电量趋势值高20% C.比上年同月增加20% D.比本年的月均用电量高20%

5.当时间序列的环比增长速度大体接近一个常数时,其趋势方程的形式为( C )。 A.直线 B.二次曲线 C.指数曲线 D.修正指数曲线

6.如果时间序列中循环变动的波动越小,则在乘法模型中,循环变动的测定值就越接近( D )。 A . -1 B. 0 C. 0.5 D . 1

36

二、判断分析题

1.一般说来,由时点序列计算平均发展水平时,时点间隔越短,计算结果就越准确。

答:正确。因为由时点序列计算平均发展水平时,假定现象在相邻时点之间的变动是均匀的,而实际情况总是不完全符合假定。一般说来,时点序列中相邻时点间隔越短,所计算的平均发展水平就越准确。

2.某企业产品的废品率逐月下降,一月份生产12500件,废品率为2.4%;二月份生产13800件,废品率为2.2%;三月份生产11200件,废品率为2%。则一季度的平均废品率为:(2.4%+2.2%+2%)/3 = 2.2%。

答:错误。计算相对数的序时平均数不能用简单算术平均法,而应该通过该相对数分子的序时平均数与分母的序时平均数对比而得,或以其分母指标为权数对相对数序列求加权算术平均数。所以,一季度的平均废品率应为:

2.4%?12500+2.2%?13800+2%?11200=2.21%。

12500+13800+112003.指数平滑法的平滑系数越大,对时间数列中数据变化的反应就越灵敏。

答:正确。因为平滑系数α越大,近期数据的权重就越大,指数平滑值受近期数据影响就越大,对数据变化的反应就越灵敏。

4. 对月度数据序列,用移动平均法测定其长期趋势值时,可采用四项或八项移动平均。 答:错误。因为对于存在周期性波动的时间序列,用移动平均法测定其长期趋势值时,移动平均的项数须等于周期长度或周期长度的整数倍。月度数据序列通常存在季节性周期波动,周期长度为一年(12个月),用移动平均法测定其长期趋势值时,须采用12(或12的整数倍)项移动平均。

5.某企业利润总额2006年比2000年增加了60%,2010年又比2006年增加了40%,因此平均来看,前后两段时间内该企业利润总额的增长速度相等,而且这10年间总的增长速度高达100%。

答:错误。前6年的平均增长速度为8.15%,后4年的平均增长速度为8.78%。这10年间总的增长速度为124%(即2010年比2000年增长124%)。 三、计算题

1.某商业企业某年第一季度的销售额、库存额及流通费用额资料如下:

销售额(万元) 月初库存额(万元) 流通费用额(万元) 1月 2880 1980 230 2月 2170 1310 195 3月 2340 1510 202 4月 —— 1560 —— 试计算第一季度的月平均商品流转次数和商品流通费用率(提示:商品流转次数=销售额÷平均库存额;商品流通费用率=流通费用额÷销售额)。

解:第一季度的月平均商品流转次数为:

37

第一季度的月平均销售额(2880?2170?2340)/32466.333???1.61 19801560第一季度的平均库存额1530(?1310?1510?)/(4?1)2 2第一季度的平均商品流通费用率为:

第一季度的月平均流通费用(230?195?202)/3209???8.48%

第一季度的月平均销售额(2880?2170?2340)/32466.3332.某企业产品销售量历年的增长速度如下:

第一年 第二年 第三年 第四年 第五年 15 6.6 30 39 环比增长速度(%) 7 定基增长速度(%) 7 试求五年间年平均增长速度,并指出增长最快的两年是哪两年?

解:平均增长速度=51.39?1?6.8078%,增长最快的是头两年。

环比增长速度(%) 定基增长速度(%)

3.某服装厂2010年服装生产量为100万件。试求:

(1)预计从2011年起,生产量每年递增10%,问到2015年该厂服装生产量可达到多少?

(2)若希望2015年生产量在2010年基础上翻一番,问2011年起每年应以多快的速度增长才能达到预定目标?平均每月递增的速度又该是多少?

解:(1)2015年该厂服装生产量=100?1.10=161.051(万件)

(2)年均递增速度=55第一年 7 7 第二年 7.48 15 第三年 6.6 22.59 第四年 6.1 30 第五年 6.9 39 2?1?14.87%;

月均递增速度=602?1?121.1487?1=1.162%

4.某地区2007~2010年各季度的LED电视机销售量数据如下表所示(单位:千台):

年度 季度 1 2 2007 3 4 1 2 2008 3 4 要求:

(1)汇总出各年度销售总量,并根据年度数据计算这几年间的:

68 74 60 65 58 52 2010 3 4 80 84 销售量 48 41 2009 3 4 1 2 75 78 63 59 年度 季度 1 2 销售量 60 56 38

a.年平均销售量、年平均增长量、年平均增长速度;

b.分别用所求年平均增长量和年平均增长速度预测2011年销售量。

(2)分别用同期平均法和移动平均趋势剔除法计算销售量的季节指数,并比较说明两种方法计算结果的差别及其原因。

解:(1)年平均销售量= (214+252+269+286)/4= 255.25

年平均增长量= (286-214)/3= 24

年平均增长速度=3286/214?1?10.15% 用所求年平均增长量预测2011年销售量=310(千台) 用所求年平均增长速度预测2011年销售量=315.03(千台)

(2)两种方法计算的各季度的季节指数(%)如下:

季度 同期平均法 趋势剔除法 1 89.72 93.07 2 81.49 83.64 3 110.87 109.15 4 117.92 114.14 由于存在上升趋势,同期平均法会将趋势变动混同于季节变动,从而低估前两个季度的季节指数、高估后两个季度的季节指数。

5.根据第4小题的数据,要求:

(1)用移动平均趋势剔除法计算的季节指数调整原时间序列,对调整后的序列用最小二乘法拟合线性趋势方程。

(2)根据季节指数和线性趋势方程,预测2011年各月及全年的销售量。

(3)试分别用直接法和剩余法测定循环变动,并说明销售量有无明显的循环波动规律。 (4)测定不规则波动。

?解:(1)线性趋势方程为T?51.08?1.474t (t=1,2,…,16)

(2)预测2011年各季度及全年的销售量为: 全季度 1 2 3 4 年 t 17 76.14 70.86 18 77.61 64.91 19 79.09 86.33 20 80.56 91.95 — — 314.05 ? 趋势预测值T??S) 销售量预测值(T (3)直接法所得的同比发展速度和间接法所得的CI的数值如下表所示: 年

季同比发展CI 年 39

季同比发展CI

度 度 速度(%) 1 2 (%) 98.14 90.73 度 度 1 2 速度(%) 103.45 107.69 110.29 105.41 105.00 105.36 106.67 107.69 (%) 100.19 101.73 102.10 99.37 96.37 98.36 100.14 98.57 2007 3 4 1 2 2008 3 4 113.33 101.46 113.85 103.12 99.04 99.95 120.83 106.62 126.83 103.75 2009 3 4 1 2 2010 3 4 (4)销售量有无明显的循环波动规律,上表中的CI可视为各期的不规则变动相对数。

6.我国1991-2010年的能源消费总量如下表(数据来源于《中国统计年鉴2010》和《2010年国民经济和社会发展统计公报》,单位:千万吨标准煤): 年 份 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 能源消费总量 104 109 116 123 131 135 136 136 141 146 年 份 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 能源消费总量 150 159 184 213 236 259 281 291 307 325 要求:

(1)利用表中2001-2010年的数据计算平均增长量、年平均增长速度。 (2)分别按(1)所求的两个平均数预测2011和2015年我国的能源消费总量。

(3)利用表中全部数据绘制折线图,利用Excel的“添加趋势线”功能拟合二次曲线趋势方程,并据以预测2011和2015年我国的能源消费总量。

解:(1)平均增长量=(325-150)/9=19.444(千万吨标准煤)

年平均增长速度=9325/150?1?8.971%

(2)~(3)我国能源消费总量预测值(单位:千万吨标准煤)分别为: 按平均增长量预测 按平均增长速度预测 按二次曲线趋势预测 2011年 344.444 354.155 360.933 2015年 422.222 499.384 479.225 能源消费总量折线图及其拟合的二次曲线趋势如下图所示:

7.已知某地区近25年粮食单产依次如下表所示(单位:公斤/公顷)。

6240 6390 6975 6885 7755

8280 8505 8445 8505

40

本文来源:https://www.bwwdw.com/article/1hwp.html

Top