《统计学》练习题 - 图文
更新时间:2024-04-04 23:34:01 阅读量: 综合文库 文档下载
- 统计学题及答案推荐度:
- 相关推荐
统计学练习题
第一章 习题
思考题
1.1 “统计”一词有哪几种含义?
1.2 什么是统计学?怎样理解统计学与统计数据的关系?
1.3 统计数据可分为哪几种类型?不同类型的统计数据各有什么特点? 1.4 举例说明总体、样本、参数、统计量、变量这几个概念。 1.5 什么是有限总体和无限总体?举例说明。 1.6 变量可分为哪几类?
1.7 举例说明离散变量和连续变量。
第二章 习题
思考题
2.1 简述普查和抽样调查的特点。 2.2 统计数据的具体收集方法有哪些? 2.3 调查方案包括哪几个方面的内容? 2.4 什么是问卷?它由哪几部分组成? 2.5 设计问卷的提问项目应注意哪些问题? 2.6 封闭型问题答案的设计有哪些主要方法? 2.7 问卷中问题顺序的设计应注意哪些问题?
练习题
2.1 假定我们要研究在校大学生的生活时间分配状况,请写出你的研究思路。 2.2 某家用电器生产厂家想通过市场调查了解以下问题: a.企业产品的知名度; b.产品的市场占有率;
c.用户对产品质量的评价及满意程度。 (1)请你设计出一份调查方案;
(2)你认为这项调查采取哪种调查方法比较合适? (3)设计出一份调查问卷。
第三章 习题
思考题
3.1 数据的预处理包括哪些内容?
3.2 分类数据和顺序数据的整理和图示方法各有哪些? 3.3 数值型数据的分组方法有哪些?简述组距分组的步骤。 3.4 直方图和条形图有何区别? 3.5 绘制线图应注意哪些问题? 3.6饼图和环形图有什么不同? 3.7 茎叶图和直方图相比有什么优点? 3.8 统计表有哪几个主要部分组成? 3.9 制作统计表应注意哪几个问题?
练习题
3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.较差 E.差。调查结果如下:
B D A B C D B B A C
E A D A B A E A D B
C C B C C C C C B C
C B C D E B C D C E
A C C E D C A E C D
D D A A B D D A A B
C E E B C E C B E C
B C D D C C B D D C
A E C D B E A D C B
E E B C C B E C B C
(1) 指出上面数据属于什么类型; (2) 用Excel制作一张频数分布表;
(3) 绘制一张条形图,反应评价等级的分布。
3.2 某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):
152
105 117 97
124 119 108 88
129 114 105 123
116 115 110 115
100 87 107 119
103 103 137 138
92 118 120 112
95 142 136 146
127 135 117 113
104 125 108 126
(1) 根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2) 如果按规定,销售收入在125万元以上为先进企业,115-万元~125万元为良好企业,105
万元~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
3.3 某百货公司连续40天的商品销售额如下(单位:万元):
41
46 35 42
根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
3.4 为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:
700
706 708 668 706 694 688 701 693 713
716 715 729 710 692 690 689 671 697 699
728 712 694 693 691 736 683 718 664 725
719 722 681 697 747 689 685 707 681 726
685 691 695 674 699 696 702 683 721 704
709 708 685 658 682 651 741 717 720 729
691 690 706 698 698 673 698 733 677 703
684 692 661 666 700 749 713 712 679 696
705 707 735 696 710 708 676 683 695 717
718 701 665 698 722 727 702 692 691 688
25 36 28 36
29 45 46 37
47 37 34 37
38 37 30 49
34 36 37 39
30 45 44 42
38 43 26 32
43 33 38 36
40 44 44 35
(1) 利用计算机对上面的数据进行排序;
(2) 以组距为10进行等距分组,整理成频数分布表,并绘制直方图。 (3) 制作茎叶图,并与直方图作比较。
3.5 下面是北方某城市1—2月份各天气温的记录数据:
-3 -14 -6 -8 -14 -3
2 -18 -8 -6 -22 2
-4 -15 -12 -15 -13 -4
-7 -9 -16 -11 -9 -4
-11 -6 -19 -12 -6 -16
-1 -1 -15 -19 0 -1
7 0 -22 -25 -1 7
8 5 -25 -24 5 5
9 -4 -24 -18 -4 -6
-6 -9 -19 -17 -9 -5
(1) 指出上面的数据属于什么类型; (2) 对上面的数据进行适当的分组;
(3) 绘制直方图,说明该城市气温分布的特点。
3.6 下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据:
年龄 % 18~19岁 1.9 20~21岁 34.7 22~24岁 34.1 25~29岁 17.2 30~34岁 6.4 35~39岁 2.7 40~44岁 1.8 45~59岁 1.2 (1) 对这个年龄分布做直方图;
(2) 从直方图分析成人自学考试人员年龄分布的特点。
3.7 下面是A、B两个班学生的数学考试成绩(单位:分)数据: A班:
44 66 73 76 85
B班:
35 55 61 71 85
39 56 62 73 90
40 56 63 74 91
44 57 64 74 91
44 57 66 79 94
48 57 68 81 95
51 58 68 82 96
52 59 70 83 100
52 60 70 83 100
54 61 71 84 100
57 66 74 77 85
59 67 74 77 86
60 69 74 77 86
61 70 75 78 90
61 70 75 78 92
62 71 75 79 92
63 72 75 80 92
63 73 75 80 93
65 73 76 82 96
(1) 将两个班的考试成绩用一个公共的茎制成茎叶图; (2) 比较两个班考试成绩分布的特点。
3.8 已知1987-1999年我国的国内生产总值数据如下(按当年价格计算,单位:亿元):
年 份 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 国内生产总值 3624.1 4038.2 4517.8 4862.4 5294.7 5934.5 7171.0 8964.4 10202.2 11962.5 14928.3 16909.2 18547.9 21617.8 第一产业 1018.4 1258.9 1359.4 1545.6 1761.6 1960.8 2295.5 2541.6 2763.9 3204.3 3831.0 4228.0 5017.0 5228.6 第二产业 1745.2 1913.5 2192.0 2255.5 2383.0 2646.2 3105.7 3866.6 4492.7 5251.6 6587.2 7278.0 7717.4 9102.2 第三产业 860.5 865.8 966.4 1061.3 1150.1 1327.5 1769.8 2556.2 2945.6 3506.6 4510.1 5403.2 5813.5 7227.0
1992 1993 1994 1995 1996 1997 1998 1999 26638.1 34634.4 46759.4 58478.1 67884.6 74462.6 78345.2 81910.9 5800.0 6882.1 9457.2 11993.0 13844.2 14211.2 14552.4 14457.2 11699.5 16428.5 22372.2 28537.9 33612.9 37222.7 38619.3 40417.9 9138.6 11323.8 14930.0 17947.2 20427.5 23028.7 25173.5 27035.8
(1) 用Excel绘制国内生产总值的线图;
(2) 绘制第一、二、三产业国内生产总值的线图;
(3) 根据1999年的国内生产总值及其构成数据绘制饼图。
3.9 1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。
月份 1 2 3 4 5 6 7 8 9 10 11 12
北京 49 41 47 50 55 57 69 74 68 47 66 56 长春 70 68 50 39 56 54 70 79 66 59 59 57 南京 76 71 77 72 68 73 82 82 71 75 82 82 郑州 57 57 68 67 63 57 74 71 67 53 77 65 武汉 77 75 81 75 71 74 81 73 71 72 78 82 广州 72 80 80 84 83 87 86 84 81 80 72 75 成都 79 83 81 79 75 82 84 78 75 78 78 82 昆明 65 65 58 61 58 72 84 74 77 76 71 71 兰州 51 41 49 46 41 43 58 57 55 45 53 52 西安 67 67 74 70 58 42 62 55 65 65 73 72 资料来源:《中国统计年鉴(1998)》,10页,北京,中国统计出版社,1998.
第四章 习题
思考题
4.1 一组数据的分布特征可以从那几个方面进行测度? 4.2 怎样理解均值在统计学中的地位? 4.3 对于比率数据为什么采用几何平均? 4.4 简述众数、中位数和均值的特点及应用场合。 4.5 简述异众比率、四分位数、方差或标准差的适用场合。 4.6 标准分数有哪些用途? 4.7 为什么要计算离散系数?
练习题
4.1 某百货公司6月份各天的销售额数据如下(单位:万元):
257
271 272 276 292 284 297 261 268 252 281 303 238 301 273 310 274 263 240 267 322 236 280 249 265 291 269 278 258 295 (1) 计算该百货公司日销售额的均值、中位数和四分位数; (2) 计算日销售额的标准差
4.2 甲、乙两个企业生产三种产品的单位成本和总成本资料如下:
产品 名称 A B C 单位成本 (元) 15 20 30 甲企业 2100 3000 1500 总成本(元) 乙企业 3255 1500 1500 比较哪个企业的总平均成本高并分析其原因。
4.3 某企业有两个生产车间,甲车间有20名工人,人均日加工产品数为78件,标准差为8件;乙车间有30名工人,人均日加工产品数为72件,标准差为10件。将两车间放在一起,计算日加工产品数的平均值及标准差。
4.4 为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。
(1)哪一位调查研究人员在其所抽取的样本中得到少年儿童的平均身高较大?或者这两组样本的平均身高相同?
(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?
(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调查人员来说,这种机会是相同的?
4.5 在某一城市所做的一项抽样调查中发现,在所抽取的1000个家庭中,月人均收入在500元~600元的家庭占24%,月人均收入在600元~700元的家庭占26%,在700元~800元的家庭占29%,在800元~900元的家庭占10%,在900元~1000元的家庭占7%,在1000
元以上的占4%。你认为要分析该城市家庭的人均收入状况,用均值、众数、和中位数哪一个测度值更好?是说明理由。
4.6 一项关于大学生体重状况的研究发现,男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么? (2)以磅为单位(1kg=2.2磅),求体重的平均数和标准差。
(3)粗略的估计一下,男生中有百分之几的人体重在55kg~65kg之间? (4)粗略的估计一下,女生中有百分之几的人体重在40kg~60kg之间?
4.7一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该位应试者哪一项测试更为理想?
4.8 一条产品生产线平均每天的产量为3700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落入正负两个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制? 时间 产量(件) 周一 3850 周二 3670 周三 3690 周四 3720 周五 3610 周六 3590 周日 3700 4.9 某班共有60名女生,在期末的统计学考试中,男生的平均考试成绩为75分,标准差为6分;女生的平均考试成绩为80分,标准差为6分。根据给出的条件回答下面的问题: (1)如果该班的男女生各占一半,全班考试成绩的平均数是多少?标准差又是多少? (2)如果该班中男生为36人,女生为24人,全班考试成绩的平均数是多少?标准差又是多少?
(3)如果该班中男生为24人,女生为36人,全班考试成绩的平均数是多少?标准差又是多少?
(4)比较(1)、(2)和(3)的平均考试成绩有何变化?并解释其变化的原因。 (5)比较(2)和(3)的标准差有何变化?并解释其原因。
(6)如果该班的男女学生各占一半,全班学生中考试成绩在64.5 分~90.5的人数大概有多少?
4.10 已知某地区农民家庭按年人均收入分组的资料如下:
按人均收入分组(元) 100以下 100~200 200~300 300~400 400~500 500~600 600以上 合 计 计算该地区平均每户人均收入的均值及标准差。 4.11 对10名成年人和10名幼儿的身高(cm)进行抽样调查,结果如下:
家庭户数占总户数比重(%) 2.3 13.7 19.7 15.2 15.1 20.0 14.0 100 成年组 幼儿组
166 68
169 69
172 68
177 70
180 71
170 73
172 72
174 73
168 74
173 75
(1)要比较成年组和幼儿组的身高差异,你会采用什么样的测度值?为什么? (2)比较分析哪一组的身高差异大?
4.12 一种产品需要工人组装,现有三种可供选择的组装方法。为检验哪种方法更好,随即抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):
方法A 164
167 168 165 170 165 164 168 164 162 163 166 167 166 165
方法B 129 130 129 130 131 130 129 127 128 128 127 128 128 125 132
方法C 125 126 126 127 126 128 127 126 127 127 125 126 116 126 125
(1)你准备采用什么方法来评价组装方法的优劣?
(2)如果让你选择一种方法,你会做出怎样的选择?试说明理由。
4.13 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高可以类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定的关系。 (1)你认为改用什么样的统计测度值来反映投资的风险?
(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票? (3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?
第五章 习题
思考题
5.1 解释抽样推断的含义。
5.2 解释简单随机抽样、分层抽样、系统抽样和整群抽样的含义。 5.3 比较简单随机抽样、分层抽样、系统抽样和整群抽样的特点。 5.4 什么是重复抽样和不重复抽样? 5.5 什么是抽样分布?
5.6 样本统计量的分布与总体分布的关系是什么?
5.7 样本均值抽样分布的两个主要特征值是什么?它们与总体参数有什么关系? 5.8 重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有什么不同? 5.9 简述评价估计量好坏的标准。 5.10 Za/2
σn的含义是什么?
5.11 简述样本容量与置信水平、总体方案、边际误差的关系。
练习题
5.1 从均值为200、标准差为50的总体中,抽取n=100的简单随机样本,用样本均值x估计总体均值。
(1)x的数学期望是多少? (2)x的标准差是多少? (3)x的抽样分布是什么?
5.2 假定总体共有1000个单位,均值μ=32,标准差σ=5。从中抽取一个容量为30的简单随机样本用于获得总体信息。 (1)x的数学期望是多少? (2)x的标准差是多少?
5.3 从π=0.4的总体中,抽取一个容量为100的简单随机样本。 (1)p的数学期望是多少? (2)p的标准差是多少? (3)p的分布是什么?
5.4 假定总体比例为π=0.55,从该总体中分别抽取容量为100,200,500和1000的样本。 (1)分别计算样本比例的标准差σp ;
(2)当样本容量增大时,样本比例的标准差有何变化?
5.5从一个标准差为5 的总体中抽取一个容量为40的样本,样本均值为25,。 (1)样本均值的抽样标准差σx等于多少? (2)在95%的置信水平下,边际误差是多少?
5.6 某快餐店想要估计每位顾客午餐的平均消费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准差; (2)在95%的置信水平下,求边际误差;
(3)如果样本均值为120元,求总体均值95%的置信区间。
5.7 某大学为了了解学生每天上网时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 4.4 2.1 4.7
3.1 2.0 1.9 1.4
6.2 5.4 1.2 1.2
5.8 2.6 5.1 2.9
2.3 6.4 4.3 3.5
4.1 1.8 4.2 2.4
5.4 3.5 3.6 0.5
4.5 5.7 0.8 3.6
3.2 2.3 1.5 2.5
求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。 5.8从一个正态总体中随机抽取容量为8的样本,各样本值分别为:
10 8 12 15 6 13 5 11 求总体均值95%的置信区间。
5.9某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(km)分别是:
10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2 求职工上班从家里到单位平均距离95%的置信区间。
5.10 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。
5.11 某居民小区共有居民500户,小区管理者准备采取一项新的供水措施,想了解居民是否赞成。采取不重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。 (1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95%。 (2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?
5.12 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求边际误差不超过20元,应抽取多少个顾客作为样本?
5.13 某大学共有在校本科生8000人,学校想要估计每个学生一个月的生活费支出金额,准备采取不重复抽样方法。根据前几届的毕业生资料,平均每个学生月生活费支出金额的标准差约为50元,边际误差不超过20元,若本次估计确定的置信水平为95%,应抽取多少名学生进行调查?
第六章 习题
思考题
6.1 理解原假设与备择假设的含义,并归纳常见的集中建立原假设与备择假设的规则。 6.2 检验统计量具备怎样的特征和用途?
6.3 第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系? 6.4 什么是显著水平?它对于假设检验决策的意义是什么? 6.5 比较单侧检验和双侧检验的本质区别。
6.6 大样本情形下的总体均值左侧检验、右侧检验及双侧检验的拒绝域。 6.7 分别列出大样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域。 6.8 小样本情形下的总体均值检验应该构造成什么检验统计量?应用前提是什么? 6.9 分别列出小样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域。 6.10 总体比例检验中“大样本”概念是指什么?检验统计量的形式怎样? 6.11 简述假设检验的一般步骤。
6.12 总结不同情形总体均值检验的基本流程。
练习题
6.1 某乐器厂以往生产的乐器采用的是一种镍合金弦线,这种弦线的平均抗拉强度不超过1035Mpa,现产品开发小组研究了一种新型弦线,他们认为其抗拉强度得到了提高。 (1)在对研究小组开发的产品进行检验室,应该采取哪种形式的假设?为什么?
H0:μ≤1035 H0: μ≥1035 H0: μ=1035 H1:μ<1035 H1: μ>1035 H1: μ≠1035 (2)如果不能拒绝原假设,应该做出怎样的结论? (3)如果有充足的理由拒绝原假设,结论又如何?
6.2 一名汽车销售管理者声称他们每个月平均销售的汽车数量至少为14辆,有关组织想通过研究知道这一数量是否属实。
(1)为解决该组织的疑问,建立合适的原假设和备择假设。 (2)当不能拒绝原假设时,该组织会得到什么结论? (3)当可以拒绝原假设是,该组织会得到什么结论?
6.3 一条产品生产线用于生产玻璃纸,正常状态下要求玻璃纸的横向延伸率为65,质量控制监督人员需要定期进行抽检,如果正式玻璃纸的横向延伸率不符合规范,该生产线就必须立即停产调整。
(1)建立适当的原假设和备择假设,帮助监控人员判断该生产线是否运转正常? (2)样本数据表明应该拒绝原假设时意味着什么? (3)样本数据无法支持拒绝假设时意味着什么?
6.4 某跨国公司的推销员每周平均销售8000美元的产品,公司的董事长建议采取一种新的刺激销售的奖励计划,通过是星期的销售数据来决定该计划是否能够提高每个销售人员的平均销售额。
(1)在这种情形下,发生第一类错误指的是什么?将导致怎样的后果? (2)在这种情形下,发生第二类错误指的是什么?将导致怎样的后果?
6.5 某种纤维原有的平均强力不超过6g,现希望通过改进工艺来提高其平均强力。研究人员测得了100个关于新纤维的强力数据,发现其均值为6.35。假定纤维强力的标准差仍保持为1.19不变,在5%的显著性水平下对该问题进行假设检验。 (1)检验的临界值是多少?拒绝法则是什么? (2)计算检验统计量的值,你的结论是什么? 6.6 考虑如下的假设检验问题:
H0: μ≥25 H1:μ<25
取α=0.01,总体标准差为12,根据100项组成的一个样本的不同结果分别计算检验统计量的值,简述你的结论。
(1)x=22.0 (2)x=24.0 (3)x=23.5 (4)x=22.8
6.7 考虑如下的假设检验问题: H0: μ=15 H1:μ≠15
一个样本由50项组成,其样本均值为14.2,样本标准差为5. (1) α=0.05时,拒绝规则是什么? (2) 计算检验统计量Z的值。 (3) 你能得出怎样的结论。
6.8 某印刷厂旧机器每台每周的开工成本服从正态分布N(100,25),现新安装了一台机器,观测到它在9周里平均每周的开工成本x=75元,假定成本的标准差不变,试问在α=0.01的水平上该厂机器的平均开工成本是否有所下降?
6.9 经验表明,一个矩形的宽与长之比等于0.618的时候会给人们良好的感觉。某工艺品工厂生产的矩形工艺品框架的宽与长要求也按这一比例设计,假定其总体服从正态分布,现随机抽取了20个框架测得比值分别为:
0.699
0.672 0.668 0.553
0.749 0.615 0.611 0.570
0.654 0.606 0.606 0.844
0,670 0.690 0.609 0.576
0,612 0.628 0.601 0.933
2
在显著水平α=0.05时能否人为该厂生产的工艺品框架宽与长的平均比例为0.618? 6.10一般来说,如果能够证明某部电视连续剧在播出的头13周中观众的收视率超过了25%,则可以认为它获得了成功。现针对一部关于农村生活题材的电视剧抽选了400个家庭组成一个样本,发现头13周里有112个家庭看过这部电视剧。 (1)建立适当的原假设与备择假设。
(2)如果允许发生第一类错误的最大概率为0.01,这些信息能否判定这部电视剧是成功的? 6.11 一位著名的医生声称有75%的女性所穿鞋子过小,美国的足部和踝部矫形协会对356名女性进行了研究,发现其中有313名妇女所穿鞋子的号码至少小一号。取α=0.01,检验如下的假定:
H0: π=0.75 H1:π≠0.75 对这个医生的论断你有什么看法?
第七章 习题
思考题
7.1 解释相关关系的含义,说明相关关系的特点。 7.2 简述相关系数的取值及其意义。 7.3 为什么要对相关系数进行显著性检验? 7.4 简述相关系数显著性检验的步骤。
7.5 解释回归模型、回归方程、估计的回归方程的含义。 7.6 一元线性回归模型中有哪些基本的假定? 7.7 简述参数最小二乘估计的基本原理。
7.8 解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。 7.9 简述判定系数的含义和作用。
7.10 在回归分析中,F检验和t检验各有什么作用? 7.11 简述线性关系检验和回归系数检验的具体步骤。 7.12 什么是置信区间估计和预测区间估计?二者有何区别?
练习题
7.1 从某一行业总随机抽取12家企业,所的产量与生产费用的数据如下:
企业 编号 1 2 3 4 5 6 产量 (台) 40 42 50 55 65 78 生产费用 (万元) 130 150 155 140 150 154 企业 编号 7 8 9 10 11 12 产量 (台) 84 100 116 125 130 140 生产费用 (万元) 165 170 167 180 175 185 (1)绘制产量与生产费用的散点图,判断二者之间的关系形态。 (2)计算产量与生产费用之间的线性相关系数。
(3)对相关系数的显著特征进行检验(α=0.05),并说明二者之间的关系密切程度。 7.2 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:
地区 北京 辽宁 上海 江西 河南 贵州 陕西
态。
人均GDP(元)
22460 11226 34547 4851 5444 2662 4549
人均消费水平(元)
7326 4490 11546 2396 2208 1608 2035
(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。
(5)检验回归方程线性关系的显著性(α=0.05)。
(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
7.3 随机抽取的10家航空公司,对其一年的航班正点率和顾客投诉次数进行了调查,所得数据如下:
航空公司编号
1
2 3 4 5 6 7 8 9 10
航班正点率(%)
81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 91.4 68.5
投诉次数(次)
21 58 85 68 74 93 72 122 18 125
(1)绘制散点图,说明二者之间的关系形态。
(2)用航班正点率作为自变量,顾客投诉次数作因变量,求出估计的回归方程,并解释回归系数的意义。
(3)检验回归系数的显著性(α=0.05)。
(4)如果航班正点率为80%,估计顾客的投诉次数。
(5)求航班正点率为80%时,顾客投诉次数95%的置信区间和预测区间。 7.4 下面是20个城市写字楼出租率和每平方米月租金的数据:
地区编号
1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
出租率(%)
70.6 69.8 73.4 67.1 70.1 68.7 63.4 73.5 71.4 80.7 71.4 80.7 71.2 62.0 78.7 69.5
每平米月租金(元)
99 74 83 70 84 65 67 105 95 107 86 66 106 70 81 75
地区编号 17 18 19 20
出租率(%)
67.7 68.4 72.0 67.9
每平米月租金(元)
82 94 92 76
设月租金为自变量,出租率为因变量,用Excel进行回归,并对结果进行分析。
7.5 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:
方差分析表
变量来源 回归 残差 总计
df 11
SS 40158.07 1642866.67
参数估计表
Intercept X Variable 1
Coefficients 363.6891 1.420211
标准误差 62.45529 0.071091
t Stat 5.823191 19.97749
P-value 0.000168 2.17E-09
MS —
F — —
Significance F
2.17E-09 — —
(1)完成上面的方差分析表‘
(2)汽车销售量的变差中有多少是由于广告费用的变动引起的。 (3)销售量与广告费用之间的相关系数是多少? (4)写出估计的回归方程并解释回归系数的实际意义。 (5)检验线性关系的显著性(α=0.05)。 (6)简要概括一下你的发现。
第八章 习题
思考题
8.1 简述时间序列的各构成要素。 8.2 什么是年度化增长率?它有何用途? 8.3 利用增长率分析时间序列时应注意哪些问题? 8.4 简述平稳序列和非平稳序列的含义。 8.5 简述指数平滑法的基本含义。 8.6 简述季节指数的计算步骤。
练习题
8.1 下表是1981-1999年国家财政用于农业的支出额数据:
年份 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 (2)计算年平均增长率。
(3)根据年平均增长率预测2000年的支出额。
8.2 下表是1981-2000年我国油菜籽单位面积产量数据单位(公斤/公顷):
年份 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 单位面积产量 1451 1372 1168 1232 1245 1200 1260 1020 1095 1260 年份 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 单位面积产量 1215 1281 1309 1296 1416 1367 1479 1272 1469 1519 支出额(亿元) 110.21 120.49 132.87 141.29 153.62 184.20 195.72 214.07 265.94 307.84 年份 1991 1992 1993 1994 1995 1996 1997 1998 1999 支出额(亿元) 347.57 376.02 440.45 532.98 574.93 700.43 766.39 1154.76 1085.76 (1)绘制时间序列图描述其形态。 (1)绘制时间序列图描述其形态。 (2)用5期移动平均法预测2001年的单位面积产量。
(3)采用指数平滑法,分别用平滑系数α=0.3和α=0.5预测2001年的单位面积产量,分析预测误差,说明用哪一个平滑系数预测更合适。 8.3下表是一家旅馆过去18 个月的营业额数据:
月份 1 2 3 4 5 6 7 8 9 营业额(万元) 295 283 322 355 286 379 381 431 424 月份 10 11 12 13 14 15 16 17 18 营业额(万元) 473 470 481 449 544 601 587 644 660 (1)用3期移动平均法预测第19个月的营业额。 (2)采用指数平滑法,分别用平滑系数α=0.3,α=0.4和α=0.5预测各月的营业额,分析预测误差,说明用哪一个平滑系数预测更合适。
(3)建立一个趋势方程预测各月的营业额,计算出估计标准误差。
8.4 下表是1981-2000年我国财政用于文教、科技、卫生事业费支出额数据:
年份 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 支出(万元) 171.36 196.96 223.54 263.17 316.70 379.93 402.75 486.10 553.33 617.29 年份 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 支出(万元) 708.00 792.96 957.77 1278.18 1467.06 1704.25 1903.59 2154.38 2408.06 2736.88 (1)绘制时间序列图描述其趋势。 (2)选择一条适合的趋势线拟合数据,并根据趋势线预测2001年的支出额。 8.5 下表是1981-2000年我国的原煤产量数据:
年份 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 原煤产量(亿吨) 6.22 6.66 7.15 7.89 8.72 8.94 9.28 9.80 10.54 10.80 年份 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 原煤产量(亿吨) 10.87 11.16 11.50 12.40 13.61 13.97 13.73 12.50 10.45 9.98 (1)绘制时间序列图描述其趋势。 (2)选择一条合适的趋势线拟合数据,并根据趋势线预测2001年的产量。
8.6 一家贸易公司经营产品的外销业务,为了合理地组织货源,需要了解外销订单的变化状况。下表是1997-2001年各月份得外销订单金额(单位:万元) 年 月 1 2 3 4 5 6 7 8 9 10 11 12 1997 54.3 46.6 62.6 58.2 57.4 56.6 56.1 52.9 54.6 51.3 54.8 52.1 1998 49.1 50.4 59.3 58.5 60.0 55.6 58.0 55.8 55.8 59.8 59.4 55.5 1999 56.7 52.0 61.7 61.4 62.4 63.6 63.2 63.9 63.2 63.4 64.4 63.8 2000 64.4 54.5 68.0 71.9 69.4 67.7 68.0 66.3 67.8 71.5 70.5 69.4 2001 61.1 69.4 76.5 71.6 74.6 69.9 71.4 72.7 69.9 74.2 72.7 72.5 (1)根据各年的月份数据绘制趋势图,说明该时间序列的特点。 (2)要寻找各月份的趋势值,你认为应该采取什么方法? (3)选择你认为合适的方法预测2002年1月份的外销订单金额。
8.7下表数据是一家大型百货公司最近几年各季度的销售额数据(单位:万元)。对这一时间序列构成要素进行分解,并作出图形进行分析。
季 月 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 8.8下表中的数据是一家水产品加工公司最近几年的加工量数据(单位:吨),对该序列进行分解与分析。 年 月 1 2 3 4 5 1997 78.8 78.1 84.0 94.3 97.6 1998 91.9 92.1 80.9 94.5 101.4 1999 90.4 100.1 114.1 108.2 125.7 2000 66.8 73.3 85.3 94.6 74.1 2001 99.5 80.0 108.4 118.3 126.8 1 993.1 1673.6 2342.4 3254.4 3904.2 5483.2 5123.6 4942.4 5009.9 6059.3 2 971.2 1931.5 2552.6 4245.2 5105.9 5997.3 6051.0 6825.5 6257.9 5819.7 3 2264.1 3927.8 3747.5 5951.1 7252.6 8776.1 9592.2 8900.1 8016.8 7758.8 4 1943.3 3079.6 4472.8 6373.1 8630.5 8720.6 8341.2 8723.1 7865.6 8128.2 6 7 8 9 10 11 12
102.8 92.7 41.6 109.8 127.3 210.3 242.8 111.7 92.9 43.6 117.5 153.1 229.4 286.7 118.3 89.1 46.1 132.1 173.9 273.3 352.1 100.8 106.7 44.0 132.1 162.5 249.0 330.8 123.3 117.2 42.0 150.6 176.6 249.2 320.6
第九章 习题
思考题
9.1 什么是指数?它有哪些性质?
9.2 编制加权指数时,确定权属需要考虑哪几个方面的问题? 9.3拉氏指数和帕氏指数各有什么特点?
9.4 加权综合指数和加权平均指数有何区别联系? 9.5居民消费价格指数由哪些作用?
练习题
9.1 某百货公司三种商品的销售量和销售价格统计数据如下:
商品 名称 甲 乙 丙 计算下列指数: (1)计算三种商品的销售额总量指数;
(2)以2001年的销售量为权数计算三种商品的销售量综合指数; (13)以2000年单价为权数计算三种商品的销售量综合指数; (4)分析销售量和价格变动对销售额影响的绝对额和相对值。
9.2 根据第9.1题中的数据,计算以2000年销售量为权数的加权价格指数和以2001年单价为权数的加权销售量指数,并将结果与9.1题的结果进行比较,说明其差异的原因。 9.3某家具公司生产三种产品的有关数据如下:
产品 名称 写字台 椅 子 书 柜 计算下列指数: (1)三种产品的生产费用总量指数; (2)以基期生产费用为权数的加权产量指数: (3)以报告期生产费用为权数的单位成本总指数; (4)分析产量和单位成品变动对总生产费用的影响。 9.4利用指数体系之间的关系回答下列问题:
(1)某企业2001年同2000年相比,各种产品的产量增长了8%,总生产费用增长了12%。该企业2001的单位成本有何变化?
(2)某地区今年与上年相比,用同样多的人民币只能购买上年商品的90%,求物价指数;若同样多的人民币比上年可多购买10%的商品,物价指数是多少?
总生产费用(万元) 基期 45.4 30.0 55.2 报告期 53.6 33.8 58.5 报告其产量比基期增长% 14.0 13.5 8.6 计量 单位 件 盒 个 2000年 1800 2400 3500 销售量 2001年 1300 2600 3800 单价(元) 2000年 35.5 15.4 8.0 2001年 43.6 18.5 10.0 9.5已知我国1990-2000年的人均GDP数据和居民消费价格指数的数据如下:
年份 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
利用价格指数对人均GDP进行缩减。
9.6设有三种工业类股票的价格和发行量数据如下:
股票 名称 A B C
人均GDP(元)
1634 1879 2287 2939 3923 4854 5576 6054 6307 6547 7078
居民消费价格指数(%)
103.1 103.4 106.4 114.7 124.1 117.1 108.3 102.8 99.2 98.6 100.4
价格(元) 前收盘 6.42 12.26 14.55 本日收盘 6.02 12.50 15.60 发行量(万股) 12000 3500 2000 使计算股票价格指数,并对股价指数的变动进行简要的分析。
正在阅读:
《统计学》练习题 - 图文04-04
群众路线个人对照检查材料02-11
黑建筑专用简历模板05-31
现代大学英语第二册第二课sayyes单元测试unit207-27
浅谈地理国情监测的内涵和方法03-15
民事起诉状09-28
公差与配合标准表01-16
尔雅黄帝内经答案10-13
1#~4#、12#~14#楼施工组织设计2016.11.11 - 图文07-09
小学生写夏天的风作文精选06-14
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 练习题
- 统计学
- 图文