统计学课后习题答案(全章节)剖析
更新时间:2023-10-18 20:14:01 阅读量: 综合文库 文档下载
第二章、练习题及解答
2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下: 700 706 708 668 706 694 688 701 693 713 要求:
(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
灯泡的使用寿命频数分布表 分组 650-660 660-670 670-680 680-690 690-700 700-710 710-720 720-730 730-740 740-750 合计
3.某公司下属40个销售点2012年的商品销售收入数据如下: 单位:万元 152 105 117 97
124 119 108 88
129 114 105 123
116 115 110 115
100 87 107 119
103 103 137 138
92 118 120 112
95 142 136 146
127 135 117 113
104 125 108 126
频数(只) 2 5 6 14 26 18 13 10 3 3 100 频率(%) 2 5 6 14 26 18 13 10 3 3 100 716 715 729 710 692 690 689 671 697 699
728 712 694 693 691 736 683 718 664 725
719 722 681 697 747 689 685 707 681 726
685 691 695 674 699 696 702 683 721 704
709 708 685 658 682 651 741 717 720 729
691 690 706 698 698 673 698 733 677 703
684 692 661 666 700 749 713 712 679 696
705 707 735 696 710 708 676 683 695 717
718 701 665 698 722 727 702 692 691 688
要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。
解:(1) 频数分布表
分组 85-95 95-105 105-115 115-125 125-135 135-145 145-155 合计
(2)茎叶图
树茎 8 9 10 11 12 13 14 15 树叶 78 257 033455788 023455677899 0345679 5678 26 2 第三章、练习题及解答
1. 已知下表资料:
日产量(件) 25 30 35 40 45 合 计 工人数(人) 20 50 80 36 14 200 工人比重(%) 10 25 40 18 7 100 数据个数 2 3 9 12 7 4 2 1 频数(个) 频率(%) 3 6 9 11 4 5 2 40 7.5 15.0 22.5 27.5 10.0 12.5 5.0 100 试根据频数和频率资料,分别计算工人平均日产量。 解: 计算表 日产量(件)x 工人数工人比重(人)f (%)f/∑f xf xf/∑f 2
25 30 35 40 45 20 50 80 36 14 10 25 40 18 7 100 500 1500 2800 1440 630 6870 2.5 7.5 14 7.2 3.15 34.35 合 计 200 根据频数计算工人平均日产量:x??xf?f?xg?f6870?34.35(件) 200?34.35(件)
根据频率计算工人平均日产量:x??f结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表:
单位产品成本(元/件) 10~12 12~14 14~18 合计 单位数 2 3 4 9 产量比重(%) 20 42 38 100 试计算这9个企业的平均单位成本。解:
单位产品成产量比重(%) 组中值单位数 X·f/∑f 本(元/件) f/∑f (元)x 10~12 12~14 14~18 合计 2 3 4 9 20 42 38 100 11 13 16 - =13.74(元)
2.2 5.46 6.08 13.74 这9个企业的平均单位成本=x??xgff?3.某专业统计学考试成绩资料如下:
按成绩分组(分) 60以下 60~70 70~80 80~90 90~100 100以上 合 计
3
学生数(人) 4 8 14 20 9 5 60 试计算众数、中位数。 解:众数的计算:
根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9,
Mo?L?fm?fm?1?d
?fm?fm?1???fm?fm?1?20?14?10?83.53(分)
?20?14???20?9? ?80?中位数的计算: 根据
?f2?60?30和向上累积频数信息知,中位数在80~90这一组。 2?fMe?L?2?Sm?1fme?d?80?30?26?10?82(分) 204.利用练习题1题资料计算200名工人日产量的标准差,并计算离散系数。(只按照频数计算即可)
解: 计算表
日产量工人数(x?x)2f (件)x (人)f 25 30 35 40 45 20 50 80 36 14 1748.45 946.125 33.8 1149.21 1587.915 5465.5 合 200 计 ?2???x?x??f2f?5465.5?27.3275 200???2?27.3275?5.23
v???x?100%?5.23?100%?15.23% 34.355.一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,平均分数是80分,标准差是15分;在B项测试中,平均分数是200分,标准差是50分。一位应试者在A项测试中得了95分,在B项测试中得了225分。与平均分数相比,该位应试者哪一项测试更为理想?
4
解:计算各自的标准分数:zA?95?80225?200?1,ZB??0.5 1550第四章、练习题及解答
因为A测试的标准分数高于B测试的标准分,所以该测试者A想测试更理想。
1. 随机变量Z服从标准正态分布,求以下概率:
(1)P(0?Z?1.2);(2)P(?0.48?Z?0);(3)P(Z?1.33)。
2. 由30辆汽车构成的一个随机样本,测得每百公里的耗油量(单位:升)数据如下:
9.19 9.63 10.10 9.7 10.09 10.01 8.82 9.43 10.03 9.85 9.60 10.50 10.12 9.49 9.37 9.27 8.83 9.39 9.48 9.64 9.78 9.35 9.54 9.36 9.68 8.82 8.65 8.51 9.14 9.75 绘制频数分布直方图,判断汽车的耗油量是否近似服从正态分布。
3. 从均值为200、标准差为50的总体中,抽取n?100的简单随机样本,用样本均值x估
计总体均值。
(1)x的期望值是多少?(2)x的标准差是多少?(3)x的概率分布是什么? 4. 从?=0.4的总体中,抽取一个容量为500的简单随机样本,样本比例为p。
(1)p的期望值是多少?(2)p的标准差是多少?(3)p的概率分布是什么? 5. 假设一个总体共有6个数值:54,55,59,63,64,68。从该总体中按重置抽样方式抽
取n?2的简单随机样本。 (1)计算总体的均值和方差。 (2)一共有多少个可能的样本?
(3)抽出所有可能的样本,并计算出每个样本的均值。
(4)画出样本均值的频数分布直方图,判断样本均值是否服从正态分布。
(5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得到的结论是什么?
第四章习题答案
1.解:由于Z服从标准正态分布,查表得 NORMSDIST(0)?0.5,NORMSDIST(1.2)?0.8849, NORMSDIST(0.48)?0.6844,NORMSDIST(1.2)?0.8849, NORMSDIST(1.33)?0.9082
(1.2)?NORMSDIST(0)?0.8849-0.5?0.3849 (1)P(0?Z?1.2)?NORMSDIST(2)
P(?0.48?Z?0)?NORMSDIST(0)?NORMSDIST(-0.48) ?NORMSDIST(0)-1?NORMSDIST(0.48)?0.1844
)?1?P(Z?1.33)?1?NORMSDIST(1.33)?0.0918 (3)P(Z?1.33
5
2.解:对数据进行整理,30个样本数据极差为1.99。将数据分为7组,组距为0.3,如下表所示:
分组 8.51-8.80 8.81-9.10 9.11-9.40 9.41-9.70 9.71-10.00 10.01-10.30 10.31-10.60 对应频数直方图为:
观察上图,数据基本上拟合正态分布曲线,可以认为汽车耗油量基本服从正态分布。 3.解:已知:??200 , n?100,??50?2500,同时由于样本量很大,可以看作重置抽样来处理。
根据公式4.5可以得到: (1)E(x)?x???200
22频数 2 3 7 9 3 5 1 (2)??2x?2n?25002?25,?x??x?5 100(3)根据中心极限定理,x近似服从均值为200,标准差为5的正态分布。 4.解:已知:??0.4 , n?500,同时由于样本量很大,可以看作重置抽样来处理。 根据公式4.7可以得到: (1)E(p)???0.4 (2)?p?2?(1??)n2?0.0219; ?0.00048,?p??p(3)根据中心极限定理,p近似服从均值为0.4,标准差为0.0219的正态分布。
5.解:
(1)x?6?xi?16iN?54?55?59?63?64?68?60.5,
6?2??(x?x)ii?12N?24.9167;???2?4.9917
2(2)由于从总体中重置抽取的样本,考虑抽取顺序情况下共有6?36种可能样本。 (3)如下表所示: 样本序号 样本单位 样本均值x 样本序号 样本单位 样本均值x
6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 54,54 54,55 54,59 54,63 54,64 54,68 55,54 55,55 55,59 55,63 55,64 55,68 59,54 59,55 59,59 59,63 59,64 59,68 54 54.5 56.5 58.5 59 61 54.5 55 57 59 59.5 61.5 56.5 57 59 61 61.5 63.5 分组 54-56 56-58 58-60 60-62 62-64 64-66 66-68 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 频数 4 4 9 7 7 3 2 63,54 63,55 63,59 63,63 63,64 63,68 64,54 64,55 64,59 64,63 64,64 64,68 68,54 68,55 68,59 68,63 68,64 68,68 58.5 59 61 63 63.5 65.5 59 59.5 61.5 63.5 64 66 61 61.5 63.5 65.5 66 68 (4)样本均值频数表:
样本均值频数直方图:
10987654321054-5656-5858-6060-6262-6464-6666-68
由上图可以发现,样本均值近似服从正态分布;
7
(5)由样本方差均值公式可以得到:
x??xi?136i3636?2178?60.5 36?x)2??x?2?(xi?1i36472.25?2?12.45833;?x??x?3.529636? 36n可以看出,样本均值与总体均值很接近,样本标准差则比总体方差小。
第五章、练习题及解答
1. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期三周的时间里选取49名顾客
组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差; (2)在95%的置信水平下,求估计误差;
(3)如果样本均值为120元,求快餐店所有顾客午餐平均花费金额的95%的置信区间。 2. 利用下面的信息,构建总体均值?的置信区间。
(1)总体服从正态分布,且已知x?8900,??500,n?15,置信水平为95%。 (2)总体不服从正态分布,且已知x?8900,??500,n?35,置信水平为95%。 (3)总体不服从正态分布,?未知,x?8900,s?500,n?35,置信水平为90%。 (4)总体不服从正态分布,?未知,x?8900,s?500,n?35,置信水平为99%。 3. 某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网
的时间,得到下面的数据(单位:小时); 3.3 4.4 2.1 4.7 3.1 2.0 1.9 1.4 6.2 5.4 1.2 1.2 5.8 2.6 5.1 2.9 2.3 6.4 4.3 3.5 4.1 1.8 4.2 2.4 5.4 3.5 3.6 0.5 4.5 5.7 0.8 3.6 3.2 2.3 1.5 2.5 求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。 4. 某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。重置随机抽取了50户,其中有32户赞成,18户反对。 (1)求总体中赞成新措施的户数比例的置信区间,置信水平为95%。
(2)如果小区管理者预计赞成的比例能达到80%,要求估计误差不超过10%。应抽取多少户进行调查?
5. 顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与很多因素有关,比
如,银行的业务员办理业务的速度、顾客等待排队的方式,等等。为此,某银行准备采
8
取两种排队方式进行试验。第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下: 方式1 方式2 6.5 4.2 6.6 5.4 6,7 5.8 6.8 6.2 7.1 6.7 7.3 7.7 7.4 7.7 7.7 8.5 7.7 9.3 7.7 10.0 (1)构建第一种排队方式等待时间标准差的95%的置信区间。 (2)构建第二种排队方式等待时间标准差的95%的置信区间。 (3)根据(1)和(2)的结果,你认为哪种排队方式更好?
6. 两个正态总体的方差?1和?2未知但相等。从两个总体中分别抽取两个独立的随机样
本,它们的均值和标准差如下:
来自总体1的样本 来自总体2的样本 22n1?14 x1?53.2 s12?96.8 n2?7 x2?43.4 2s2?102.0 求(?1-?2)的置信区间,显著性水平分别为95%和99%。
7. 一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得
到的自信心测试分数如下: 人员编号 方法1 方法2 1 78 71 2 63 44 3 72 61 4 89 84 5 91 74 6 49 51 7 68 55 8 76 60 9 85 77 10 55 39 构建两种方法平均自信心得分之差?d??1-?2的95%的置信区间。
8. 从两个总体中各抽取一个n1?n2?250的独立随机样本,来自总体1的样本比例为
p1?40%,来自总体2的样本比例为p2?30%。
构造(?1-?2)的置信区间,置信水平分别为90%和95%。
9. 生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对工序进行改进以减
小方差。下表是两部机器生产的袋茶重量(单位:克)的数据:
机器1 3.45 3.22 3.90 3.22 机器2 3.28 3.35 9
3.20 3.22 3.50 2.95 3.16 3.20 2.98 3.75 3.38 3.45 3.48 3.18 223.70 3.28 3.35 3.20 3.12 3.25 3.28 3.30 3.30 3.34 3.28 3.30 3.19 3.20 3.29 3.35 3.16 3.34 3.30 3.05 3.33 3.27 3.28 3.25 构造两个总体方差比?1/?2的95%的置信区间。
10. 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120
元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求估计误差不超过20元,应抽取多少个顾客作为样本?
11. 假定两个总体的标准差分别为:?1?12,?2?15,若要求估计误差不超过5,相应的
置信水平为95%,假定n1?n2,估计两个总体均值之差(?1-?2)时所需的样本量为多大?
12. 假定n1?n2,估计误差为0.05,相应的置信水平为95%,估计两个总体比例之差(?1-?2)时所需的样本量为多大?
第五章课后习题参考答案
1.解:(1)已知??15,n?49,故:?x??n2?15?2.1429; 7(2)由题目可知:??0.05,故查表可知:Z??Z0.025?1.96 估计误差Z??x?1.96?2.1429?4.2;
2(3)由题目可知:x?120,由置信区间公式可得: x?Z??x?120?4.2?(115.8,124.2)
2即快餐店所有顾客午餐平均花费金额的95%的置信区间为(115.8,124.2)元。 2.解:
(1)总体服从正态分布,Z??Z0.025?1.96,则?的95%置信区间为:
2x?Z??x?8900?1.96?129.0994?(8646.9652,9153.0348)
2(2)总体不服从正态分布,且样本属于大样本,Z??Z0.025?1.96,则?的95%置信区间
2为:
x?Z??x?8900?1.96?84.5154?(8734.3498,9065.6502)
2(3)总体不服从正态分布,?未知,因此使用样本方差代替总体方差,Z??Z0.05?1.645,
2 10
则?的90%置信区间为:
x?Z?2s?8900?1.645?84.5154?(8760.9722,9039.0278) n2?未知,(4)总体不服从正态分布,因此使用样本方差代替总体方差, Z??Z0.025?1.96,
则?的95%置信区间为:
x?Z?2s?8900?1.96?84.5154?(8734.3498,9065.6502) n2?x?3.3167,s??(x?x)3.解:整理数据可以得到n?36,x?nn?1?1.6093,由于
n?36属于大样本,所以使用正态分布来构建置信区间。
当Z??Z0.05?1.645,该校大学生平均上网时间的90%置信区间为:
2x?Z?2s?3.3167?1.645?0.2682?(2.8755,3.7579)小时 n当Z??Z0.025?1.96,该校大学生平均上网时间的95%置信区间为:
2x?Z?2s?3.3167?1.96?0.2682?(2.7910,3.8424)小时 n当Z??Z0.025?2.58,该校大学生平均上网时间的95%置信区间为:
2x?Z?2s?3.3167?2.58?0.2682?(2.6244,4.0089)小时 n4.解:
(1)由题目可知:n?50,p?32?0.64,?p?50p(1?p)?0.0679,由于抽取的样n本属于大样本,所以Z??Z0.025?1.96,总体中赞成新措施的户数比例的95%置信区间为:
2p?Z?2p(1?p) ?0.64?1.96?0.0679?(0.5069,0.7731)n(2)由题目可知:估计误差d?Z?2p(1?p)?10%?0.1,p?0.8,Z??Z0.025?1.96,n2得到:
Z?2p(1?p)?0.1 n11
1.96?0.8(1-0.8)?0.1
n61.5385?n
即样本个数至少为62户。
或直接将d?0.1带入n确定的公式,即,
(z?/2)2?(1??)1.962?0.8?(1?0.8)n???61.54?62
d20.125.解:
(1)整理数据可以得到:n?10,x1?7.15,s1?0.2272,由于抽取的样本属于小样本,所以由CHIINV函数得:????0.025(9)?19.0228,?22221?2?22??0.975(9)?2.7004,由
此可以得到第一种排队方式等待时间标准差的95%的置信区间为:
(n?1)s12??22???(n?1)s12?2?1?2
0.33???0.87
(2)整理数据可以得到:n?10,x2?7.15,s2?3.8183,第二种排队方式等待时间标准差的95%的置信区间为:
2(n?1)s22??22???(n?1)s22?21?
?21.25???3.33
(3)比较两种方法的标准差置信区间,第一种方法的置信区间更小,说明第一种方法等待时间的离散程度更小,比第二种方式好。
2(n1?1)s12?(n2?1)s2?9.9218 6.解:由题目可以得到:sw?n1?n2?2当t1??2(n1?n2?2)?t0.975(19)?2.093 ,(?1-?2)的95%置信区间为:
(x1?x2)?t0.975(19)sw1111??9.8?2.093?9.9218???(0.1871,19.4129)n1n2147
当t1??2(n1?n2?2)?t0.995(19)?2.8609,(?1-?2)的95%置信区间为:
12
(x1?x2)?t0.995(19)sw?(?3.3398,22.9398)1111??(53.2?43.4)?2.8609?9.9218??n1n2147
7.解:由样本数据计算得到:
d?110?11,sd?10?(di?1ni?d)2?nd?1384?6.53,t?(10?1)?2.262
10?12则自信心得分之差?d??1-?2的95%的置信区间为:
d?t0.025(9)sd6.53?11?2.262??11?4.67?(6.33,15.67) n108.解:由题目可以得到:n1?n2?250,p1?0.4,p2?0.3, 当Z??Z0.95?1.645,(?1-?2)的90%置信区间为:
2p1?p2?Z0.95p1(1?p1)p2(1?p2)??(3.021%,16.98%) n1n2当Z??Z0.975?1.96,(?1-?2)的95%置信区间为:
2p1?p2?Z0.975p1(1?p1)p2(1?p2)??(1.684%,18.32%) n1n2229.解:由题目可以得到:n1?n2?21,s1?0.058375,s2?0.005265,
F?(n1?1,n2?1)?F0.025(20,20)?2.4645,F2221??2(n1?1,n2?1)?F0.975(20,20)?0.4058
两个总体方差比?1/?2的95%的置信区间为:
s121?12s12?2?22s2F?(n1?1,n2?1)?2s2F21?1
(n?1,n?1)?122?12 17.4123?2?27.3223
?210.解:由题目可以得到:使用过去经验数据,则可以认为? 已知,即??120,在95%置信度下Z??Z0.025?1.96,估计误差Z?22?n?20,因此:
Z0.975
?n13
?20
1.96?120?20 n138.2976?n
即样本个数至少为139个。
11.解:由题目可以得到:总体? 已知,即?1?12,?2?15,n1?n2?n,在95%置信度下Z??Z0.025?1.96,估计误差Z?2?12n1?2?22n2??5,因此:
Z0.025?12n12?2n2?5
122?1521.96??5
n 56.7020?n
即两个总体的样本各至少为57个。
第六章、练习题及解答
1. 一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为7.25小时,标
准差为2.5小时。据报道,10年前每天每个家庭看电视的平均时间是6.70小时。取显著性水平??0.01,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?
2. 为监测空气质量,某城市环保部门每隔几周即对空气烟尘质量进行一次随机测试。已知
该城市过去每立方米空气中悬浮颗粒的平均值是82微克。在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值(单位:微克)如下: 81.6 96.6 77.3 74.0 86.6 74.9 76.1 82.5 80.0 83.0 92.2 87.0 85.8 66.6 72.4 73.2 78.6 68.6 61.7 88.5 58.3 70.9 75.6 86.9 68.7 71.1 85.5 94.9 73.2 71.6 72.5 83.0 根据最近的测量数据,当显著性水平??0.01时,能否认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值?
3. 安装在一种联合收割机上的金属板的平均重量为25公斤。对某企业生产的20块金属板
进行测量,得到的重量(单位:公斤)数据如下: 22.6 26.6 23.1 23.5 27.0 25.3 28.6 24.5 26.2 30.4 27.4 24.9 25.8 23.2 26.9 26.1 22.2 28.1 24.2 23.6 假设金属板的重量服从正态分布,在??0.05显著性水平下,检验该企业生产的金属
14
板是否符合要求。
4. 对消费者的一项调查表明,17%的人早餐饮料是牛奶。某城市的牛奶生产商认为,该城
市的人早餐饮用牛奶的比例更高。为验证这一说法,生产商从该城市随机抽取550人,调查知其中115人早餐饮用牛奶。在??0.05显著性水平下,检验该生产商的说法是否属实。
5. 某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样
本产生如下结果:
操作A 操作B n1?100 x1?14.8分钟 n2?50 x2?10.4分钟 s1?0.8分钟 s2?0.6分钟 在??0.05的显著性水平下检验平均装配时间之差是否等于5分钟。
6. 某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人
都分别在看过该产品的新的电视广告之前与之后打分。潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。对??0.05的显著性水平,用下列数据检验该假设,并对该广告给予评价。 个体 1 2 3 4 购买力得分 看后 6 6 7 4 看前 5 4 7 3 个体 5 6 7 8 购买力得分 看后 3 9 7 6 看前 5 8 5 6 7. 某企业为比较两种方法对员工进行培训的效果,采用方法1对15名员工进行培训,采
用方法2对12名员工进行培训。培训后的测试分数如下:
方法1 56 47 42 50 47 51 52 53 42 44 45 43 52 48 44 59 52 53 54 方法2 57 56 55 64 53 65 53 57 两种方法培训得分的总体方差未知且不相等。在??0.05的显著性水平下,检验两种方法的培训效果是否有显著差异。
8. 为研究小企业经理是否认为他们获得了成功,在随机抽取的100个小企业的女性经理中,
认为自己成功的人数为24人;而在对95个男性经理的调查中,认为自己成功的人数为
15
39人。在??0.05的显著性水平下,检验男女经理认为自己成功的人数比例是否有显著差异。
9. 为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者选择了面积相等、
土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:
旧肥料 109 98 103 97 101 98 88 105 97 94 108 102 98 99 102 104 100 104 106 101 105 113 106 110 109 111 117 111 新肥料 110 111 99 103 118 99 107 110 109 112 119 119 取显著性水平??0.05,检验:
(1)新肥料获得的平均产量是否显著地高于旧肥料?假定条件为: ①两种肥料产量的方差未知但相等,即?1??2。 ②两种肥料产量的方差未知且不相等,即?1??2。 (2)两种肥料产量的方差是否有显著差异?
10. 生产工序中的方差是工序质量的一个重要测度,通常较大的方差就意味着要通过寻找减
小工序方差的途径来改进工序。某杂志上刊载了关于两部机器生产的袋茶重量(单位:克)的数据如下,检验这两部机器生产的袋茶重量的方差是否存在显著差异。(??0.05)
2.95 机器1 3.16 3.20 3.12 3.22 机器2
第六章课后习题参考答案
1.解:由题目可以得到:n?200,??2.5;
提出原假设与备择假设:H0:??6.7,H1:??6.7;
该检验属于右侧单边检验,因此得到拒绝域为:W?{z?z1???z0.99?2.3263}; 在大样本条件下检验统计量为:z?3.38 3.30 3.45 3.20 3.22 3.30 3.34 3.28 3.50 3.22 2.98 3.34 3.35 3.30 3.75 3.38 3.45 3.28 3.19 3.20 3.48 3.90 3.70 3.29 3.35 3.16 3.26 3.36 3.34 3.25 3.05 3.33 3.33 3.25 3.18 3.30 3.36 3.20 3.28 3.35 3.27 3.28 2222x??0??3.1113?2.32563,落入拒绝域中,因
n此拒绝原假设,认为如今每个家庭每天收看电视的平均时间较十年前显著增加了。
(或利用Excel的“1-NORMSDIST(3.1113)”函数得到检验P=0.0009<0.01,则拒绝原假设)
16
2.解:由题目可以得到:n?32,根据样本数据计算得到:s?9.1979,x?78.10625; 提出原假设与备择假设:H0:??82,H1:??82;
该检验属于左侧单边检验,因此得到拒绝域为:W?{z?z??z0.01??2.3264};
在大样本且总体方差未知条件下检验统计量为:z?x??0??2.3949?2.325,落入sn拒绝域中,因此拒绝原假设,认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值。 (或利用Excel的“NORMSDIST(-2.3949)”函数得到检验P=0.0083<0.01,则拒绝原假设)
3.解:由题目可以得到:n?20,计算样本数据得到s?2.1933,x?25.51; 提出原假设与备择假设:H0:??25,H1:??25;
该检验属于双边检验,因此得到拒绝域为:W?{z?z??z0.025?1.96};
2 在服从正态分布的小样本且总体方差未知条件下检验统计量为: z?x???1.0399?1.96,落入接受域中,因此不能拒绝原假设,没有证据表明该企业生产sn的金属板不符合要求。
(或利用“TDIST(1.04,19,2)”函数得到检验P=0.3114>0.05,则不能拒绝原假设) 4.解:由题目可以得到:n?550,计算样本数据得到p?n0115??20.91%; n550 提出原假设与备择假设:H0:??17%,H1:??17%;
该检验属于右侧单边检验,因此得到拒绝域为:W?{z?z??z0.025?1.96};
2在大样本条件下检验统计量为:z?p??0?2.4412?1.96,落入拒绝域中,
?0(1??0)n因此拒绝原假设,认为生产商的说法属实,该城市的人早餐饮用牛奶的比例高于17%。 (或利用“1-NORMSDIST(2.4412)”函数得到检验P=0.0073<0.05,则拒绝原假设) 5.解:提出原假设与备择假设:H0:?1??2?5,H1:?1??2?5;
在大样本条件下检验统计量为:z?(x1?x2)?(?1??2)ss?n1n22122??5.1450
利用“2*(1-NORMSDIST(5.1450))”函数,得到双尾P值为2.6752?10?7,由于
P???0.05,拒绝原假设,认为两种装配操作的平均装配时间之差不等于5分钟。
17
6.解:设:“看后”平均得分为?1 ,“看前”平均得分?2,“看后”平均得分与“看前”平均得分之差为d;
提出原假设与备择假设:H0:?1??2?0,H1:?1??2?0;
根据样本数据计算得到:d??di?1nin?0.625,sd??(di?1ni?d)2?1.3025;
n?1在配对的小样本条件下检验统计量为:t?0.625?1.3572
1.30258利用Excel “=TDIST(1.3572, 7, 1)”得到的单尾概率P值为0.10842,由于
P???0.05,不能拒绝原假设,没有证据表明广告提高了平均潜在购买力得分。
7.解:设:方法一培训测试平均得分为?1,方法二培训测试平均得分为?2; 提出原假设与备择假设:H0:?1??2?0,H1:?1??2?0;
根据样本数据计算得到:
2?18.2727 n1?15,n2?12,x1?47.7333,x2?56.5,s12?19.4952,s2由于小样本情况下总体方差未知且不相等,t分布自由度为:
2s12s2(?)2nn2??21?24 2ss(1)2(2)2n1n?2n1-1n2-1在小样本条件下检验统计量为:t?(x1-x2)-(?1-?2)ss?n1n22122??5.2183
利用Excel的“=TDIST(5.2183, 24, 2)”函数,得到的双尾概率P值为0.00002,由于P???0.05,拒绝原假设,认为两种培训方法的效果存在显著差异。
8.解: 设:男性经理认为自己成功的人数比例为?1 , 女性经理认为自己成功的人数比例为?2,两个样本合并后得到的合并比例为p;
提出原假设与备择假设:H0:?1??2?0,H1:?1??2?0;
根据样本数据计算得到:两个样本的比例分别为:p1?41%,p2?24%
18
两个样本合并后得到的合并比例p?n1p1?n2p2?32.31%;
n1?n2检验统计量为:z?p1-p2?2.5373
11p(1-p)(?)n1n2利用Excel的“=2*(1-NORMSDIST(2.5373))”函数,得到检验概率P值为0.0112,由于P???0.05,所以拒绝原假设,认为男女经理认为自己成功的人数比例具有显著差异。 9.解:设:新肥料获得的平均产量为?1,旧肥料获得的平均产量为?2; (1)两种肥料产量的方差未知但相等,即?1??2时:
提出原假设和备择假设:H0:?1??2?0;H1:?1??2?0 ; 根据样本数据计算得:
2?24.1158; n1?20,n2?20,x1?109.9,x2?100.7, s12?33.3579,s222 总体方差的合并估计量为:
2(n1-1)s12?(n2-1)s2 s??28.73685
n1?n2-22p检验统计量为: t?(x1-x2)-(?1-?2)?5.4271
11sp?n1n2利用Excel的“=TDIST(5.4271, 38, 1)”函数,得到单尾概率P值为0.000002,由于
P???0.05,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。
(以上也可由Excel中的[t-检验:双样本等方差假设]给出) 两种肥料产量的方差未知且不相等,即?1??2时:
提出原假设与备择假设:H0:?1??2?0;H1:?1??2?0;
根据样本数据计算得到:
2?24.1158 n1?20,n2?20,x1?109.9,x2?100.7, s12?33.3579,s222由于小样本情况下总体方差未知且不相等,t分布自由度为:
19
2s12s2(?)2nn2??21?37 2s12s2()()2n1n?2n1-1n2-1在小样本条件下检验统计量为:t?(x1-x2)-(?1-?2)ss?n1n22122?5.4271
利用Excel的“=TDIST(5.4271, 37, 1)”函数,得到单尾概率P值为0.000002,由于
P???0.05,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。
(以上也可由Excel中的[t-检验:双样本异方差假设]给出) (2)设:使用新肥料的田地为样本1,使用旧肥料的田地为样本1
?12?12 提出原假设与备择假设:H0:2?1;H1:2?1
?2?2利用Excel中的“F-检验:双样本方差”(??0.025)得到的检验结果如下表所示:
F-检验 双样本方差分析 平均 方差 观测值 df F P(F<=f) 单尾 F 单尾临界 由于2P?0.4861??有显著差异。
变量 1 109.9 20 19 1.383239 0.24311 2.526451 变量 2 100.7 20 19 33.35789 24.11579
?0.05,不能拒绝原假设,没有证据表明两种肥料产量的方差
10.解:设:机器一为样本1,机器二为样本1
?12?12 提出原假设与备择假设:H0:2?1;H1:2?1
?2?2 利用Excel的“F-检验:双样本方差”(??0.025)得到的检验结果如下表所示:
F-检验 双样本方差分析 平均 方差 观测值 df
20
变量 1 3.3284 0.048889 25 24 变量 2 3.278181818 0.005901299 22 21
分析略。
第十一章、练习题及解答
设某地区某年有关核算资料如下: 指标 总产出 中间投入 固定资本消耗 劳动报酬 生产税净额 营业盈余 最终消费 数额(亿元) 指标 1200 700 60 300 40 100 300 总资本形成 出口 进口 来自国外的要素收入 支付国外的要素收入 来自国外的经常转移收入 支付国外的经常转移收入 数额(亿元) 210 80 90 25 15 3 5 试根据以上资料:
(1)用相应的三种方法分别计算国内生产总值和国内生产净值; (2)计算国民总收入和国民净收入;
(3)计算国民可支配总收入和国民可支配净收入。 解:(1)生产法:国内生产总值=总产出-中间投入=1200-700=500(亿元) 收入法:国内生产总值=劳动报酬+生产税净额+固定资本消耗+营业盈余 =300+40+60+100=500(亿元)
支出法:国内生产总值=最终消费+总资本形成+出口-进口 =300+210+80-90=500(亿元)
国内生产净值=国内生产总值-固定资本消耗=500-60=440(亿元) (2) 国民总收入=国内生产总值+来自国外的要素收入净额 =500+25-15=510(亿元)
国民净收入=国民总收入-固定资本消耗=510-60=450(亿元) (3) 国民可支配总收入=国民总收入+来自国外的经常转移收入净额 =510+3-5=508(亿元)
国民可支配净收入 = 国民可支配总收入 - 固定资本消耗 =508-60
=448(亿元)
46
F P(F<=f) 单尾 F 单尾临界 8.284447623 3.61079E-06 2.367525575 由于2P?0.000007???0.05,拒绝原假设,认为两种肥料产量的方差有显著差异。
第七章、练习题及解答
1.从某市的三个小学中分别抽若干名5年级男生,测量其身高,数据如下,
小学 大成小学 平明小学 师范附小 身高(cm) 128 135 148 152 146 135 148 145 156 162 157 136 145 136 139 148 164 142 试检验不同小学5年级男生身高有无显著差别(? =0.05) 解:设三个小学的5年级男生的平均身高分别为?,?,?。
123提出假设:H0:?1??2??3 H1:?1,?2,?3不全相等 由Excel输出的方差分析表如下: 差异源 组间 组内 总计 SS 262.4381 1417.562 1680 df 2 15 MS F P-value F crit 131.219 1.388501 0.279734 3.68232 94.50413 17 P-value=0.279734>? =0.05,(或者F=1.388501<F crit=3.68232),不能拒绝原假设,
没有证据表明该市3所小学5年级的男生身高有显著差异。
2.某家电制造公司准备购进一批5#电池,现有A、B、C三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(小时)数据见下表:
试验号 1 2 3 4 5 电池生产企业 A 50 50 43 40 39 B 32 28 30 34 26 C 45 42 38 48 40
试分析三个企业生产的电池的平均寿命之间有无显著差异?如果有差异,用LSD方法检验哪些企业之间有差异? (? =0.05)
解:A、B、C三个企业生产的电池的平均寿命分别为?,?12,?。
3提出假设:H0:?1??2??3
21
H1:?1,?2,?3不全相等 由Excel输出的方差分析表如下: 方差分析 差异源 组间 组内 总计
SS 615.6 216.4 832
df
MS
F
P-value
F crit
2 307.8 17.06839 0.00031 3.885294 12 18.03333 14
P-value=0.00031<? =0.05(或F=17.06839>F crit=3.885294),拒绝原假设。表明
电池的平均寿命之间有显著差异。
为判断哪两家企业生产的电池平均寿命之间有显著差异,首先提出如下加红色:
检验1:H0:?1??2;检验2:H0:?1??3;检验3:H0:?2??3;然后计算检验统计量:
H1:?1??2 H1:?1??3 H1:?2??3
x?x?44.4?30?14.4
12x?x?44.4?42.6?1.8
13x?x?30?42.6?12.6
22计算LSD。根据方差分析表可知,MSE=18.03333.根据自由度=n-k=15-3=12.查t分布表得t?/2?t0.025?2.179.计算的LSD如下:
11
LSD?2.179?18.033?(?)?5.8555作出决策。
x?x?44.4?30?14.4>LSD=5.85,拒绝原假设。企业A与企业B电池的平均
12使用寿命之间有显著差异。
x?x?44.4?42.6?1.8<LSD=5.85,不拒绝原假设。没有证据表明企业A与企
13业C电池的平均使用寿命之间有显著差异。
x?x?30?42.6?12.6>LSD=5.85,拒绝原假设。企业B与企业C电池的平均
22使用寿命之间有显著差异。
3.某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,平均分为三组,并指定每组使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果。
差异源
SS df MS 22
F P-value F crit 组间 组内 合计 (420) 3836 (4256) (2) 210 (1.478) - - 0.245946 - - 3.354131 - - (27) (142.07) 29 要求:(1)完成上面的方差分析表。 (2)检验三种方法组装的产品数量之间是否有显著差异? (?=0.05) 解:(1) 差异源 组间 组内 合计 SS (420) 3836 (4256) df (2) MS 210 F (1.478) - - P-value 0.245946 - - F crit 3.354131 - - (27) (142.07) 29 (2)由方差分析表可知:P-value=0.245946>?=0.05,(或F=1.478<F crit=3.354131=,不能拒绝原假设。没有证据表明三种方法组装的产品数量之间有显著的差异。 4.某农场在不同的地块试种四个品种的谷子,试验数据如下(单位:千克/亩),试检验地块类型和谷子品种是否对平均亩产量有影响(α=0.05)。
太行2号 洼地 坡地 平地 225 156 320 冀丰2号 210 198 351 12冀丰3号 198 265 298 农科9号 152 210 302 农科12号 205 236 261 解:设不同地块的平均亩产量分别为:?,?提出假设:H0:?1??2??3 H1:?1,?2,?3不全相等 设不同品种的平均亩产量分别为?,?1,?
32,?,?,?
3455提出假设:H0:?????????
1234 H0:?,?,?,?,?,不全相等
12345由Excel输出的方差分析表如下: 方差分析 差异源 行 列 误差 总计
SS 34498.53 2329.733 11749.47 48577.73
df 2 4 8 14
MS
F
P-value
F crit
17249.27 11.74471 0.004166 4.45897 582.4333 0.396568 0.806054 3.837853 1468.683
P-value=0.0014<α=0.05(或F=11.74471> F crit=4.45897),拒绝原假设。表明不
同品种的种子对亩产量的影响显著。
P-value=0.806054>α=0.05(或F=0.396568<F crit=3.837853),不拒绝原假设。没有证据表明不同地块类型对亩产量有显著差异。
23
5.为研究食品的包装和销售地区对其销售量是否有影响,在某周的3个不同地区中用3种不同包装方法进行销售,获得的销售量数据见下表: 销售地区 (A ) A1 A2 A3 包装方法(B ) B1 45 50 35 B2 75 50 65 B3 30 40 50 检验不同的地区和不同的包装方法对该食品的销售量是否有显著影响? (? =0.05) 解:设不同地区的平均销售量分别为?提出假设: HA1,?,?A2A3
0:?????A1A2
A3 H0:?,?,?A1A2A3不全相等
设不同包装方式的平均销售量分别为?提出假设: HB1,?,?B2B3
0:?????B1B2B3
H0:?,?,?B1B2B3不全相等
由Excel输出的方差分析表如下: 方差分析 差异源 行 列 误差 总计 SS 22.22222 955.5556 611.1111 1588.889 df 2 2 4 8 MS F P-value F crit 11.11111 0.072727 0.931056 6.944272 477.7778 3.127273 0.152155 6.944272 152.7778 P-value=0.931056>? =0.05(或F=0.072727< F crit=6.944272),不拒绝原假设,没有证据表明不同地区对该食品的销售量有显著影响。
P-value=0.152155>? =0.05(或F=3.127273< F crit=6.944272),不拒绝原假设,没有证据表明包装方式对该食品的销售量有显著影响。
第八章、练习题及解答
1.从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:
企业编号 1 2 3 4 5 6 要求:
24
产量(台) 40 42 50 55 65 78 生产费用(万元) 130 150 155 140 150 154 企业编号 7 8 9 10 11 12 产量(台) 84 100 116 125 130 140 生产费用(万元) 165 170 167 180 175 185 (1) 绘制产量与生产费用的散点图,判断二者之间的关系形态。 (2) 计算产量与生产费用之间的相关系数。
(3) 对相关系数的显著性进行检验(?=0.05),并说明二者之间的关系强度。 解:(1)
200 生产费用 150 100 20 50 产量 产量与生产费用散点图 80 110 140 170 散点图表明产量与生产费用两变量之间为正线性相关。 (2)设产量为X,生产费用为Y,
?x?1025,?y?1921,?x?101835,
2?y?310505,?xy?1700942产量与生产费用之间的相关系数:
r?n?xy??x?yn?x?(?x)n?y?(?y)22222
12?170094?1025?192172103???0.9212?101835?102512?310505?1921783532两变量为高度正相关关系。 (3)相关系数的显著性检验如下: 第1步,提出假设。
原假设H0:??0;备择假设H1:??0 第2步,计算检验统计量。
t?rn?20.92?12?2??18.941?r1?0.9222
25
第3步,给定显著性水平??0.05,查表确定临界值t第4步,做出统计决策。由于t的线性关系显著。
2.设SSR?36,SSE?4,n?18。 要求:
(1)计算判定系数R2,并解释其意义。 解:R=
20.05/2(12?2)?2.228。
?t(10),则拒绝原假设,说明产量与生产费用之间
0.025SSR36
??90%SSR?SSE36?42其意义为: R=90%表示,在因变量y取值的变差中,有90%可以由x和y之间的线性关系来解释。
(2)计算估计标准误差se,并解释其意义。
s?eSSE4
??0.5n?218?2 其意义:se=0.5表示,当用x来预测y时,平均的预测误差为0.5.
3.一家物流公司的管理人员想研究货物的运送距离和运送时间的关系,为此,抽出了公司最
近10辆卡车运货记录的随机样本,得到运送距离(单位:公里)和运送时间(单位:天)的数据如下: 运送距离x 运送时间y 825 215 1070 550 480 920 1350 325 670 1215 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0 (1) 绘制运送距离和运送时间的散点图,判断二者之间的关系形态。 解答:距离和运送时间的散点图:
6 5 4 时间 3 2 1 0 0 500 1000 1500 距离 货物运送距离与时间散点图
运送距离与时间大致呈正的线性相关关系。
(2) 计算相关系数,说明两个变量之间的关系强度。
26
相关系数:
?x?7620,?y?28.5,?x?y?99.75,?xy?2637022?7104300,
r??n?xy??x?yn?x2?(?x)2n?y2?(?y)210?26370?7620?28.510?7104300?7620210?99.75?28.52?46530?0.9549033.54
表明运输距离与运送时间之间有较强的正的线性相关关系。
(3) 利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
????x ?i??设两变量之间的线性回归方程为:y01i10?26370?7620?28.5?????0.0035851??10?7104300?7620?7620???1?28.5?1?7620?0.003585?0.11823 ??0?1010???0.11823?0.003585x 得到的回归方程为:y??0.003585表示运送距离每增加1公里,运送时间平均增加0.003583天。 回归系数?1(4) 计算判定系数,并解释其意义。
nnSST??(yi?y)=?yi2?ny2=99.75-10×2.852 =18.525
2i?1ni?12???i?y)=?SSR??(y0?yi??1?xiyi?ny=0.11823×28.5+0.003583×26370-10×
2i?1i?1i?1nn2.85=16.681
2
?)SSE??(yi?yi?1n2=
?yi???0?yi???1?xiyi=99.75-0.11823×28.5-0.003585×
2i?1i?1i?1nnn26370=1.843995 判定系数R2?SSR16.681??0.90 SST18.525判定系数等于90%表示,在因变量运送时间取值的变差中,有90%可以由运送距离和运输时间之间的线性关系来解释。
(5) 检验回归方程的线性关系 (?=0.05)。
第1步:提出假设
原假设H0:?1?0, 两个变量之间的线性关系不显著
27
备择假设H1:?1?0,两个变量之间的线性关系显著 第2步:计算检验统计量F。
F?SSR/116.681/1??72.369
SSE/(n?2)1.844/(10?2)第3步:做出决策。确定显著性水平??0.05,并根据分子自由度df1?1,分母自由度
df2?n?2?10?2?8,查F分布表,找到相应的临界值F0.05(1,10)?5.318。由于
F?F0.05(1,10),拒绝H0,表明运送距离与运送时间之间的线性关系是显著的。
(6) 如果运送距离为1000公里,预测其运送时间。
?0?0.11823?0.003585?1000?3.7(天) x0?1000时,y(7) 求运送距离为1000公里时,运送时间的95%的置信区间和预测区间。
运送距离为1000公里时,运送时间的95%的置信区间为:
se?SSE1.844??0.48,n=10, t0.5/2(n?2)?t0.025(10?2)?2.3646 n?210?2n22x7620?x???762,?(x?x)??x1010i?11?(?x)2?1297860 n运送时间95%的置信区间为:
1(1000?762)23.7?2.3646?0.48???3.7?0.43
101297860即3.27?E(y0)?4.13。这就是说,当运送距离为1000公里时,平均运送时间在3.27
天~4.13天之间。
如果运送距离为1000公里,运送时间的95%的预测区间为:
1(1000?762)23.7?2.3646?0.48?1???3.7?1.21
101297860?0?4.91。这说明,运送距离为1000公里时,运送时间95%的预测区间在3.49即3.49?y天~4.91天之间。
Excel输出的回归结果如下表:
回归统计
Multiple R R Square Adjusted R Square 标准误差 观测值
0.948943 0.900492 0.888054 0.480023
10
28
方差分析
回归分析 残差 总计
Intercept X Variable 1
df
SS
MS
F
Sig F
1 16.68162 16.68162 72.39585 2.79E-05 8 1.843379 0.230422 9 18.525
P-value
Lower 95% Upper 95% -0.70084 0.937101
0.002613 0.004557
Coefficients 标准误差 t Stat
0.118129 0.355148 0.33262 0.74797 0.003585 0.000421 8.508575 2.79E-05
4.美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下。
航空公司名称 西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 美国西部(Americawest)航空公司 环球(TWA)航空公司 航班正点率(%) 投诉率(次/10万名乘客) 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 68.5 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 1.25 资料来源:(美)David R.Anderson等《商务与经济统计》,第405页,机械工业出版社。 (1) 绘制散点图,说明二者之间的关系形态。
1.41.21投诉率0.80.60.40.2066687072747678808284航班正点率(%)航班正点率与投诉率散点图
从散点图可以看出,航班正点率与投诉率之间是负的线性相关关系。 Excel输出的回归结果如下表:
回归统计
Multiple R
0.882607
29
R Square
Adjusted R Square 标准误差 观测值
方差分析
回归分析 残差 总计
Intercept X Variable 1
0.778996 0.747424 0.160818
9
df
SS
MS
F
Sig F
1 0.638119 0.638119 24.67361 0.001624 7 0.181037 0.025862 8 0.819156
3.529633 8.506031
-0.10393 -0.03689
Coefficients 标准误差 t Stat
P-value Lower 95% Upper 95%
6.017832 1.05226 5.718961 0.000721 -0.07041 0.014176 -4.96725 0.001624
从散点图可以看出,航班正点率与投诉率之间为负的线性相关关系。
(2)用航班正点率作自变量,顾客投诉次数作因变量,建立估计的回归方程,并解释回归系数的意义。
??6.017832-0.07041x 从Excel输出的结果可得回归方程为:y回归系数为-0.07041,表示航班正点率每提高1%,每10万名顾客投诉次数平均下降0.07041次。
(3) 检验回归系数的显著性(?=0.05)。
回归系数的P值=0.001624<?=0.05,拒绝原假设,表明回归系数显著。 (4)如果航班正点率为80%,估计每10万名乘客投诉的次数。
?0?6.017832-0.07041?0.8?5.96(次) x0?80%时,y(5)求航班正点率为80% 时,顾客投诉次数95%的置信区间和预测区间。
x?n?x?667.2?74.13109,
122(x?x)?x?(?x)2?49590.46-667.22/10?5074.876 ??ni?1t0.5/2(n?2)?t0.05(9?2)?2.3646,se?0.160818
2置信区间为:
?0?t?(n?2)sey2(x0?x)21?n? n?(xi?x)2i?11(0.8?0.7413)25.96?2.3646?0.160818???5.96?0.1268
95074.876即(5.8332,6.08680)
30
(x0?x)21?0?t?(n?2)se1??n预测区间为:y 2n?(xi?x)2i?121(0.8?0.7413)=5.96?2.3646?0.160818?1???5.96?0.4008 95074.876即(5.5592,6.3608).
5.某公司想了解广告支出对销售收入的影响,收集了12年的有关数据。计算得到方差分析表结果: 变差来源 回归 残差 总计
参数估计表
nt InterceptX Variable 1
(1)完成上面的方差分析表。
(2)销售收入的变差中有百分之多少是由于广告支出的变动引起的? 由于R2?363.6891 1.420211 62.45529 0.071091 5.823191 19.97749 0.000168 2.17E-09 Coefficie标准误差 t Stat P-value df SS MS (1602708.6) (4015.807) — F (399.1 ) — — Significance F 2.17E-09 — — ( 1 ) (1602708.6 ) ( 10) 40158.07 11 1642866.67 SSR1602708.6??97.6%,即销售收入的变差中有97.6%是由于广告支出的变动引SST1642866.7起的。
(4) 销售收入与广告支出之间的相关系数是多少? 相关系数r=0.988
(5) 写出估计的回归方程并解释回归系数的实际意义。
??363.6891+1.4202x y??1.4202表示广告支出每增加1万元,销售收入平均增加1.4202万元。 回归系数?1(6) 检验线性关系的显著性(?=0.05)。
检验统计量F对应的P值=2.17E-09<?=0.05,拒绝原假设,表明线性关系显著。
6.一家家用电器产品销售公司在30个地区设有销售分公司。为研究产品彩电销售量(台)与该公司的销售价格(百元)、各地区的年人均收入(百元)、广告费用(百元)之间的关系,搜集到30个地区的有关数据。设彩电销售量为y,销售价格为x1,年人均收入为x2,广告费用为x3,利用Excel得到下面的回归结果:
相关系数表
31
回归输出结果
(1)将方差分析表中的所缺数值补齐; 回归分析 残差 总计
(2)写出销量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义;
Df SS MS F Signifficence F (3) (12026774.1) (4008924.7) (26) (29) 1431812.6 13458586.7 (72.7973) 8.88E-13 (55069.7153) ??7589.1025?117.8861x1?80.6107x2?0.5012x3 y销售价格的回归系数为-117.8861,表示当其他变量不变时,由于销售价格每提高
一百元,销售量平均下降117.8861台;年人均收入的回归系数为80.6107。表示当其他变量不变时,由于年人均收入每增加一百元,销量平均提高80.6107台;广告费用的回归系数为0.5012,表示当其他变量不变时,广告费用每增加一百元,销量平均增加0.5012台。
(3)若显著水平?=0.05,回归方程的线性关系是否显著? 由于检验统计量F对应的P值为8.88E-13<?=0.05,回归方程的线性关系显著。 (4)若显著水平?=0.05,各回归系数是否显著?
各回归系数的P值均小于0.05,各回归系数显著。 (5)销售量y的变差中被回归方程所解释的百分比是多少?
32
R2=
SSR12026774.1??89.36% SST13458586.7R2?1?(1?R2)n?130?1?1?(1?0.8936)?88.13%n?k?130?3?1 即:销售量y的变差中被回归方程所解释的百分比是88.13%。
第九章、练习题及解答 1.某工业企业某年第二季度的总产值和工人数资料如下表:
月 份 总产值(万元) 月末工人数(人) 3 1500 600 4 1600 615 5 1650 630 6 1850 660 要求计算:(1)第二季度各个月的工人劳动生产率;
(2)第二季度月平均工人劳动生产率; (3)第二季度的工人劳动生产率。 解:(1)月工人劳动生产率=
总产值
月平均工人数4月:
1600?2.6337(万元);
?600?615??21650?2.6506(万元)
?615?630??21850?2.8682(万元)
?630?660??2?5100?1700(万元) 35月:
6月:
a1600?1650?1850??(2)a?n3 33
600660?615?630?2?1875?625(人) b?233a1700c???2.72(万元)
b625(3)第二季度的工人劳动生产率=2.72×3=8.16(万元) 2.某地区2007~2010年工业总产值资料如下:
时间 2007 2008 2009 2010 合计 总产值(亿元) 64 75 93 125 357 增长量(亿元) 逐期 累计 发展速度(%) 环比 定基 要求:(1)计算表中所缺数字;
(2)以2007年为基期计算该地区2008~2010年工业总产值的年平均发展速度; (3)如果2010年后继续按照这样的速度发展,预测2013年该地区工业总产值。 解:(1)
时间 2007 2008 2009 2010 合计 总产值(亿元) 64 75 93 125 357 增长量(亿元) 逐期 — 11 18 32 61 累计 — 11 29 61 — 发展速度(%) 环比 — 117.19 124.00 134.41 195.31 定基 100 117.19 145.31 195.31 — (2)2008~2010年工业总产值的年平均发展速度=3195.31%?125% (3)2013年该地区工业总产值=125×1.25=244.14(亿元)
3.某地区粮食产量2007~2009年平均发展速度是1.03,2010~2011年平均发展速度是1.05,粮食产量2012年比2011年增长6%,试求2007~2012年这六年粮食产量的平均发展速度。
解:R?1.033?1.052?1.06?104.16%
4.党的十八大报告中指出,确保到2020年全面建成小康社会,实现国内生产总值和城乡居民人均收入比2010年翻一番的目标。其中2010年国内生产总值现价总量为401202亿元,以2010年为价格基期,按不变价格来计算:为实现翻一番的目标,2020年的国内生产总值将至少达到多少?平均每年的经济增长速度应达到多少? 解:2020年的国内生产总值=401202×2=802404(亿元)
平均每年的经济增长速度=102?1?1.072?1?0.072(或7.2%) 63
34
5.某公司2004~2012年的某种家电产品销售额数据如下:
年 份 销售额(万元) 2004 2005 2006 2007 2008 2009 2010 2011 2012 80 83 87 89 95 101 105 110 125 要求:(1)应用三年和四年移动平均法计算趋势值;
(2)应用最小二乘法配合趋势直线,并计算出各年的趋势值,并说明平均每年增加的销售额是多少;
(3)预测2013年销售额将达到的水平。 解:(1)移动平均法趋势值:
年 份 2004 2005 2006 2007 2008 2009 2010 2011 2012 销售额(万元) 80 83 87 89 95 101 105 110 125 三项移动 四项移动 — 83.33 86.33 90.33 95.00 100.33 105.33 113.33 — — — 86.63 90.75 95.25 100.13 106.50 — — ?t?a?bt (2)设家电产品销售额的趋势直线为y年 份 2004 2005 2006 2007 2008 2009 2010 2011 2012 合计 由以上计算得式:
y 80 83 87 89 95 101 105 110 125 875 t 1 2 3 4 5 6 7 8 9 45 2ty 80 166 261 356 475 606 735 880 1125 4684 t 1 4 9 16 25 36 49 64 81 285 2?t 趋势值y76.62 81.77 86.92 92.07 97.22 102.37 107.52 112.67 117.82 — ?t?2 ?y?y11.4244 1.5129 0.0064 9.4249 4.9284 1.8769 6.3504 7.1289 51.5524 94.2056 ?t?45,?y?875,?t?根据最小二乘法参数求解公?285,?ty?4684,
b?n?ty??t?yn?t2???t?29?4684?45?875?5.15
9?285?452a?y?bt?71.47
35
正在阅读:
统计学课后习题答案(全章节)剖析10-18
定西市安定区思源实验学校简介08-18
微课勿重走“黑板上讲实验”的老路03-20
12010-2011年度第一学期江都市七年级英语期末试题及答案 - 图文09-24
浅谈劳动纪律和工作作风的重要性12-10
《金钱的魔力》课文原文04-12
岗位工种分类汇总情况08-26
人工智能第二章 知识表示方法04-04
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 统计学
- 课后
- 习题
- 剖析
- 答案
- 章节
- VDA6.5产品审核分析报告
- 2012年4月高等教育自学考试全国统一命题考试
- 营业厅多媒体信息发布系统方案0822 - 图文
- 1.3化学键练习
- 13年14年新款苹果电脑另类方法安装win7 32位系统 - 图文
- 天津中考诗歌赏析
- 质谱知识总结
- 医科大学2014年1月考试《社区护理学》答案
- 物理人教版八年级上册第一章第3节教学设计正式版
- 2、六年级总复习(2)诗句填空
- 关于打伤并限制员工人身自由构成何
- 苏教版小学语文毕业模拟试卷(含答案)
- 2019届高考地理大二轮复习微专题七植被与地理环境的关系学案(含答案)
- BW基本知识
- 科学四上 交通工具 说课稿
- 2013年政法干警招录培养体制改革试点教育入学考试民法学考试大纲
- 人教版三年级下册数学第五、六单元复习题
- 圆的整理和复习教学反思
- 物联网导论论文参考 - 图文
- 工作坊活动计划书 - 图文