统计学课后习题答案（全章节）剖析

更新时间：2023-10-18 20:14:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

医学统计学第七版课后答案及解析推荐度：
相关推荐

第二章、练习题及解答

2.为了确定灯泡的使用寿命（小时），在一批灯泡中随机抽取100只进行测试，所得结果如下： 700 706 708 668 706 694 688 701 693 713 要求：

(2)以组距为10进行等距分组，生成频数分布表，并绘制直方图。

灯泡的使用寿命频数分布表分组 650-660 660-670 670-680 680-690 690-700 700-710 710-720 720-730 730-740 740-750 合计

3.某公司下属40个销售点2012年的商品销售收入数据如下：单位：万元 152 105 117 97

124 119 108 88

129 114 105 123

116 115 110 115

100 87 107 119

103 103 137 138

92 118 120 112

95 142 136 146

127 135 117 113

104 125 108 126

频数（只） 2 5 6 14 26 18 13 10 3 3 100 频率（%） 2 5 6 14 26 18 13 10 3 3 100 716 715 729 710 692 690 689 671 697 699

728 712 694 693 691 736 683 718 664 725

719 722 681 697 747 689 685 707 681 726

685 691 695 674 699 696 702 683 721 704

709 708 685 658 682 651 741 717 720 729

691 690 706 698 698 673 698 733 677 703

684 692 661 666 700 749 713 712 679 696

705 707 735 696 710 708 676 683 695 717

718 701 665 698 722 727 702 692 691 688

要求：（1）根据上面的数据进行适当分组，编制频数分布表，绘制直方图。（2）制作茎叶图，并与直方图进行比较。

解：（1）频数分布表

分组 85-95 95-105 105-115 115-125 125-135 135-145 145-155 合计

（2）茎叶图

树茎 8 9 10 11 12 13 14 15 树叶 78 257 033455788 023455677899 0345679 5678 26 2 第三章、练习题及解答

1. 已知下表资料：

日产量（件） 25 30 35 40 45 合计工人数（人） 20 50 80 36 14 200 工人比重（%） 10 25 40 18 7 100 数据个数 2 3 9 12 7 4 2 1 频数（个）频率（%） 3 6 9 11 4 5 2 40 7.5 15.0 22.5 27.5 10.0 12.5 5.0 100 试根据频数和频率资料，分别计算工人平均日产量。解：计算表日产量（件）x 工人数工人比重（人）f （%）f/∑f xf xf/∑f 2

25 30 35 40 45 20 50 80 36 14 10 25 40 18 7 100 500 1500 2800 1440 630 6870 2.5 7.5 14 7.2 3.15 34.35 合计 200 根据频数计算工人平均日产量：x??xf?f?xg?f6870?34.35（件） 200?34.35（件）

根据频率计算工人平均日产量：x??f结论：对同一资料，采用频数和频率资料计算的变量值的平均数是一致的。

2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表：

单位产品成本（元/件） 10～12 12～14 14～18 合计单位数 2 3 4 9 产量比重（%） 20 42 38 100 试计算这9个企业的平均单位成本。解：

单位产品成产量比重（%）组中值单位数 X·f/∑f 本（元/件） f/∑f （元）x 10～12 12～14 14～18 合计 2 3 4 9 20 42 38 100 11 13 16 - =13.74（元）

2.2 5.46 6.08 13.74 这9个企业的平均单位成本=x??xgff?3.某专业统计学考试成绩资料如下：

按成绩分组（分） 60以下 60～70 70～80 80～90 90～100 100以上合计

学生数（人） 4 8 14 20 9 5 60 试计算众数、中位数。解：众数的计算：

根据资料知众数在80～90这一组，故L=80，d=90-80=10,fm=20,fm-1=14,fm+1=9,

Mo?L?fm?fm?1?d

?fm?fm?1???fm?fm?1?20?14?10?83.53(分)

?20?14???20?9? ?80?中位数的计算：根据

?f2?60?30和向上累积频数信息知，中位数在80～90这一组。 2?fMe?L?2?Sm?1fme?d?80?30?26?10?82（分） 204.利用练习题1题资料计算200名工人日产量的标准差，并计算离散系数。（只按照频数计算即可）

解：计算表

日产量工人数(x?x)2f （件）x （人）f 25 30 35 40 45 20 50 80 36 14 1748.45 946.125 33.8 1149.21 1587.915 5465.5 合 200 计 ?2???x?x??f2f?5465.5?27.3275 200???2?27.3275?5.23

v???x?100%?5.23?100%?15.23% 34.355.一家公司在招收职员时，首先要通过两项能力测试。在A项测试中，平均分数是80分，标准差是15分；在B项测试中，平均分数是200分，标准差是50分。一位应试者在A项测试中得了95分，在B项测试中得了225分。与平均分数相比，该位应试者哪一项测试更为理想？

解：计算各自的标准分数：zA?95?80225?200?1，ZB??0.5 1550第四章、练习题及解答

因为A测试的标准分数高于B测试的标准分，所以该测试者A想测试更理想。

1. 随机变量Z服从标准正态分布，求以下概率：

（1）P(0?Z?1.2)；（2）P(?0.48?Z?0)；（3）P(Z?1.33)。

2. 由30辆汽车构成的一个随机样本，测得每百公里的耗油量（单位：升）数据如下：

9.19 9.63 10.10 9.7 10.09 10.01 8.82 9.43 10.03 9.85 9.60 10.50 10.12 9.49 9.37 9.27 8.83 9.39 9.48 9.64 9.78 9.35 9.54 9.36 9.68 8.82 8.65 8.51 9.14 9.75 绘制频数分布直方图，判断汽车的耗油量是否近似服从正态分布。

3. 从均值为200、标准差为50的总体中，抽取n?100的简单随机样本，用样本均值x估

计总体均值。

（1）x的期望值是多少？（2）x的标准差是多少？（3）x的概率分布是什么？ 4. 从?=0.4的总体中，抽取一个容量为500的简单随机样本，样本比例为p。

（1）p的期望值是多少？（2）p的标准差是多少？（3）p的概率分布是什么？ 5. 假设一个总体共有6个数值：54，55，59，63，64，68。从该总体中按重置抽样方式抽

取n?2的简单随机样本。（1）计算总体的均值和方差。（2）一共有多少个可能的样本？

（3）抽出所有可能的样本，并计算出每个样本的均值。

（4）画出样本均值的频数分布直方图，判断样本均值是否服从正态分布。

（5）计算所有样本均值的平均数和标准差，并与总体的均值和标准差进行比较，得到的结论是什么？

第四章习题答案

1.解：由于Z服从标准正态分布，查表得 NORMSDIST（0）?0.5，NORMSDIST（1.2）?0.8849， NORMSDIST（0.48）?0.6844，NORMSDIST（1.2）?0.8849， NORMSDIST（1.33）?0.9082

（1.2）?NORMSDIST（0）?0.8849-0.5?0.3849 （1）P(0?Z?1.2)?NORMSDIST（2）

P（?0.48?Z?0）?NORMSDIST（0）?NORMSDIST（-0.48） ?NORMSDIST（0）-1?NORMSDIST（0.48）?0.1844

）?1?P(Z?1.33)?1?NORMSDIST(1.33)?0.0918 （3）P（Z?1.33

2.解：对数据进行整理，30个样本数据极差为1.99。将数据分为7组，组距为0.3，如下表所示：

分组 8.51-8.80 8.81-9.10 9.11-9.40 9.41-9.70 9.71-10.00 10.01-10.30 10.31-10.60 对应频数直方图为：

观察上图，数据基本上拟合正态分布曲线，可以认为汽车耗油量基本服从正态分布。 3.解：已知：??200 , n?100，??50?2500，同时由于样本量很大，可以看作重置抽样来处理。

根据公式4.5可以得到：（1）E(x)?x???200

22频数 2 3 7 9 3 5 1 （2）??2x?2n?25002?25，?x??x?5 100（3）根据中心极限定理，x近似服从均值为200，标准差为5的正态分布。 4.解：已知：??0.4 , n?500，同时由于样本量很大，可以看作重置抽样来处理。根据公式4.7可以得到：（1）E(p)???0.4 （2）?p?2?(1??)n2?0.0219； ?0.00048，?p??p（3）根据中心极限定理，p近似服从均值为0.4，标准差为0.0219的正态分布。

5.解：

（1）x?6?xi?16iN?54?55?59?63?64?68?60.5，

6?2??(x?x)ii?12N?24.9167；???2?4.9917

2（2）由于从总体中重置抽取的样本，考虑抽取顺序情况下共有6?36种可能样本。（3）如下表所示：样本序号样本单位样本均值x 样本序号样本单位样本均值x

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 54，54 54，55 54，59 54，63 54，64 54，68 55，54 55，55 55，59 55，63 55，64 55，68 59，54 59，55 59，59 59，63 59，64 59，68 54 54.5 56.5 58.5 59 61 54.5 55 57 59 59.5 61.5 56.5 57 59 61 61.5 63.5 分组 54-56 56-58 58-60 60-62 62-64 64-66 66-68 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 频数 4 4 9 7 7 3 2 63，54 63，55 63，59 63，63 63，64 63，68 64，54 64，55 64，59 64，63 64，64 64，68 68，54 68，55 68，59 68，63 68，64 68，68 58.5 59 61 63 63.5 65.5 59 59.5 61.5 63.5 64 66 61 61.5 63.5 65.5 66 68 （4）样本均值频数表：

样本均值频数直方图：

10987654321054-5656-5858-6060-6262-6464-6666-68

由上图可以发现，样本均值近似服从正态分布；

（5）由样本方差均值公式可以得到：

x??xi?136i3636?2178?60.5 36?x)2??x?2?(xi?1i36472.25?2?12.45833；?x??x?3.529636? 36n可以看出，样本均值与总体均值很接近，样本标准差则比总体方差小。

第五章、练习题及解答

1. 某快餐店想要估计每位顾客午餐的平均花费金额，在为期三周的时间里选取49名顾客

组成了一个简单随机样本。

（1）假定总体标准差为15元，求样本均值的抽样标准误差；（2）在95%的置信水平下，求估计误差；

（3）如果样本均值为120元，求快餐店所有顾客午餐平均花费金额的95%的置信区间。 2. 利用下面的信息，构建总体均值?的置信区间。

（1）总体服从正态分布，且已知x?8900,??500,n?15，置信水平为95%。（2）总体不服从正态分布，且已知x?8900,??500,n?35，置信水平为95%。（3）总体不服从正态分布，?未知，x?8900,s?500,n?35，置信水平为90%。（4）总体不服从正态分布，?未知，x?8900,s?500,n?35，置信水平为99%。 3. 某大学为了解学生每天上网的时间，在全校学生中随机抽取36人，调查他们每天上网

的时间，得到下面的数据（单位：小时）； 3.3 4.4 2.1 4.7 3.1 2.0 1.9 1.4 6.2 5.4 1.2 1.2 5.8 2.6 5.1 2.9 2.3 6.4 4.3 3.5 4.1 1.8 4.2 2.4 5.4 3.5 3.6 0.5 4.5 5.7 0.8 3.6 3.2 2.3 1.5 2.5 求该校大学生平均上网时间的置信区间，置信水平分别为90%，95%和99%。 4. 某居民小区共有居民500户，小区管理者准备采用一项新的供水设施，想了解居民是否赞成。重置随机抽取了50户，其中有32户赞成，18户反对。（1）求总体中赞成新措施的户数比例的置信区间，置信水平为95%。

（2）如果小区管理者预计赞成的比例能达到80%，要求估计误差不超过10%。应抽取多少户进行调查?

5. 顾客到银行办理业务时往往需要等待一些时间，而等待时间的长短与很多因素有关，比

如，银行的业务员办理业务的速度、顾客等待排队的方式，等等。为此，某银行准备采

取两种排队方式进行试验。第一种排队方式是：所有顾客都进入一个等待队列；第二种排队方式是：顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短，银行各随机抽取10名顾客，他们在办理业务时所等待的时间(单位：分钟)如下：方式1 方式2 6.5 4.2 6.6 5.4 6，7 5.8 6.8 6.2 7.1 6.7 7.3 7.7 7.4 7.7 7.7 8.5 7.7 9.3 7.7 10.0 （1）构建第一种排队方式等待时间标准差的95%的置信区间。（2）构建第二种排队方式等待时间标准差的95%的置信区间。（3）根据（1）和（2）的结果，你认为哪种排队方式更好？

6. 两个正态总体的方差?1和?2未知但相等。从两个总体中分别抽取两个独立的随机样

本，它们的均值和标准差如下：

来自总体1的样本来自总体2的样本 22n1?14 x1?53.2 s12?96.8 n2?7 x2?43.4 2s2?102.0 求(?1-?2)的置信区间，显著性水平分别为95%和99%。

7. 一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试，得

到的自信心测试分数如下：人员编号方法1 方法2 1 78 71 2 63 44 3 72 61 4 89 84 5 91 74 6 49 51 7 68 55 8 76 60 9 85 77 10 55 39 构建两种方法平均自信心得分之差?d??1-?2的95%的置信区间。

8. 从两个总体中各抽取一个n1?n2?250的独立随机样本，来自总体1的样本比例为

p1?40%，来自总体2的样本比例为p2?30%。

构造(?1-?2)的置信区间，置信水平分别为90%和95%。

9. 生产工序的方差是工序质量的一个重要度量。当方差较大时，需要对工序进行改进以减

小方差。下表是两部机器生产的袋茶重量(单位：克)的数据：

机器1 3.45 3.22 3.90 3.22 机器2 3.28 3.35 9

3.20 3.22 3.50 2.95 3.16 3.20 2.98 3.75 3.38 3.45 3.48 3.18 223.70 3.28 3.35 3.20 3.12 3.25 3.28 3.30 3.30 3.34 3.28 3.30 3.19 3.20 3.29 3.35 3.16 3.34 3.30 3.05 3.33 3.27 3.28 3.25 构造两个总体方差比?1/?2的95%的置信区间。

10. 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验，标准差大约为120

元，现要求以95%的置信水平估计每个顾客平均购物金额的置信区间，并要求估计误差不超过20元，应抽取多少个顾客作为样本？

11. 假定两个总体的标准差分别为：?1?12，?2?15，若要求估计误差不超过5，相应的

置信水平为95%，假定n1?n2，估计两个总体均值之差(?1-?2)时所需的样本量为多大？

12. 假定n1?n2，估计误差为0.05，相应的置信水平为95%，估计两个总体比例之差(?1-?2)时所需的样本量为多大？

第五章课后习题参考答案

1.解：（1）已知??15，n?49，故：?x??n2?15?2.1429； 7（2）由题目可知：??0.05，故查表可知：Z??Z0.025?1.96 估计误差Z??x?1.96?2.1429?4.2；

2（3）由题目可知：x?120，由置信区间公式可得： x?Z??x?120?4.2?(115.8,124.2)

2即快餐店所有顾客午餐平均花费金额的95%的置信区间为（115.8，124.2）元。 2.解：

（1）总体服从正态分布，Z??Z0.025?1.96，则?的95%置信区间为：

2x?Z??x?8900?1.96?129.0994?(8646.9652,9153.0348)

2（2）总体不服从正态分布，且样本属于大样本，Z??Z0.025?1.96，则?的95%置信区间

2为：

x?Z??x?8900?1.96?84.5154?(8734.3498,9065.6502)

2（3）总体不服从正态分布，?未知，因此使用样本方差代替总体方差，Z??Z0.05?1.645，

2 10

则?的90%置信区间为：

x?Z?2s?8900?1.645?84.5154?(8760.9722,9039.0278) n2?未知，（4）总体不服从正态分布，因此使用样本方差代替总体方差， Z??Z0.025?1.96，

则?的95%置信区间为：

x?Z?2s?8900?1.96?84.5154?(8734.3498,9065.6502) n2?x?3.3167，s??(x?x)3.解：整理数据可以得到n?36，x?nn?1?1.6093，由于

n?36属于大样本，所以使用正态分布来构建置信区间。

当Z??Z0.05?1.645，该校大学生平均上网时间的90%置信区间为：

2x?Z?2s?3.3167?1.645?0.2682?(2.8755,3.7579)小时 n当Z??Z0.025?1.96，该校大学生平均上网时间的95%置信区间为：

2x?Z?2s?3.3167?1.96?0.2682?(2.7910,3.8424)小时 n当Z??Z0.025?2.58，该校大学生平均上网时间的95%置信区间为：

2x?Z?2s?3.3167?2.58?0.2682?(2.6244,4.0089)小时 n4.解：

（1）由题目可知：n?50，p?32?0.64，?p?50p(1?p)?0.0679，由于抽取的样n本属于大样本，所以Z??Z0.025?1.96，总体中赞成新措施的户数比例的95%置信区间为：

2p?Z?2p(1?p) ?0.64?1.96?0.0679?（0.5069，0.7731）n（2）由题目可知：估计误差d?Z?2p(1?p)?10%?0.1，p?0.8，Z??Z0.025?1.96，n2得到：

Z?2p(1?p)?0.1 n11

1.96?0.8（1-0.8）?0.1

n61.5385?n

即样本个数至少为62户。

或直接将d?0.1带入n确定的公式，即，

(z?/2)2?(1??)1.962?0.8?(1?0.8)n???61.54?62

d20.125.解：

（1）整理数据可以得到：n?10，x1?7.15，s1?0.2272，由于抽取的样本属于小样本，所以由CHIINV函数得：????0.025(9)?19.0228，?22221?2?22??0.975(9)?2.7004，由

此可以得到第一种排队方式等待时间标准差的95%的置信区间为：

(n?1)s12??22???(n?1)s12?2?1?2

0.33???0.87

（2）整理数据可以得到：n?10，x2?7.15，s2?3.8183，第二种排队方式等待时间标准差的95%的置信区间为：

2(n?1)s22??22???(n?1)s22?21?

?21.25???3.33

（3）比较两种方法的标准差置信区间，第一种方法的置信区间更小，说明第一种方法等待时间的离散程度更小，比第二种方式好。

2(n1?1)s12?(n2?1)s2?9.9218 6.解：由题目可以得到：sw?n1?n2?2当t1??2(n1?n2?2)?t0.975(19)?2.093 ，(?1-?2)的95%置信区间为：

(x1?x2)?t0.975(19)sw1111??9.8?2.093?9.9218???(0.1871,19.4129)n1n2147

当t1??2(n1?n2?2)?t0.995(19)?2.8609，(?1-?2)的95%置信区间为：

(x1?x2)?t0.995(19)sw?(?3.3398,22.9398)1111??(53.2?43.4)?2.8609?9.9218??n1n2147

7.解：由样本数据计算得到：

d?110?11，sd?10?(di?1ni?d)2?nd?1384?6.53，t?(10?1)?2.262

10?12则自信心得分之差?d??1-?2的95%的置信区间为：

d?t0.025(9)sd6.53?11?2.262??11?4.67?(6.33,15.67) n108.解：由题目可以得到：n1?n2?250，p1?0.4，p2?0.3，当Z??Z0.95?1.645，(?1-?2)的90%置信区间为：

2p1?p2?Z0.95p1(1?p1)p2(1?p2)??(3.021%,16.98%) n1n2当Z??Z0.975?1.96，(?1-?2)的95%置信区间为：

2p1?p2?Z0.975p1(1?p1)p2(1?p2)??(1.684%,18.32%) n1n2229.解：由题目可以得到：n1?n2?21，s1?0.058375，s2?0.005265，

F?(n1?1,n2?1)?F0.025(20,20)?2.4645，F2221??2(n1?1,n2?1)?F0.975(20,20)?0.4058

两个总体方差比?1/?2的95%的置信区间为：

s121?12s12?2?22s2F?(n1?1,n2?1)?2s2F21?1

(n?1,n?1)?122?12 17.4123?2?27.3223

?210.解：由题目可以得到：使用过去经验数据，则可以认为? 已知，即??120，在95%置信度下Z??Z0.025?1.96，估计误差Z?22?n?20，因此：

Z0.975

?n13

?20

1.96?120?20 n138.2976?n

即样本个数至少为139个。

11.解：由题目可以得到：总体? 已知，即?1?12，?2?15，n1?n2?n，在95%置信度下Z??Z0.025?1.96，估计误差Z?2?12n1?2?22n2??5，因此：

Z0.025?12n12?2n2?5

122?1521.96??5

n 56.7020?n

即两个总体的样本各至少为57个。

第六章、练习题及解答

1. 一项包括了200个家庭的调查显示，每个家庭每天看电视的平均时间为7.25小时，标

准差为2.5小时。据报道，10年前每天每个家庭看电视的平均时间是6.70小时。取显著性水平??0.01，这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”？

2. 为监测空气质量，某城市环保部门每隔几周即对空气烟尘质量进行一次随机测试。已知

该城市过去每立方米空气中悬浮颗粒的平均值是82微克。在最近一段时间的检测中，每立方米空气中悬浮颗粒的数值(单位：微克)如下： 81.6 96.6 77.3 74.0 86.6 74.9 76.1 82.5 80.0 83.0 92.2 87.0 85.8 66.6 72.4 73.2 78.6 68.6 61.7 88.5 58.3 70.9 75.6 86.9 68.7 71.1 85.5 94.9 73.2 71.6 72.5 83.0 根据最近的测量数据，当显著性水平??0.01时，能否认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值?

3. 安装在一种联合收割机上的金属板的平均重量为25公斤。对某企业生产的20块金属板

进行测量，得到的重量(单位：公斤)数据如下： 22.6 26.6 23.1 23.5 27.0 25.3 28.6 24.5 26.2 30.4 27.4 24.9 25.8 23.2 26.9 26.1 22.2 28.1 24.2 23.6 假设金属板的重量服从正态分布，在??0.05显著性水平下，检验该企业生产的金属

板是否符合要求。

4. 对消费者的一项调查表明，17％的人早餐饮料是牛奶。某城市的牛奶生产商认为，该城

市的人早餐饮用牛奶的比例更高。为验证这一说法，生产商从该城市随机抽取550人，调查知其中115人早餐饮用牛奶。在??0.05显著性水平下，检验该生产商的说法是否属实。

5. 某生产线是按照两种操作平均装配时间之差为5分钟而设计的，两种装配操作的独立样

本产生如下结果：

操作A 操作B n1?100 x1?14.8分钟 n2?50 x2?10.4分钟 s1?0.8分钟 s2?0.6分钟在??0.05的显著性水平下检验平均装配时间之差是否等于5分钟。

6. 某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人

都分别在看过该产品的新的电视广告之前与之后打分。潜在购买力的分值为0～10分，分值越高表示潜在购买力越高。原假设认为“看后”平均得分小于或等于“看前”平均得分，拒绝该假设就表明广告提高了平均潜在购买力得分。对??0.05的显著性水平，用下列数据检验该假设，并对该广告给予评价。个体 1 2 3 4 购买力得分看后 6 6 7 4 看前 5 4 7 3 个体 5 6 7 8 购买力得分看后 3 9 7 6 看前 5 8 5 6 7. 某企业为比较两种方法对员工进行培训的效果，采用方法1对15名员工进行培训，采

用方法2对12名员工进行培训。培训后的测试分数如下：

方法1 56 47 42 50 47 51 52 53 42 44 45 43 52 48 44 59 52 53 54 方法2 57 56 55 64 53 65 53 57 两种方法培训得分的总体方差未知且不相等。在??0.05的显著性水平下，检验两种方法的培训效果是否有显著差异。

8. 为研究小企业经理是否认为他们获得了成功，在随机抽取的100个小企业的女性经理中，

认为自己成功的人数为24人；而在对95个男性经理的调查中，认为自己成功的人数为

39人。在??0.05的显著性水平下，检验男女经理认为自己成功的人数比例是否有显著差异。

9. 为比较新旧两种肥料对产量的影响，以便决定是否采用新肥料。研究者选择了面积相等、

土壤等条件相同的40块田地，分别施用新旧两种肥料，得到的产量数据如下：

旧肥料 109 98 103 97 101 98 88 105 97 94 108 102 98 99 102 104 100 104 106 101 105 113 106 110 109 111 117 111 新肥料 110 111 99 103 118 99 107 110 109 112 119 119 取显著性水平??0.05，检验：

（1）新肥料获得的平均产量是否显著地高于旧肥料？假定条件为： ①两种肥料产量的方差未知但相等，即?1??2。 ②两种肥料产量的方差未知且不相等，即?1??2。（2）两种肥料产量的方差是否有显著差异？

10. 生产工序中的方差是工序质量的一个重要测度，通常较大的方差就意味着要通过寻找减

小工序方差的途径来改进工序。某杂志上刊载了关于两部机器生产的袋茶重量(单位：克)的数据如下，检验这两部机器生产的袋茶重量的方差是否存在显著差异。(??0.05)

2.95 机器1 3.16 3.20 3.12 3.22 机器2

第六章课后习题参考答案

1.解：由题目可以得到：n?200，??2.5；

提出原假设与备择假设：H0:??6.7，H1:??6.7；

该检验属于右侧单边检验，因此得到拒绝域为：W?{z?z1???z0.99?2.3263}；在大样本条件下检验统计量为：z?3.38 3.30 3.45 3.20 3.22 3.30 3.34 3.28 3.50 3.22 2.98 3.34 3.35 3.30 3.75 3.38 3.45 3.28 3.19 3.20 3.48 3.90 3.70 3.29 3.35 3.16 3.26 3.36 3.34 3.25 3.05 3.33 3.33 3.25 3.18 3.30 3.36 3.20 3.28 3.35 3.27 3.28 2222x??0??3.1113?2.32563，落入拒绝域中，因

n此拒绝原假设，认为如今每个家庭每天收看电视的平均时间较十年前显著增加了。

（或利用Excel的“1-NORMSDIST(3.1113)”函数得到检验P=0.0009<0.01，则拒绝原假设）

2.解：由题目可以得到：n?32，根据样本数据计算得到：s?9.1979，x?78.10625；提出原假设与备择假设：H0:??82，H1:??82；

该检验属于左侧单边检验，因此得到拒绝域为：W?{z?z??z0.01??2.3264}；

在大样本且总体方差未知条件下检验统计量为：z?x??0??2.3949?2.325，落入sn拒绝域中，因此拒绝原假设，认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值。（或利用Excel的“NORMSDIST(-2.3949)”函数得到检验P=0.0083<0.01，则拒绝原假设）

3.解：由题目可以得到：n?20，计算样本数据得到s?2.1933，x?25.51；提出原假设与备择假设：H0:??25，H1:??25；

该检验属于双边检验，因此得到拒绝域为：W?{z?z??z0.025?1.96}；

2 在服从正态分布的小样本且总体方差未知条件下检验统计量为： z?x???1.0399?1.96，落入接受域中，因此不能拒绝原假设，没有证据表明该企业生产sn的金属板不符合要求。

（或利用“TDIST(1.04,19,2)”函数得到检验P=0.3114>0.05，则不能拒绝原假设） 4.解：由题目可以得到：n?550，计算样本数据得到p?n0115??20.91%； n550 提出原假设与备择假设：H0:??17%，H1:??17%；

该检验属于右侧单边检验，因此得到拒绝域为：W?{z?z??z0.025?1.96}；

2在大样本条件下检验统计量为：z?p??0?2.4412?1.96，落入拒绝域中，

?0(1??0)n因此拒绝原假设，认为生产商的说法属实，该城市的人早餐饮用牛奶的比例高于17%。（或利用“1-NORMSDIST(2.4412)”函数得到检验P=0.0073<0.05，则拒绝原假设） 5.解：提出原假设与备择假设：H0:?1??2?5，H1:?1??2?5；

在大样本条件下检验统计量为：z?(x1?x2)?(?1??2)ss?n1n22122??5.1450

利用“2*(1-NORMSDIST(5.1450))”函数，得到双尾P值为2.6752?10?7，由于

P???0.05，拒绝原假设，认为两种装配操作的平均装配时间之差不等于5分钟。

6.解：设：“看后”平均得分为?1 ，“看前”平均得分?2，“看后”平均得分与“看前”平均得分之差为d；

提出原假设与备择假设：H0:?1??2?0，H1:?1??2?0；

根据样本数据计算得到：d??di?1nin?0.625，sd??(di?1ni?d)2?1.3025；

n?1在配对的小样本条件下检验统计量为：t?0.625?1.3572

1.30258利用Excel “=TDIST(1.3572, 7, 1)”得到的单尾概率P值为0.10842，由于

P???0.05，不能拒绝原假设，没有证据表明广告提高了平均潜在购买力得分。

7.解：设：方法一培训测试平均得分为?1，方法二培训测试平均得分为?2；提出原假设与备择假设：H0:?1??2?0，H1:?1??2?0；

根据样本数据计算得到：

2?18.2727 n1?15，n2?12，x1?47.7333，x2?56.5，s12?19.4952，s2由于小样本情况下总体方差未知且不相等，t分布自由度为：

2s12s2(?)2nn2??21?24 2ss(1)2(2)2n1n?2n1-1n2-1在小样本条件下检验统计量为：t?(x1-x2)-(?1-?2)ss?n1n22122??5.2183

利用Excel的“=TDIST(5.2183, 24, 2)”函数，得到的双尾概率P值为0.00002，由于P???0.05，拒绝原假设，认为两种培训方法的效果存在显著差异。

8.解：设：男性经理认为自己成功的人数比例为?1 ，女性经理认为自己成功的人数比例为?2，两个样本合并后得到的合并比例为p；

提出原假设与备择假设：H0:?1??2?0，H1:?1??2?0；

根据样本数据计算得到：两个样本的比例分别为：p1?41％，p2?24％

两个样本合并后得到的合并比例p?n1p1?n2p2?32.31%；

n1?n2检验统计量为：z?p1-p2?2.5373

11p(1-p)(?)n1n2利用Excel的“=2*(1-NORMSDIST(2.5373))”函数，得到检验概率P值为0.0112，由于P???0.05，所以拒绝原假设，认为男女经理认为自己成功的人数比例具有显著差异。 9.解：设：新肥料获得的平均产量为?1，旧肥料获得的平均产量为?2；（1）两种肥料产量的方差未知但相等，即?1??2时：

提出原假设和备择假设：H0:?1??2?0；H1:?1??2?0 ；根据样本数据计算得：

2?24.1158； n1?20，n2?20，x1?109.9，x2?100.7， s12?33.3579，s222 总体方差的合并估计量为：

2(n1-1)s12?(n2-1)s2 s??28.73685

n1?n2-22p检验统计量为： t?(x1-x2)-(?1-?2)?5.4271

11sp?n1n2利用Excel的“=TDIST(5.4271, 38, 1)”函数，得到单尾概率P值为0.000002，由于

P???0.05，拒绝原假设，认为新肥料获得的平均产量显著地高于旧肥料。

（以上也可由Excel中的[t-检验：双样本等方差假设]给出）两种肥料产量的方差未知且不相等，即?1??2时：

提出原假设与备择假设：H0:?1??2?0；H1:?1??2?0；

根据样本数据计算得到：

2?24.1158 n1?20，n2?20，x1?109.9，x2?100.7， s12?33.3579，s222由于小样本情况下总体方差未知且不相等，t分布自由度为：

2s12s2(?)2nn2??21?37 2s12s2()()2n1n?2n1-1n2-1在小样本条件下检验统计量为：t?(x1-x2)-(?1-?2)ss?n1n22122?5.4271

利用Excel的“=TDIST(5.4271, 37, 1)”函数，得到单尾概率P值为0.000002，由于

P???0.05，拒绝原假设，认为新肥料获得的平均产量显著地高于旧肥料。

（以上也可由Excel中的[t-检验：双样本异方差假设]给出）（2）设：使用新肥料的田地为样本1，使用旧肥料的田地为样本1

?12?12 提出原假设与备择假设：H0:2?1；H1:2?1

?2?2利用Excel中的“F-检验：双样本方差”（??0.025）得到的检验结果如下表所示：

F-检验双样本方差分析平均方差观测值 df F P(F<=f) 单尾 F 单尾临界由于2P?0.4861??有显著差异。

变量 1 109.9 20 19 1.383239 0.24311 2.526451 变量 2 100.7 20 19 33.35789 24.11579

?0.05，不能拒绝原假设，没有证据表明两种肥料产量的方差

10.解：设：机器一为样本1，机器二为样本1

?12?12 提出原假设与备择假设：H0:2?1；H1:2?1

?2?2 利用Excel的“F-检验：双样本方差”（??0.025）得到的检验结果如下表所示：

F-检验双样本方差分析平均方差观测值 df

变量 1 3.3284 0.048889 25 24 变量 2 3.278181818 0.005901299 22 21

分析略。

第十一章、练习题及解答

设某地区某年有关核算资料如下：指标总产出中间投入固定资本消耗劳动报酬生产税净额营业盈余最终消费数额（亿元）指标 1200 700 60 300 40 100 300 总资本形成出口进口来自国外的要素收入支付国外的要素收入来自国外的经常转移收入支付国外的经常转移收入数额（亿元） 210 80 90 25 15 3 5 试根据以上资料：

(1)用相应的三种方法分别计算国内生产总值和国内生产净值； (2)计算国民总收入和国民净收入；

(3)计算国民可支配总收入和国民可支配净收入。解：(1)生产法：国内生产总值=总产出-中间投入=1200-700=500（亿元）收入法：国内生产总值=劳动报酬+生产税净额+固定资本消耗+营业盈余 =300+40+60+100=500（亿元）

支出法：国内生产总值=最终消费+总资本形成+出口-进口 =300+210+80-90=500（亿元）

国内生产净值=国内生产总值-固定资本消耗=500-60=440（亿元） (2) 国民总收入=国内生产总值+来自国外的要素收入净额 =500+25-15=510（亿元）

国民净收入=国民总收入-固定资本消耗=510-60=450（亿元） (3) 国民可支配总收入=国民总收入+来自国外的经常转移收入净额 =510+3-5=508（亿元）

国民可支配净收入 = 国民可支配总收入 - 固定资本消耗 =508-60

=448（亿元）

F P(F<=f) 单尾 F 单尾临界 8.284447623 3.61079E-06 2.367525575 由于2P?0.000007???0.05，拒绝原假设，认为两种肥料产量的方差有显著差异。

第七章、练习题及解答

1.从某市的三个小学中分别抽若干名5年级男生，测量其身高，数据如下，

小学大成小学平明小学师范附小身高（cm） 128 135 148 152 146 135 148 145 156 162 157 136 145 136 139 148 164 142 试检验不同小学5年级男生身高有无显著差别(? =0.05) 解：设三个小学的5年级男生的平均身高分别为?,?,?。

123提出假设：H0:?1??2??3 H1:?1,?2,?3不全相等由Excel输出的方差分析表如下：差异源组间组内总计 SS 262.4381 1417.562 1680 df 2 15 MS F P-value F crit 131.219 1.388501 0.279734 3.68232 94.50413 17 P-value=0.279734＞? =0.05,(或者F=1.388501＜F crit=3.68232），不能拒绝原假设，

没有证据表明该市3所小学5年级的男生身高有显著差异。

2.某家电制造公司准备购进一批5#电池，现有A、B、C三个电池生产企业愿意供货，为比较它们生产的电池质量，从每个企业各随机抽取5只电池，经试验得其寿命（小时）数据见下表：

试验号 1 2 3 4 5 电池生产企业 A 50 50 43 40 39 B 32 28 30 34 26 C 45 42 38 48 40

试分析三个企业生产的电池的平均寿命之间有无显著差异？如果有差异，用LSD方法检验哪些企业之间有差异？ (? =0.05)

解：A、B、C三个企业生产的电池的平均寿命分别为?,?12,?。

3提出假设：H0:?1??2??3

H1:?1,?2,?3不全相等由Excel输出的方差分析表如下：方差分析差异源组间组内总计

SS 615.6 216.4 832

P-value

F crit

2 307.8 17.06839 0.00031 3.885294 12 18.03333 14

P-value=0.00031＜? =0.05（或F=17.06839＞F crit=3.885294），拒绝原假设。表明

电池的平均寿命之间有显著差异。

为判断哪两家企业生产的电池平均寿命之间有显著差异，首先提出如下加红色：

检验1：H0:?1??2;检验2：H0:?1??3;检验3：H0:?2??3;然后计算检验统计量:

H1:?1??2 H1:?1??3 H1:?2??3

x?x?44.4?30?14.4

12x?x?44.4?42.6?1.8

13x?x?30?42.6?12.6

22计算LSD。根据方差分析表可知，MSE=18.03333.根据自由度=n-k=15-3=12.查t分布表得t?/2?t0.025?2.179.计算的LSD如下：

LSD?2.179?18.033?(?)?5.8555作出决策。

x?x?44.4?30?14.4＞LSD=5.85，拒绝原假设。企业A与企业B电池的平均

12使用寿命之间有显著差异。

x?x?44.4?42.6?1.8＜LSD=5.85，不拒绝原假设。没有证据表明企业A与企

13业C电池的平均使用寿命之间有显著差异。

x?x?30?42.6?12.6＞LSD=5.85，拒绝原假设。企业B与企业C电池的平均

22使用寿命之间有显著差异。

3.某企业准备用三种方法组装一种新的产品，为确定哪种方法每小时生产的产品数量最多，随机抽取了30名工人，平均分为三组，并指定每组使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果。

差异源

SS df MS 22

F P-value F crit 组间组内合计（420） 3836 （4256）（2） 210 （1.478） - - 0.245946 - - 3.354131 - - （27）（142.07） 29 要求：（1）完成上面的方差分析表。（2）检验三种方法组装的产品数量之间是否有显著差异？ (?=0.05) 解：（1）差异源组间组内合计 SS （420） 3836 （4256） df （2） MS 210 F （1.478） - - P-value 0.245946 - - F crit 3.354131 - - （27）（142.07） 29 （2）由方差分析表可知：P-value=0.245946＞?=0.05,(或F=1.478＜F crit=3.354131＝，不能拒绝原假设。没有证据表明三种方法组装的产品数量之间有显著的差异。 4.某农场在不同的地块试种四个品种的谷子，试验数据如下（单位：千克/亩），试检验地块类型和谷子品种是否对平均亩产量有影响（α＝0.05）。

太行2号洼地坡地平地 225 156 320 冀丰2号 210 198 351 12冀丰3号 198 265 298 农科9号 152 210 302 农科12号 205 236 261 解：设不同地块的平均亩产量分别为：?,?提出假设：H0:?1??2??3 H1:?1,?2,?3不全相等设不同品种的平均亩产量分别为?,?1,?

32,?,?,?

3455提出假设：H0:?????????

1234 H0:?,?,?,?,?,不全相等

12345由Excel输出的方差分析表如下：方差分析差异源行列误差总计

SS 34498.53 2329.733 11749.47 48577.73

df 2 4 8 14

P-value

F crit

17249.27 11.74471 0.004166 4.45897 582.4333 0.396568 0.806054 3.837853 1468.683

P-value=0.0014＜α＝0.05(或F=11.74471＞ F crit=4.45897)，拒绝原假设。表明不

同品种的种子对亩产量的影响显著。

P-value=0.806054＞α＝0.05（或F=0.396568＜F crit=3.837853)，不拒绝原假设。没有证据表明不同地块类型对亩产量有显著差异。

5.为研究食品的包装和销售地区对其销售量是否有影响，在某周的3个不同地区中用3种不同包装方法进行销售，获得的销售量数据见下表：销售地区（A ） A1 A2 A3 包装方法（B ） B1 45 50 35 B2 75 50 65 B3 30 40 50 检验不同的地区和不同的包装方法对该食品的销售量是否有显著影响？ (? =0.05) 解：设不同地区的平均销售量分别为?提出假设： HA1,?,?A2A3

0:?????A1A2

A3 H0:?,?,?A1A2A3不全相等

设不同包装方式的平均销售量分别为?提出假设： HB1,?,?B2B3

0:?????B1B2B3

H0:?,?,?B1B2B3不全相等

由Excel输出的方差分析表如下：方差分析差异源行列误差总计 SS 22.22222 955.5556 611.1111 1588.889 df 2 2 4 8 MS F P-value F crit 11.11111 0.072727 0.931056 6.944272 477.7778 3.127273 0.152155 6.944272 152.7778 P-value=0.931056＞? =0.05（或F=0.072727＜ F crit=6.944272)，不拒绝原假设，没有证据表明不同地区对该食品的销售量有显著影响。

P-value=0.152155＞? =0.05（或F=3.127273＜ F crit=6.944272)，不拒绝原假设，没有证据表明包装方式对该食品的销售量有显著影响。

第八章、练习题及解答

1.从某一行业中随机抽取12家企业，所得产量与生产费用的数据如下:

企业编号 1 2 3 4 5 6 要求：

产量（台） 40 42 50 55 65 78 生产费用（万元） 130 150 155 140 150 154 企业编号 7 8 9 10 11 12 产量（台） 84 100 116 125 130 140 生产费用（万元） 165 170 167 180 175 185 （1）绘制产量与生产费用的散点图，判断二者之间的关系形态。（2）计算产量与生产费用之间的相关系数。

（3）对相关系数的显著性进行检验(?=0.05)，并说明二者之间的关系强度。解：（1）

200 生产费用 150 100 20 50 产量产量与生产费用散点图 80 110 140 170 散点图表明产量与生产费用两变量之间为正线性相关。（2）设产量为X，生产费用为Y，

?x?1025,?y?1921,?x?101835,

2?y?310505,?xy?1700942产量与生产费用之间的相关系数：

r?n?xy??x?yn?x?(?x)n?y?(?y)22222

12?170094?1025?192172103???0.9212?101835?102512?310505?1921783532两变量为高度正相关关系。（3）相关系数的显著性检验如下：第1步，提出假设。

原假设H0:??0；备择假设H1:??0 第2步，计算检验统计量。

t?rn?20.92?12?2??18.941?r1?0.9222

第3步，给定显著性水平??0.05，查表确定临界值t第4步，做出统计决策。由于t的线性关系显著。

2.设SSR?36,SSE?4,n?18。要求：

（1）计算判定系数R2，并解释其意义。解：R=

20.05/2(12?2)?2.228。

?t(10)，则拒绝原假设，说明产量与生产费用之间

0.025SSR36

??90%SSR?SSE36?42其意义为： R=90%表示，在因变量y取值的变差中，有90%可以由x和y之间的线性关系来解释。

（2）计算估计标准误差se，并解释其意义。

s?eSSE4

??0.5n?218?2 其意义：se=0.5表示，当用x来预测y时，平均的预测误差为0.5.

3.一家物流公司的管理人员想研究货物的运送距离和运送时间的关系，为此，抽出了公司最

近10辆卡车运货记录的随机样本，得到运送距离（单位：公里）和运送时间（单位：天）的数据如下：运送距离x 运送时间y 825 215 1070 550 480 920 1350 325 670 1215 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0 （1）绘制运送距离和运送时间的散点图，判断二者之间的关系形态。解答：距离和运送时间的散点图：

6 5 4 时间 3 2 1 0 0 500 1000 1500 距离货物运送距离与时间散点图

运送距离与时间大致呈正的线性相关关系。

（2）计算相关系数，说明两个变量之间的关系强度。