统计学课后作业答案

更新时间:2023-10-11 05:50:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

4.2 随机抽取25个网络用户,得到他们的年龄数据如下: 19 23 30 23 41

15 21 20 27 20

要求;(1)计算众数、中位数:

1、排序形成单变量分值的频数分布和累计频数分布:

网络用户的年龄

15 16 17 18 19 20 21 22 23 Valid 24 25 27 29 30 31 34 38 41 Total Frequency 1 1 1 1 3 2 1 2 3 2 1 1 1 1 1 1 1 1 25 Percent 4.0 4.0 4.0 4.0 12.0 8.0 4.0 8.0 12.0 8.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0 100.0 Cumulative Frequency 1 2 3 4 7 9 10 12 15 17 18 19 20 21 22 23 24 25 Cumulative Percent 4.0 8.0 12.0 16.0 28.0 36.0 40.0 48.0 60.0 68.0 72.0 76.0 80.0 84.0 88.0 92.0 96.0 100.0 29 38 19 22 31

25 22 19 34 17

24 18 16 24 23

从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。

(2)根据定义公式计算四分位数。 Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25

和27都只有一个,因此Q3也可等于25+0.75×2=26.5。 (3)计算平均数和标准差; Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773

(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。

为分组情况下的直方图:

32Count10151617181920212223242527293031343841网络用户的年龄 为分组情况下的概率密度曲线:

3.02.5Count2.01.51.0151617181920212223242527293031343841网络用户的年龄 分组:

1、确定组数:K?1?lg?25?lg(n)1.398?1??1??5.64,取k=6

lg(2)lg20.301032、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5 3、分组频数表

网络用户的年龄 (Binned)

<= 15 16 - 20 21 - 25 Valid 26 - 30 31 - 35 36 - 40 41+ Total 分组后的均值与方差:

Mean Std. Deviation Variance Skewness 23.3000 7.02377 49.333 1.163 Frequency 1 8 9 3 2 1 1 25 Percent 4.0 32.0 36.0 12.0 8.0 4.0 4.0 100.0 Cumulative Frequency 1 9 18 21 23 24 25 Cumulative Percent 4.0 36.0 72.0 84.0 92.0 96.0 100.0 Kurtosis

分组后的直方图:

101.302 8Frequency642Mean =23.30Std. Dev. =7.024N =25010.0015.0020.0025.0030.0035.0040.0045.0050.00组中值 4.11 对10名成年人和10名幼儿的身高进行抽样调查,结果如下: 成年组 幼儿组 166 169 l72 177 180 170 172 174 168 173 68 69 68 70 7l 73 72 73 74 75 要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么? 均值不相等,用离散系数衡量身高差异。 (2)比较分析哪一组的身高差异大?

成年组 平均 标准差 离散系数 幼儿组的身高差异大。

平均 172.1 标准差 4.201851 离散系数 0.024415 幼儿组 71.3 2.496664 0.035016 7.6利用下面的信息,构建总体均值μ的置信区间:

x =8900,置信1) 总体服从正态分布,且已知σ = 500,n = 15,水平为95%。

解: N=15,为小样本正态分布,但σ已知。则1-?=95%,

。其置信区间公式为 x?z??22?n?105.36?1.96???101.44,109.28?1025?105.36?3.92 ∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2)

2) 总体不服从正态分布,且已知σ = 500,n = 35,x =8900,置信水平为95%。

解:为大样本总体非正态分布,但σ已知。则1-?=95%,

。其置信区间公式为 x?z??22?n?105.36?1.96??105.36?3.92??101.44,109.28?1025 ∴置信区间为:8900±1.96×500÷√35=(8733.9 9066.1)

7.9某居民小区为研究职工上班从家里到单位的距离,抽取了由

16个

人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。

解:小样本正态分布,σ未知。已知,n = 16,

,则

2.14

,

α/2=0.025,查自由度为n-1 = 15的 分布表得临界值

样本均值=150/16=9.375

再求样本标准差:于是 , 的置信水平为

= √253.75/15 ≈ 4.11 的置信区间是

,

9.375±2.14×4.11÷√16 即(7.18,11.57)

8.5某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(?=0.05)? 解:已知N=50,P=6/50=0.12,为大样本,右侧检验,用Z统计量计算。?=0.05,即Z?=1.645

H0:丌≤5% H1:丌>5%

p?P0~N(0,1)P0(1?P0) n = (0.12-0.05)/√(0.05×0.95÷50)≈2.26

z?(因为没有找到丌表示的公式,这里用P0表示丌0)

结论:因为Z值落入拒绝域,所以在?=0.05的显著性水平上,拒绝H0,而接受H1。

决策:有证据表明该批食品合格率不符合标准,不能出厂。 8.6某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下超过目前的平均水平25000公里。对一个由15个轮胎组成的随机样本做了试验,得到样本均值和标准差分别为27000公里和5000公里。假定轮胎寿命服从正态分布,问该厂家的广告是否真实(?=0.05)? 解:N=15, =27000,s=5000,小样本正态分布,σ未知,用t统计量计算。这里是右侧检验,?=0.05,自由度N-1=14,即t?=1.77

H0:μ0 ≤25000 H1:μ >25000

t ?

= (27000-25000)/(5000÷√15)≈1.55

s n

结论:因为t值落入接受域,所以接受H0 ,拒绝H1。

x ? μ

0

决策:有证据表明,该厂家生产的轮胎在正常行驶条件下使用寿

命与目前平均水平25000公里无显著性差异,该厂家广告不真实。 9.1欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了四个不同收入组的消费者共527人,购买习惯分为:经常购买,不购买,有时购买。调查结果如下表所示。

本文来源:https://www.bwwdw.com/article/pjkf.html

Top