复习讲解

更新时间:2024-04-25 01:04:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

习题一

一、选择题(每小题1分,共20分) 1、统计研究的过程为:

A、收集数据-整理数据-分析数据-解释数据; B、整理数据-收集数据-分析数据-解释数据;

C、收集数据-分析数据-整理数据-解释数据; D、收集数据-解释数据-分析数据-整理数据

2、统计数据的类型按计量尺度分为:

A、观测数据和实验数据; B、时序数据和截面数据; C、分类数据、顺序数据和数值型数据; D、离散数据和连续数据 3、( )主要研究如何根据样本信息来推断总体的特征。

A、 描述统计;B、推断统计;C、统计工作;D、理论统计 4、抽样的目的就是要根据( )去估计总体参数。

A、样本数据;B、样本统计量;C、抽样分布;D、抽样理论 5、进行什么样的抽样设计首先取决于( )

A、调查费用;B、研究目的;C、精度要求;D、领导要求

7、在某城市中随机抽取10个家庭,每个家庭的人均月收入数据为:1500,1080,780,750,690,960,850,2000,1250,1630,则中位数为( ): A、1020;B、960;C、1080;D、950

12、下列受极端值的影响最大的是( )

A、众数;B、平均数;C、几何平均数;D、中位数

13、关于标准分数,下列说法错误的是( )

A、 只是将原始数据进行了线性变换;B、没有改变一个数据在该组数据中的位置; C、改变了该组数据的分布; D、没有改变该组数据分布的形状。 14、能够确定出估计值与总体参数的真实值接近程度的是( ) A、点估计;B、参数估计;C、区间估计;D、最小二乘估计

15、 ?错误是指( )

A、原假设为真,却被拒绝的概率; B、备择假设为真,却拒绝H的概率; C、原假设为伪,却没有被拒绝的概率; D、备择假设为伪,却没有拒绝H的概率 16、假设检验中的P值不取决于( )

A、样本数据与原假设值之间的差异;B、样本容量;C、被假设参数的总体分布;D、α值的大小。

17、已知y关于x的一元线性回归方程为y=0.78-0.81x,经计算得SSR=160,SST=326.53,

则由此可知y与x的相关系数为:

A、0.81; B、0.9;C、-0.7;D、-0.9 二、简答题(每小题10分,共30分)

1、二手资料与一手资料有何不同?使用二手资料时应注意哪些问题? 2、什么是参数最小二乘估计?

3、试述“小概率原理”在假设检验中的作用?

三、计算与分析题(第1、2各15分,第3题8分,第4题12分, 共50分)

1、某地区为了了解在校大学生生活消费支出的情况,从该地区高校中随机抽取了100名学生进行调查,调查结果如下:

按月生活费支出分组(元) 200以下 200-300 300-400 400-500 500-600 600以上 人数 10 20 30 20 10 10 合计 100 要求:(1)对该地区全体在校大学生人均月生活费支出进行点估计;(5分)

(2)在95%的置信水平下,对该地区全体在校大学生人均月生活费支出额进行区间估计。(7分)

(3)如果生活费支出边际误差为25元,问进行95%的置信区间估计时,该100名样

本容量是否合适?(已知t0.025(99)=1.96,Z0.05=1.645, Z0.025=1.96)(3分)

2、根据甲企业2004年每月的产品销售额Y与广告费支出X数据(单位:元),计算出其估计的回归方程为?=31.98+1.68X,估计结果中R2=0.923,F=230.78,自变量系数的t检验值为3.587;另有一企业乙也进行了同样情况的分析,已知∑X=50, ∑Y=110.8, ∑X=294, ∑Y=1465.0, ∑XY=654.9, 要求:

(1)确定乙企业产品销售额Y与广告费支出X的线性回归方程,并说明(7分)

2

2

??的含义;

1 (2)若已知乙企业的回归结果中R2=0.847,F=302.5,自变量系数的t检验值为1.7689,

试根据所学知识对甲、乙两企业所建立的线性回归方程的优劣进行综合分析。(已知

t

0.025=2)(8分)

一、选择题(每小题1分,共20分)

ACBBB CABDC BBCCA DCABC 二、简答题 (每小题10分,共30分)

1、二手资料是指与研究内容有关的信息,只需重新加工、整理的资料(2分);而一手资

料是指必须通过调查和实验的方法直接获得的资料(2分)。

注意问题:① 资料的可信度;② 资料的时效性;③ 资料的产生背景;④ 数据质量;

⑤ 要注意数据的定义、含义、计算口径和计算方法;⑥ 注明数据来源。(各1分) 2、最小二乘法是指使因变量的观察值

?之间的残差平方和达到最小来求得y与估计值yii22??和

0??的方法(5分),即

1????xi)?i)??(yi???(yi?y01的偏导数并令其等于零,便可求出

1?min.(2分)

然后对该式求相应于

??和

0????和

0??(3分)。

13、“小概率原理”是指发生概率很小的随机事件在一次实验中是几乎不可能发生的(5分);它是假设检验的基本原理,根据这一原理,可以做出是否拒绝原假设的决定(5分)。

三、计算与分析题(第1、2各15分,第3题8分,第4题12分, 共50分) 1、 解:① x??Mf?fii2i?38000; ?380元(5分,其中求出组中值得2分)

1002010000?20303(3分) 99(Mi?x)f?② s??f?12ii?

Z0.025s2n?1.96*20303?27.9元(2分), 100所以,区间估计为[380-27.9,380+27.9],即[352.1,407.9] (2分)

(Z?)S*203031.962③ n?因样本容量100小于125,故该样??124.8?125,

E2522222本量太小。(3分)

2、 解:

?① ???01?n?XiYi??Xi?Yin?Xi?(?12Xi)2?12*654.9?50*110.812*294?502?2318.8(2分) ?2.256

1028?X??Y??110.850?2.256*??0.167(1分) 1212???0.167?2.256X((2分)) 线性回归方程为:Y

??12

(2分) ?2.256的含义为广告费每支出1元,产品销售额平均增加2.256元。

2

② R为拟合优度,该数值越大说明回归方程拟合得越好,因甲企业的R为0.923大于乙企

业的0.847,从该系数来看,甲企业所建立的回归方程较好(3分);两个回归方程的F检验都通过了,说明两回归方程的线性关系显著(2分);甲企业回归方程系数的t检验值为3.587大于2,而乙企业的t检验值为1.7689小于2,说明甲企业的自变量对因变量的影响显著,而乙企业的不显著,应去掉该变量,而重新建立方程。(3分) 3、 解: ①

Y11??F16Y15?Y12?Y13?Y14?Y155?48?47?47?53?61?51.25万元(2分)

② 该方法主要适合对较为平稳时间序列的预测(1分);应用时,关键是确定合理的移动间隔长度k。(2分)

③ 因3期移动的预测误差平方和为483.79,则其均方误差为483.79/12=40.32,用k=5求出的均方误差为397.65/10=39.765,小于k=3求出的均方误差40.32,故选择k=5进行预测更合适。(3分)

习题二

-一、选择题(每小题1分,共20分)

1、 下列哪一个是变量:

A、二等品; B、初中; C、20万元; D、产品的质量等级

2、按照统计数据的收集方法,可以将其分为:

A、观测数据和实验数据; B、时序数据和截面数据; C、分类数据、顺序数据和数值型数据; D、离散数据和连续数据 5、调查员在街头、公园、商店等公共场所进行随机拦截式的调查行为属( ) A、判断抽样;B、随机抽样;C、方便抽样;D、简单随机抽样 6、下列哪一个误差大小与样本量大小和总体的变异性有关:

A、抽样误差;B、非抽样误差;C、抽样框误差;D、测量误差 9、若某总体分布呈轻微右偏分布,则有( )式成立。

A、x>Me>Mo; B、x Mo > Me; D、x< Mo < Me 12、( )主要用于测度顺序数据的离散程度。

A、异众比率;B、极差;C、四分位差;D、标准差

13、对数据分布形状的测度是( )

B、 偏态; B、均值; C、峰态; D、峰态和偏态。 14、( )是指随着样本容量的增大,估计量的值越来越接近总体参数真值 A、无偏性;B、有效性;C、一致性;D、大样本性 15、?错误是指( )

A、原假设H0为真,却被拒绝的概率; B、备择假设为真,却拒绝H0的概率; C、原假设H0为伪,却没有被拒绝的概率; D、备择假设为伪,却没有拒绝H0的概率 二、简答题(每小题10分,共30分)

1、选择数据收集的方法时,需要考虑哪些问题?

2、什么是估计误差?什么是估计标准误差?两者有何不同? 3、P值与显著性水平有何区别?在假设检验中各自的作用是什么?

2、根据甲企业2004年每月的产品销售额Y与广告费支出X数据(单位:元),计算出其估计的回归方程为Y=27.63+1.78X,估计结果中R2=0.893,F=330.78,自变量系数的t检验值为3.475;另有一企业乙在相同时间内也进行了同样情况的分析,数据经整理得:∑X=50, ∑Y=110.8, ∑X=294, ∑Y=1465.0, ∑XY=654.9, 要求:

(1)确定乙企业产品销售额Y与广告费支出X的线性回归方程,并说明

2

2

??的含义;(7分)

1 (2)若已知乙企业的回归结果中R2=0.807,F=312.5,自变量系数的t检验值为1.8862,

试根据所学相关知识对甲、乙两企业所建立的线性回归方程的优劣进行综合分析。(已知

t0.025=2)(8分)

一、选择题(每小题1分,共20分) DABBC CCBAC CCDCC BCBDC 二、简答题 (每小题10分,共30分)

1、答:① 抽样框中的有关信息;② 目标总体特征;③ 调查问题的内容;④质量要求;

⑤ 管理与控制;⑥ 实施调查的资源;⑦有形辅助物的使用。(共10分) 2、答:估计误差就是估计总体均值时的边际误差(2分),即

Z?y?2n (2分);

2 估计标准误差是对误差项?的标准差?的估计(2分),即

s??i)?(yi?yn?2(2分)

估计误差是在进行区间估计时的误差范围,而估计标准误差是进行回归分析时对误差项标准差?的估计,两者不是一回事。 (2分)

3、答:显著性水平?是指当原假设为真时却被拒绝的概率(3分);

P值为当原假设为真时,所得到样本观察结果或更极端结果的概率(3分);

;?值是衡量小概率的标准,?是可以事先确定,而P值是通过计算得到的(2分)

P值可以与小概率标准?/2进行比较来判断是拒绝H0还是接受H0。(2分) 三、计算与分析题(第1、2各15分,第3题8分,第4题12分, 共50分)

f?M4、 解:① x??fii22i?56500; ?376.67元(5分,其中求出组中值得2分)

1503567389.7?23942.2(3分)

149(Mi?x)f?② s??f?1ii?

Z0.025s2n?1.96*23942.2?24.76元(2分),

150所以,区间估计为[376.67-24.76,376.67+24.76],即[351.91,401.43] (2分)

(Z?)S*23942.22③ n??1.96?147.2?148,因样本容量150大于148,故该

E2522222样本量合适。(3分)

5、 解: ①

??1?n?XiYi??Xi?Yin?Xi?(?12Xi)2?12*654.9?50*110.812*294?502?2318.8(2分) ?2.256

1028??0?X??Y??110.850?2.256*??0.167(1分) 1212???0.167?2.256X((2分)) 线性回归方程为:Y

??1(2分) ?2.256的含义为广告费每支出1元,产品销售额平均增加2.256元。

② R为拟合优度,该数值越大说明回归方程拟合得越好,因甲企业的R为0.893大于乙企业的0.807,从该系数来看,甲企业所建立的回归方程较好(3分);两个回归方程的F检验都通过了,说明两回归方程的线性关系显著(2分);甲企业回归方程系数的t检验值为3.475大于2,而乙企业的t检验值为1.8862小于2,说明甲企业的自变量对因变量的

影响显著,而乙企业的不显著,应去掉该变量,而重新建立方程。(3分)

22

习题三

-一、选择题(每小题1分,共20分) 1.下面具有品质特征的是( )。

A、工人年龄 B、工人性别 C、工人月工资 D、工人体重

2.构成统计总体的个别事物称为( )

A、调查单位 B、总体单位 C、调查对象 D、填报单位 3.2000年11月1日零点的第五次全国人口普查是( )

A、典型调查 B、重点调查 C、一次性调查 D、经常性调查

4.工厂对生产的一批零件进行检查,通常采用( )

A、普查 B、抽样调查 C、重点调查 D、典型调查

13.某地有2万亩稻田,根据上年资料得知其中平均亩产的标准差为50公斤,若以95.45%的概率保证平均亩产的误差不超过10公斤,应抽选( )亩地作为样本进行抽样调查。

A、100 B、250 C、500 D、1000

19.已知变量x与y之间存在着负相关,指出下列回归方程中哪一个肯定是错误的( )

????A、y=–10-0.8x B、y=100-1.5x C、y=–150+0.9x D、y=25

-0.7x

?20.在回归方程y=a+bx中,回归系数b表示( )

A、当x=0时y的期望值 B、x变动一个单位时y的变动总额 C、y变动一个单位时x的平均变动量 D、x变动一个单位时y的平均变动量

二、简答题(每小题10分,共30分) 2.什么是假设检验中的两类错误? 3.什么是回归分析?

三、计算与分析题(第1、2、3、4分别6分、12分、12分、20分, 共50分) 1.某地甲乙两个农贸市场三种主要蔬菜价格及销售额资料如表:

品 种 甲 乙 丙 价 格 (元/千克) 0.30 0.32 0.36 销售额(万元) 甲市场 65.0 50.0 45.0 乙市场 32.5 85.0 45.0 试计算比较该地区哪个农贸市场蔬菜平均价格高?并说明原因。(计算必须有公式和过程)

一、选择题(每小题1分,共20分)

1—5.BBCBD 6—10. BACBA 11—15. CAADB 16—20. DBBCD 二、简答题 (每小题10分,共30分) 1.答:

1) 数学研究的是抽象的数量规律,统计学则是研究具体的、实际现象的数量规律 2) 数学研究的是没有量纲或单位的抽象的数,统计学研究的是有具体实物或计量单位的

数据

3) 统计学与数学研究中所使用的逻辑方法不同,数学研究所使用的主要是的演绎,统计

学则是演绎与归纳相结合,占主导地位的是归纳 2.答:

1) 第一类错误(弃真错误)

原假设为真时拒绝原假设 会产生一系列后果

第一类错误的概率为?被称为显著性水平

2) 第二类错误(取伪错误)

原假设为假时接受原假设 第二类错误的概率为??

3.答:

1) 从一组样本数据出发,确定变量之间的数学关系式

2) 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中

找出哪些变量的影响显著,哪些不显著

3) 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取

值,并给出这种预测或控制的精确程度

三、计算与分析题(第1、2、3、4分别6分、12分、12分、20分, 共50分) 1.解:

f?X甲市场平均价格x??fiii?51.7=0.323(元/千克) 16053.15=0.327(元/千克)

162.5f?X乙市场平均价格x??fiii?经计算得知,乙市场蔬菜平均价格高,其原因是乙市场价格较高的蔬菜销售量比重大于甲市场,也可以说,乙市场蔬菜平均价格高的蔬菜销售额比重大于甲市场。

习题四

一、选择题(每小题1分,共20分) 1.下面具有数量特征的是( )。

A、工人爱好 B、工人性别 C、工人月工资 D、工人民族

3.有意识地选择三个农村点调查农民收入情况,这种调查方式属于( )

A、典型调查 B、重点调查 C、抽样调查 D、普查

4.调查大庆、胜利等几个主要油田来了解我国石油生产的基本情况,这种调查方式属于( )

A、普查 B、典型调查 C、重点调查 D、抽样调查

6.某外商投资企业按工资水平分为四组:1000元以下,1000~1500元;1500~2000元;2000元以上。第一组和第四组的组中值分别为( )

A、 750和2500 B、 800和2250 C、 800和2500 D、 750和2250 11.标准差指标数值越小,则反映变量值( )

A、越分散,平均数代表性越低 B、越集中,平均数代表性越高

C、越分散,平均数代表性越高 D、越集中,平均数代表性越低 14.直线回归方程中,若回归系数为负,则( )。

A、表明现象正相关 B、表明现象负相关C、表明相关程度很弱 D、不能说明相关的方向和程度 18.有两个数列,甲数列平均数为100,标准差为12.8;乙数列平均数为14.5,标准差为3.7。据此资料可知( )。

A、甲平均数代表性高于乙 B、乙平均数代表性高于甲

C、甲乙平均数代表性相同 D、无法直接比较甲乙平均数代表性大小 ?20.当所有观察值y都落在回归直线y=a+bx上,则x与y之间的相关系数( )

A 、r=1 B、–1

二、简答题(每小题10分,共30分)

3.回归分析与相关分析的区别是什么?

一、选择题(每小题1分,共20分)

1—5.ACACA 6—10. DDADC 11—15. BCDBC 16—20. AADCC 二、简答题 (每小题10分,共30分) 1.答:

1) 统计学运用到大量的数学知识

2) 数学为统计理论和统计方法的发展提供基础 3) 不能将统计学等同于数学 2.答:

1) 在一次试验中,一个几乎不可能发生的事件发生的概率

2) 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3) 小概率由研究者事先确定 3.答:

1) 相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,

处在被解释的地位,x 称为自变量,用于预测因变量的变化 2) 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变

量,自变量 x 可以是随机变量,也可以是非随机的确定变量

3) 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变

量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制

习题五

一、选择题(每小题1分,共20分) 1.在假设检验中,原假设总是表示( )

A、总体参数会变大 B、总体参数会变小 C、总体参数没有变化 D、样本统计量没有变化

2.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。文章称,从前20名商学院毕业的女性MBA的平均起薪是54794美元,中位数是47543美元,标准差是10250美元。根据这些数据可以判断,女性MBA起薪的分布状态( )

A、尖峰,对称 B、右偏 C、左偏 D、均匀 6.计算方差所依据的中心数据是( )

A、众数; B、中位数;C、均值; D、几何平均数

7.以样本均值为估计量对总体均值进行区间估计,且总体方差已知,则如下说法正确的是( )

A、95%的置信区间比90%置信区间宽 B、样本容量较小的置信区间较小 C、相同置信水平下,样本量大的区间较大 D、样本均值越小,区间越大 8.在参数估计中利用t分布构造置信区间的条件是( )

A、总体分布需服从正态分布且方差已知 B、总体分布为正态分布,方差未知

C、总体不一定是正态分布但须是大样本 D、总体不一定是正态分布,但需要方差已知

9.在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量标准之一是他与总体参数的离差越小越好。这种评价标准称为( )

A、无偏性 B、有效性 C、一致性 D、充分性 10.95%的置信水平是指( )

A、总体参数落在一个特定的样本所构造的区间内的概率为95%

B、在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为95%

C、总体参数落在一个特定的样本所构造的区间内的概率为5%

D、在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为5% 11.下面的说法正确的是( )

A、置信区间越宽,估计的准确性越高; B、置信区间越窄,估计的准确性越低 C、置信区间越宽,估计的可靠性越大; D、置信区间越宽,估计的准确性越小 12. 在假设检验中,“=”总是放在( )

A、原假设上; B、备择假设上;

C、可以放在原假设上,也可以放在备择假设上;D、有时放在原假设上,有时也放在备择假设上

13.P值所反映的是( )

A、拒绝域的大小 B、统计量的大小

C、若原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率 D、事先给定的显著性水平的大小

14.当r=0.8时,下列说法正确的是( )

A.80%的点都密集在一条直线的周围; B.80%的点高度相关

C.其线性程度是r=0.4是的两倍; D.两变量高度正线性相关

15.在因变量的总离差平方和中,如果回归平方和所占比重大,残差平方和所占比重小,则两变量之间( )

A.相关程度高 B、相关程度低 C、完全相关 D、完全不相关 二、判断题(每题1分,共10分)

1统计数据的显示包括统计报表和统计图. 2、众数只适合于定类数据和定序数据。

3、 移动平均数的时距项数k越大,移动平均的修匀作用越强。 ( )

4、在时间序列乘法模型中,只有长期趋势和季节变动在各个时间上的数值与时间序列Y的

计量单位和表现形式相同。 5、统计分组的第一步是确定组数.

三、简答题(第1、2小题7分,第3小题6分,共20分) 1.估计总体均值时样本容量的确定与哪些因素有关,并写出相关计算公式? 2.试简单分析P值与α之间的含义、区别和使用规则?

3.试问利用一元线性回规模型进行区间预测时使预测精确度下降的原因有哪些? 四、计算与分析题(共50分,计算保留3位小数)

1.某电子邮箱用户一周内共收到邮件56封,其中由若干封属于广告邮件,并且根据这一周数据估计广告邮件所占比率的95%的置信区间为[8.9%,16.1%]。问这一周内收到了多少封广告邮件?若计算出了20周平均每周收到 48封邮件,标准差为9封,则其每周平均收到的邮件数的95%的置信区间是多少?设每周收到的邮件数服从正态分布。且已知t0.025(19)=2.903,t0.05(19)=1.729,z0.05=1.645,z0.025=1.96。(12分)

3、设销售额X为自变量,销售利润Y为因变量。现根据某公司12个月的有关资料计算出以下数据(单位:万元)。

?(Xt?X)2=36784,

?(Yt?Y)2=22234,

?(Yt?Y)(Xt?X)?26480,

X?254,Y?175

试利用以上数据计算:

(1)建立销售额与销售利润的回归方程,并解释回归系数的经济意义;(7分) (2) 计算样本决定系数和样本相关系数;(7分) (3) 试问建立的本模型是否对回归系数和整个回归方程的显著性都需要进行检验吗?为什么?(4分)

一、选择题(每小题1分,共20分) CBCCA CABBB CACDA CBDCB 二、判断题(每小题1分,共10分) ××√×× √×√×√

三、简答题 ( 共20分)

1.(6分)答:影响因素有:①总体方差?2,总体方差越大,所需n越大; ②允许的极限误差△ ,△越大所需n越小; ③可靠性或1-α的大小,可靠性越高,所需n越大。 计算公式:n?2z??22?2

2.(7分)答:①显著性水平?是指当原假设为真时却被拒绝的概率;

②P值为若原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的

概率;③?是可以事先确定,而P值是通过计算得到的; ④?值是衡量小概率的标准,P值可以与小概率标准?/2或?进行比较来判断是拒绝H0还是接受H0。

3.(7分)答:预测区间为:

Yf?t?(n?2)?S2efSe2,

?Sf(Xf?X) 11??n?(Xt?X)22①n较少; ②回归标准误差S较大;③?(Xt?X)较少,即x在平均值X的附近过

于集中;④作为预测基准的Xf与均值X离的较远,即α的要求太高,从而

(Xf?X)太大;5、置信度1-

2t?(n?2)增大。

2四、计算与分析题(共50分)

1.(12分)解:本周收到广告邮件比率为:p=

0.089?0.161=0.125

2收到广告邮件数为:np=56?0.125?7(封) 根据已知:x?48,n?20,s?9,t0.025(19)?2.093,则:

x?t0.025(19)到53封。

sn?48?2.903?920?[43.68,52.32]

该邮箱每周平均收到邮件数的95%的置信区间为44封

32.(8分)解:(1)发展总速度=(1?12%)?(1?10%)?(1?8%)?259.12%

平均增长数度=10259.12%?1?9.9892% (2)500?(1?6%)?561.8(亿元)

234

14570?142.5(亿元) (3)季度平均数y??yj?4j?14???3.(18分)解: Yt??1??2Xt

(1)

?(X?X)(Y?Y)?26480?0.7199 ????(X?X)3678422

?1?Y??2X?175?0.7199?254??7.854 6????2表示销售额每增加1万元,销售利润平均增加0.7199万元。

SSR?2??SST?(2)r2??(X?X)?(Y?Y)22?0.71992?236784?0.8574

22234 因为:相关系数与?2 符号相同, 所以: r=r?0.8574?0.9260

(3) 不需要都进行,因为在一元线性回归模型中回归系数和回归方程的显著性检验都是检验

H0:?2?0,H1:?2?0虽然建立的统计量不同,但目的时一致

习题六

-一、选择题(每小题1分,共20分)

1.为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中,样本是( )

A、100所中学 B、20个城市 C、全国的高中学生 D、100所中学的高

中学生

2. 1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。文章称,从前20名商学院毕业的女性MBA的平均起薪是54794美元,中位数是47543美元,标准差是10250美元。对样本中位数可作如下解释( )

A、大多数女性MBA的起薪是47543美元 B、最常见到的起薪是47543美元 C、样本起薪的平均值为47543美元 D、有一半女性的起薪高于47543美元

3.某组数据的四分之一分位数是45,中位数是85,四分之三分位数是105,则该组数据的分布是( )

A、右偏的 B、对称的 C、左偏的 D、上述全不对 5.下列关于抽样调查的描述,不正确的是( )

A、目的是根据抽样结果推断总体;B、结果往往缺乏可靠性; C、是一种非全面; D、调查单位是随机抽取的 6.两组数据的均值不等,但标准差相等,则( )

A、均值小,差异程度大 B均值大,差异程度大 C两组数据的差异程度相同 D

无法判断。

7.下列叙述正确的是( )

A、众数可以用于数值型数据; B、中位数可以用于分类数据; C、几何平均数可以用于顺序数据; D、均值可以用于分类数据。

8.各变量值与其( )的离差之和等于零。

A、中位数; B、众数; C、均值; D、标准差 9.点估计的缺点是( )

A、不能给出总体参数的准确估计 B、不能给出总体参数的有效估计 C、不能给出点估计值与总体参数真实值接近程度的度量 D、不能给出总体参数的准确区间

10.估计量的抽样标准误差反映了估计的( )

A、准确性; B、精确性; C、显著性 ; D、可靠性 11.在总体均值和总体比率的区间估计中,允许的极限误差由( )确定。

A置信水平 B统计量的抽样标准差 C置信水平和统计量的抽样标准差 D统计量的抽样方差

12.下面的说法正确的是( )

A、一个无偏的估计量意味着它非常接近总体的参数; B、一个无偏的估计量并不意味着它等于总体的参数; C、一个有效的估计量意味着它更接近总体的参数; D、一个有效的估计量意味着它等于总体的参数。

16.由同一资料计算的相关系数r与回归系数b之间的关系是( )

A、r大,b也大; B、r小,b也小; C、r与b同值; D、r与b的正负号相同 17.某研究人员发现,举重运动员的体重与他能举起的重量之间的相关系数为0.6,则( )

A、体重越重,运动员能举起的重量越多; B、平均来说,运动员能举起其体重60%的重量;

C、如果运动员体重增加10公斤,则可多举6公斤的重量; D、举重能力的60%归功于其体重。

二、判断题(每题1分,共10分)

1、对于统计学与数学的关系,从使用方法上看,数学使用的是纯粹的演绎,而统计学是演绎与归纳相结合

2、统计数据从低级到高级,由粗略到精确分为四个层次,即定类数据、定序数据、定比数据和定距数据. ( )

3、 普查是专门组织的一次性全面调查,而抽样调查是从调查对象总体中随机抽取一部分作为样本,并以此来推断总体数量特征的一种非全面调查,因此,抽样调查的准确性没有普查高. ( ) 8、离散系数的作用主要是用于比较相同总体或样本数据的离散程度. 9、峰度是对分布偏斜方向和程度的测度,而偏态是分布集中趋势高峰的形状。 三、简答题(第1小题6分,第2、3小题7分,共20分) 2.确定检验统计量时应考虑哪些因素?

3.利用回归模型进行预测时产生预测误差的原因有哪些? 四、计算与分析题(共50分,计算保留3位小数)

1. 某公司付给生产一线雇员的平均工资是每小时15美元。该公司正计划建造一座新厂,备选厂址有好几个地方。但是,能够获得每小时至少15美元的劳动力是选厂址的主要因素。某个地方的40名工人的样本显示:最近每小时平均工资是x=14美元,样本标准差是s=2.4美元。问在 α=0.01的显著水平下,样本数据是否说明在这个地方的工人每小时的平均工

资大大低于15美元?已知

z0.01(10分) ?2.326,t0.01?2.426。

2.某商业企业1997——2001年五年内商品销售额的年平均数为421万元,标准差为30.07

万元,商业利润的年平均数为113万元,标准差为15. 41万元,五年内销售额与商业利润的乘积和为240170万元,各年销售额的平方和为890725万元,各年商业利润的平方和为65033万元。试就以上资料计算:

(1)商业销售额与商业利润的样本相关系数并解释其含义。(5分)

(2)其他条件不变时,估计当商品销售额为600万元时,商业利润可能为多少万元?(10分)

-一、单项选择题(每小题1分,共20分) DDCDB AACCB CBACB DADAD 二、判断题(每小题1分,共10分) √××√× ×√××× 三、简答题 (共20分) 1.(6分)答:

4) 常用的变异指标主要有:极差、四分位差、平均差、标准差、离散系数、异众比率。 5) 变异指标的主要作用:

①说明数据的离散程度,反映变量的稳定性、均衡性。 ②衡量平均数的代表性

③在统计推断中,变异指标常常还是判别统计推断前提条件是否成立的重要依据, 也是衡量推断效果好坏的主要尺度。 2.(7分)答:主要考虑:

4) 总体的分布;2)总体的方差已知还是未知;3)样本容量的大小 3.(7分)答: 发生预测误差的原因:

1) 模型本身中的误差因素所造成的误差。

2) 由于回归系数的估计值同其真值不一致所造成的误差。 3) 由于自变量X的设定值同其实际值的偏离所造成的误差。 4) 由于未来时期总体回归系数发生变化所造成的误差。 四、计算与分析题(共50分)

1.(10分)解:H0:??15,H1:??15 检验统计量为:z?由已知计算得:z?x??s/nx??s/n , 拒绝域为: z??z???z0.01??2.326

?14?152.4/40??2.635

由于z??2.635??z0.01,故拒绝原假设,即可认为该地区的平均工资确实大大低于15美元。 或检验统计量为:t?x?? , 拒绝域为: t??t???t0.01??2.426

s/n由已知计算得:t?x??14?15 ???2.635s/n2.4/40由于 t??2.635??t0.01,故拒绝原假设,即可认为该地区的平均工资确实大大低于15美元。 2.(15分)解:设商品销售额为X,商业利润为Y,根据所给条件有:

X?421;?X?X?n?421?5?2105;?X2?8907252Y?113;?Y?Y?n?113?5?565;?Y?6503;?3XY?240170n?XiYi??Xi?Yin?X?(?Xi)2i2

样本相关系数为:r? =

2n?Yi?(?Yi)25?240170?2105?5655?890725?21052?5?65033?5652 说明商业销售额与商业利润是高度线性相关。 对于回归模型Yt????Xt?ut ,估计参数为 ???n?X?(?Xi)?????Y??X?113?0.5099?6421??10.169322i2?11525?0.99470

11585.93n?XYi??Xi?Yi?5?24017?0210?5565?0.5099 65?89072?251025? 即Yt??101.6392?0.5096Xt

其他条件不变时,估计当商品销售额为600万元时,商业利润可能为

? Y??101.6932?0.50996?600?204.282(8万元)

本文来源:https://www.bwwdw.com/article/cigp.html

Top