2013年4月统计学基础思考与应用技能训练答案

更新时间:2024-03-25 10:44:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

项目1 思考与应用技能训练

一、填空题

1.现代统计的含义包括三个方面: 、 和 。

2.一个完整的统计工作过程可以划分为 、 、 、 四个阶段。

3.总体是由许多具有 的个别事物组成的整体;总体单位是 的组成单位。

4.统计总体具有四个基本特征,即 、 、 和 。 5.标志是说明总体单位的特征的名称,按表现形式不同分为 和 两种。 6.统计指标按其所说明的总体现象内容的不同,可分为 和 。 答案:1.统计工作 统计资料 统计学

2. 统计设计 统计调查 统计整理 统计分析 3.共同属性 总体

4.同质性 差异性 大量性 客观性 5.数量标志 品质标志 6.数量指标 质量指标

二、单项选择题

1.统计总体的同质性是指( )。

A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值

答案:A

模块一 基 础 知 识

2.某地区有800家工业企业,要研究这些企业的产品生产情况,总体单位是( )。

A.全部工业企业 C.每一件产品

B.每一家工业企业

D.800家工业企业的全部工业产品

答案:B

3.要了解某班50名学生的学习情况,则总体是( )。

A.50名学生 C.每一个学生

B.50个学生的学习成绩 D.每一个学生的学习成绩

答案:A

4.一个统计总体( )。

A.只能有一个标志 C.只能有一个指标

B.可以有多个标志 D.可以有多个指标

答案:D

5.某工人月工资为550元,工资是( )。

A.品质标志 B.数量标志 C.变量值

D.指标

答案:B

6.在调查设计时,学校作为总体,每个班作为总体单位,各班学生人数是( )。

7.某班四名学生金融考试成绩分别为70分、80分、86分,这三个数字是( )。

8.工业企业的职工人数、职工工资是( )。

9.某学院2009级新生的平均年龄是18.56岁,这是( )

A.数量标志 B.数量指标 C.质量指标 D.品质标志

2

A.变量 B.指标 C.变量值 D.指标值

答案:A

A.标志 B.指标值 C.指标 D.变量值

答案:D

A.连续型变量 B.离散型变量 C.前者是连续型变量,后者是离散型变量 D.前者是离散型变量,后者是连续型变量

答案:D

答案:B

模块一 基 础 知 识

10.对某财会班新生的家庭状况进行调查,下列标志中属于不变标志的是( ) A.年龄 B.专业 C.入学成绩 D.身高 答案:B

三、多项选择题

1.全国第四次人口普查中( )。

A.全国人口数是统计总体 B.总体单位是每一个人

C.全部男性人口数是统计指标 D.人口的性别比是总体的品质标志 E.人的年龄是变量

参考答案:BCE

2.下列各项中,属于连续型变量的有( )。

A.基本建设投资额 E.就业人口数

B.岛屿个数

C.国民生产总值中三次产业比例 D.居民生活费用价格指数

参考答案:ACD

3.下列指标中,属于数量指标的有( )。

A.国民生产总值 C.全国总人口数 E.工程成本降低程度

B.人口密度 D.投资效果系数

参考答案:AC

4.下列标志中,属于品质标志的有( )。

A.工资

B.所有制

C.旷课次数

D.耕地面积 E.产品质量

参考答案:BE

5.总体、总体单位、标志、指标间的相互关系表现为( )。

A.没有总体单位也就没有总体,总体单位不能离不开总体而存在 B.总体单位是标志的承担者

3

C.统计指标的数值来源于标志

D.指标是说明总体特征的,标志是说明总体单位特征的 E.指标和标志都是能用数值表示的

模块一 基 础 知 识

参考答案:ABCD 四、判断题

1.总体的差异性是指总体单位必须具有一个或若干个可变的品质标志或数量标志。

( )

2.总体的同质性是指总体中的各个单位在所有标志上都相同。 ( ) 3.统计学与统计工作的研究对象是一致的。 ( ) 4.数量指标是指由数量标志汇总来的,质量指标是由品质标志汇总来的。 ( ) 5.品质标志和质量指标一般不能用数值表示。 ( ) 6.品质标志不能转变为统计指标数值。 ( ) 7.社会经济现象都是有限总体。 ( ) 8.全国人口普查的总体单位是户。 ( ) 9.所有总体单位与总体之间都存在相互转换关系。 ( ) 10.统计所研究的对象必须是可度量的现象。 ( ) 11.统计指标是客观事实的具体反映,不具有抽象性。 ( ) 12.要了解一个企业的产品生产情况,总体单位是每一件产品。 ( ) 13.统计指标及其数值可以当做总体。 ( ) 14.商品的价格在标志分类上属于数量标志。 ( )

参考答案:

正确的判断题:1、3、6、12、14、15 其余错误

五、简答题

1.如何理解统计的含义?

2.如何理解统计的研究对象?试述统计研究对象的特点。 3.什么是统计总体?其基本特征是什么?什么是总体单位? 4.举例说明标志和指标之间的关系。

5.什么是统计指标和指标体系?统计指标的构成要素有哪些?

4

六、应用技能训练

1.试将下列标志区分为数量标志和品质标志。

性别 教育水平

民族

模块一 基 础 知 识

轮胎寿命 GDP增长率

人口增长率

型号 功率

2.试将下列指标区分为数量指标和质量指标。

国内生产总值 销售收入

人口数 增长速度

投入产出比 销售额 人口密度 计划完成程度

3.我国进行农业经济普查时常用的指标有:总户数、总人数、土地总面积、耕地总面积、果园面积、粮食总产量、油料作物播种面积、牛奶总产量、烟叶总产量、汽车总数量、农用汽车总数量、人均收入、人均住房面积、农业总产值、农业总收入等。 (1)把上述指标按时间属性分为时点指标和时期指标。 (2)把上述指标按内容属性分为质量指标和数量指标。 (3)把上述指标分为总量指标、平均指标和相对指标。

项目2 思考与应用技能训练

一、填空

1.统计调查的要求是:准确性、 、 和系统性。 2.统计调查按组织形式可分为: 和 。 3.统计调查按研究总体的范围可分为: 和 。 4. 是专门组织的不连续型全面调查。 5.普查的主要特点是: 。

6.非全面调查中,最完善、最有科学依据的方式方法是: 。 7.调查表的格式一般有两种,分别是:单一表和 。 参考答案:

1.及时性、全面性

2. 统计报表和专门调查 3. 全面调查和非全面调查 4.普查 5. 不连续性 6. 抽样调查

5

模块一 基 础 知 识

参考答案:正确的判断题:2、3、5、7、8、11、15

其余错误

五、简答题

1.什么是统计数据整理?简述统计数据整理的原则和步骤。 2.统计数据分组的原则和方法是什么?

3.统计分组的关键是什么?怎样正确选择分组标志? 4.简要说明单项数列、组距数列的适用范围。 5.编制组距数列时怎样确定组数和组距?

11

六、应用技能训练

1.有一个班学生的统计学考试成绩如下:

模块一 基 础 知 识

89 88 76 99 74 60 82 60 93 99 94 82 77 79 97 78 87 84 79 65 98 67 59 72 56 8l 77 73 65 66 83 63 89 86 95 92 84 85 79 70 78 79 89 81 66 84 78 46

根据学校规定:60分以下为不及格;60~70分为及格;70~80分为中;80-90分为良,90分以上为优。试把该班学生分为不及格、及格、中、良、优五组,编制分配数列。

2.某酒店2009年1月份职工工资分布见表3-9:

表3-9 某酒店2009年1月份职工工资情况

按工资分组(元) 700以下 700~800 800~1 100 1 100~1 500 1 500~2 000 2 000以上 合 计 频 数 (人) 3 23 152 45 18 8 频 率 (%) 向上累计 向下累计 人数(人) 比率(%) 人数(人) 比率(%) 要求:根据表3-9资料,在空格内填上相应的数字或符号,并说明各指标的意义。 答案:

按工资分组(元) 700以下 700-800

某酒店2009年1月份职工工资情况 频数频率(人) (%) 3 23 1.2% 9.2% 向上累计 向下累计 比率(%) 100.0% 98.8% 12

人数人数(人) 比率(%) (人) 3 26 1.2% 10.4% 249 246

模块一 基 础 知 识

800-1100 1100-1500 1500-2000 2000以上 合计

152 45 18 8 249 61.0% 18.1% 7.2% 3.2% 100.0% 178 223 241 249 - 71.5% 89.6% 96.8% 100.0% - 223 71 26 8 - 89.6% 28.5% 10.4% 3.2% - 3.某地区20家农产品加工企业2008年的增加值资料如下:

(单位:万元)

企业编号 A B C D E 工业增加值 46 68 118 33 79 企业编号 F G H I J 工业增加值 50 89 27 127 99 13

模块一 基 础 知 识

(续 表) 企业编号 K L M N O 工业增加值 24 78 92 57 40 企业编号 P Q R S T 工业增加值 60 72 58 66 74 要求:对统计资料进行汇总整理,编制组距数列。 答案解析:

1.按工业增加值排序,结果如下:

企业编号 工业增加值 企业编号 工业增加值

K 24 B 68 H 27 Q 72 D 33 T 74 O 40 L 78 A 46 E 79 F 50 G 89 N 57 M 92 R 58 J 99 P 60 C 118 S 66 I 127

2. 确定全距:R=127-24=103

3.确定组距和组数:本例把工业增加值分6组,组距为20,本例变量分布较均匀,采用等距分组;

4.确定组限:20-40,40-60,60-80,80-100,100-120,120-140 5.编制分配数列:

将总体各工业增加值分配到各组,计算各种次数和频率,完成分配数列的编制,如下表:

14

模块一 基 础 知 识

按工业增加值分组(万元) 20-40 40-60 60-80 80-100 100-120 120-140 合计

频数(家) 3 5 7 3 1 1 20 某地区20家农产品加工企业2008年增加值分析表 频率(%) 15.0% 25.0% 35.0% 15.0% 5.0% 5.0% 100.0% 累计频数 向上累计 3 8 15 18 19 20 - 向下累计 20 17 12 5 2 1 - 累计频率 向上累计 15.0% 40.0% 75.0% 90.0% 95.0% 100.0% - 向下累计 100.0% 85.0% 60.0% 25.0% 10.0% 5.0% - 4.已知1998年某地区45个企业的产值计划完成情况(%):

95 96 97 88 120 102 103 113 99 103 105 107 135 114 116 107 108 115 133 129 100 101 107 131 122 106 111 125 106 103 121 107 97 104 130 122 117 115 118 121 114 108 123 101 108 要求:根据上述资料编制分配数列,并绘制产值完成情况统计图。 答案解析:

1).按产值计划完成情况排序; 2)确定全距:R=135-88=47

3)确定组距和组数:本例把产值计划完成情况分5组,组距为10,本例变量分布较均匀,采用等距分组;

4)确定组限:86-96,96-106,106-116,116-126,126-136。 5)编制分配数列:

将总体各产值计划完成情况分配到各组,计算各种次数和频率,完成分配数列的编制,如下表:

15

影响。( )

5.分位数都属于数值平均数。( )

模块一 基 础 知 识

6.在资料已分组时,形成变量数列的条件下,计算算术平均数或调和平均数时,应采用简单式;反之,采用加权式。( )

7.当各标志值的连乘积等于总比率或总速度时,宜采用几何平均法计算平均数。( )

8.众数是总体中出现最多的次数。( )

9.未知计算平均数的基本公式中的分子资料时,应采用加权算术平均数方法计算。( )

10.按人口平均的粮食产量是一个平均数。( )

11.变量数列的分布呈右偏分布时,算术平均数的值最小。 ( )

12.若数据组的均值是450,标准差为20,则所有观察值都在450±20的范围内。( )

13.是非标志的标准差是总体中两个成数的几何平均数。( ) 14.总体中各标志值之间的差异程度越大,标准差系数就越小。 ( ) 15.同一数列,同时计算平均差、标准差,二者必然相等。( ) 16.如果两个数列的极差相同,那么,它们的离中程度就相同。( )

17.离中趋势指标既反映了数据组中各标志值的共性,又反映了它们之间的差异性。( )

18.若两组数据的平均数与标准差均相同,则其分布也是相同的。( ) 19.在对称分布的条件下,高于平均数的离差之和与低于平均数的离差之和,必然相等,全部的离差之和一定等于0。( )

20.数据组中各个数值大小相当接近时,它们的离差就相对小,数据组的标准差就相对小。( )

答案:陈述正确的有:3、7、9、13、19、20

其余陈述错误

五、简答题

1.反映总体集中趋势的指标有哪几种?集中趋势指标有什么特点和作用? 2.简述算术平均数、中位数、众数的含义及三者之间的关系。 3.什么是离中趋势指标?它有哪些作用?

21

4.离中趋势指标有哪些,它们之间有何区别? 5.如何对任意两个总体平均数的代表性进行比较? 六、应用技能训练

1.某产品第一季度的成本和产量资料如下表: 月 份 单位成本(元/个) 产量比重(%) 一 月 360 20 二 月 300 36 模块一 基 础 知 识

三 月 280 44 合 计 — 100 已知一月份的总成本为180万元。 计算:(1)第一季度的平均单位成本。

(2)第一季度的总产量和各月份的产量。

解析:(1)第一季度平均单位成本=第一季度总成本/第一季度总产量 =(360*0.2d+300*0.36d+280*0.44d)/d =303.2(元/个)

(2)一月份的产量=一月份总成本/一月份单位成本=1800000/360=5000个

第一季度总产量d=一月份产量/一月份产量比重=5000/0.2=25000个 二月份产量=第一季度总产量*二月份产量比重=25000*0.36=9000个 三月份产量=第一季度总产量*三月份产量比重=25000*0.44=11000个

2.2008年12月份甲、乙两农贸市场蔬菜价格和成交量、成交额资料如下表: 品 种 价格(元/kg) 1.2 1.8 2.2 甲市场成交额(万元) 1.2 2.8 1.5 乙市场成交量(万千克) 2 1 1 土 豆 黄 瓜 西红柿 22

合 计 — 5.5 模块一 基 础 知 识

4 试问哪一个市场农产品的平均价格高?并说明原因。 解析:甲市场农产品平均价格=甲市场成交额/甲市场成交量 =(12000+28000+15000)

/(12000/1.2+28000/1.8+15000/2.2)

=1.7(元/kg)

乙市场农产品平均价格=乙市场成交额/乙市场成交量 =(1.2*20000+1.8*10000+2.2*10000)

/(20000+10000+10000)

=1.6(元/kg)

综上可知,甲市场农产品平均价格高于乙市场农产品平均价格。

3.某银行连续10年的贷款利率分别为:第1~3年为7%,第4~5年为9%,第6~8年为11%,第9~10年为10%。试分别计算在单利和复利情况下的平均年利率。

解析:单利情况下:

平均年利率=10年总利率/10=(总利息/本金)/10

=(100*7%*3+100*9%*2+100*11%*3+100*10%*2)/100/10 =9.2.% 复利情况下:

3232 平均年利率=10(1?0.07)(1?0.09)(1?0.11)(1?0.1)?1?9.18%

4.已知某地区30家企业今年的经营情况资料如下: 计划完成百分比(%) 企业个数(家) 实际产值(万元) 23

80~90 90~100 100~110 110~120 计算该地区30家企业计划完成程度相对指标。

解析:1)4个组中值依次为:85%,95%,105%,115%;

2 6 16 6 模块一 基 础 知 识

456 688 967 1 082 2)计划完成程度=(实际完成值总和)/ (计划完成值总和)

=(456*2+688*6+967*16+1082*6)/

【(456/0.85)*2+(688/0.95)*6+(967/1.05)*16+(1082/1.15)*6】 =27004 / 25798=1.0467=104.67%

5.某大学经管学院男生的体重资料如下表: 按体重分组(kg) 50以下 50~55 55~60 60~65 65~70 70~75 75以上 合 计

学生人数(人) 2 87 268 419 311 147 83 1 317 24

模块一 基 础 知 识

试根据所给资料计算学生体重的算术平均数、中位数、众数,并分析三者的关系。

答:(1)算出各组组中值,然后利用加权算术平均数计算体重算术平均数=

(47.5*2+52.5*87+57.5*268+62.5*419+67.5*311+72.5*147+77.5*83)/1317=64(KG)

(2)中位数:首先,计算中位数所在的组:1317/2=658.5

其次,根据累计数列可以得出,658.5所在的组应该是(60-65),根据插值法下限公式,Me=60+【(658.5-357)/ 419】*5=63.6(KG)

(3)众数:由上表可知,众数组为(60-65),根据比例插值法下限公式: Mo=60+【(419-268)/(419-268+419-311)】*5=62.9(KG) 综上所得,此题中从大到小排序为:算术平均数、中位数、众数。

6.对成年组和幼儿组共500人身高资料分组,分组资料列表如下: 成年组 幼儿组 按身高分组(cm) 150~155 155~160 160~165 165~170 170以上 合 计 人数(人) 30 120 90 40 20 300 按身高分组(cm) 70~75 75~80 80~85 85~90 90以上 合计 人数(人) 20 80 40 30 30 200 根据资料:(1)分别计算成年组和幼儿组身高的平均数、标准差和标准差系数。 (2)说明成年组和幼儿组平均身高的代表性哪个大?为什么?

答:

25

答:(1)逐期增长量:435-134= 301亿 415-435= -20亿 672-415= 257亿 1028-672= 356亿 累计增长量=1028-134=894亿 (2)平均发展速度=

4模块一 基 础 知 识

1028?1.664263 1345.某车间某年各月产量资料(台)如下:一月份185、二月份190、三月份236、四月份240、五月份230、六月份255、七月份272、八月份270、九月份275、十月份280、十一月份278、十二月份285。

计算:(1)各季度的平均每月产量;

(2)全年的平均每月产量。

答:(1)第一季度平均每月产量=(185+190+236)/ 3=203.67(台) 第二季度平均每月产量=(240+230+255)/ 3=241.67(台) 第三季度平均每月产量=(272+270+275)/ 3=272.33(台) 第四季度平均每月产量=(280+278+285)/ 3=281(台) (2)全年的平均每月产量=(185+190+236+??+285)/12=249.67(台)

6.某企业历年来的工业总产值资料如下: 1988 1989 年 份 1990 1991 1992 667 732 757 779 819 工业总产值(万元) 计算该企业几年来的逐期和累计增长量,环比和定基发展速度,以及年平均增长量。 答:

31

年 份 工业总产值(万元) 1988 667 1989 732 1990 757 模块一 基 础 知 识

1991 779 1992 819 增长量 (万元) 发展速度 逐期 累计 环比 定基 - - - 65.00 65.00 25.00 22.00 40.00 90.00 112.00 152.00 109.75% 103.42% 102.91% 105.13% 100.00 109.75% 113.49% 116.79% 122.79% 年平均增长量=(65+25+22+40)/ 4=38(万元)

项目6 思考与应用技能训练

一、填空题

1.全及指标是反映 的综合指标。

2.抽样推断是在 的基础上,利用样本资料计算样本指标,并据以推算 特征的一种统计分析方法。

3.抽样误差是 与 之间的离差。抽样误差越小,样本对总体的代表性就越 ,抽样推断就越 。

4.区间估计是根据 与 去推断总体指标所在的 。

5.抽样调查过程中可能发生的误差分为 和 两类。

6.计算抽样平均误差,若未知总体标准差是,可用 来代替。

7.在重复抽样的条件下,抽样平均误差与 成反比,与 成正比。 1.全及总体数量特征 2.随机原则 总体数量

3.抽样平均数 总体平均数 大 准确 4.样本指标 抽样误差 可能范围 5.登记性误差 代表性误差 6.样本标准差

7.样本容量 总体标准差

32

二、单项选择题

1.抽样推断必须遵循的基本原则是( )。

A.灵活性原则 C.随机原则 A.代表性误差 C.系统性误差

B.准确性原则 D.可靠性原则 B.登记性误差 D.随机误差

模块一 基 础 知 识

2.抽样误差是( )。

3.抽样平均误差和极限误差的关系是( )。 A.抽样平均误差小于极限误差 B.抽样平均误差大于极限误差 C.抽样平均误差等于极限误差

D.抽样平均误差可能大于、等于或小于极限误差 A.扩大为原来的4倍 C.缩小为原来的1/4倍 A.简单抽样 C.整群抽样

B.扩大为原来的2倍 D.缩小为原来的1/2倍 B.分层抽样 D.等距抽样

4.在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量( )。

5.一般来说,在抽样组织形式中,抽样误差较大的是( )。

6.根据抽样的资料,一年级优秀生比重为10%,二年级为20%,在人数相等时,优秀生比重的抽样误差( )。

A.一年级较大 C.相同

B.二年级较大 D.无法判断

7.根据重复抽样的资料,甲单位工人工资方差为25,乙单位为100,乙单位人数比甲单位多3倍,则抽样误差( )。

A.甲单位较大 C.乙单位较大

B.无法判断 D.相同

B.可以抽取多个样本 D.只能抽取一个单位 B.类型抽样 D.简单随机抽样

33

8.一个全及总体( )。 A.只能抽取一个样本 C.只能计算一个指标 A.整群抽样 C.阶段抽样

9.最符合随机原则的抽样组织形式是( )。

1-5 CCDAC 6-9 BDBD

三、多项选择题

1.抽样估计的抽样平均误差( )。

A.是不可以避免的

B.是可以改进调查方法消除的 C.是可以事先计算的

D.只有调查结束之后才能计算 E.其大小是可以控制的 A.推断的可靠程度 C.抽样方法

B.抽样方式 D.允许误差的大小

模块一 基 础 知 识

2.影响样本容量的因素有( )。

E.总体各单位标志变异程度 3.抽样估计的特点是( )。 A.运用归纳推理 B.运用演绎推理 C.运用数学分析法 D.运用概率分析法 E.抽样误差和抽样估计的可靠程度有关

4.提高推断的可靠程度,可以采取的办法是( )。 A.扩大估计值的误差范围 B.缩小估计值的误差范围 C.增大概率度 D.降低概率度 E.增加样本容量

5.影响整群抽样的抽样误差的因素有( )。 A.总方差 B.组内方差 C.组间方差 D.总体群数 E.样本群数 6.抽样估计的优良标准是( )。 A.无偏性 B.随机性 C.一致性 D.有效性 E.代表性 7.影响抽样平均误差的因素有( )。 A.总体标志变异程度 B.样本容量 C.抽样方法 D.抽样组织形式 E.样本指标值的大小

34

模块一 基 础 知 识

8.抽样推断遵循随机原则的原因是( )。 A.样本客量有限

B.保证总体中每个单位有同等机会被抽中 C.能确定抽样方法

D.能确定推断的可靠程度 E.能计算抽样误差

9.和重复抽样相比,不重复抽样的特点是( )。 A.总体单位数在抽选过程中逐渐减少 B.总体中每个单位都有被重复抽中的可能 C.总体中每个单位没有被重复抽中的可能 D.样本可能数目要多些 E.样本可能数目要少些

10.总体标准差未知时,常用的替代办法有( )。 A.用过去调查的同类问题的经验数据 B.用样本的标准差 C.凭调查者经验确定 D.用总体方差 E.先组织试验性抽样,用试验样本的标准差 11.抽样推断的主要目的是( )。 A.对调查单位做深入研究 B.用样本指标推断总体的指标 C.计算和控制误差 D.广泛运用数学方法 E.对总体进行科学的估计和判断 12.区间估计的基本要素是( )。 A.概率度 B.点估计 C.误差范围 D.抽样数目 E.总体单位数

1.ADE 2.ABCDE 3.CDE 4.ACE 5、6删掉 7.ABCD 8.BD 9.ACE 10.ABDE 11.BE 12 ACD

35

四、问答题

模块一 基 础 知 识

1.影响抽样平均误差的因素有哪些? 2.抽样估计的特点是什么?

3.什么是类型抽样?有哪些方法? 4.影响必要样本容量的因素有哪些?

5.抽样平均误差、抽样极限误差和概率度三者之间是何关系? 五、应用技能训练

1.某企业生产一批零件共6 000个,随机抽查300个,发现其中9个不合格,求合格品率的抽样平均误差。

答:根据重置抽样计算公式 :up? 根

p?1?p??n置

0.97*0.03?0.009849

300样

up?p?1?p??n?1????nN??0.97*0.03?300?1????0.0300?6000?0 9599

2.某灯泡产生产一批灯泡共8 000只,随机抽选400只进行试验,结果平均寿命5 000 小时,总体标准差为300小时。试用重复与不重复抽样方法计算抽样平均误差。

答:根据重置抽样计算公式 :up? 根

?n?300400抽

?15(小时)样 时公

up??2?n?1????n?N?300*300?400?1????14.62(小400?8000?)

3.某地区种植小麦40 000亩,随机抽取200亩进行实割实测,测得平均亩产量为300 公斤,根据以往经验,抽样总体的标准差为6公斤。试求在概率为95.45%的保证程度下,该地区小麦平均亩产量的可能范围。

答:根据已知条件可知,N=40000,n=200,x?300,??6,f(t)?0.9545

则:抽样平均误差ux??2?n??1???n?N?6*6?200? ?1???0.4232(亩)200?40000? 由于f(t)=0.9545,查表可得t=2,则:

36

抽样极限误差??t?ux?2*0.4232?0.8464(亩) 因此,该地区小麦平均亩产量的可能范围是: 上限:x???300?0.8464?300.8464(亩) 下限:x???300?0.8464?299.15(亩) 即:299.15?X?300.8464

模块一 基 础 知 识

4.某公司生产某种电子元件,现从10 000件电子元件随机抽取1%进行耐用性能检查,并规定电子元件耐用在9 500小时以下为不合格,抽检结果如下表所示。 答:根据题意可知,N=10000,n=10000*1%=100,不合格率=3/100=3% 且根据题目所给表中数据,可得到以下数据:

x-x均

个数f xf 值 (x-x均值)的平方 1 8750 -1705 2907025 2 18500 -1205 1452025 7 68250 -705 497025 45 461250 -205 42025 37 397750 295 87025 6 67500 795 632025 2 23500 1295 1677025 100 1045500 7294175

xf1045500???10455(小时) (1)根据上表可得:样本平均耐用时间= f100? 样本耐用时间标准差=

2??x?xf?耐用时间组中值x 8750 9250 9750 10250 10750 11250 11750 合计

?f?21547500 ?464.19(小时)100

样本平均耐用时间抽样平均误差

?x?

?2n(1?n)?N464.19*464.19100(1??46.19(小时)

10010000)37

当F(t)=0.9545时,查表可得t=2,则有: ?x?t*?x?2*46.19?92.37(小时) 因此该批电子元件平均耐用时间区间估计为:

上限:x???10455?92.37?10547.37(小时) 下限:x???10455?92.37?10362.63(小时) 即:10362.63?X?10547.37 (2)由于不合格率p=3%,则 不合格率的平均抽样误差

模块一 基 础 知 识

p(1?p)?n?0.03*0.97?1?0.01)??0.016973 ?1???nN100??30.03394 6 ?p?t*?p?2*0.01697??p?因此该批电子元件不合格率的区间估计为:

上限:p??p?0.03?0.033946?0.063946 下限:p??p?0.03?0.033946?0.003946

即:0.003946?P?0.063946

5.答:由题意可知,??2,??0.2,f(t)?0.9545,N?40000,要求求样本容量n

t2?22*2*2*2??400 在重置抽样条件下,n?20.2*0.2?Nt2?240000*2*2*2*2??397 在不重置抽样条件下,n?N?2?t2?240000*0.2*0.2?2*2*2*26.答:根据题意得。

x?50,?x?2,?x?50*1%?0.5,p?98%,?p?98%*3%?2.94%f(t)?0.9973,则t?3,要求求样本容量n故由平均长度推算的样本容量:

t2?232*22nx?2??144

0.5*0.5?x由合格率计算的样本容量为:

38

模块一 基 础 知 识

t2p(1?p)32*0.98*0.02np???205 20.0294*0.0294?p结论,为满足平均长度和合格率两种推算的需要,至少应抽查205个产品。

项目7 思考与应用技能训练

一、填空题

1. 相关关系按变动方向分为 和 。

2. 两变量间相关系数的绝对值在0.3到0.5之间,则称其为 相关。 3. 相关关系按自变量的个数分为 和 。

4. 在回归分析当中,估计标准误差数值较大时,表明估计值的代表性 ,也就是相关点的离散程度 。

5. 在Excel中,使用函数分析法进行相关分析,所使用的函数为 。 一、填空题

1.正相关 负相关 2.低度相关

3.单相关 复相关 4.越小 大

5.CORREL 二、单项选择

1.下列现象不存在相关关系的是( )。 A.广告投放量与产品销售量 B.居民收入水平与居民储蓄额 C.降雨量与茶叶产量 D.利息水平与利率水平 2.当r = 0.9时,下列说法正确的是( )。 A.90%的点都集中在一条直线的周围 B.90%的点都高度相关

C.其线性程度是r = 0.45时的两倍 D.两变量呈高度正相关关系

3.当所有观测值都落在回归直线y=a+bx上,则x与y之间的相关系数( )。

A.r =0 B.r =1 C.r =-1

D.r=1

39

模块一 基 础 知 识

4.根据样本资料得到单位产品成本y(元)与产量x(万件)之间的回归方程为?868?8x,则下列说法正确的是( )。

A.产量与单位成本之间是正相关关系 B.产量为1万件时,单位成本为860元 C.产量为1万件时,单位成本平均为860元 D.产量每增加1万件,单位成本增加8元 5.如果估计标准误差Syx?0表明( )。 A.全部观测值和回归值都不相等 B.回归值代表性小

C.全部观测值与回归值的离差之积为零 D.全部观测值都落在回归直线上

二、单选题

1.D(函数关系) 2.D 3.D 4.C 5.D

三、多项选择题

1.现象的相关关系按相关因素多少可分为( )。 A.单相关 B.复相关 C.完全相关 D.不相关 E.零相关

2.相关关系按变量的多少可分为( )。 A.一元相关 B.曲线相关 C.线性相关 D.多元相关 E.正相关

3.相关系数能说明相关关系的( )。 A.内容 B.离散程度 C.方向 D.变化 E.密切程度

4.在一元线性回归方程$y?a?bx中,b值( )。 A.是回归系数

B.表示当x每增加一个单位时,y平均增加的数量 C.是回归直线的起点 D.是回归直线的截距

E. 既是回归系数,也是相关系数

5.下列关系中存在负相关关系的是( )。 A.身高与体重 B.产量与单位成本

40

)y

模块一 基 础 知 识

五、技能训练

1. 年份 2003 2004 2005 2006 2007 合计 职工生活费收入x百元 15.5 16 16.5 17 17.5 82.5 商品销售额 y亿元 87 93 100 106 114 500 x2 240.25 256 272.25 289 306.25 1363.75 y2 7569 8649 10000 11236 12996 50450 xy 1348.5 1488 1650 1802 1995 8283.5

解:将表中的相关数据代入相关系数计算公式中,可得:

r?n?xy??x?yn?x?(?x)?n?y?(?y)2222=0.9988

由计算结果可知,职工生活费收入与商品销售额之间存在着高度的正相关关系。 2. 编号 1 2 3 4 5 6 7 合计 生产性固定资产价值 x万元 320 200 409 415 502 316 910 3072 总价值 y万元 524 641 818 907 926 608 1123 5547 xy 102400 40000 167281 172225 252004 99856 828100 1661866 x2 274576 410881 669124 822649 857476 369664 1261129 4665499 y2 167680 128200 334562 376405 464852 192128 1021930 2685757 46

模块一 基 础 知 识

b?n?xy??x?y7?1661866?3072?5547=?0.80

n?x2?(?x)27?4665499?3072277故回归方程为:y?440.70?0.80x

yb?x55473072?a????0.80??440.70

nn当生产性固定资产平均价值为1226万元时,年总产值为1421.50万元。

3. 编号 1 2 3 4 5 合计 年限x(年) 3 7 15 18 20 63 年薪y(万元) 6.5 8.9 12 16 17 60.4 x2 9 49 225 324 400 1007 =0.9808

y2 42.25 79.21 144 256 289 810.46 xy 19.5 62.3 180 288 340 889.8 r?n?xy??x?yn?x?(?x)?n?y?(?y)2222即工作年限和年薪属于高度正相关的关系。

n?xy??x?y5?889.8?63?60.4b?==0.60 2n?x2?(?x)25?1007?6355故回归方程为:y?4.52?0.60x

a??y?b?x?60.4?0.60?63?4.52

nn 47

模块一 基 础 知 识

s?y2?a(?y)?b(?xy)yx?n?2?1.09

4. R&D编号 投入x利润yx2 y2 xy (万元) (万元) 14641 20 121 400 1 2420 26562 32 163 1024 9 5216 707510903 41 266 1681 6 6 750712334 459 274 2025 6 0 967217725 57 311 3249 1 7 28374859合计 195 1135 8379 63 9 r?n?xy??x?y2 ?0.9639

n?x2?(?x)?n?y2?(?y)2b?n?xy??x?y5?48599?195?1135n?x2?(?x)2?5?8379?1952?5.60 a??yn?b?xn?11355?5.60?1955?8.62

以R&D投入为自变量的回归方程为:y?8.62?5.60x

b?n?xy??x?y5?48599?n?y2?(?y)2??195?11355?11352?11352?0.16 a??xb?y1951135n?n?5?0.16?5?1.33

以利润为自变量的回归方程为:x?1.33?0.16y

48

模块一 基 础 知 识

当R&D投入为60万时,利润为y?8.62?5.60?60?344.62万元

当利润为400万元时,需要的R&D投入为x?1.33?0.16?400?65.33万元

?y?x5.因为r?b?,所以b?r?,故b?0.64

?y?xa?y?bx?124?0.64?165?18.4

故回归方程y?18.4?0.64x

因为Syx??y1?r

故估计标准差Syx?4?1?0.8?2.4万元 6. 编号 1 2 3 4 5 6 7 8 合计 航班正点率x(%) 79 78.3 76.6 74.9 73.7 71.3 70.5 69.8 594.1 投诉率y(%) 0.52 0.58 0.61 0.67 0.72 0.76 0.87 1.34 6.07 (%) y2 (%) 22xy x241.08 45.414 46.726 50.183 53.064 54.188 61.335 93.532 445.522 6241 6130.89 5867.56 5610.01 5431.69 5083.69 4970.25 4872.04 44207.13 0.2704 0.3364 0.3721 0.4489 0.5184 0.5776 0.7569 1.7956 5.0763 以航班正点率为自变量的回归方程为:y=5.20-0.06x

49

模块一 基 础 知 识

syx??y2?a(?y)?b(?xy)n?2=0.20

当正点率为80%,y=5.20-0.06?80=0.4,又因为f(t)?95%,t?1.96

故 0.4?1.96?0.20?y?0.4?1.96?0.20

0.008?y?0.792

即在置信水平为95%的条件下,当航班的正点率为80%时,乘客的投诉率在0.008%到0.792%之间。

7. 编号 1 2 3 4 5 6 7 8 9 10 合计 空置率(%)y 5 12.3 13.8 15.1 16.4 16.8 19.6 19.9 20.3 22.6 161.8 租金水平(万元/平方米)x 0.92 1.71 1.87 2.04 2.43 2.46 3.16 3.46 4.69 6.7 29.44 xy 4.6 21.033 25.806 30.804 39.852 41.328 61.936 68.854 95.207 151.42 540.84 x2% y%2 0.8464 2.9241 3.4969 4.1616 5.9049 6.0516 9.9856 11.9716 21.9961 44.89 112.2288 25 151.29 190.44 228.01 268.96 282.24 384.16 396.01 412.09 510.76 2848.96 以租金为自变量的回归方程为:y=8.75+2.52x

syx??y2?a(?y)?b(?xy)n?2=2.96

当写字楼的租金为每平米7万元时,空置率为y=8.75+2.52?7=26.39,即空置率为26.39%。又因为f(t)?99.73%,t?3

故 26.39?3?2.96?y?26.39?3?2.96

50

本文来源:https://www.bwwdw.com/article/n838.html

Top