统计学贾俊平课后习题答案1

更新时间:2024-03-18 01:15:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第1章 统计与统计数据

一、学习指导

统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。

章节 1.1 统计及其应用领域 主要内容 什么是统计学 统计的应用领域 分类数据、顺序数据、数值型数据 观测数据和实验数据 截面数据和时间序列数据 数据的间接来源 学习要点 ? 概念:统计学,描述统计,推断统计。 ? 统计在工商管理中的应用。 ? 统计的其他应用领域。 ? 概念:分类数据,顺序数据,数值型数据。 ? 不同数据的特点。 ? 概念:观测数据,实验数据。 ? 概念:截面数据,时间序列数据。 ? 统计数据的间接来源。 ? 二手数据的特点。 ? 概念:抽样调查,普查。 ? 数据的间接来源。 ? 数据的收集方法。 ? 调查方案的内容。 ? 概念。抽样误差,非抽样误差。 ? 统计数据的质量。 ? 概念:总体,样本。 ? 概念:参数,统计量。 ? 概念:变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。 1.2 数据的类型 1.3 数据来源 数据的直接来源 调查方案设计 数据质量 总体和样本 1.4 统计中的参数和统计量 几个基本概念 变量 二、主要术语

1. 2. 3. 4. 5. 6. 7. 8. 9. 10.

统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 描述统计:研究数据收集、处理和描述的统计学分支。

推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 分类数据:只能归于某一类别的非数字型数据。 顺序数据:只能归于某一有序类别的非数字型数据。 数值型数据:按数字尺度测量的观察值。 观测数据:通过调查或观测而收集到的数据。

实验数据:在实验中控制实验对象而收集到的数据。 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间上收集到的数据。

1

11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推

断总体特征的数据收集方法。

12. 普查:为特定目的而专门组织的全面调查。 13. 总体:包含所研究的全部个体(数据)的集合。 14. 样本:从总体中抽取的一部分元素的集合。

15. 样本容量:也称样本量,是构成样本的元素数目。 16. 参数:用来描述总体特征的概括性数字度量。 17. 统计量:用来描述样本特征的概括性数字度量。 18. 变量:说明现象某种特征的概念。 19. 分类变量:说明事物类别的一个名称。 20. 顺序变量:说明事物有序类别的一个名称。 21. 数值型变量:说明事物数字特征的一个名称。 22. 离散型变量:只能取可数值的变量。

23. 连续型变量:可以在一个或多个区间中取任何值的变量。

第2章 数据的图表展示

一、学习指导

数据的图表展示是应用统计的基本技能。本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。本章各节的主要内容和学习要点如下表所示。

章节 主要内容 数据审核 数据排序 2.1 数据的预处理 数据筛选 数据透视表 学习要点 ? 数据审核的目的。 ? 原始数据和二手数据的审核内容。 ? 数据排序的目的。 ? 分类数据和数值型数据的排序方法。 ? 数据筛选的目的。 ? 用Excel进行数据筛选。 ? 数据透视表的用途。 ? 用Excel进行数据透视。 ? 概念:频数,频数分布,比例,百分比,比率。 ? 用Excel制作分类数据的频数分布表。 ? 分类数据的图示:条形图,帕累托图,对比条形图,饼图。 ? 概念:累积频数,累积频率。 ? 累积频数分布图。 ? 概念:数据分组,单变量值分组,组距分组,等距分组,不等距分组,组距,组中值。 ? 频数分布表的制作步骤。 ? 用Excel制作频数分布表。 2

2.2 品质数据的整理与展示 分类数据的整理与图示 顺序数据的整理与图示 2.3 数值型数据的整理与展示 数据分组

数值型数据的图示 ? ? ? ? ? ? ? ? ? 直方图的绘制。 茎叶图的绘制。 箱线图的绘制。 直方图与条形图的区别。 茎叶图与直方图的区别。 线图的绘制。 散点图的绘制。 气泡图的绘制。 雷达图的绘制。 鉴别图形优劣的准则 2.4 合理使用图表 统计表的设计 ? 图形应包括的基本特征。 ? 鉴别图形优劣的准则。 ? 统计表的结构。 ? 统计表的设计。 二、主要术语

24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35.

频数:落在某一特定类别(或组)中的数据个数。 频数分布:数据在各类别(或组)中的分配。

比例:一个样本(或总体)中各个部分的数据与全部数据之比。 比率:样本(或总体)中各不同类别数值之间的比值。

累积频数:将各有序类别或组的频数逐级累加起来得到的频数。

数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。 组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 组距:一个组的上限与下限的差。

组中值:每一组的下限和上限之间的中点值,即组中值=(下限值+上限值)/2。 直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。 茎叶图:由“茎”和“叶”两部分组成的、反应原始数据分布的图形。 箱线图:由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布的图形。

第3章 数据的概括性度量

一、学习指导

数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。本章将从数据的不同类型出发,分别介绍集中趋势测度值的计算方法、特点及其应用场合。本章各节的主要内容和学习要点如下表所示。 章节 3.1 集中趋势的度量 众数 主要内容 学习要点 ? 概念:众数。 ? 众数的特点。 3

中位数和分位数 ? 概念:中位数,四分位数。 ? 中位数和四分位数的特点。 ? 中位数和四分位数的计算。 ? 概念:平均数,简单平均数,加权平均数,几何平均数。 ? 简单平均数和加权平均数的计算。 ? 平均数的性质。 ? 几何平均数的计算和应用场合。 ? 众数、中位数和平均数在分布上的关系。 ? 众数、中位数和平均数的特点及应用场合。 ? 概念:异众比率。 ? 异众比率的计算和应用场合。 ? 概念:四分位差。 ? 四分位差的计算和应用场合。 ? ? ? ? ? ? ? ? ? 概念:极差,平均差,方差,标准差。 极差的计算和特点。 平均差的计算和特点。 样本方差和标准差的计算。 总体方差和标准差的计算。 概念:标准分数。 标准分数的计算和应用。 经验法则。 切比雪夫不等式。 平均数 众数、中位数和平均数的比较 异众比率 四分位差 方差和标准差 3.2 离散程度的度量 相对位置的度量 离散系数 ? 概念:离散系数。 ? 离散系数的计算。 ? 离散系数的用途。 ? 概念:偏态,偏态系数。 ? 偏态系数的计算。 ? 偏态系数数值的意义。 ? ? ? ? ? 概念:峰态,峰态系数。 峰态系数的计算。 峰态系数数值的意义。 用Excel计算描述统计量。 Excel统计函数的应用。 偏态及其测度 3.3 偏态与峰态的度量 峰态及其测度 二、主要术语和公式

(一)主要术语

1. 众数:一组数据中出现频数最多的变量值,用Mo表示。 2. 中位数:一组数据排序后处于中间位置上的变量值,用Me表示。 3. 四分位数:一组数据排序后处于25%和75%位置上的值。

4

4. 平均数:一组数据相加后除以数据的个数而得到的结果。 5. 几何平均数:n个变量值乘积的n次方根,用Gm表示。

6. 异众比率:非众数组的频数占总频数的比率。

7. 四分位差:也称为内距或四分间距,上四分位数与下四分位数之差。 8. 极差:也称全距,一组数据的最大值与最小值之差。

9. 平均差:也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。 10. 方差:各变量值与其平均数离差平方的平均数。 11. 标准差:方差的平方根。

12. 标准分数:变量值与其平均数的离差除以标准差后的值。

13. 离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比。 14. 偏态:数据分布的不对称性。

15. 偏态系数:对数据分布不对称性的度量值。 16. 峰态:数据分布的平峰或尖峰程度。 17. 峰态系数:对数据分布峰态的度量值。

(二)主要公式 名称 公式 中位数 ?x?n?1?????2??Me??????1?x?x??n??n??????1???2??2?????2?n为奇数 n为偶数简单样本平均数 x??xi?1nink 加权样本平均数 x??Mi?1ifi n几何平均数 Gm?x1?x2???xn?nn?xi?1ni 异众比率 Vrf?f???fiim?1?fm f?i四分位差 极差 Qd?QU?QL R?max(xi)?min(xi) 5

简单平均差 Md?k?xi?1ni?x n加权平均差 Md??Mi?1i?xfi n简单样本方差 s2??(xi?1ni?x)2 n?1简单样本标准差 s?k?(xi?1ni?x)2 n?1加权样本方差 s2??(Mi?1i?x)2fi n?1加权样本标准差 s??(Mi?1ki?x)2fi n?1zi?xi?x ss x标准分数 离散系数 vs?未分组数据的偏态系数 n?xi?x?SK??? ?(n?1)(n?2)?s?3分组数据的偏态系数 SK???Mi?x?i?1k3fi 2ns3未分组数据的峰态系数 K?n(n?1)?(xi?x)4?3??(xi?x)2?(n?1)(n?1)(n?2)(n?3)s4 分组数据的峰态系数 K??(Mi?1ki?x)4fi4ns?3

6

第4章 抽样与参数估计

一、学习指导

参数估计是推断统计的重要内容之一,它是在抽样及抽样分布的基础上,根据样本统计量来推断我们所关心的总体参数。本章首先介绍抽样分布的有关知识,然后讨论参数估计的一般问题,最后介绍一个总体参数估计的基本方法和参数估计中样本容量的确定问题。本章各节的主要内容和学习要点如下表所示。 章节 主要内容 学习要点 ? 概念:简单随机抽样,简单随机样本,重复抽样,不重复抽样,分层抽样,系概率抽样方法 统抽样,整群抽样。 ? 用Excel抽取简单随机样本。 ? 概念:抽样分布,样本均值的抽样分布,样本比例的抽样分布,样本方差的4.1 抽样与抽样分布。 抽样分布 ? 中心极限定理。 抽样分布 ? 样本均值抽样分布的特征。 ? 样本均值的抽样分布与总体分布的关系。 ? 样本比例抽样分布的形式和特征。 ? 样本方差抽样分布的形式。 估计量与估计值 ? 概念:估计量,估计值。 ? 概念:点估计,区间估计,臵信区间,4.2 参数估臵信水平。 计的一般问点估计与区间估计 ? 臵信区间构建的原理。 题 ? 臵信区间的解释。 评价估计量的标准 ? 概念:无偏性,有效性,一致性。 ? 正态总体、方差已知时的臵信区间。 正态总体、方差已? 非正态总体、大样本时的臵信区间。 知,或非正态总体、? 用Excel计算给定?的正态分布的临大样本 界值。 4.3 总体均? 正态总体、方差已知时的小样本臵信值的区间估区间。 计 正态总体、方差未? 正态总体、方差未知时的小样本臵信知、小样本 区间。 ? 用Excel计算给定?的t分布的临界值。 4.4 总体比总体比例的区间估例的区间估? 总体比例的臵信区间。 计 计 4.5 总体方总体方差的区间估? 总体方差的臵信区间。

7

差的区间估计 计 ? 用Excel计算给定?的?2分布的临界值。 估计总体均值时样? 样本容量的计算方法。 4.6 样本容本容量的确定 量的确定 估计总体比例时样? 样本容量的计算方法。 本容量的确定 二、主要术语和公式

(一)主要术语

36. 简单随机抽样:也称纯随机抽样,它是从含有N个元素的总体中,抽取n个

元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中。 37. 简单随机样本:从含有N个元素的总体中,抽取n个元素作为样本,使得总

体中每一个样本量为n的样本都有相同的机会(概率)被抽中。

38. 重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二

个元素,直至抽取n个元素为止。

39. 不重复抽样:一个元素被抽中后不再放回总体,而是从所剩元素中抽取第二

个元素,直到抽取n个元素为止。

40. 分层抽样:也称分类抽样,它是在抽样之前先将总体的元素划分为若干层

(类),然后从各个层中抽取一定数量的元素组成一个样本。

41. 系统抽样:也称等距抽样或机械抽样,它是先将总体中的各元素按某种顺序

排列,并按某种规则确定一个随机起点;然后,每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本。 42. 整群抽样:先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,

随后再对抽中的各个群中所包含的所有元素进行观察。

43. 抽样分布:在重复选取样本量为n的样本时,由样本统计量的所有可能取值

形成的相对频数分布。

44. 样本均值的抽样分布:在重复选取样本量为n的样本时,由样本均值的所有

可能取值形成的相对频数分布。

45. 样本比例抽样分布:在重复选取样本量为n的样本时,由样本比例的所有可

能取值形成的相对频数分布。

46. 标准误差:也称为标准误,它是样本统计量的抽样分布的标准差。

47. 估计标准误差:若计算标准误时所涉及的总体参数未知,可用样本统计量代

替计算的标准误。 48. 估计量:用来估计总体参数的统计量的名称,用符号??表示。 49. 估计值:用来估计总体参数时计算出来的估计量的具体数值。 50. 点估计:用样本统计量??的某个取值直接作为总体参数?的估计值。 51. 区间估计:在点估计的基础上,给出总体参数估计的一个范围。 52. 臵信区间:由样本统计量所构造的总体参数的估计区间。

53. 臵信水平:也称为臵信系数,它是将构造臵信区间的步骤重复多次后,臵信

8

区间中包含总体参数真值的次数所占的比率。

(二)主要公式 名称 总体均值的臵信区间(正态总体,?已知) 公式 x?z?2?nsnsn 总体均值的臵信区间(?未知,大样本) 总体均值的臵信区间(正态总体,?未知,小样本) 总体比例的臵信区间 x?z?2 x?t?2 p?z?2p(1?p) n2总体方差的臵信区间 (n?1)s2??2n?2???(n?1)s2?21??2 估计总体均值时的样本容量 (z?2)2?2E2 估计总体比例时的样本容量 n?(z?2)2??(1??)E2 第5章 假设检验

一、学习指导

假设检验是推断统计的另一项重要内容,它是利用样本信息判断假设是否成立的一种统计方法。本章首先介绍有关假设检验的一些基本问题,然后介绍一个总体参数的检验方法。本章各节的主要内容和学习要点如下表所。

章节 主要内容 假设的陈述 5.1 假设检验的基本问题 学习要点 ? 概念:假设,假设检验,原假设,备择假设,单侧检验,双侧检验。 ? 针对具体的实际问题,建立合理的原假设和备择假设。 ? 概念:第Ⅰ类错误,第Ⅱ类错误,显著性水平。 ? 两类错误的控制。 ? 两类错误的关系。 ? 概念:检验统计量,标准化检验统计量,拒绝域,临界9

两类错误与显著性水平 检验统计量与拒绝域

值。 ? 统计量检验的原理。 ? 利用统计量检验的决策准则。 ? ? ? ? 概念:P值。 P值决策的原理,P值的计算。 P值检验与统计量检验的异同。 P值决策的准则。 利用P值进行决策 小结 ? 假设检验的步骤。 ? 假设检验结果的表述。 ? 总体方差?已知时,均值检验的统计量和程序。 2大样本的检验方法 5.2 总体均值的检验 小样本的检验方法 ? 总体方差?未知时,均值检验的统计量和程序。 ? 用Excel计算P值。 ? 总体方差?已知时,均值检验的统计量和程序。 2?? 总体方差未知时,均值检验的统计量和程序。 22? 用Excel计算P值。 5.3 总体比例的检验 5.4 总体方差的检验 总体比例的检验 ? 检验的统计量。 ? 检验的程序。 ? 用Excel计算P值。 ? 检验的统计量。 ? 检验的程序。 ? 用Excel计算P值。 总体方差的检验 二、主要术语和公式

(一)主要术语

18. 假设:对总体参数的具体数值所做的陈述。

19. 假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。 20. 备择假设:也称研究假设,是研究者想收集证据予以支持的假设,用H1或Ha表示。 21. 原假设:也称零假设,是研究者想收集证据予以反对的假设,用H0表示。

22. 单侧检验:也称单尾检验,是指备择假设具有特定的方向性,并含有符号“>”或“<”

的假设检验。

23. 双侧检验:也称双尾检验,是指备择假设没有特定的方向性,并含有符号“?”的假设

检验。

24. 第Ⅰ类错误:当原假设为正确时拒绝原假设,犯第Ⅰ类错误的概率记为?。 25. 第Ⅱ类错误:当原假设为错误时没有拒绝原假设,犯第Ⅱ类错误的概率通常记为?。 26. 显著性水平:假设检验中发生第Ⅰ类错误的概率,记为?。

10

回归方程的斜率(回归系数) ???1n?xiyi??xi?yii?1i?1i?1nnn??n?xi2???xi?i?1?i?1?nn2 判定系数 ?i?y)2SSR?(y R??2SST?(yi?y)2估计标准误差 se??(y?y)ii?2n?2?SSE n?2线性关系检验的统计量 F?SSR1~F(n?2) SSEn?2回归系数检验的统计的统计量 t??is??i?~t(n?2) y的平均值的置信区间 ?0?t?2sey(x0?x)21?nn2(x?x)?ii?1 y的个别值的预测区间 (x0?x)21?0?t?2se1??ny n?(xi?x)2i?1修正的多重判定系数 R2?1?(1?R2)?n?1 n?k?1 第8章 时间序列分析和预测

一、学习指导

分析时间序列数据的主要目的是对未来的观测值进行预测。本章在给出时间序列概念及分类的基础上,首先介绍了时间序列的描述性分析方法,然后介绍了平稳序列和非平稳序列的一些简单预测方法。本章各节的主要内容和学习要点如下表所示。 章节 8.1 时间序列及其分解 8.2 时间序列

主要内容 时间序列及其分解 图形描述 学习要点 ? 概念:时间序列,平稳序列,非平稳序列,趋势,季节性,周期性,随机性。 ? 时间序列的分解模型。 ? 时间序列的图形描述。 16

的描述性分析 增长率分析 ? 概念: 增长率,环比增长率,定基增长率,平均增长率,年度化增长率,增长1%绝对值。 ? 一般增长率的计算与分析。 ? 平均增长率的计算与分析。 ? 年度化增长率的计算与分析。 ? 增长率分析中应注意的问题。 ? 增长1%绝对值的计算和应用。 ? 时间序列的预测步骤。 ? 趋势成分的确定方法。 ? 季节性成分的确定方法。 ? 时间序列的类型和预测方法的 ? 概念:平均误差,平均绝对误差,均方误差,平均百分比误差和平均绝对百分比误差。 ? 各种误差的计算方法。 ? 简单平均法预测。 ? 移动平均法预测。 ? 用Excel进行移动平均预测。 ? 指数平滑法预测。 ? 用Excel进行指数平滑预测。 ? 直线趋势方程的求法。 ? 直线趋势方程预测。 ? ? ? ? ? 二次曲线预测。 指数趋势预测,指数曲线和直线的区别。 修正指数曲线预测。 龚铂茨曲线预测。 Logistic曲线预测 确定时间序列的成分 8.3 时间序列的预测程序 选择预测方法 预测方法的评估 简单平均法 8.4 平稳序列的预测 移动平均法 指数平滑法 线性趋势预测 8.5 趋势型序列的预测 非线性趋势预测 确定并分离季节成分 8.6 复合型序建立预测模型并进行预列的分解预测 测 计算最后的预测值 ? 季节指数的计算。 ? 分离季节成分。 ? 建立预测模型。 ? 最终预测值的计算。 二、主要术语和公式

(一)主要术语

61. 时间序列:同一现象在不同时间上的相继观察值排列而成的序列。 62. 平稳序列:基本上不存在趋势的序列。

63. 非平稳序列:包含趋势性、季节性或周期性的序列。 64. 趋势:也称长期趋势,是指时间序列在长时期内呈现出来的某种持续向上或持续下降的

变动。

65. 季节性:也称季节变动,是指时间序列在一年内重复出现的周期性波动。 66. 周期性:也称循环波动,是指时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡

式变动。

17

67. 随机性:也称不规则波动,是指时间序列中除去趋势、周期性和季节性之后的偶然性波

动。 68. 增长率:也称增长速度,是指时间序列中报告期观察值与基期观察值之比减1后的结果,

用%表示。

69. 平均增长率:也称平均发展速度,是指时间序列中各逐期环比值(也称环比发展速度)

的几何平均数减1后的结果。

70. 增长1%绝对值:增长率每增长一个百分点而增加的绝对数量。

71. 简单平均法预测:根据过去已有的t期观察值通过简单平均来预测下一期的数值。 72. 移动平均法预测:通过对时间序列逐期递移求得平均数作为预测值的一种预测方法。 73. 指数平滑法预测:对过去的观察值加权平均进行预测的一种方法,该方法使得第t+1

期的预测值等于t期的实际观察值与第t期指数预测值的加权平均值。

(二)主要公式

名称 环比增长率 公式 Gi?Yi?1 Yi?1定基增长率 Yi?Y0YiGi???1 Y0Y0平均增长率 YnYnY1Y2nG??????1??1 Y0Y1Yn?1Y0n年度化增长率 GA?(Yimn)?1 Yi?1n平均预测误差 ME??(Yi?1i?Fi) n平均绝对预测误差 MAD??Yni?Fin 均方预测误差 MSE??(Yi?1i?Fi)2n 平均百分比预测误差 ?Yi?Fi????100??Y?i?? MPE?nFt?111t?(Y1?Y2???Yt)??Yi tti?118

简单平均法预测

移动平均法预测 Ft?1?Yt?Yt?k?1?Yt?k?2???Yt?1?Yt k指数平滑法预测 Ft?1??Yt?(1??)Ft ?n?tY??t?Y?b?n?t2?(?t)2 ???a?Y?bt线性趋势方程的截距和斜率 二次曲线的标准方程组 ??Y?na?b?t?c?t2?23 ??tY?a?t?b?t?c?t?t2Y?at2?bt3?ct4?????指数曲线的标准方程组 ??lgY?nlga?lgb?t ?2??tlgY?lga?t?lgb?t1?S3?S2?m?b????S?S???21???b?1?a?(S?S) ?21m2b(b?1)??1?ab(bm?1)??K???S1???mb?1????修正指数曲线的未知数 龚铂茨曲线的未知数 1?S3?S2?m?b????S?S???21???b?1? ?lga?(S2?S1)m2b(b?1)???1?b(bm?1)?lgK???S??lga1??m?b?1???1?S3?S2?m?b????S?S???21???b?1??a?(S2?S1)m2 b(b?1)??1?ab(bm?1)??K???S1???mb?1????Logistic曲线未知数

19

第9章 指数

一、学习指导

指数是应用于经济领域的一种特殊统计方法。本章首先介绍指数的概念和分类,然后介绍加权指数的编制方法,最后介绍实际中几种常用的价格指数。本章各节的主要内容和学习要点如下表所示。

章节 9.1 引言 主要内容 指数的概念和分类 加权综合指数 9.2 加权指数 加权平均指数 价值指数与指数体系 学习要点 ? 概念:指数,个体指数,综合指数,简单指数,加权指数,时间性指数,区域性指数。 ? 概念:加权综合指数。 ? 加权综合指数的编制。 ? 概念:加权平均指数。 ? 加权平均指数的编制。 ? 概念:价值指数,指数体系。 ? 指数体系的应用。 ? 概念:零售价格指数,居民消费价格指数,生产价格指数,股票价格指数。 ? 零售价格指数和居民消费价格指数的区别。 ? 居民消费价格指数的作用。 9.3 几种常用的价格指数 几种常用的价格指数 二、主要术语和公式

(一)主要术语

74. 指数:测定多个项目在不同场合下综合变动的相对数。

75. 加权综合指数:通过加权来测定一组项目的综合变动状况的指数。

76. 加权平均指数:以某一时期的价值总量为权数对个体指数加权平均计算的指数。 77. 价值指数:由两个不同时期的价值总量对比形成的指数。

78. 指数体系:由价值指数及其若干个因素指数构成的数量关系式。 79. 零售价格指数:反映城乡商品零售价格变动趋势的一种经济指数。 80. 居民消费价格指数:反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格

的变动趋势和程度的一种相对数。

81. 生产价格指数:测量在初级市场上所售货物(即在非零售市场上首次购买某种商品时)

价格变动的一种价格指数。

82. 股票价格指数:是反映某一股票市场上多种股票价格变动趋势的一种相对数。

(二)主要公式 名称 公式 20

加权综合价格指数 Ippq???pq1101 加权综合销售量指数 Iqpq???pq0010 加权平均价格指数 Ip??pq?p1p0111p1q1加权平均销售量指数 q1?qp0q00 Iq?pq?00价值指数 pq?v??pq0110 附录:教材各章习题答案

第1章 统计与统计数据

1.1 (1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)

分类数据。

1.2 (1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;

(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。

1.3 (1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。 1.4 (1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者

的月平均花费;(4)统计量;(5)推断统计方法。 1.5 (略)。 1.6 (略)。 第2章 数据的图表展示 2.1

(1) 属于顺序数据。

(2)频数分布表如下

服务质量等级评价的频数分布 服务质量等级 家庭数/频率 频率/% A 14 14 B 21 21 C 32 32 21

D 18 18 E 15 15 合计 100 100 (3)条形图(略) (4)帕累托图(略)。 2.2 (1)频数分布表如下

40个企业按产品销售收入分组表 按销售收入分企业频率 向上累积 向下累积 组 数 /% 企业数 频率 企业数 频率 /万元 /个 100以下 5 12.5 5 12.5 40 100.0 100~110 9 22.5 14 35.0 35 87.5 110~120 12 30.0 26 65.0 26 65.0 120~130 7 17.5 33 82.5 14 35.0 130~140 4 10.0 37 92.5 7 17.5 140以上 3 7.5 40 100.0 3 7.5 合计 40 100.0 — — — — (2)某管理局下属40个企分组表 按销售收入分组/万元 企业数/个 频率/% 先进企业 11 27.5 良好企业 11 27.5 一般企业 9 22.5 落后企业 9 22.5 合计 40 100.0 2.3 频数分布表如下 某百货公司日商品销售额分组表 按销售额分组/万频数/天 频率/% 元 25~30 4 10.0 30~35 6 15.0 35~40 15 37.5 40~45 9 22.5 45~50 6 15.0 合计 40 100.0 直方图(略)。 2.4 茎叶图如下 茎 叶 数据个数 1 8 8 9 3 2 0 1 1 3 3 6 8 8 8 9 9 9 12 3 1 3 5 6 9 5 4 1 2 3 6 6 7 6 5 0 1 2 7 4 箱线图(略)。 22

(1)排序略。

(2)频数分布表如下

2.5

100只灯泡使用寿命非频数分布 按使用寿命分组/小灯泡个数/只 频率/% 时 650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计 100 100 (3)直方图(略)。 (4)茎叶图如下 茎 叶 65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7 2.6 (1)频数分布表如下 按重量分组 频率/包 40~42 2 42~44 3 44~46 7 46~48 16 48~50 17 52~52 10 52~54 20 54~56 8 56~58 10 58~60 4 60~62 3 合计 100 (2)直方图(略)。

23

(3)食品重量的分布基本上是对称的。 2.7 (1)频数分布表如下 按重量误差分组 频数/个 10~20 0 20~30 5 30~40 7 40~50 8 50~60 13 60~70 9 70~80 6 80~90 2 合计 50 (2)直方图(略)。 2.8 (1)属于数值型数据。

(2)分组结果如下 天数/天 分组 -25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计 60 (3)直方图(略)。 2.9 (1)直方图(略)。

(2)自学考试人员年龄的分布为右偏。 2.10 (1)茎叶图如下 A班 数据个数 树 叶 树茎 B班 树叶 数据个数 0 3 59 2 1 4 4 0448 4 2 97 5 122456677789 12 11 97665332110 6 011234688 9 23 98877766555554443332100 7 00113449 8 7 6655200 8 123345 6 6 632220 9 011456 6 0 10 000 3 (2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,

且平均成绩较A班低。

2.11 (略)。 2.12 (略)。 2.13 (略)。

24

2.14 2.15

958575655545(略)。

箱线图如下:(特征请读者自己分析)

各城市相对湿度箱线图Min-Max3525%-75%北京长春南京郑州武汉广州成都昆明兰州西安Median value 第3章 数据的概括性度量 3.1

(1)M0?10;Me?10;x?9.6。

(2)QL?5.5;QU?12。 (3)s?4.2。

(4)左偏分布。 3.2

(1)M0?19;Me?23。

(2)QL?5.5;QU?12。 (3)x?24;s?6.65。 (4)SK?1.08;K?0.77。 (5)略。 3.3 (1)略。

(2)x?7;s?0.71。

(3)v1?0.102;v2?0.274。

(4)选方法一,因为离散程度小。 3.4 (1)x=274.1(万元);Me=272.5 。

(2)QL=260.25;QU=291.25。 (3)s?21.17(万元)。 3.5 甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原

因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 3.6

(1)x=426.67(万元);s?116.48(万元)。

(2)SK?0.203;K??0.688。

3.7 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相

25

同,因为均值和标准差的大小基本上不受样本大小的影响。

(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。 3.8 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生

体重的离散系数0.08。 (2) 男生:x=27.27(磅),s?2.27(磅); 女生:x=22.73(磅),s?2.27(磅); (3)68%;

(4)95%。 3.9

通过计算标准化值来判断,zA?1,zB?0.5,说明在A项测试中

该应试者比平均分数高

出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。 3.10 通过标准化值来判断,各天的标准化值如下表

日期 周一 周二 周三 周四 周五 周六 周日 标准化值Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。 3.11 (1)离散系数,因为它消除了不同组数据水平高地的影响。

4.2?0.024; (2)成年组身高的离散系数:vs?172.12.3?0.032; 幼儿组身高的离散系数:vs?71.3 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。 3.12 下表给出了一些主要描述统计量,请读者自己分析。 方法A 方法B 方法C 平均 165.6 平均 128.73 平均 125.53 中位数 165 中位数 129 中位数 126 众数 164 众数 128 众数 126 标准偏差 2.13 标准偏差 1.75 标准偏差 2.77 极差 8 极差 7 极差 12 最小值 162 最小值 125 最小值 116 最大值 170 最大值 132 最大值 128 3.13 (1)方差或标准差;(2)商业类股票;(3)(略)。 第4章 抽样与参数估计

4.1 (1)200。(2)5。(3)正态分布。(4)?2(100?1)。 4.2 (1)32。(2)0.91。 4.3 0.79。

4.4 (1)x25~N(17,22)。(2)x100~N(17,1)。

26

4.5 (1)1.41。(2)1.41,1.41,1.34。 4.6 (1)0.4。(2)0.024 。(3)正态分布。 4.7 (1)0.050,0.035,0.022,016。(2)当样本量增大时,样本比例的标准

差越来越小。 4.8 (1)?x?2.14;(2)E=4.2;(3)(115.8,124.2)。

4.9 (87819,121301)。 4.10(1)81±1.97;(2)81±2.35;(3)81±3.10。 4.11(1)(24.11,25.89);(2)(113.17,126.03);(3)(3.136,3.702) 4.12(1)(8687,9113);(2)(8734,9066);(3)(8761,9039);(4)(8682,

9118)。

4.13(2.88,3.76);(2.80,3.84);(2.63,4.01)。 4.14(7.1,12.9)。 4.15(7.18,11.57)。 4.16(1)(148.9,150.1);(2)中心极限定理。 4.17(1)(100.9,123.7);(2)(0.017,0.183)。 4.18(15.63,16.55)。 4.19(10.36,16.76)。 4.20(1)(0.316,0.704);(2)(0.777,0.863);(3)(0.456,0.504)。 4.21(18.11%,27.89%);(17.17%,22.835)。 4.22167。

4.23(1)2522;(2)601;(3)268。 4.24(1)(51.37%,76.63%);(2)36。 4.25(1)(2.13,2.97);(2)(0.015,0.029);(3)(25.3,42.5)。 4.26(1)(0.33,0.87);(2)(1.25,3.33);(3)第一种排队方式更好。 4.27 48。 4.28 139。 第5章 假设检验

5.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以

前提高了”,所以原假设与备择假设应为:H0:??1035,H1:??1035。 5.2 ?=“某一品种的小鸡因为同类相残而导致的死亡率”,H0:??0.04,

H1:??0.04。

5.3 H0:??65,H1:??65。

5.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于

60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克; (2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;

27

(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。 5.5 (1)检验统计量z?x??s/n,在大样本情形下近似服从标准正态分布;

(2)如果z?z0.05,就拒绝H0;

(3)检验统计量z=2.94>1.645,所以应该拒绝H0。 5.6 z=3.11,拒绝H0。 5.7 t?1.66,不拒绝H0。 5.8 z??2.39,拒绝H0。 5.9 t?1.04,不拒绝H0 5.10z?2.44,拒绝H0。 5.11z=1.93,不拒绝H0。 5.12z=7.48,拒绝H0。 5.13?2=206.22,拒绝H0。 5.14F?2.42,拒绝H0。 第6章 方差分析

6.1 F?4.6574?F0.01?8.0215(或P?value?0.0409???0.01),不能拒绝原假

设。

6.2 F?15.8234?F0.01?4.579(或P?value?0.00001???0.01),拒绝原假设。 6.3 F?10.0984?F0.01?5.4170(或P?value?0.000685???0.01),拒绝原假设。 6.4 F?11.7557?F0.05?3.6823(或P?value?0.000849???0.05),拒绝原假设。 6.5 F?17.0684?F0.05?3.8853(或P?value?0.0003???0.05),拒绝原假设。

xA?xB?44.4?30?14.4?LSD?5.85,拒绝原假设; xA?xC?44.4?42.6?1.8?LSD?5.85,不能拒绝原假设;

28

xB?xC?30?42.6?12.6?LSD?5.85,拒绝原假设。

6.6 方差分析表中所缺的数值如下表: 差异源 SS df MS 组间 210 420 2 组内 3836 27 142.07 总计 29 — 4256 F 1.478 — — P-value 0.245946 — — F crit 3.354131 — — (或P?value?0.245946???0.05),不能拒绝原F?1.478?F0.05?3.554131假设。

第7章 相关与回归分析

7.1 (1)散点图(略),产量与生产费用之间正的线性相关关系。

(2)r?0.920232。

(3)检验统计量t?14.4222?t?2?2.2281,拒绝原假设,相关系数显著。 7.2 (1)散点图(略)。 (2)r?0.8621。

?表示当x?0时y的期望值。 7.3 (1)?0?表示x每变动一个单位y平均下降0.5个单位。 (2)?1(3)E(y)?7。 7.4 (1)R2?90%。

(2)se?1。 7.5 (1)散点图(略)。

(2)r?0.9489。

??0.00358表示运送距离每增加1??0.1181?0.00358x。回归系数?(3)y1公里,运送时间平均增加0.00358天。

7.6 (1) 散点图(略)。二者之间为高度的正线性相关关系。

(2)r?0.998128,二者之间为高度的正线性相关关系。

??0.308683??734.6928?0.308683x。(3)估计的回归方程为:y回归系数?1表示人均GDP每增加1元,人均消费水平平均增加0.308683元。 (4)判定系数R2?0.996259。表明在人均消费水平的变差中,有99.6259%

是由人均GDP决定的。

(5)检验统计量F?1331.692?F??6.61,拒绝原假设,线性关系显著。

29

?5000?734.6928?0.308683(6)y。 ?5000?2278.1078(元)

(7)臵信区间:[1990.749,2565.464];预测区间:[1580.463,2975.750]。

7.7 (1) 散点图(略),二者之间为负的线性相关关系。

???4.7表示航班??430.1892?4.7x。回归系数?(2)估计的回归方程为:y1正点率每增加1%,顾客投诉次数平均下降4.7次。

(3)检验统计量t?4.959?t?2?2.3060(P-Value=0.001108

拒绝原假设,回归系数显著。

?80?430.1892?4.7?80?54.1892(次)(4)y。

(5)臵信区间:(37.660,70.619);预测区间:(7.572,100.707)。 7.8 Excel输出的结果如下(解释与分析请读者自己完成)

Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析

回归分析 残差 总计

Intercept X Variable 1

Coefficients

49.3177 0.2492

df

1 18 19

标准误差

3.8050 0.0448

0.7951 0.6322 0.6117 2.6858

20

SS 223.1403 129.8452 352.9855

t Stat 12.9612 5.5618

MS 223.1403 7.2136

P-value 0.0000 0.0000

F 30.9332

Lower 95%

41.3236 0.1551

Significance F 2.79889E-05

Upper 95%

57.3117 0.3434

7.9 (1)方差分析表中所缺的数值如下 方差分析表 变差来源 df SS MS F Significance F 回归 2.17E-09 1 1422708.6 1422708.6 354.277 残差 40158.07 4015.807 — — 10 总计 11 1642866.67 — — — SSR1422708.60??0.8660?86.60%。表明汽车销售量的变(2)R2?SST1642866.67差中有86.60%是由于广告费用的变动引起的。

(3)r?R2?0.8660?0.9306。

??1.420211??363.6891?1.420211x。回归系数?(4)y表示广告费用每1增加一个单位,销售量平均增加1.420211个单位。

30

本文来源:https://www.bwwdw.com/article/flf8.html

Top