第2章 统计基础知识

更新时间:2023-09-07 13:32:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第2章 学习目标

统计基础知识

–知识目标:系统复习概率论与数理统计基础 知识,为计量经济学的学习打下基础。 –技能目标:通过本章复习,能以有效地方式 获得、整理和分析受到随机性影响的数据, 并以这些数据为依据,建立有效地数学模型, 去揭示所研究问题的统计规律性。 –能力目标:本章先后阐述了数据特征数以及 统计学中的参数估计、假设检验和经济指数, 通过学习本章知识,能构建概率统计基本知 识框架,理解相关概念,为计量经济学知识 的学习做好知识储备。

第2章 统计基础知识§ 2.1 § 2.2 § 2.3 § 2.4 § 2.5 数据特征数 总体特征数的点估计与区间估计 参数估计 假设检验 经济指数

§2.1 数据特征数2.1.1 数理统计的基本概念2.1.2 画图 2.1.3 算数平均数 2.1.4 几何平均数

2.1.5 中位数2.1.6 极差

2.1.7 方差 2.1.8 标准差 2.1.9 偏度 2.1.10 峰度 2.1.11 协方差

2.1.12 相关系数

2.1.1 数理统计的基本概念总体:在数理统计中,常把被考察对象的某一 个(或多个)指标的全体称为总体(或母体)。 个体:总体中的每一个单元称为个体。

总体容量:总体中所含个体的个数。样本:我们把从总体中抽取的部分样品 X 1 , X 2 , , X n

称为样本。

样本容量:样本中所含个体的个数称为样本容 量,一般用n表示。 特征数:用于描述一组数据(总体或样本) 特 征的数值称为特征数。

事件:在随机试验中,可能出现也可能不出现, 而在大量重复试验中具有某种规律性的事件叫 做随机事件,简称事件。

概率:如果在n次试验中(或n个观察值中), 事件A出现了m次,假定试验的次数n足够多, 那么事件A发生的概率P(A)就等于m/n。随机变量:在设Ω={ω}为随机试验的样本 空间,对于每一个样本点 ω∈ Ω ,有一个实 数X=X(ω)与之相对应,这样,就得到一个定 义在Ω上的单值实函数 X=X(ω) ,且对任何一 个实数x,{ω| X=X(ω) ≤x, ω∈ Ω } 是随机事件,称 X(ω) 为随机变量。

累计求和算子:对于T个观测值,{x1,x2, …,xT}, 累计求和可以简化地表示为x1 x2 xT xtt 1 T

其中Σ(· )称为累计求和算子,用大写希腊 字Σ表示。Σ的下标t=1和上标T表示xt从x1累计 加至xT。

累计求和算子的运算规则有以下几个方面: (1)观测值倍数的累加和等于观测值累加和 的倍数。

kxt 1

T

t

k xtt 1

T

式中,k是常数,xt是观测值。(2)两组观测值相应求和(或差)的累加和等 于它们分别求累加和后再相加(或相减)。

(xt 1

T

t

yt ) xt ytt 1 t 1

T

T

(3)T个常数k求和等于该常数k与T的乘积。 k kTt 1 T

式中

,k是常数。

( 4 )用双下标表示的T×T个观测值的累 加和可以用双重累加和符号表示为( x11 x12 x1T ) ( x 21 x 22 x 2T ) ( xT 1 xT 2 xTT ) ( x i 1 x i 2 x iT ) x iji 1 i 1 j 1 T T T

(5)两组观测值相应求和的双重累加和等于 它们各自双重累加和的和。

( xi 1 j 1

T

T

ij

yij ) xij yiji 1 j 1 i 1 j 1

T

T

T

T

( 6 ) 两组不同单下标观测值积的双重累计 求和等于它们各自累计求和的乘积。

x yi 1 j 1 i

T

T

j

( xi )( y j )i 1 i 1

T

T

2.1.2 画图直方图

直方图分频数直方图和频率直方图两类。 直方图用横轴表示观测值,并把横轴分成若干 个区间(每个区间的宽度称为组距);用纵轴 表示落在相应区间内的观测值频数(个数)或 频率,并用矩形(长方形)表示组频数或组频 率。

画直方图的步骤是先依据原始数据大小排 序,然后制作分组数据频数(频率)分布表, 然后按频数(频率)分布表画图。

例2-1 20个新生儿体重值(克)数据见表21,画20个新生儿体重值的频数(频率)直方 图。表2-1 20个新生儿体重值分组数据频数(频率)分布

首先把这20个新生儿的体重值按从小到大顺 序排列。把观测值的取值范围按2250~2500, 2500~ 2750,2750~3000, 3000 ~3250,

3250~3500,3500~3750,3750~4000分成7 组。 记录这20个观测值分别落在这7个组内频 数(个数)。结果分别是1,2,2,8,3,3, 1。用总观测值个数20除每个组频数,得组频 率值分别是0.05,0.10,0.10,0.40,0.15, 0.15,0.05。用上面的结果制成频数(频率) 分布表(见表2-2)。

表2-2 20个新生儿体重值分组数据频数(频率)分布

以组距为一条边,以频数(频率)值为另一 条边,画矩形(长方形)构成的图就是直方图。

图 2-1 频数分布直方图

图2-2频率分布直方图

注意:

(1)频数、频率直方图所展示的数据分布 特征是一样的,只不过前者的纵轴表示的是频 数、后者纵轴表示的是频率。

(2)当观测值正巧等于组边界值时,注意不 要在相邻两组中重复记录频数。 (3)同样一组数据由于分组数不同,因此 所画频数、频率直方图的特征会不一样。 (4)很多专用软件都具有画直方图的功能, 非常方便。用EViews软件画直方图的步骤是: 打开单数据窗口,点击View/descriptive Statistics & Tests/Histogram and Stats功能。

折线图 折线图:把观测点按序号或时间顺序用直 线连接起来的图形。对于截面数据,横轴表示 观察值的序号,纵轴表示观测值。对于时间序 列数据,横轴表示时间,纵

轴表示观测值。时 间序列折线图也称时间序列图。 图2-3是1976至1995年中国基本建设投资额 变化时间序列图,通过这张图可以清晰地看到 在该期间中国基本建设投资额一直处于上升的 大趋势中。

图2-3 1976至1995年基本建设投资额变化时间序列图

用Eviews软件画折线图的步骤:打开数据窗口, 点击View/Graph功能。在随后打开的Graph Options (画图选择)窗口中的Specific(图类设定)选项中选 Line&Symbol(折线图),点击确定键。

本文来源:https://www.bwwdw.com/article/yu9h.html

Top