数理统计课程设计

更新时间:2023-09-28 22:40:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

课程设计

设计题目 数理统计

学生姓名

学 号

专业班级 数学与应用数学11-2班

指导教师 凌能祥 李彤

2014年 7 月 10 日

设计 题目 离散型变量分布的假设检验 成绩 课程设计主要内容1. 随机变量分布的计算机实例分析 2. 基于卡方检验,说明数据近似分布,并估计有关参数。 建议:从学生的工作态度、工作量、设计(论文)的创造性、学术性、实用性及书面表达能力等方面给出评价。 指导教师评语 签名: 20 年 月 日

离散型变量分布的假设检验

实验

试验名称: 离散型变量分布的假设检验 试验目的: 随机变量分布的计算机实例分析

设计要求: 附表为某医院眼科门诊数据,基于卡方检验,说明数据近似分布,并估计有关参数。

问题描述

该医院眼科门诊主要分为四大类:白内障、视网膜疾病、青光眼和外伤。 题目附录中给出了2008年7月13日至2008年9月11日这段时间里各类病人的情况。根据这些病人情况,得出数据的近似分布并估计有关参数。

模型假设

1. 假定题目附录中给定的数据真实可靠,具有较好的代表性;

模型的建立与数据处理

数据处理

题目附录中给出了2008年7月13日至2008年9月11日这段时间里各类病人的情况,我们利用EXCEL软件对这些数据进行了相关统计分析,得到了相关信息。

各类病人每天门诊人数

根据统计分析,我们得出五类病人在2008年7月13日至2008年9月11日这段时间里每门诊的人数,见下表所示。、

由于医院排队问题都是典型的排队论问题,而一般的排队论模型都是泊松输入,所以我们先假定病人的门诊时间服从泊松分布。

根据表2中的数据,我们利用EXCEL软件进行统计分析。我们采用6SQ统计插件中的假设检验下的卡方拟和优度来对其进行泊松分布的检验,在显著性水平??0.1 时,发现五类病人每天门诊的人数和总门诊人数都服从泊松分布。

白内障 白内障(双眼) 视网膜 统计量 统计量 统计量 数据个数 61 数据个数 61 数据个数 61

100 133 170 总和 总和 总和

7 7 最大值 5 最大值 最大值 平均值

1.6

平均值

2.2

平均值

2.8

假设检验 假设检验 假设检验

服从泊松分服从泊松分服从泊松分

零假设 布 零假设 布 零假设 布

4 4 自由度 3 自由度 自由度

卡方统计

1.8 3.7 量 卡方统计量 1.9 卡方统计量 0.6 0.8 0.5 p值 p值 p值

显著性水

0.1 0.1 平 显著性水平 0.1 显著性水平

结果 接受零假设 接受零假设 接受零假设 结果 结果 外伤: 青光眼: 所有病人: 统计量 统计量 统计量 数据个数 61 数据个数 61 数据个数 61

64 63 530 总和 总和 总和

4 16 最大值 3 最大值 最大值 1 8.7 平均值 1 平均值 平均值

假设检验 假设检验 假设检验

服从泊松分服从泊松分服从泊松分

零假设 布 零假设 布 零假设 布

3 7 自由度 2 自由度 自由度

卡方统计

1 5.1 量 卡方统计量 4 卡方统计量 1 0 0.6 p值 p值 p值

显著性水

0.1 0.1 平 显著性水平 0.1 显著性水平

结果 接受零假设 结果 接受零假设 结果 接受零假设

通过P值得比较,可以得出该医院眼科门诊各类病人的到达均服从泊松分布。

根据指数分布及泊松分布的关系:如相继两个事件出现的间隔事件服从参数为λ的指数分布,则在单位时间间隔内事件出现的次数服从参数为λ的泊松分布,即在单位时间内该事件出现k次的概率为

(k=0,1,3, …)

视网膜疾病与外伤相关性检验:

WEIGHT OFF. CROSSTABS

/TABLES=视网膜疾病 BY 外伤 /FORMAT=AVALUE TABLES /STATISTICS=CHISQ /CELLS=COUNT EXPECTED /COUNT ROUND CELL.

交叉表

[数据集1]

案例处理摘要 案例 N 视网膜疾病 * 外伤 有效的 百分比 61 100.0% N 缺失 百分比 0 .0% N 合计 百分比 61 100.0% 视网膜疾病* 外伤 交叉制表 视网膜疾病 0 计数 期望的计数 1 计数 期望的计数 2 计数 期望的计数 3 计数 期望的计数 4 计数 期望的计数 5 计数 期望的计数 6 计数 期望的计数 7 计数 期望的计数 外伤 0 1 .7 3 5.5 4 3.8 3 3.8 5 3.1 3 3.4 1 .3 1 .3 1 0 .7 8 5.2 3 3.6 4 3.6 1 3.0 4 3.3 0 .3 0 .3 2 1 .5 4 4.2 3 2.9 2 2.9 3 2.4 3 2.6 0 .3 0 .3 3 0 .1 1 1.0 1 .7 2 .7 0 .6 0 .7 0 .1 0 .1 合计 2 2.0 16 16.0 11 11.0 11 11.0 9 9.0 10 10.0 1 1.0 1 1.0 合计 计数 期望的计数

21 21.0 20 20.0 16 16.0 4 4.0 61 61.0

卡方检验

Pearson 卡方 似然比

线性和线性组合 有效案例中的 N

渐进 Sig. (双

值 14.884 16.823 1.631 61 a

df

21 21 1 侧)

.829 .722 .202

a. 30 单元格(93.8%) 的期望计数少于 5。最小期望计数为 .07。

卡方值为14.884和sig值为0.829大于0.05,说明视网膜疾病与外伤相关不显著

总结

卡方检验是一种非参数检验,非参数统计是一种在不了解总体分布及全部参数的情况下的一种统计方法。这种方法的优点有:

1. 不受总体分布的限制,适用范围广。 2. 适宜定量模糊的变量和等级变量。

3. 方法简便 缺点:

当测量的数据能够满足参数统计的所有假设时,非参数检验方法的效果就远不如参数检验方法,由于当数据满足假设条件时,参数检验方法能够从其中广泛的充分的提取有关信息。非参数统计方法对数据的限制较为宽松,只能从其中提取一般的信息。

合计 计数 期望的计数

21 21.0 20 20.0 16 16.0 4 4.0 61 61.0

卡方检验

Pearson 卡方 似然比

线性和线性组合 有效案例中的 N

渐进 Sig. (双

值 14.884 16.823 1.631 61 a

df

21 21 1 侧)

.829 .722 .202

a. 30 单元格(93.8%) 的期望计数少于 5。最小期望计数为 .07。

卡方值为14.884和sig值为0.829大于0.05,说明视网膜疾病与外伤相关不显著

总结

卡方检验是一种非参数检验,非参数统计是一种在不了解总体分布及全部参数的情况下的一种统计方法。这种方法的优点有:

1. 不受总体分布的限制,适用范围广。 2. 适宜定量模糊的变量和等级变量。

3. 方法简便 缺点:

当测量的数据能够满足参数统计的所有假设时,非参数检验方法的效果就远不如参数检验方法,由于当数据满足假设条件时,参数检验方法能够从其中广泛的充分的提取有关信息。非参数统计方法对数据的限制较为宽松,只能从其中提取一般的信息。

本文来源:https://www.bwwdw.com/article/l7jd.html

Top