SPSS数据分析教程-4_概率论初步
更新时间:2023-05-29 15:10:01 阅读量: 实用文档 文档下载
SPSS数据分析教程
—《SPSS数据分析教程》
第4章 概率论初步
目录
4.1 离散型随机变量的仿真
4.1.1 均匀分布的随机数 4.1.2 正态分布的随机数 4.2.1 二项分布的分布函数和概率 4.2.2 连续分布的随机变量—正态分布
4.2 理论分布
4.3 经验分布 4.4 抽样分布 4.5 置信区间
本章学习目标
用仿真方法从总体中抽取随机样本:生成服从 某种分布的随机数; 得到观测值的理论分布、经验分布; 理解抽样分布的形状; 掌握如何求置信区间; 学习如何从数据集中选择符合条件的个案。
4.1 离散型随机变量的仿真
4.1.1 均匀分布的随机数
假设我们有一个正方形,它被均 匀的分为4个相同大小的小正方形。 现在从正方形的中心上方随机地 投掷一颗玉米粒1 000次,假设每 次投掷的玉米粒都等可能的落在4 个小正方形中的一个之中。 问题是:落在1号、2号、3号和4 号正方形中的情况如何呢?
1
2
4
3
模拟投掷的过程 (1)
第1步:设置随机数种子 选择【转换】→【随机数字生成器】,勾选 “设置起点”,并在“固定值”下的“值”中 输入一个用户给定的数值。 第2步:生成均匀分布的随机数,等可能的产生 1,2,3和4这四个数共计1 000个. 选择【转换】→【计算变量】,在“目标变量” 框中输入变量名 “Spinn”,在“数字表达式” 框中输入TRUNC(RV.UNIFORM(1,5)),然后单击 【确定】按钮.
模拟投掷的过程 (2)
第3步:然后分析这四个数出现的次数和相对 频率。 选择【分析】→【描述统计】→【频率】
随机数分析(1)
Spinn 频 1.00 2.00 有效 3.00 4.00 合计 237 259 264 240 1 000 率 百 分 比 23.7 25.9 26.4 24.0 100.0 有效百分比 23.7 25.9 26.4 24.0 100.0 累积百分比 23.7 49.6 76.0 100.0
随机数分析(2)
4.1.2 正态分布的随机数
正态分布的随机变量是连续型随机变量, 它的可能取值是所有实数。数据分析的许 多模型和理论都要求数据服从正态分布, 因此正态分布的随机数在模拟中有广泛的 应用。
一、生成正态分布的随机数
第1步:设置随机数种子为123456 第2步:选择【转换】→【计算变量】, 应用 函数RV.Normal(0,1)。
SET SEED=123456. COMPUTE Rnorm01= RV.NORM(0,1). SAVE OUTFILE='D:\SPSSIntro\data\Sim_norm.sav' /COMPRESSED. EXECUTE
生成随机数示意图
二、分析这些正态随机数的性质
绘制随机数的序列图,有几种方法
方法1:选择【图形】→【图表构建程序】,选择“条” 方法2:选择【分析】→【预测】→【序列图】 方法3:选择【图形】→【旧对话框】→【线图】
该样本数据的确是从正态分布的总体 中随机抽
取的呢?
绘制随机数的带有正态 曲线的直方图
4.2 理 论 分 布
除4.1中的均匀分布和正态分布外,常见的分 布还有二项分布、负二项分布、泊松分布、指 数分布、t分布等。SPSS软件中提供了这些常 见分布的分布函数、概率分布函数和概率密度 函数。 SPSS的PDF与非中心PDF函数族提供了相关分布 的概率分布函数或者概率密度函数,CDF与非 中心CDF函数族提供了相关分布的累积概率分 布函数(或简称分布函数)。而逆DF函数族则 给出了相应分布的分位数。
4.2.1 二项分布的分布函数和概率
如果随机试验只有两个可能的结果,设该试验 中成功的概率为p。如果将该试验独立地重复 进行次n次,这一串重复的独立试验称为重n贝 努力试验。如果用X表示在这次试验中成功的 次数,则随机变量X服从二项分布,其分布函 数为 n i P( X i ) p (1 p )n i , i 0,1, 2,..., n i
CDF.BINOM(x,10,0.25),该函数用于计算出x 所对应的累计概率,即:P( X ≤ x)
i 0
x
n i n i p (1 p ) i
(1)
这里[x]表示不大于的最大整数。。 PDF.BINOM(x,10,0.25)计算而X取某个特定值i 的概率为: n i n i (2) P( X i ) p (1 p ) i
由上面(1)式计算出的为分布函数的值;如 果是离散随机变量,(2)式给出的为概率值, 它是随机变量X取各个离散值0,1,2,…,10 的概率 。 函数CDF.BINOM(x,10,0.25)用于计算n=10, p=0.25的二项分布下x的分布函数值或者称为 累计概率。
二项分布的概率分布图
正在阅读:
SPSS数据分析教程-4_概率论初步05-29
2019八年级道德与法治上册第三单元第5课我与集体共发展第1框集体是个人成长的乐园教案01-05
难忘我的2017作文700字07-14
我心目中的好老师作文大全06-12
2016年广东公务员面试课程02-08
2017年省质检理综生物试题及参考答案03-25
我心目中的好老师小学作文06-15
温馨的瞬间作文500字02-04
怎样判断钻石的切工好坏?02-27
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 概率论
- 数据分析
- 初步
- 教程
- SPSS
- 农村初中九年级班主任工作计划20110906
- 火力发电厂施工组织大纲设计规定(试行)
- ==镇2012年防灾减灾工作汇报
- MongoDB_Architecture_Guide
- 大工11春《大学英语2(开放英语2)》在线作业3
- 2陆地生活的动物1
- 教师招聘《中学教育心理学》通关试题每日练卷6899
- 122例尿路感染临床特征分析
- Web课程表 使用说明
- MX232_V01主板使用说明书20140424
- 高二生物学业水平测试复习
- 设计院的CAD制图标准
- 七年级地理 上学期期中试题(无答案) 人教新课标版
- C++课程设计公司工资管理系统说明书
- 经济政治与社会1、2单元带答案
- 高三大纲版化学配套月考试题1B
- 办公用品领用制度
- 0数字信号处理绪论
- 小区道路景观绿化施工方案精编
- 北京国资委:首钢北京主流程年底停产