2022年高中数学第一章统计案例1.1回归分析的基本思想及初步应用
更新时间:2023-04-10 20:17:01 阅读量: 实用文档 文档下载
实用文档 2021年高中数学第一章统计案例1.1回归分析的基本思想及初步应用知识点精析新人
教A 版选修
一.知识要点,学习目标
1.如果一组具有相关关系的数据1122(,),(,),,(,),n n x y x y x y 作出散点图大致分布在一条直线附近,那么我们称这样的变量之间的关系为线性相关关系(也称一元线性相关),这条直线就是回归直线,记为.
2.在所求回归直线方程中,当取时,与实际收集到的数据之间的偏差为,偏差的平方为22()[()]i i i i y y y bx a -=-+
即以 来刻画出个点与回归直线在整体上偏差的平方和,显然Q 取最小值时的的值就是我们所求的。
应注意,这个最小距离不是通常所指的各数据的点到直线的距离,而是各数据点沿平行y 轴方向到直线的距离. 121()()()n i i i n i
i x x y y b x x ==--=-∑∑1221n
i i
i n i i x y nx y x nx ==-=-∑∑
这就是我们所要求的公式(无特殊要求时以此公式求回归方程中的、).
其中为样本数据,为样本平均数,称为样本点中心,且所求线性回归直线经过样本点中心点(如图2所示).
当回归直线斜率时,为线性正相关,时为线性负相关.
线性回归分析:
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.前面我们给出了线性回归方程,这里我们主要结合教材分析一元线性回归问题.
1.以散点图分析线性相关关系,散点图是较粗略地分析和判断两个具有相关关系的变量是否线性相关的问题,如果是线性相关的,我们可以求其线性回归方程,如果不是线性向相关的,即使求得线性回归方程,也是无效的;也就是说不能对一些数据进行分析判断,不能应用它解决和解释一些实际问题.
实用文档 2.以相关系数分析线性相关关系的强弱
两个变量之间的相关关系的样本相关系数:
()()n
i i
x x y y r --=∑可衡量是否线性相关,以及线性相性关系的强弱.由于分子与线性回归方程中的斜率的分子一样(这也给出了公式的内在联系以及公式的记法),因此,当时,两个变量正相关;当时两个变量负相关.当的绝对值接近1,表明两个变量的线性相关性很强;当的绝对值接近0,表明两个变量之间几乎不存在线性相关关系.规定当时,我们认为两个变量有很强的线性相关关系.
3.解释变量与随机误差对预报精度的影响以及残差分析
(1)有关概念
由于样本数据点与一元线性回归方程上的点还有一定的差距,这说明了另外的一个因素随机误差的影响.于是有线性回归模型其中和为模型的未知参数;称为解释变量,称为预报变量;是与之间的误差,叫随机误差。随机误差的估计值为:
称为相应于样本点的残差(如图3).
(2)通过残差分析判断模型拟合效果
由计算出残差,,…,,然后选取横坐标为编号、或解释变量或预报变量,纵坐标为残差作出残差图.通过图形分析,如果样本点的残差较大,就要分析样本数据的采集是否有错误;另一方面,可以通过残差点分布的水平带状区域的宽窄(如教材图1.1-5),说明模型拟合效果,反映回归方程的预报精度.
4.相关指数反应模型的拟合效果
2
2121()1()n i i i n i
i y y R y y ==-=--∑∑=22112
1()()()n n i i i i i n i i y y y y y y ===----∑∑∑ (1)变量剖析理解:
总偏差平方和,表示解释变量和随机误差产生的总的效应;
残差平方和,表示了随机误差效应;
其差 2
211()()n n i i i
i i y y y y ==---∑∑,表示了解释变量效应.
(2)模型拟合效果
①残差平方和占总偏差平方和的百分比
2
1
2
1
()
()
n
i i
i
n
i
i
y y
y y
=
=
-
-
∑
∑
,反映了随机误差对预报变量(总效应)的贡献率,
显然这个数值越大,模型的拟合效果越差.
②解释变量效应占总偏差平方和的百分比
2
21
2
1
()
1
()
n
i i
i
n
i
i
y y
R
y y
=
=
-
=-
-
∑
∑
反映了解释变量对预报变量(总效应)的贡
献率;因此,越接近1(即
2
1
2
1
()
()
n
i i
i
n
i
i
y y
y y
=
=
-
-
∑
∑
越接近0),表示回归的效果越好,即解释变量和预报变量的线性
相关性越强.
四.非线性回归的问题转化为线性回归问题
(1)作散点图确定曲线模型
根据收集的数据作散点图(如图4),可见两个变量不呈线性相关关系.而是分布在某一条指数函数曲线的周围,也可以认为样本点集中在某二次曲线的附近.
(2)非线性转化为线性
这时通过对数变换把指数关系变为线性关系;通过换元把二次函数关系变换为线性关系.在这两种情况下就可以利用线性回归模型,建立和之间的非线性回归方程了.
(3)比较两种模型的拟合效果
对于给定的样本点ⅰ可以通过转换后的对应数表作散点图来确定线性回归的拟合情况,判断选用哪一种曲线模型较为合适;ⅱ可以通过原始数据及和之间的非线性回归方程列出残差对比分析表,一般通过残差平方和比较两种模型的拟合效果,显然残差平方和较小的拟合效果较好;ⅲ还可以用来比较两个模型的拟合效果,越大(越接近1),拟合效果越好。
实用文档
正在阅读:
2022年高中数学第一章统计案例1.1回归分析的基本思想及初步应用04-10
2005-2022年湖南省高考语文真题作文解析一览表04-10
珠江三角洲环境保护规划纲要2004-2020年实施方案10-09
日本不断挑衅中国源于三大战略误判08-10
助学金申请书格式03-31
班主任技能大赛情景答辩题目06-06
房地产公司所有岗位说明书 - 图文05-23
2020年学校“停课不停学”线上教学活动工作情况汇报09-12
县文化体育和旅游局最新工作总结及2022年工作规划04-10
生产部物料员岗位职责说明书05-27
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 初步
- 回归
- 案例
- 高中
- 思想
- 统计
- 数学
- 基本
- 应用
- 分析
- 2022
- 1.1
- unit-1-3---原文+翻译-汇总
- 七年级英语上册Unit4FoodandRestaurants复习导学案无答案新版冀
- 申请书-大学生助学金申请书1000字
- 2022年北京语言大学中国古代文学820中国古代文学史之中国文学史
- (完整版)带拼音_增广贤文
- 论中国化马克思主义的实践精神及其当代自觉-最新年文档
- 2008届全国百套高考数学模拟试题分类汇编-立体几何解答题b
- 2005-2022年湖南省高考语文真题作文解析一览表
- 2022年华中科技大学经济学院431金融学综合之公司理财
- 2022执业药师继续教育全部15学分
- 南京市国有资产投资管理控股(集团)有限 责任公司2011年度第一期
- 大学生社会调查报告标准范本
- 外包服务项目招标评分细则
- 冷冻干燥工艺流程及其应用.doc
- 中国建设银行员工绩效管理办法 精讲
- 2022年黑龙江大学003现代外国哲学复试实战预测五套卷
- 北京市师大附中七年级数学下学期期末考试试题(无答案).doc
- 口腔诊所卫生管理标准操作流程
- 监理工程师继续教育考试试题港口与航道专业及答案
- 幼儿园大班社会教案:安全教育我知道