统计学本科毕业论文2改 - 基于spss的多元回归分析模型选取的应用殷婷 - 图文

更新时间:2023-10-27 19:53:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

毕 业 论 文

题 目 基于SPSS的多元回归分析模型选取的应用

院 (系) 数学与统计学院 专业年级 2010级统计学专业 学生姓名 殷婷 学号 2010101217 指导教师 安军 职称 副教授 日 期 2014-5-10

基于SPSS的多元回归分析模型选取的应用

数学与统计学院 2010级统计专业2班 殷婷 学号:2010101217

指导老师 安军

摘 要

本文不仅对于复杂的统计计算通过常用的计算机应用软件SPSS来实现,同时通过对两组数据的实证分析,来研究统计学中多元回归分析中的变量选取,让大家对统计学中的多元回归分析中模型的选取以及变量的选取和操作方法有更深层次的了解. 一组数据是对于淘宝交易额的未来发展趋势的研究,一组数据时对于我国财政收入的研究. 本文通过两个实证即淘宝交易额研究和财政收入研究从不同程度上对非线性回归模型和变量选取的研究运用通俗的语言和浅显的描述将SPSS在多元回归分析中的统计分析方法呈现在大家面前,让大家对多元回归分析以及SPSS软件都可以有更深一步的了解. 通过SPSS软件对数据进行分析,对数据进行处理的方法进行总结,找出SPSS对于数据处理和分析的优缺点,最后得在对变量的选取和软件的操作提出建议.

关键词:统计学,SPSS,变量选取,多元回归分析

Abstract

This article not only for complex statistical calculations done by the commonly used computer application software of SPSS, through the empirical analysis of the two groups of data at the same time, to study the statistics of the variables in the multivariate regression analysis, let everybody in the multiple regression analysis of statistical model selection as well as the selection of variables and operation methods have a deeper understanding. Is a set of data for the future development trend of research taobao transactions, a set of data for the research of our country's fiscal revenue. In this paper, through two empirical taobao transactions and fiscal revenue research from different degree of the study of nonlinear regression model and variable selection using a common language and plain the SPSS statistical analysis method in multiple regression analysis of present in front of everyone, let everyone to multiple regression analysis and SPSS software can have a deeper understanding. Through SPSS software to analyze data, and summarizes method of data processing, find out the advantages and disadvantages of SPSS for data processing and analysis, finally had to put forward the proposal to the operation of the selection of variables and software.

Keywords: Statistical, SPSS, The selection of variables, multiple regression analysis

第1页(共30页)

目 录

第一章 引 言 ................................................................................................................ 3 第二章 多元回归模型的选取 ...................................................................................... 4 2.1 多元回归分析概述 ............................................................................................ 4 2.2 相关系数概述 .................................................................................................... 5 2.3 非线性回归模型概述 ........................................................................................ 5 2.4 多元线性回归模型自变量的选取 .................................................................... 6 第三章 非线性回归模型案例:淘宝交易额模型的研究 .................... 7 3.1 回归模型变量的确定 ........................................................................................ 7 3.1.1 数据来源 ................................................................................................... 7 3.1.2 复相关系数 ............................................................................................... 8 3.1.3 散点图看线性关系 ................................................................................... 9 3.1.4 回归分析看拟合度 ................................................................................. 11 3.1.5 确定回归模型变量 ................................................................................. 11 3.2 调整后的变量的相关分析 .............................................................................. 12 3.2.1 散点图 ..................................................................................................... 12 3.2.2 计算相关系数 ......................................................................................... 14 3.3 多元线性回归分析 .......................................................................................... 16 3.4 小 结 ................................................................................................................ 18 第四章 线性回归分析变量选取案例:财政收入模型的研究 ............... 18 4.1 数据来源及变量选取 ...................................................................................... 18 4.2 相关分析 .......................................................................................................... 20 4.2.1 散点图 ..................................................................................................... 20 4.2.2 计算相关系数 ......................................................................................... 21 4.3 线性回归分析 .................................................................................................. 24 4.4 逐步回归 .......................................................................................................... 26 4.5 小 结 ................................................................................................................ 27 第五章 总 结 ...................................................... 28 参考文献 .......................................................... 30

第2页(共30页)

第一章 引 言

随着社会的发展,统计的运用范围越来越广泛,统计学作为高等院校经济类专业和工商管理类专业的核心课程,不管是在经济管理领域,或是在军事、医学等领域的研究中对于数量分析与统计分析都需要更高的要求,需要用到的数学知识较多,应用方面的灵活性也较强,计算量大且复杂.然而科学研究的深入,研究的对象也日益变得复杂,复杂系统的研究问题更是成为当今研究的热点. 为了更好的描述一个复杂的现象,就需要大量的数据和信息,如何高效、准确地利用已知的信息便成为当今社会研究的一项重要课题.

在科学技术飞速发展的今天,统计学通过不断吸收和融合相关学科的新理论,开发应用新技术和新方法,拓展新的领域的同时不断深化和丰富了统计学传统领域的理论与方法. 在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求. 随着我国社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘. 从20世纪60年代开始,关于回归自变量的选择成为统计学中研究的热点问题,统计学家提出了许多回归选元的准则,并提出了许多行之有效的选元方法. 在应用回归分析去处理实际问题时,回归自变量选择是首先要解决的重要问题. 通常在做回归分析时,人们根据所研究问题的目的,结合经济理论罗列出对因变量可能有影响的的一些因素作为自变量引进回归模型,把一些对因变量影响很小的,有些甚至是没有影响的自变量,不但使得计算量变大,估计和预测的精度也下降了. 此外,如果遗漏了某些重要变量,回归方程的效果肯定不好. SPSS软件作为当今国际上运用广泛的统计分析软件,其功能齐全带有各种特点,在各个领域内都得到了迅速普及,并成为各个行业提高管理水平、形成科学决策的重要手段. 然而,我国对于该软件的运用和理解始终处于早期应用阶段,无论是在功能的研究开发还是实际生活当中的运用都与西方发达国家相差甚远. 尤其是在管理决策方面,都因为没有进行深度分析而造成了浪费,要么就是利用SPSS软件进行简单分析而未进行深度开发,导致所得的信息有限、各信息间的关系不明确,最终导致管理者的判断出现偏差.

基于以上背景,本文通过总结和吸取其他国内外学者对统计学研究的,并结合我国的实际情况,本文采用了案例一对于网络购物这块的的研究,通过对2005年到2012年的居民消费水平,以及我国网络普及度,我国人人均纯收入以及我国的居民消费水平对

第3页(共30页)

淘宝网的未来发展趋势进行非线性回归模型的研究以及案例二对于我国财政收入的进行变量选取研究,通过对1992年到2012年的人均国内生产总值,城镇居民家庭人均可支配收入,全社会固定投资,进出口总额,居民消费价格水平对我国财政收入的影响进行定量数据的研究. 通过对数据的选取,回归模型的确定以及软件的操作方法来告知读者如何在SPSS的操作中变量选取的原则、要求和方法.

第二章 多元回归模型的选取

2.1 多元回归分析概述

回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法(即寻找具有相关关系的变量减的数学表达式并进行统计推断的一种统计方法). 按照其所涉及的自变量,可分为一元回归分析和多元回归分析;线性回归分析和非线性回归分析是按照自变量和因变量之间的关系划分的.

而本文运用了多元线性回归分析中的方法,多元线性回归分析就是指回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系. 多元回归分析的主要内容有以下几点:

(1)从一组数据出发,确定某些变量之间的定量关系式,即建立数学模型并估计其中的未知参数. 估计参数的常用方法是最小二乘法;

(2)对这些关系式的可信程度进行检验;

(3)在许多自变量共同影响着一个因变量的关系中,判断哪些自变量的影响是显著的,哪些自变量的影响是不显著的,将影响显著的自变量选入模型中,而剔除影响不显著的变量,通常用逐步回归等方法;

(4)利用所求的关系式对某一生产过程进行预测或控制.

回归分析研究的主要问题是确定Y与X间的定量关系表达式,这种表达式称为回归方程;对求得的回归方程的可信度进行检验;判断自变量X对因变量Y有无影响;利用所求得的回归方程进行预测和控制. 回归分析主要应用于研究两个变量之间到底是哪个变量受哪个变量的影响,影响程度如何,通过分析现象之间相关的具体形式,确定其因果关系,并用数学模型来表现其具体关系,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测数据;如果能够很好的拟合,则可以根据自变量作进一步预测.

第4页(共30页)

参考文献

[1]魏和清,罗良清.实用统计学[M]. 北京:中国财政经济出版社,2011. [2]符啟勋.实用统计学[M]. 北京:国防工业出版社,2008. [3]王正朋.实用统计学[M].北京:中国财政经济出版社,2008.

[4]薛薇.基于SPSS的数据分析[M].北京:对外经济贸易大学出版社,2007. [5]冯力.统计学实验[M].大连:东北财经大学出版社,2012. [6]陈珍珍.统计学[M].厦门:厦门大学出版社,2006. [7]阮桂海.SPSS实用教程[M].北京:北京大学出版社,1999.

[8]阮桂海.数据统计与分析-SPSS应用教程[M].北京:北京大学出版社,2005. [9]何晓群.现代统计分析方法与应用[M].北京:中国人民大学出版社,2012. [10]张海瑜.SPSS软件在管理决策方面的应用扩展[M].北京:北京化工大学,2011. [11]余建英.数据统计分析与SPSS应用[M].北京:人民邮电出版社,2004. [12]薛微.基于SPSS的数据分析[M].北京:中国人民大学出版社,2006. [13]吴世军.SPSS在数据分析中的应用[J].统计与决策,2(9),2006,1-3. [14]朱建平,殷瑞飞.SPSS在统计分析中的应用[M].北京:清华大学出版社,2007. [15]詹世煌,方世荣.统计学导论[M].台北:晓园出版社,1995. [16]许飞琼,曾玉平.统计学[M].北京:中国统计出版社,1995.

[17]汪浩瀚,丁元耀.应用统计学[M].北京:中国人民大学出版社,1993. [18] 何晓群.多元统计学[M].北京:中国人民大学出版社,2010. [19]茆诗松.概率论与数理统计[M].北京:中国统计出版社,1999.

[20]毛炳寰.用Excel和SPSS学习统计学[M].北京:中国财政经济出版社,2005. [21]王玉荣.统计数据分析软件教程[M].北京:对外经济贸易大学出版社,2007. [22]薛薇.基于SPSS的数据分析[M].北京:中国人民大学出版社,2007. [23]肖智.应用统计学实验[M].重庆:重庆大学出版社,2007. [24]李纬铮.应用统计学[M].北京:高等教育出版社,1989. [25]胡健颖,冯泰.实用统计学[M].北京:北京大学出版社,1995. [26]汤银才.R语言与统计分析[M].北京:高等教育出版社,2008.

第30页(共30页)

本文来源:https://www.bwwdw.com/article/jcq2.html

Top