数量分析方法复习
更新时间:2024-01-20 19:19:01 阅读量: 教育文库 文档下载
数量分析方法复习材料
第一部分:安装stata13.0以及界面优化设置的步骤,该步骤是为达到理想工作的友好界面。
一、Stata13.0MP 32位/64位破解版安装 安装步骤:
1.解压缩,压缩包内有三个文件,分别是“Stata13_setup.msi”——安装程序,“Crack”——破解补丁目录,“破解说明”。
2.点击Stata13_setup.msi,根据windows操作系统,自行选择32/64位MP版,静静等待安装完成。
3.把“Crack”文件夹中的Stata.lic和StataMP.exe(或StataMP-64.exe)复制粘贴到安装目录。运行程序,关键的一步是去掉自动在线注册的勾选项。 注意:
1.Stata13应当安装在D盘或E盘的根目录下,绝不能安装在C盘。
2.安装好的Stata13文件夹下只能有12个文件以及一个名为profile的do文件(在第三
1 / 12
步设置中出现)。
3.要创建一个Stata13的快捷方式在桌面,便于操作。
二、界面优化
1.改变stata13界面排版
Edit --- Preferences --- Load Preference Set --- Presentation(1024*768) 2.设置结果窗口界面颜色
Edit --- Preferences --- General preferences --- Result colors --- classic 3.改变结果窗口界面字体大小 在结果窗口右键 --- Font --- 大小
4.保存设置,使得再次打开stata13时显示为该设置,保存名自行设置 Edit --- Preferences --- Save Preferences --- New Preferences Set--- 自行命名 5.文件关联,关联“.dta”,“.do”,“.gph”,“.smcl”。 Edit --- Preferences --- Reset File Associations --- 是 6.编辑do文件时,改变其窗口字体大小 在命令窗口输入doedit,打开do文件编辑器 Edit --- Preferences --- Editor Font ---Size
三、基本文件及工作日志设置
1.在Stata13文件夹下的ado文件夹内,创建名为personal、 plus 的文件夹 方法一:手动右键新建文件夹
方法二:在stata13 command 命令窗口内输入如下命令: mkdir d:\\stata13\\ado\\plus
2 / 12
mkdir d:\\stata13\\ado\\personal
2.在personal文件下创建command.log和stata.log两个日志文件,使得运行的命令及结果都存在这两个text文件内。
方法:在stata13目录下创建profile.do文件。 (1)在命令窗口内输入doedit,打开do文件编辑器。
(2)输入代码并保存,保存位置为d:\\stata13,文件名为profile,文件类型为Do Files(*.do)。 代码如下: cap prog drop profile prog profile
cap log close cap cmdlog close
log using d:\\stata13\\ado\\personal\\stata.log, text replace cmdlog using d:\\stata13\\ado\\personal\\command.log, append sysdir set PERSONAL d:\\stata13\\ado\\personal sysdir set PLUS d:\\stata13\\ado\\plus sysdir set OLDPLACE d:\\stata13\\data
end profile 说明:
1.replace,替换,指每一次打开都用新文件覆盖上一次的文件,即stata.log的内容如果
3 / 12
需要保存,应当在工作完成后将其移至其他文件夹。
2.append,叠加,指在旧文件的基础上继续添加新文件,即command.log的内容包含了全部已输入的命令。
3.设置完成后,打开Stata,在结果窗口的下方应当显示log on(text)及cmdlog on。
第二部分:结合“Stata特性”、“本课程的学习体会”谈一谈MPAcc/MV学生如何应用Stata13.0成就一篇较高水平的硕士学位论文。 Stata的八个特性: 1.互动性—— 2.高效性——数据处理 3.直观性——画图 4.便捷性——制表 5.先进性——统计分析
6.一体性——统计程序、数据管理与制图浑然一体 7.创造性——编程
8.开放性——参与开发do文件、ado文件 ols.ado; ols.hlp;ols.sthlp 学习体会:学会stata,就拥有了全世界。
4 / 12
第三部分:Do文件英汉互译——sunny cap prog drop sunny
//捕获内存中的sunny程序,有则清除(_all是系统宏,指全部程序,如果输入“cap prog drop _all”,会将全部程序从内存中清除)。 prog sunny
// sunny程序的起始语句,与end对应 set more off //result窗口翻屏至最后一页
cap mkdir f:\\haihan
//在F盘的根目录下产生名为haihan的文件夹,前面加cap,可选择性执行——没有就创建,有则忽略
cd f:\\haihan
//设定当前工作路径为f:\\haihan
sysuse auto, clear
//调用系统自带的数据集audo.dta,如果是外部数据,例如mv.dta,则应当输入“use mv.dta”;“clear”是清除已经被占用的内存。
tabstat price-foreign, stats(N min mean median max) column(statistics) format(%9.2g)
//以简表的形式描述auto.dta中从price到foreign的所有数值型变量的统计结果,同时要求变量名在第一列。tabstat只能报告数值型,字符型会报错;stats(N min mean median max):N-样本量,min-最小值,mean-均值,median-中位数(与p50相同),max-最大值;column(statistics):变量名在第一列显示;format是对统计结果的格式进行设置,%9.2g代表最长9位,小数点后保留2位。
5 / 12
spearman price weight length foreign,stats(rho p) star(0.05) sidak pw
//显示变量“price weight length foreign”的spearman等级相关系数与显著性水平。stats(rho p)是spearman的语法,表示提供相关系数与对应的显著性水平P值;star(0.05)是对相关系数显著性水平在5%及以下的结果加星号;Sidak是使用Sidak调整方法计算显著性水平; pw使用所有可用数据计算配对相关系数。
winsor2 price weight length, suffix(_win) cuts(1 99)
//对“price weight length”三个变量使用winsor2进行缩尾,缩尾后产生新变量,变量名为原变量加后缀“_win”,缩尾区间为1%——99%。winsorize:缩尾;suffix:后缀;cuts(1 99)缩尾区间1%——99%,默认值同样为1%——99%。
reg price_win weight_win length_win foreign, nocons beta robust
//对缩尾后的数据使用无截距模型进行稳健回归分析,并报告标准化回归系数。noncons:使用无截距模型;beta:提供标准化回归系数;robust:稳健估计,消除残差影响。
estimates store ols
//存储ols回归结果
estimates table ols, stats (r2 r2_a N F) b(%7.2f) star(0.10 0.05 0.01) title(\汽车价格模
型的ols回归结果\
//列表报告ols回归结果,标题为“汽车价格模型的ols回归结果”,报告指包括r2,调整后的r2,样本量以及F指。stats (r2 r2_a N F):报告r2,调整后的r2,样本量,F值(F值的意义是用来检验样本的结果能够代表总体的真实程度);b(%7.2f):报告结果格式,最长7位,小数点后保留2位;star(0.10 0.05 0.01):0.10——0.05之间加1星,0.05——0.01之间加2星,0.01以下加3星;title(\汽车价格模型的ols回归结果\:设置标题。
vif, uncentered //vif 检验,方差膨胀系数,去中心化,因为14条nocons 是无
截距模型,vif不能超过8.0
6 / 12
end
//程序结束,与之前的“prog sunny”对应。 sunny
//执行sunny.do。
第四部分:Do文件英汉互译——group cap prog drop group
//捕获内存中的group程序,有则清除。 prog group
// group程序的起始语句,与end对应 set more off //翻屏至最后一页 sysuse auto, clear
//调用系统自带的数据集audo.dta并清除已被占用的内存。 bys foreign: reg price weight length, robust
//按照变量foreign分组排序,进行稳健回归分析,被解释变量为price(价格),解释变量为weight(重量) length(长度)。 quietly sum price, detail
//后台运行,对变量price进行详细的描述统计 return list //显示统计结果
g group1 = price > r(mean)
7 / 12
//产生虚拟变量,变量名为group1,当价格大于均值时,变量值为1;否则为0。 g group2 = price > r(p50)
//产生虚拟变量,变量名为group2,当价格大于中位数时,变量值为1;否则为0。 bys group1: reg price weight length foreign, robust beta level(90)
//按照变量group1分组排序,进行稳健回归分析,被解释变量为price,解释变量为weight length foreign,并显示标准化回归系数,置信区间为90,默认值为95。 bys group2: reg price weight length foreign, robust
//按照变量group2分组排序,进行稳健回归分析,被解释变量为price,解释变量为weight length foreign。
label values group2 group2lbl //对group2做标签,命名为group2lbl
label define group2lbl 0 \低于价格中位数\高于价格中位数\
//定义group2lbl并赋值,当其为0时,赋值“低于价格中位数”,当其为1时,赋值“高于价格中位数”。
bys group2: reg price weight length foreign
//按照变量group2分组排序,进行回归分析,被解释变量为price,解释变量为weight length foreign。注:此条命令没有robust,未消除残差影响。 pctile pct_price = price, nq(3) genp(pctx)
//依据变量price生成三分位变量pct_price,并将pct_price中的值对应的百分比保存在新变量pctx中。pctile:生成百分位变量;nq(3):该变量为三分位数;genp(pctx):在新变量pctx中显示产生的分位数的百分比。 xtile priceq = price, nq(3)
//将变量price按照分位数分成三组,生成新变量priceq。
8 / 12
table foreign priceq, c(mean mpg) format(%5.2f)
//以变量foreign为行、变量priceq为列生成交互式列联表,在单元格中显示均值、mpg的统计结果,数据格式为浮点型,最长五位,小数点后保留两位。 bys priceq: reg price weight length foreign,robust
//按照变量priceq分组排序,进行稳健回归分析,被解释变量为price,解释变量为weight length foreign。
bys priceq: reg price weight length foreign,robust,nocons
//按照变量priceq分组排序,使用无截距模型进行稳健回归分析,被解释变量为price,解释变量为weight length foreign。 end
//程序结束,与之前的“prog group”对应。 group
//执行group.do。
9 / 12
第五部分:Do文件英汉互译——饼图
import excel wlh1009, sheet(\
//调入名为wlh1009的excel文件中的Sheet1表,第一行忽略。 sort stkcd date
//按照变量stkcd和date顺序排列。 save d2, replace
//将排列后的数据保存为d2.dta,如果d2已存在,则替换之。 import excel code, sheet(\
//调入名为code的excel文件中的Sheet1表,第一行忽略。 sort stkcd
//按照变量stkcd排序。 merge 1:m stkcd using d2
//将已保存的d2表与之前调入的表按照股票代码(stkcd)以1对多的形式合并。 g year = substr(date, 1 ,4)
//产生一个新变量,命名为year;该变量由\之后的函数提供结果;\:截取变量\字符串,从第1位开始,共截4位。 g code = substr(ind,1,cond(substr(ind , 1 , 1)==\
//产生一个新变量,命名为code;该变量由\之后的条件函数提供结果;\substr(ind,1,cond(substr(ind , 1 , 1)==\:截取变量\字符串,从第1位开始,如果第1位是”C”,截取2位,否则截取1位。 tab code //对code变量制表 drop if code == \
10 / 12
//删除变量code值为”I”的项目,I指金融业。 keep if _merge == 3 //保留” _merge”值为3的项目
list stkcd year fvvi ii op bor if stkcd == \
//列示stkcd(股票代码)值为000063的项目的stkcd year fvvi ii op bor值。
graph pie fvvi ii op bor if stkcd == \gap(20)) pie(3, color(blue)) legend(position(11) rows(4) ring(0))
//绘制股票代码为000063的项目的饼状图,该图包含fvvi(公允价值变动损益) ii(投资收益) op(营业利润) bor(营业外收入);pie(3, explode):第三块突出显示(按照顺序排列,即变量op突出显示);plabel(3 percent, gap(20)):为第三块添加百分比标签,标签距离圆心20个单位;pie(3, color(blue)):第三块颜色设为蓝色;legend(position(11) rows(4) ring(0)):在11点方向的空白处添加图例,图例格式设为4行显示。
graph pie fvvi ii op bor if stkcd == \percent, gap(20)) pie(3, color(blue)) legend(position(11) rows(4) ring(0))
//绘制股票代码为000063的项目2007年的饼状图,该图包含fvvi(公允价值变动损益) ii(投资收益) op(营业利润) bor(营业外收入);pie(3, explode):第三块突出显示(按照顺序排列,即变量op突出显示);plabel(3 percent, gap(20)):为第三块添加百分比标签,标签距离圆心20个单位;pie(3, color(blue)):第三块颜色设为蓝色;legend(position(11) rows(4) ring(0)):在11点方向的空白处添加图例,图例格式设为4行显示。
graph pie fvvi ii op bor if stkcd == \percent, gap(20)) pie(3, color(blue)) legend(position(11) rows(4) ring(0))
//绘制股票代码为000063的项目2014年的饼状图,该图包含fvvi(公允价值变动损益)
11 / 12
ii(投资收益) op(营业利润) bor(营业外收入);pie(3, explode):第三块突出显示(即变量op突出显示);plabel(3 percent, gap(20)):为第三块添加百分比标签,标签距离圆心20个单位;pie(3, color(blue)):第三块颜色设为蓝色;legend(position(11) rows(4) ring(0)):在11点方向的空白处添加图例,图例格式设为4行显示。 list stkcd year fvvi ii op bor if stkcd == \
//列示stkcd(股票代码)值为600881的项目的stkcd year fvvi ii op bor值。
graph pie fvvi ii op bor if stkcd == \gap(20)) pie(3, color(cranberry)) legend(rows(1)) by(year) angle0(0)
//绘制股票代码为600881的项目按年分类的饼状图,该图包含fvvi(公允价值变动损益) ii(投资收益) op(营业利润) bor(营业外收入);pie(3, explode):第三块突出显示(即变量op突出显示);plabel(3 percent, gap(20)):为第三块添加百分比标签,标签距离圆心20个单位;pie(3, color(blue)):第三块颜色设为蔓越橘色;legend(rows(1)):在默认位置(6点方向)的空白处添加图例,图例格式设为1行显示;by(year):按年分类;angle0(0):饼图的起始角度为0度。
graph pie op bor, pie(2, explode) plabel(2 percent, gap(20)) pie(2, color(gs13)) legend(rows(1)) by(code) angle0(0)
//绘制饼状图,该图包含op(营业利润) bor(营业外收入);pie(2, explode):第二块突出显示(即变量bor突出显示);plabel(2 percent, gap(20)):为第二块添加百分比标签,标签距离圆心20个单位;pie(2, color(gs13)):第二块颜色设为第13级灰色(浅灰色);legend(rows(1)):在默认位置(6点方向)的空白处添加图例,图例格式设为1行显示;by(code):按行业分类;angle0(0):饼图的起始角度为0度。
12 / 12
正在阅读:
数量分析方法复习01-20
面孔加工的认知神经科学研究:回顾与展望06-09
精细化学品习题B10-03
铸造二车间安全生产流动红旗活动细则11-19
钳工计算题库(含答案)09-30
北语网院17春《日本地理》作业_123407-08
河南农业大学成人函授2019招生简章(含专业学费)_ss03-08
毕设开题报告及开题报告分析04-07
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 复习
- 数量
- 方法
- 分析