统计学30556-统计思想综述题库答案

更新时间:2023-11-13 08:46:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

感谢在校统招的同学帮忙把绝大多数都做了,但可能还是落下了少数题目。如有高手能够补完,还请与其他同学分享。

卷1

一、

直方图:直观的给出原始数据(电池寿命)的分布情况

箱线图:直观的识别出原始数据(电池寿命)的异常值,并展示出分布的峰度和偏态。 二、

(1)方差分析中有三个基本的假定。

1、正态性:每个总体都应服从正态分布,即对于因子的每一个水平,其观测值是来自正态分布总体的简单随机样本; 2、方差齐性:各个总体的方差必须相同;

3、独立性:每个样本数据是来自因子各水平的独立样本。

(2)在上述3个假定中,对独立性的要求比较严格,若该假设得不到满足时,方差分析的结果往往会受到较大影响。而对正态性和方差齐性的要求相对比较宽松。 三、

(1)拒绝的结论是:该食品每袋的平均重量不是100克;不拒绝的结论是:样本提供的证据不能证明该食品每袋的平均重量不是100克。 (2)不能。样本得出的结论只能用于拒绝原假设,而不能证明原假设为真。

(3)结论:若该食品每袋的平均重量是100克,则得到的样本会像现在观测到的结果这样极端或者更极端的概率仅为0.03。解释P值:若给定显著性水平为0.05,则可以拒绝原假设,认为该食品每袋的平均重量不是100克;但若给定显著性水平为0.01,则不能拒绝原假设。 四、

(1)若将所有的自变量都引入回归模型,往往会导致所建立的模型不能进行有效的解释,也可能会导致多重共线性。

(2)变量筛选有向前选择、向后剔除、逐步回归等方法。特点如下。 向前选择:从没有自变量开始,不停向模型中增加自变量,直到增加不能导致SSE显著增加为止。

1

向后剔除:从所有自变量开始,不停从模型中剔除自变量,直到剔除不能导致SSE显著减小为止。

逐步回归:结合向前选择和向后剔除,从没有自变量开始,不停向模型中增加自变量,每增加一个自变量就对所有现有的自变量进行考察,若某个自变量对模型的贡献变得不显著就剔除之。如此反复,直到增加变量不能导致SSE显著减少为止。

五、

有季节性多元回归模型、时间序列分解法等方法。

季节性多元回归模型引入虚拟变量来表示季节,对于以季度记录的数据,引入3个虚拟变量Q1、Q2、Q3,其中Q1=1(第1季度)或0(其他季度),Q2=1(第2季度)或0(其他季度),Q3=1(第3季度)或0(其他季度),则季节性多元回归模型表示为:

其中b0是时间序列平均值,b1是去市场分的洗漱,表示趋势给时间序列带来的影响,b2、b3、b4表示每一季度与参照的第4季度的平均差值。

时间序列分解法分3步:

第一步,确定并分离季节成分。计算季节指数,确定时间序列中的季节成分。然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。

第二步,建立预测模型并进行预测。对消除了集结成分的时间序列建立适当的预测模型,饼干局这一模型进行预测。

第三步,计算出最后的预测值。用预测值乘以相应的季节之术,得到最终的预测值。

2

卷2

一、

平均数:用于表示统计对象的一般水平,常为算术平均数。

中位数:也可用于表示统计对象的一般情况,而且不受极值的影响。 方差:用于描述数据的离散程度,越大说明数据的分布越分散。 偏态系数:用于描述数据分布的不对称性。

峰度系数:用于描述数据分布的尖峰或平峰程度。 二、

t分布:描述样本均值分布,用于对两个样本均值差异进行显著性测试、估算置信区间等。

F分布:应用于方差分析、协方差分析和回归分析等,还可用于似然比检验。 三、

P值是当原假设为真时,得到的样本会像现在观测到的结果这样极端或者更极端的概率。

若要证明原假设不正确,则由样本得到的P值应小于给定的显著性水平。 四、

(1) 差异源 SS 组间 组内 总计 420 df MS 2 210 F P-value — — 1.478 0.245946 — 3836 27 142.074 — 4256 29 — (2)

从P值来看,组装方法与组装产品数量之间的关系强度较弱。 (3)

若显著性水平为0.05,则P>0.05,因此不能拒绝原假设,即不能证明三种方法组装的产品数量之间有显著差异。 五、

时间序列分解法分3步:

3

第一步,确定并分离季节成分。计算季节指数,确定时间序列中的季节成分。然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。

第二步,建立预测模型并进行预测。对消除了集结成分的时间序列建立适当的预测模型,饼干局这一模型进行预测。

第三步,计算出最后的预测值。用预测值乘以相应的季节之术,得到最终的预测值。

考题卷号:3

一、 (20分)在2008年8月10日举行的第29届北京奥运会女子10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩如下表: 要对各名运动员进行综合评价,使用的统计量有哪些?简要说明这些统计量的用途。 有, 平均数、众数和中位数、方差、离散系数、偏态和峰态 其中平均数、众数和中位数是评价数据的集中趋势的,可以座位数的平均水平或代表值,三者略有差异。三者特点和差异如下 众 数 不受极端值影响 具有不惟一性 数据较多时有意义,且有明显峰值时应用 中位数 4

不受极端值影响 数据分布偏斜程度较大时应用 平均数 易受极端值影响 利用了全部数据信息,数学性质优良 数据对称分布或接近对称分布时应用较好 当要用样本信息对总体进行推断时,平均数就更显示出它的各种优良特性 方差、离散系数都是可以评价数据的离散程度的。: 二、 (20分)为什么说假设检验不能证明原假设正确? 1.假设检验的目的主要是收集证据拒绝原假设,而支持你所倾向的备择假设。因为假设检验只提供不利于原假设的证据 2. 假设检验得出的结论都是根据原假设进行阐述的。当不能拒绝原假设时,我们也从来不说“接受原假设”,因为没有证明原假设是真的。没有足够的证据拒绝原假设并不等于你已经“证明”了原假设是真的,它仅仅意为着目前还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设。“不拒绝”的表述方式实际上意味着没有得出明确的结论 3. 假设检验中通常是先确定显著性水平,这就等于控制了第Ι类错误的概率,但犯第Ⅱ类错误的概率却是不确定的。 三、 (20分)为估计公共汽车从起点到终点平均行驶的时间,一家公交公司随机抽取36班公共汽车,得到平均行驶的时间为26分钟,标准差为8分钟。 (1) 说明样本均值服从什么分布?依据是什么? (2) 计算平均行驶时间95%的置信区间。 (3) 解释95%的置信水平的含义。 5

(z0.05?1.645,z0.025?1.96,t0.05?1.860,t0.025?2.306) 略 四、 (20分)设单因素方差分析的数学模型为:yij????i??ij。解释这一模型的含义,并说明对这一模型的基本假定。 模型表明,因变量手自变量的变动主要来自于两方面,一个自变量,另一个是随机扰动。 基本假定:随机扰动服从正态分布 五、 (20分)在多元回归中,判断共线性的统计量有哪些?简要解释这些统计量。 答案见第五套题 6

考题卷号:4

一、 (20分)在2008年8月10日举行的第29届北京奥运会男子10米气手枪决赛中,最后获得金牌和银牌的两名运动员10枪的决赛成绩如下表所示: 运动员 庞 伟 秦钟午 9.3 9.5 10.3 10.5 10.3 10.3 决赛成绩 10.4 10.3 10.7 10.1 10.4 10.8 10.7 9.3 9.9 10.6 9.4 10.2 9.9 9.8 根据上表计算的韩国运动员秦钟午的平均环数是10.05环,标准差是0.445环。比较分析哪个运动员的发挥更稳定。 可以算出中国选手的平均数和方差,方差小的发挥更稳定 二、 (20分)什么是统计意义上的显著性?为什么说统计上显著不一定就有现实意义? 统计意义上的显著性是指规定一个最小的容错概率,如果犯错的概率小于这个容错概率则说是显著的,但在现实中各个行业各个领略同样的容错概率对应的意义不同,同样的容错概率在有的行业带来的损失要远大于其他行业,所以要根据实际情况来看。 具体的来说:在假设检验中,拒绝原假设称样本结果在“统计上是显著的”;不拒绝原假设则称结果是“统计上不显著的”。“显著的”在这里的意义是指“非偶然的”,它表示这样的样本结果不是偶然得到的,同样,结果是不显著的,则表明这样的样本结果很可能是偶然得到的。 在进行决策时,我们只能说P值越小,拒绝原假设的证据就越强,检验的结果也就越显著。当P值很小而拒绝原假设时,并不一定意味着检验的结果就有实际意义,因为假设检验中所说的“显著”仅仅是“统计意义上的显著”。也就是说,一个在统计上显著的结论在实际中却不见得就很重要,也不以为着就有实际意义 7

三、 (20分)简要说明判断一组数据是否服从正态分布的统计方法。 方法有很多,即雅克贝拉检验 还有其他一些分布检验如卡方检验,K-S检验、即雅克贝拉检验、PP图,或QQ图及偏态和直方图。 样量化判断数据是否服从正态分布? 数据是否服从正态分布,除了做数据分布直方图来判断,是不是还可用公式计算?量化计算方法是什么? j-b检验,即雅克贝拉检验 还有其他一些分布检验如卡方检验,K-S检验,,都是用来检验分布的。 游程检验也可以用来检验分布。 你可以使用SPSS的explore,或PP图,或QQ图,具体的一般可以万采取下列几种做法1、K-S 检测,在explore 中会有这一选项,在非参数检验中也有,它会给出一个sig,你通过看这个数就可以判断数据是否服从正态分布 2、通过P-P图目测,这样做的好处在于直观 3、就是看峰度和偏度了,你要问偏度在什么范围内是服从正态分布,这个统计学上没有定论,如果偏度等于0就是完美的,一般接近这个值就可以了 (20分)国家统计局目前对地区的划分中,将我国31个省市自治区划分为东部地区、中部地区、西部地区、东北地区。 (1) 要分析四个地区的平均消费水平是否存在显著差异,所用的统计方法有哪些?这些方法的区别是什么? (2) 你会选择什么方法进行分析?你的假设是什么? (1)可以选用的方法有 F检验,非参中的ridit方法。假定不同 (2)我会选非参方法。原假设为四个地区平均消相同费水平 四、 (20分)一家房地产评估公司想对某城市的房地产销售价格y(元/m2)与地产的评估价值x1(万元)、房产的评估价值x2(万元)和使用面积x3(m2)建立一个模型,以便对销售价格作出合理预测。 8

为此,收集了20栋住宅的房地产评估数据,由统计软件给出的部分回归结果如下(显著性水平为95%): 方差分析 回归 残差 总计 Intercept X Variable 1 X Variable 2 X Variable 3 Coefficients 148.7005 0.8147 0.821 0.135 标准误差 574.4213 0.512 0.2112 0.0659 t Stat 0.2589 1.5913 3.8876 2.0503 P-value 0.799 0.1311 0.0013 0.0571 df SS MS 626760.91 F Sig. 46.70 3.879E-08 3 87803505.46 29267835.15 16 10028174.54 19 97831680 对所建立的回归模型进行综合评价。 从F检验来看,模型整体是很显著地。具体来看X Variable 2和X Variable 3显著性更强,如果将各变量的交互项考虑进来会更好。

9

考题卷号:5

一、 (20分)为研究大学生的逃课情况。随机抽取350名大学生进行调查,得到的男女学生逃课情况的汇总表如下。 是否逃课 逃过课 未逃过课 合计 男 84 78 162 女 88 100 188 合计 172 178 350 (1) 这里涉及的变量有哪些?这些变量属于什么类型? (2) 描述上述数据所适用的统计图形有哪些? 答:(1)有分类变量和数量变量,分类变量有 是否逃课,数量变量有逃过课的人数和为逃过课的人数。 (2)可以用条形图或者饼图。 二、 (20分)现从一批零件中随机抽取16只,测得其长度(单位:厘米)如下: 15.1 14.8 14.5 15.1 14.8 15.3 14.6 14.7 15.2 15.0 14.8 15.2 14.9 15.1 14.6 14.7 (1)如果要使用t分布构建零件平均长度的置信区间,基本的假定条件是什么? (2)构建该批零件平均长度的95%的置信区间。 (3)能否确定该批零件的实际平均长度就在你所构建的区间内?为什么?(注:t?2(n?1)?t0.025(15)?2.131) 略 三、 (20分)在假设检验中,当不拒绝原假设时,为什么一般不采取“接受原假设”的表示方式? 因为不拒绝原假设不能证明原假设正确 1.假设检验的目的主要是收集证据拒绝原假设,而支持你所倾向的备择假设。因为假设检验只提供不利于原假设的证据

10

2. 假设检验得出的结论都是根据原假设进行阐述的。当不能拒绝原假设时,我们也从来不说“接受原假设”,因为没有证明原假设是真的。没有足够的证据拒绝原假设并不等于你已经“证明”了原假设是真的,它仅仅意为着目前还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设。“不拒绝”的表述方式实际上意味着没有得出明确的结论 3. 假设检验中通常是先确定显著性水平,这就等于控制了第Ι类错误的概率,但犯第Ⅱ类错误的概率却是不确定的 四、 (20分)简要说明?2分布在统计中的应用。 卡方分布应用很广,常用于假设检验和置信区间的计算,比如应用到独立性检验中,同质性检验、适合性检验等等 五、 (20分)简要说明解决多元回归中共线性的方法。 有如下方法: (1)方差膨胀因子(variance inflation factors, ) j?1,2,?,m VIF?1(1?R2)jjXRj为 其中 与其余(m-1)个自变量线性回归的决定系数。值越大,多j2元共线程度越严重 (2)特征根系统(system of eigenvalues) 主要包括条件指数和方差比。条件指数是最大特征根与每个特征根之比的平方根。当 且对应的方差比大于0.5时,可认为多元共线性严重存在

考题卷号:6

11

一、 (20分)一家电视台为了解观众对某档娱乐节目的喜欢程度,对不同年龄段的男女观众进行了调查,得到喜欢该档娱乐节目的观众比例(单位:%)如下: 年龄段 20岁以下 20—30岁 30—40岁 40—50岁 50岁以上 男性 5 25 16 12 6 女性 6 32 15 12 8 (1) 这里涉及的变量有哪些?这些变量属于什么类型? (2) 描述上述数据所适用的统计图形有哪些? 答:(1)有分类变量和数量变量。分类变量有性别,年龄段。数量变量有各年龄段的男女人数。 (2)可以用条形图和饼图 二、 (20分)假定总体共有1000个个体,均值??32,标准差??5。从中抽取容量为100的所有简单随机样本。样本均值x的期望值和标准差各是多少?得出上述结论所依据的是统计中的哪一个定理?请简要叙述这一定理。 计算略,是中心极限定理,定理如下 设从均值为μ、方差为σ^2;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n的正态分布 三、 (20分)在假设检验中,利用P决策与利用统计量决策有什么不同? P值:如果能把犯第Ⅰ类错误的真实概率算出来,就可以直接用这个 12

概率做出决策。而不需要管什么事先给定的显著性水平α,这个犯第Ⅰ类错误的真实概率就是P值。 不同:统计量检验是根据事先确定的显著性水平α围成的拒绝域作出决策,不论检验统计量的值是大是小,只要把它落入拒绝域就拒绝原假设H。否则就不拒绝H。这样,无论统计量落在拒绝域的什么位置,你也只能说犯第一错误的概率为α,而用P值检验则能把犯第Ⅰ类错误的真实概率算出来。 四、 (20分)简要说明方差分析的基本原理。 方差分析被解释为检验多个总体均值是否相等的统计方法,这种解释侧重于方差分析的过程和形式。 本质上,方差分析研究的是分类自变量对数值因变量的影响 方差分析总的思想是通过计算来比较因某一特定因素带来的样本值的差异与随机偶然因素对样本值的差异的大小,从而判断该因素对总体是否有统计意义 五、 (20 分)比较说明指数曲线和直线的异同。 略 考题卷号:7

一、 (20分)一项关于大学生体重状况的研究发现,男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。请回答下面的问题 (1) 是男生的体重差异大还是女生的体重差异大?为什么? (2) 粗略地估计一下,男生中有百分之几的人体重在55kg到65kg之间? (3) 粗略地估计一下,女生中有百分之几的人体重在40kg到60kg之间? 13

答:(1)女生差异大,因为女生变异系数大。计算略 2假设为正态分布,一个标准差之内概率约为68.3% 3 同上,两个标准差之内 约为 94.5% 二、 (20分)叙述评价估计量的标准。 评价估计量的标准有: 无偏性。无偏性是指估计量抽样分布的期望值等于被估计的总体参数。 有效性。有效性是指估计量的方差尽可能小。 一致性。一致性是指随着样本量的增大,点估计量的值越来越接近被估计总体的参数 三、 (20分)一家房地产开发公司准备购进一批灯泡,公司打算在两个供货商之间选择一家购买,两家供货商生产的灯泡使用寿命的方差大小基本相同,价格也很相近,房地产公司购进灯泡时考虑的主要因素就是使用寿命。其中一家供货商声称其生产的灯泡平均使用寿命在1500小时以上。如果在1500小时以上,在房地产公司就考虑购买。由36只灯泡组成的随机样本表明,平均使用寿命为1510小时,标准差为193小时。 (1) 如果是房地产开发公司进行检验,会提出怎样的假设?请说明理由。 (2) 如果是灯泡供应商进行检验,会提出怎样的假设,请说明理由。 四、 (20分)什么是判定系数?它在回归分析中的主要作用是什么? 判定系数(又称拟合优度或决定系数)是建立在回归分 析基础之上的,用于研究一个随机变量对别一个随机变量的解释程度,该值的取值范围为0≤R2≤1,值越接近1,说明自变量对因变量的解释程度越高,自变量引起的因变量变动占总变动的百分比越高 计算公式

14

五、 (20分)说明t分布的适用条件,如何判断某个过程产生的数据满足这一条件? 一个总体参数的估计:t分布适用于小样本、正态总体、总体方差未知的情况。 置信区间为 均值 加减 (自由度为n-1个自由度,右侧面积为α/2的t值 乘以 s/根号下n) 两个总体参数的估计:t适用于均值差是独立小样本、正态分布、两个总体方差未知(不管等不等)的情况 判断方法:可以做独立性和是否满足正态分布的检验,或者根据已知信息及相关图形来判断。

15

考题卷号:8 一、 (20分)在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。 (1) 你认为该用什么样的统计量来反映投资的风险? (2) 如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票? (3) 如果你进行股票投资,你会选择商业类股票还是高科技类股票? 答:(1)可以用反应收益率变动的统计量,如方差,来衡量 2)商业类,从图上看集中趋势明显,方差小 3)我是风险偏好性,会选高科技类 二、 (20分)某种感冒冲剂规定每包重量为12克,超重或过轻都是严重问题。从过去的生产数据得知??0.6克,质检员抽取25包冲剂称重检验,平均每包的重量为11.85克。假定产品重量服从正态分布。 (1) 根据上述检验计算出的P?0.02,感冒冲剂的每包重量是否符合标准要求(??0.05)?

16

(2) 说明上述检验中可能犯哪类错误?该错误的实际含义是什么? 答:1)可知 (11.85-12)/(0.6/根号25)=-1.25<0.02对应的分位数(因为1.96是0.05对应的分位数,0.02的会更大),所以题目估计有错。不管按0.05还是0.02,都是拒绝原假设 2)可能犯第一类错误(去真的错误),实际含义为原假设为真,但判断时拒绝了。 三、 (20分)简述方差分析的基本假定。 有三大假定: 可加性。 方差分析的每一次观察值都包含了总体平均数、各因素主效应、各因素间 的交互效应、随机误差等许多部分,这些组成部分必须以叠加的方式综合起来, 即每一个观察值都可视为这些组成部分的累加和。 正态性 即随机误差 ε 必须为相互独立的正态随机变量。这 方差同质性(齐性)。 即要求所有处理随机误差的方差都要相等,换句话说不同处理不能影响随 机误差的方差。由于随机误差的期望一定为 0 四、 (20分)怎样自相关图和偏自相关图来识别ARIMA(p,d,q)模型中的参数? 五、 (20分)什么是回归中的置信区间估计和预测区间估计?两个区间的宽度是否一样?x取何值时两个区间宽度最窄? 置信区间估计(confidence interval estimate):利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的估计区间。 17

预测区间估计(prediction interval estimate):利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计区间 取平均值的时候

18

考题卷号:9

一、 (20分)为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。 (1) 哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平均身高相同? (2) 哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同? (3) 哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的? 答:1)如果抽样是随机的,抽样样本数目对样本平均值没有决定作用,答案是不确定的。 2)如果抽样是随机的,抽样样本数目对样本方差也没有决定作用,答案是不确定的 3)不确定。都有可能 二、 (20分)在参数统计分析中,应用t分布、?分布和F分布的假定条件是什么? 如何判断样本数据是否满足假定条件。 答:t分布假定:样本服从正态分布,方差未知,(用于估计平均值) 2?2分布假定:样本服从正太分布,n个样本平方和服从自由度n-1的?2分布 F分布假定:分子分母分别为服从?分布的统计量除以其相应的自由度,且互相独立;构成?分布的两总体自然服从正太分布。 分别作相应的假设检验即可。 22 19

三、 (20分)由于时间和成本对产量变动的影响很大,所以在一种新的生产方式投入使用之前,生产厂家必须确信其所推荐新的生产方法能降低成本。目前生产中所用的生产方法成本均值为每小时200元。对某种新的生产方法,测量其一段样本生产期的成本。 (1) (2) (3) 在该项研究中,建立适当的原假设和备择假设。 当不能拒绝H0时,试对所做的结论进行评述。 当可以拒绝H0时,试对所做的结论进行评述。 答: (1) 原假设:新的生产方法不能降低成本 及新成本大于或等于200 备择假设:新的生产方法能降低成本 及新成本小于200 (2)不能拒绝“成本不下降的假设”,及没有把握说成本会下降 (3)拒绝原假设,即如果确定成本下降,犯错的概率为相应的p值,或临界概率。 四、 (20分)列出度量下述测度变量间的关系所使用的统计量。 (1) 两个分类变量。 (2) 两个数值变量。 (3) 两个顺序变量。 (4) 一个分类变量与一个数值变量。 答:1)卡方统计量 2)相关系数 3)等级相关系数 4)F统计量 (方差分析) 五、 (20分)在多元线性回归分析中,F检验和t检验有何不同? F检验是对模型整体显著性的检验,t检验只能对单独变量显著性检验。F检验下,模型显著不能说明所有变量均显著. 20

46

----------------下面是赠送的excel操作

练习

不需要的下载后可以编辑删除

(Excel 2003部分)

1. 公式和函数

1. (1)打开当前试题目录下文件excel-10.xls;

(2)利用函数计算每个人各阶段总成绩,并利用函数计算各阶段的平均成绩; (3)“平均成绩”行数字格式都为带一位小数(例如0.0)格式; (4)同名存盘。 步骤:

a) 文件→在各阶段总成绩单元格内,点插入,点函数,在对话框中

选择求和函数“SUM”,在对话中Number1内点右侧的按钮,将出现另外一个对话框,在文件中选择需要求和的单元格,然后点该对话框的右侧按钮,点确定(完成一个总成绩求和后,利用填充柄完成其他的总成绩求和,或者重复上面的顺序)→在平均成绩单元格内,点插入,点函数,选择算术平均值函数AVERAGE,出现对话框后,采用求和时的相同方法,完成操作→选中平均成绩行,点右键点设臵单元格,点数字,在分类项下点数值,设小数位为1, b) 确定→保存

47

2. (1)打开当前试题目录下文件excel-13.xls;

(2)根据工作表中给定数据,按“合计=交通费+住宿费+补助”公式计算“合计”数,并计算交通费、住宿费和补助的合计数;

(3)所有数字以单元格格式中货币类的“¥”货币符号、小数点后2位数表现(如:¥2,115.00格式); (4)同名存盘。

打开当前试题目录下文件excel-13.xls→在合计下的一个单元格内输入“=交通费(在该行的单元格,假如说是E3)+住宿费(同上)+补助(同上)”,回车(其他的合计可以采用填充柄完成,或者重复上面的顺序)→利用求和函数,参考1中的方法完成交通费、住宿费和补助的合计→选择文件中的所有数字单元格,点右键,点设臵单元格格式,点数字,点货币,选择货币符号为“¥”,设臵小数点后为2位,确定→保存文件→本题完成

3. (1)打开当前试题目录下文件excel-2.xls;

(2)根据工作表中数据,计算“总成绩”列的数据。总成绩=一阶段成绩×0.3+二阶段成绩×0.3+三阶段成绩×0.4; (3)“总成绩”列数据格式为小数点后2位小数(例:6.20); (4)同名存盘。

打开当前试题目录下文件excel-2.xls→在总成绩下的一个单元格内输入“=一阶段成绩(在该行的单元格,假如说是E3)*0.3+住宿费(同上)*0.3+补助(同上)*0.4”,回车(其他的合计可以采用填充柄完成,或者重复上面的顺序)→选中总成绩列的数据单元格,点右键,点设臵单元格格式,点数字,点数值,设臵小数点后为2位,确定→保存文件→本题完成

4. (1)打开当前试题目录下文件excel-3.xls;

(2)计算“审定费”和“税后款”,“审定费=全书字数÷1000×3,税后款=审定费-审定费×5%”;

(3)利用菜单将“审定费”和“税后款”列格式设臵为货币类的“¥”货币符号、小数点1位(例¥1,280.0); (4)同名存盘。

打开当前试题目录下文件excel-3.xls→在审定费下的一个单元格内输入“=全书字数(在该行的单元格,假如说是E3)/1000*3”,回车(其他的审定费可以采用填充柄完成,或者重复上面的顺序)→在税后款下的一个单元格内输入“=审定费(在该行的单元格,假如说是F3)-审定费*5%”,回车(其他的税后款可以采用填充柄完成,或者重复上面的顺序)→选中审定费及税后款列的数据单元格,点右键,点设臵单元格格式,点货币,选择货币符号“¥”,设臵小数点后为1位,确定→保存文件→本题完成

5. (1)打开当前试题目录下文件excel-8.xls;

(2)利用函数计算“总成绩”,利用公式“平均成绩=总成绩÷3”来计算“平均成绩”; (3)同名存盘。

打开当前试题目录下文件excel-8.xls→在总成绩下的一个单元格,点插入,点函数,在对话框中选求和函数“SUM”,在对话中Number1内点右侧的按钮,将出现另外一个对话框,在文件中选择需要求和的单元格,然后点该对话框的右侧按钮,点确定(完成一个总成绩求和后,利用填充柄完成其他的总成绩求和,或者重复上面的顺序→在平均成绩下的一个单元格内,输入“=平均成绩(在该行的单元格,假如说是B3)/3”,回车(其他平均

48

成绩可以采用填充柄完成,或者重复上面的顺序)→保存文件→本题完成

6. (1)打开当前试题目录下文件excel-1.xls;

(2)利用公式计算每个项目的“合计”; (3)“合计”列数据的格式和其它数据的格式相同; (4)同名存盘。

打开当前试题目录下文件excel-1.xls→在合计下的一个单元格,点插入,点函数,在对话框中选求和函数“SUM”,在对话中Number1内点右侧的按钮,将出现另外一个对话框,在文件中选择需要求和的单元格,然后点该对话框的右侧按钮,点确定(完成一个总成绩求和后,利用填充柄完成其他的总成绩求和,或者重复上面的顺序→利用格式刷将合计的列的数据格式刷成与其他数据格式相同的格式(使用格式刷的方法是,先选中合计列外的其他任意一个单元格,点格式刷,然后再点需要刷成该样格式的单元格即可)→保存文件→本题完成

7. (1)打开当前试题目录下文件excel-6.xls;

(2)计算出“净资产收益率”,净资产收益率=净利润÷净资产总额; (3)“净资产收益率”行以保留三位小数的百分数形式表现(如:32.310%); (4)同名存盘。

打开当前试题目录下文件excel-6.xls→在净资产收益率下的一个单元格,输入“=净利润(在该行的单元格,假如说是B3)/净资产总额”,回车(完成一个单元格后,可以利用填充柄完成其他的单元格的操作,或者重复上面的顺序)→选中净资产收益率列下的数据单元格,点右键,点设臵单元格格式,点数字,单百分比,将小数位数设为3位,确定→保存文件→本题完成

8. (1)打开当前试题目录下文件excel-7.xls;

(2)分别利用函数计算出“总成绩”、“平均成绩”; (3)平均成绩设臵带两位小数格式(例如:78.00); (4)同名存盘。

打开当前试题目录下的excel-7.xls文件→在总成绩对应的单元格内,点插入,点函数,在对话框中选择求和函数“SUM”,在对话中Number1内点右侧的按钮,将出现另外一个对话框,在文件中选择需要求和的单元格,然后点该对话框的右侧按钮,点确定(如果有多个总成绩项,完成一个总成绩求和后,利用填充柄完成其他的总成绩求和,或者重复上面的顺序)→在平均成绩对应的单元格内,点插入,点函数,选择算术平均值函数AVERAGE,出现对话框后,采用求和时的相同方法,完成操作→选中平均成绩对应的单元格,点右键,点设臵单元格,点数字,点数值,设小数位为2,确定→保存文件→本题完成

9. (1)打开当前试题目录下文件excel-16.xls;

(2)计算出“全套优惠价”,公式为:全套优惠价裸机价+入网费-送话费; (3)所有数字都以单元格格式中货币类的“¥”货币符号、小数点后1位小数表现(如:¥1,450.00); (4)同名存盘。

打开当前试题目录下文件excel-16.xls→在全套优惠价对应的单元格,输入“=全套优惠价裸机价(在该行的单元格,假如说是B3)+入网费(同上)-送话费”,回车(如果有多个全套优惠价项,可以利用填充柄完成,也可以重复上面的顺序)→选中所有的数字单元格,点右键,点设臵单元格格式,点数字,点货币,选择货币符号为“¥”,设小数位为2位,确定→保存文件→本题完成

49

10. (1)打开当前试题目录下文件excel-71.xls;

(2)利用函数计算奖金项的值,公式是“满工作量为40,满工作量的奖金为800元,工作量不足的奖金为600元”; (3)利用公式计算实发工资项的值,公式是“实发工资为基本工资加奖金,再减去住房基金和保险费”; (4)同名存盘。

打开当前试题目录下文件excel-71.xls→选中奖金项下的一个单元格,点插入,点函数,点IF函数,在对话框中,第一个条件格式内输入“该行工作量项下的单元格(比如是E3)>=40(即E3>=40)”,在true内输入800,在false内输入600,确定(其余行可以采用填充柄完成,或重复上述的顺序)→选择实发工资项下的一个单元格,输入“=基本工资(在该行的单元格名)+奖金(同上)-住房基金(同上)-保险费(同上)”,确认(回车)(其余单元格采用填充柄完成,或重复上述顺序)→保存文件→本题完成

11. If函数的应用:根据教师工作表教师职称确定其职务津贴

练习Excel2003P140:Excel2003电子表格的编辑操作

2. 排序

3. (1)打开当前试题目录下文件excel-24.xls;

(2)在B4单元格内键入数字“45637”;

(3)表格所有数字格式为带1位小数格式(如:23456.0); (4)将Sheet1的所有内容复制到工作表Sheet2的相应单元格内,并以“电器”为关键字,对四个季度所有数据递减排序; (5)同名存盘。

打开当前试题目录下文件excel-24.xls→点B4单元格,输入“45637”→选中表格内的所有数字格式,点右键,点设臵单元格格式,点数字,设小数位为1,确定→全选SHEET1(即当前的文件),点复制,点开SHEET2,点当前页面的左上角的单元格,点粘贴→点“电器”单元格,点表格,点排序,主要关键字下选择电器,点降序,确定→保存文件→本题完成

4. (1)打开当前试题目录下文件excel-29.xls;

(2)根据工作表中数据,在B4单元格内键入数据“2580”; (3)表格数字数据设臵为“0,000.0”的格式;

(4)以“1997年”为关键字,对不同规格所有相应数据进行递减排序; (5)同名存盘。

打开当前试题目录下文件excel-29.xls→点B4单元格,输入“2580”→选中表格内的所有数字格式,点右键,点设臵单元格格式,点数值,设小数位为1,点使用千分分隔符为有效,确定→点“1997年”单元格,点表格,点排序,主要关键字下选择1997,点降序,确定→保存文件→本题完成

5. (1)打开当前试题目录下文件excel-33.xls;

(2)根据工作表中数据,在E4单元格内键入数据“商务出版社”;

(3)将SHEET1所有内容复制到工作表SHEET2的相应位臵,并以“单价”为关键字,递减排序; (4)同名存盘。

50

考题卷号:10

一、 (20分)在2008年8月北京举办的第29届奥林匹克运动会上,获得金牌总数前三名的国家及奖牌数如下。要描述这一数据,可以使用的图形有哪些?说明它们在描述这一数据中的用途。 排名 1 2 3 国家 中国 美国 俄罗斯 金 51 36 23 银 21 38 21 铜 28 36 28 总 100 110 72 列出适合展示上述数据的图形并说明这些图形的用途。 (1) 可使用条形图,以国家为项目展示三个国家各种奖牌数的对比情况,或以奖牌种类为项目展示不同国家获得的某种奖牌数量的对比情况。 (2) 可使用环形图,展示三个国家所获得的各种奖牌所占比例,或展示三种奖牌中各国家所获奖牌数目所占比例。 二、 (20分)某企业生产的产品需用纸箱进行包装,按规定供应商提供的纸箱用纸的厚度不应低于5毫米。已知用纸的厚度服从正态分布,?一直稳定在0.5毫米。企业从某供应商提供的纸箱中随机抽查了100个样品,得样本平均厚度x?4.55毫米。 (1) 在??0.05的显著显著性水平上,是否可以接受该批纸箱?该检验中会犯哪类错误?该错误的含义是什么? (2) 抽查的100个样本的平均厚度为多少时可以接收这批纸箱?此时

21

可能会犯哪类?该错误的含义是什么? (注:z0.025?1.96,z0.05?1.645) (1)统计量z=(4.55-5)/(0.5/10)=-9<-1.96,拒绝原假设。 该检验中会犯第一类错误,即原假设是正确的却将其拒绝的错误。 (2)若要接受,则-1.96<(x-5)/(0.5/10)<1.96,即平均厚度在4.902毫米到5.098毫米之间时可以接受这批纸。此时会犯第二类错误,即原假设是错误的却将其接受的错误。 三、 (20分)简要说明?2分布在统计中的的应用。 卡方分布应用很广,常用于假设检验和置信区间的计算,比如应用到独立性检验中,同质性检验、适合性检验等等 四、 (20分)在多元线性回归分析中,如果某个回归系数的t检验不显著,是否就意味着这个自变量与因变量之间的线性回归不显著?为什么?当出现这种情况时应如何处理? (1)在多元线性回归分析中,当t检验表明某个回归系数不显著时,也不能断定这个自变量与因变量之间线性关系就不显著。因为当多个自变量之间彼此显著相关时,就可能造成某个或某些回归系数通不过检验,这种情况称为模型中存在多重共线性。 (2)当模型中存在多重共线性时,应对自变量有所选择。变量选择的方法主要有向前选择、向后剔除和逐步回归等。 22

五、 (20分)下表是某贸易公司近几年的出口额数据: 年份 2002 2003 2004 2005 2006 2007 2008 出口额(万美元) 13 19 24 35 58 88 145 (1) 从图形上判断,出口额时间序列含有什么成分? (2) 要预测该公司的出口额,应采用哪种趋势线?该趋势线的特点是什么? (3) 根据上面的数据拟合的指数曲线方程为:??8.02?(1?0.4904Y)t,这里的0.4909的具体含义是什t么? (1) (2) (3) 含有上升趋势。 应采用上升趋势,它是两个以上的低点的连线。 出口额年增长率。 23

考题卷号:11

一、 (20分)A、B两个班各有50名学生,统计学考试成绩的描述统计量如下: 统计量 平均数 中位数 25%四分位数 75%四分位数 标准差 最小值 最大值 A班 74.4 75 67 80 10.6 44 96 B班 68.5 67 56 83 17.4 35 100 (1) 画出两个班考试成绩的箱线图,并比较分布的特征。 (2) 根据统计量对两个班考试成绩的特点进行分析。 (3) 两个班考试成绩的最低分和最高分是否属于离群点? (1) A班平均成绩较高,成绩分布相对集中,分数极差较小,而B班平均成绩相对较低,成绩分布较为分散,高分与低分差距较大。 (2) A班成绩的平均值和中位数都高于B班,表明A班的整体成绩相对较好,但从最大值和75%分位数来看B班的尖子生要比A班更优秀,同理差生也更差。从标准差、极差、四分位差可以看出B班班内的学生间成绩差距要大于A班。 (3) 都不属于。 二、 (20分)谈谈你对方差分析的理解。 方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”, 用于两个及两个以上样本均数差别的显著性检验。 由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分 24

析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量,其基本思想是通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。方差分析是在可比较的数组中,把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。对变差的度量,采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和。 三、 (20分)某厂产品的优质品率一直保持在40%,近期质检部门来厂抽查,共抽查了50件产品,其中优质品为9件。 (1) 在??0.05的显著显著性水平上,能否认为其优质品率仍保持在40%? (2) 该检验中可能犯哪类错误?其含义是什么? (3) 根据上述检验计算出的P?0.564,解释这个P值的具体含义。 (注:z0.025?1.96,z0.05?1.645) (1) z=(18%-40%)/(18%/√50)=-8.64,拒绝原假设,认为不能保持。 (2) 可能犯第一类错误,即原假设是正确的却将其拒绝的错误。 (3) 当原假设为真时所得到的样本观察结果或更极端结果出现的概率为0.564. ?,xk,则四、 (20分)设因变量为y,k个自变量分别为x1,x2,多元线性回归模型可表示为: 25

计算略,根据公式即可。 2)A组间平方和,反应组间差异;B组内均方,反应组内差异程度。 3)组间差异显著 三、 (20分)谈谈那个置信水平和置信区间的理解。 置信水平反应的是显著性的程度,置信区间是在一定置信水平下的估计区间。 四、 (20分)要建立一个多元线性回归模型,谈谈你的建模思路。 初选变量----筛选变量----确定模型----解释模型 五、 (20分)聚类分析时对变量或数据有哪些基本要求? 略

31

考题卷号:14

一、 (20分)为分析不同地区的消费者与所购买的汽车价格是否有关,一家汽车企业的销售部门对东部地区、中部地区和西部地区的400个消费者作了抽样调查,得到如下结果: 汽车价格 10万元以下 10—20万元 20—30万元 30万元以上 略,见前面 二、 (20分)从一批零件中随机抽取16只,测得其评价长度为14.9cm,标准差为0.25cm。 (1) 如果要使用t分布构建零件平均长度的置信区间,基本的假定条件是什么? (2) 构建该批零件平均长度的95%的置信区间。 (3) 能否确定该批零件的实际平均长度就在你所构建的区间内?为什么? (注:t?2(n?1)?t0.025(15)?2.131) 略,见前面; 三、 (20分)某汽车制造公司想了解广告费用(x)对销售量(y)的影响,收集了过去10年有关广告费用(单位:万元)和销售量(单位:辆)的数据,希望建立二者之间的线性回归方程,并通过广告费用来预测汽车的销售量。通过计算得到下面的部分结果: 回归平方和(SSR) 残差平方和(SSE) 回归方程的截距 回归方程的斜率 755456 37504 348.94 14.41 东部地区 20 50 30 40 中部地区 40 60 20 20 西部地区 40 50 20 10 列出描述上述数据所适用的统计图形,并说明这些图形的用途。 (1) 写出销售量与广告费用的直线回归方程,并解释回归系数的实际意义。

32

(2) 计算判定系数R,说明汽车销售量的变差中有多少是由于广告费用的变动引起的? (3) 计算估计标准误差2se,并解释其实际意义。 答:1)方程略,解释注意自变量百分比变动带来因变量百分比变动就行 2)计算略,根据公式,R即为汽车销售量的变差中有多少是由于广告费用的变动引起 3)略, 四、 (20分)简述分解法预测的基本步骤。 答:略 五、 (20分)对于聚类分析回答下面的问题: (1) 解释Q型聚类和R型聚类的含义。 (2) 聚类分析与判别分析有何不同? 答:1)Q型聚类就是对样品个体进行聚类,R型聚类是指对指标变量进行聚类 2)聚类分析是对已有数据进行分类,分多少类一般是未知的(当然你也可以设定分几类),判别分析是主要是对已有数据建模,对新的数据进行分类,类别是确定好的。

2 33

考题卷号:15

一、 (20分)为研究上市公司对其股价波动的关注程度,一家研究机构对在主板、中小板和创业板上市的200家公司进行了调查,得到如下信息: 上市公司的类型 主板企业 中小板企业 创业板企业 关注 50 35 25 不关注 70 15 5 列出分析上述数据所适用的统计方法。 略 二、 (20分)由30辆汽车构成的一个随机样本,测得每百公里的耗油量数据(单位:公升):判断该种汽车的耗油量是否近似服从正态分布的方法有哪些?简要说明这些方法。 略 三、 (20分)简述时间序列的构成要素。 时间序列构成要素有四种,它们是趋势(T)、季节变动(S)、周期性或循环波动(C)和不规则波动(I)。趋势也称为长期趋势,是指时间序列在长时期内呈现出来的某种持续向上或持续下降的变动。它是由某种固定性的因素作用于序列而形成的。它可以是线性的,也可以是非线性的。季节变动是指时间序列在一年内重复出现的周期性波动。循环波动或周期性波动是指时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。它不同于趋势变动,不是朝着单一的方向持续运动,也不同于季节变动,季节变动有比较固定的规律,且变动周期为一年,而循环波动则无固定的规律,变动周期多为一年以上,且周期长短不一。周期性通常是由于经济环境的变化而引起的。随机性或不规则波动是由于一些偶然性的因素产生的 四、 (20分)用一个电子秤对一个标准重量为10克的物体称重100次, 34

以核对电子秤的准确性。设?为这个电子秤读数的均值,即??10。检验假设H0:??10,H1:??10,考虑以下三个结论:(a)电子秤是准确的;(b)电子秤是不准确的;(c)电子秤可能是准确的。 (1) 如果拒绝H0,那么三个结论中那个最好? (2) 如果没有拒绝H0,那么三个结论中那个最好? (3) 能否通过假设检验来证明这个电子秤是准确的?请说明理由。 略,见之前题目 五、 (20分)为研究人均国内生产总值(GDP)与人均消费水平之间的关系,在全国范围内随机抽取7个地区,得到2008年的人均国内生产总值(单位:元)和人均消费水平(单位:元)的统计数据,设人均GDP作自变量(x),人均消费水平作因变量(y),经初步计算,用最小二乘法得到下面的回归结果(??0.05): ??734.69 方程的截距:?0??0.31 回归系数:?1回归平方和:SSR?814.8 残差平方和:SSE?30.3 (1) 写出人均GDP与人均消费水平的线性回归方程,并解释回归系数的实际意义。 (2) 计算判定系数R,并说明它的实际意义。 (3) 计算估计标准误差se,并说明它的实际意义。 (4) 计算相关系数,说明人均GDP与人均消费水平之间的关系强度。 略,见之前题目

2 35

考题卷号:16

一、 (20分)下表是2006年北京、上海和天津按收入法计算的地区生产总值(按当年价格计算)数据。 地 区 北 京 天 津 上 海 劳动者报酬 3496.57 1383.36 3756.56 生产税净额 1161.55 775.09 1623.36 固定资产折旧 1251.09 595.09 1730.51 营业盈余 1961.07 1605.61 3255.94 描述上述数据所用的统计方法有哪些?简要说明这些方法的用途。 略 二、 (20 分)由25辆汽车构成的一个随机样本,测得每百公里的耗油量数据如下(单位:公升): 9.19 9.63 10.10 9.70 10.09 10.01 8.82 9.43 10.03 9.85 9.60 10.50 10.12 9.49 9.37 9.78 9.35 9.54 9.36 9.68 8.82 8.65 8.51 9.14 9.75 列出分析上述数据所适用的统计方法,并进行简要说明。 略 三、 (20分)检验如下假设:H0:??100,H1:??100。根据样本数据得到的P?0.04。 (1) 请你做出决策,并说明理由。 (2) 对检验结论进行评述。 略 四、 (20分)一家集团公司有用多家分公司,为研究销售收入(单位:万元)与销售利润(单位:万元)之间的关系,集团公司抽取12家分公司,得到年销售收入和销售利润的数据。集团公司想建立销售收入与销售利润之间的一元线性回归模型,并通过销售收入预测销售利 36

润。经回归得到下面的有关结果(??0.05): 回归统计 Multiple R 0.9735 方差分析 回归 残差 总计 Intercept X Variable 1 df 1 4 5 SS 1192.993 65.840 1258.833 Coefficients 6.604 0.070 MS 1192.993 16.460 标准误差 5.044 0.008 F 72.478 t Stat 1.309 8.513 Sig. 0.001 P-value 0.261 0.001 R Square 0.9477 标准误差 4.0571 参数估计和检验 根据上述回归结果,对所建立的回归模型进行分析。 Multiple R=0.9735 模型效果不错 从方差分析来看,sig=0.001,模型整体显著性强。 从参数估计来看,X Variable 2 较为显著 五、 (20分)简要说明聚类分析和判别分析的异同(20分) 聚类分析是对已有数据进行分类,分多少类一般是未知的(当然你也可以设定分几类),判别分析是主要是对已有数据建模,对新的数据进行分类,类别是确定好的。 37

考题卷号:17

一、 (20分)随机抽取10个消费者,得到他们在超市一次购物所花费的金额(元)数据如下:254,55,159,63,264,68,69,70,138,485。 分析该组数据所适用的统计方法有哪些?对这些方法做简要说明。 见第三套第一题 二、 (20分)谈谈你对原假设和备择假设的理解,并举例说明你的看法。 在假设检验中,首先需要提出两种假设,即原假设和备择假设。 原假设也称零假设,它通常是研究者想收集证据予以推翻的假设,用Ho表示。原假设所表达的含义总是指参数没有变化或变量之间没有关系,因此符号“=”总是放在原假设上。 备择假设通常是指研究者想收集证据予以支持的假设,用H1或Ha表示。备择假设所表达的含义是总体参数发生了变化或变量之间有某种关系,因此,备择假设的形式总是为H1 :? ??0 H1 :? ??0 H1 :?

38

个回归模型,通过营业面积和服务人员的多少来预测营业额。为此,收集到10家分店的营业额(万元)、营业面积(平方米)和服务人员数(人)的数据。经回归得到下面的有关结果(??0.05)。 Multiple R R Square 0.9147 方差分析 回归 残差 总计 df 2 7 9 SS 132093.20 25796.80 157890.00 MS 66046.60 3685.26 F 17.922 Sig. 0.002 0.8366 Adjusted R Square 0.7899 标准误差 60.7063 参数估计和检验 Intercept X Variable 1 X Variable 2 Coefficients -115.288 0.578 3.935 标准误差 110.568 0.503 0.699 t Stat P-value -1.043 1.149 5.628 0.332 0.288 0.001 对所建立的回归模型进行评价。 从 Multiple R=0.9147 模型效果不错 从方差分析来看,模型整体显著性强。 从参数估计来看,X Variable 2 较为显著。

39

考题卷号:18

一、 (20分)一组数据的分布特征可以从哪几个方面进行描述? 见第三套第一题 二、 (20分)一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此抽取一个简单随机样本。请回答以下问题。 (1) 讨论样本均值的抽样分布。 (2) 讨论不同情形下,估计的假定条件及其所使用的统 计分布。 答:1)如果样本是服从整体分布的话,那样本均值也服从正态分布,不过标准差略有变化。 2)略 三、 从一批零件中随机抽取36个,测得其平均长度为150厘米,标准差为2.4厘米。 (1) 解释95%的置信水平 (2) 若置信水平为确定该种零件平均长度的95%的置信区间。 (3) 在上面的估计中,你使用了统计中的哪一个重要定理?请简要解释这一定理。 (注:z?2?z0.025?1.96) 答:1)略 2)略 3)用到的定理为中心极限定理。 设从均值为μ、方差为σ^2;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n的正态分布 四、 (20分)机抽取的15家超市,对它们销售的同类产品集到销售价格、购进价格和销售费用的有关数据(单位:元)。设销售价格为y、购进价格为x1、销售费用为x2,经回归得到下面的有关结果 40

(??0.05): 方差分析 回归 残差 总计 df 2 12 14 SS 61514.17 28646.76 90160.93 MS 30757.09 2387.23 F 12.88 Sig. 0.0010 参数估计和检验 Intercept X Variable 1 X Variable 2 Coefficients 637.07 0.18 1.59 2标准误差 112.63 0.08 0.34 t Stat P-value 5.66 2.33 4.71 0.0001 0.0380 0.0005 (1) 计算判定系数R,并解释其实际意义。 计算略,意义为两个自变量能解释的因变量变动的比例 (2) 计算估计标准误差se,并解释其意义。 计算略,自变量的估计方差。 (3) 根据上述结果,你认为用购进价格和销售费用来预测销售价格是否都有用?请说明理由。 从判定系数和标准差看整体模型和具体变量的显著性,作答。 五、 (20分)什么是非参数检验?它的应用场合是什么? 非参数检验是在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检

41

考题卷号:19

一、 (20分)甲乙两个班各有40名学生,期末统计学考试成绩的分布如下: 考试成绩 优 良 中 及格 不及格 见前面的题,略 二、 (20分)某城市的餐饮业管理协会估计,餐馆的月平均用水量为100吨。一家研究机构认为实际用水量要高于这个数字。该研究机构随机抽取了36家餐馆,记录了每个餐馆的月用水量(单位:吨),经初步计算得到样本数据的部分描述统计量如下: 平均 标准误差 样本标准差 样本方差 107 4.99 29.96 897.77 人数 甲班 3 6 18 9 4 乙班 6 15 9 8 2 列出适合展示上述数据的图形,并说明这些图形的用途。 (1) 确定餐馆月平均用水量95%的置信区间。 计算略 (2) 餐馆实际月平均用水量在你所建立的置信区间里吗?请说明原因。 根据上题计算结果,如果在则说明不能拒绝100为平均水平的说法,如果不在则能拒绝。 (3) 如果要检验研究机构看法是否正确,应该如何建立原假设和备择假设?并谈谈拒绝和不拒绝原假设的含义。 略, 42

三、 (20分)研究表明,期末考试成绩的高低与概率统计的考试成绩密切相关,而且与期末复习时间的多少也有很强的关系。根据随机抽取的15名学生的一个样本,得到统计学考试分数、概率统计的考试分数和期末统计学的复习时间(单位:小时)数据,经回归得到下面的有关结果(??0.05): 方差分析 回归 残差 总计 df 2 12 14 SS A 418.46 900.86 MS B C F D Sig. 0.01 参数估计和检验 Intercept X Variable 1 X Variable 2 Coefficients -15.533 0.703 1.710 标准误差 33.695 0.203 0.676 t Stat P-value -0.461 3.465 2.527 0.653 0.005 0.027 (1) 计算出方差分析表中A、B、C、D单元格的数值。 (2) 计算判定系数R,并解释其实际意义。 (3) 计算估计标准误差se,并解释其意义。 见十八套第四题 四、 (20分)简要说明方差分析的基本原理。 见之前的题目 五、 (20分)谈谈你对时间序列预测的答题思路。

2 43

考题卷号:20

一、 (20分)一家物业公司需要购买大一批灯泡。市场上有两种比较知名品牌的灯泡,物业公司希望从中选择一种。为此,为检验灯泡的质量,从两个供应商处各随机抽取了60个灯泡的随机样本,进行“破坏性”试验,得到灯泡寿命数据经分组后如下: 灯泡寿命(小时) 700~900 900~1100 1100~1300 1300~1500 合计 供应商甲 12 14 23 11 60 供应商乙 4 34 19 3 60 (1) 画出两个供应商灯泡使用寿命的直方图直。 (2) 计算甲供应商灯泡使用寿命的平准数和标准差。 (3) 已知乙供应商灯泡使用寿命的平均数为1070小时,标准差为58.74小时。物业公司应该选择哪个供应商的灯泡?请简要说明你的理由。 略 二、 (20分)按着生产标准,某种食品的每袋重量为85克。一家食品生产商声称,他们所生产的该种食品每袋的平均重量要不低于85克。为检验食品生产商的说法是否属实,管理部门随即抽取9袋食品,测得每袋的平均重量为85.4克,标准差为2.5克。假定该种食品的重量服从正态分布。 (1) 提出原假设和备择假设,并说明理由。 (2) 该检验所使用的分布是什么?使用该分布的假定条件是什么? (3) 若该检验的P值为0.323522,请说明这个P值的含义。 (1) 略 H0:平均重量>=85,H1:平均重量<85 (2) t分布,假定原变量服从正态分布,但方差未知

44

(3) p值过大,不能拒绝原假设,没有充足的证据证明平均重量小于85克 三、 (20分)解释?2拟合优度检验和?2独立性检验,并说明其用途。 ?2拟合优度检验是为了所得数据是否适合某个假设模型或者服从某种分布;?2独立性检验则是为了检验列联表中每个变量之间是否独立(20分) 四、 多重共线性对回归模型有哪些影响?判断多重共线性的判别方法主要有哪些? 估计量的方差增大;难以区分每个解释变量的单独影响;显著性检验失效;回归模型缺乏稳定性。 判断共线性,可以利用自变量之间的相关系数、方差膨胀系数等来进行判断 五、 (20分)在时间序列预测中,Box-Jenkins方法的基本思想是什么?它与经典的回归方法有何不同? 通过差分方法将某时间序列变换为平稳序列,再根据序列的自相关性、偏自相关性拟合得到相应的模型

45

本文来源:https://www.bwwdw.com/article/kcev.html

Top