大学统计学复习资料8相关

更新时间:2023-12-18 05:58:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

一.填空题

1. 若全部观察值都落在直线上,则相关系数等于(±1) 2. 按相关的方向分,相关关系可分为(正相关)和(负相关)。 3. 相关系数为“-1”时,表示(完全负相关 )相关。

4. 相关系数是在(线性) 相关条件下用来说明两个变量相关(关系 )的统计分析指标。 5. 估计标准误差是用来说明(回归方程)代表性大小的统计分析指标。

6. 相关系数是在(线性)相关条件下,用来说明两个变量相关(强度)的统计分析。

7. 现象之间的相关关系按相关的程度分有 相关 、 相关和_____ 相关;按相关的方向分有 相关和 相关 ;按相关的形式分有____ 相关和 相关;按影响因素的多少分有 相关和 相关。

完全相关、不完全相关、不相关;正相关、负相关;线性相关、非线性相关;单相关、复相关

8. 完全相关即是 相关,其相关系数为 。函数、±1

9. 相关系数是在 相关条件下用来说明两变相关 的统计分析指标。 线性、密切程度

10. 当变量X值增加,变量Y值也增加,这是 相关关系;当变量X值减少,变量Y

值也减少,这是 相关关系。正、正

11. 在回归分析中,两变量不是对等的关系,其中因变量是 变量,自变量是

( )量 。随机、可控制的

13. 用来说明回归方程代表性大小的统计分析指标是 指标。估计标准误;

14. 当变量X按一定数额变动时,变量Y也按一定的数额变动,这时变量X与变量Y存在着

关系。直线相关

15. 一个回归方程只能作一种推算,即给出 的数值,估计 的可能性。

自变量、因变量

16. 已知X变量的标准差为2,因变量的标准差为5,两变量的相关系数为0.8,则回归系数为

( )2

17. 已知直线回归方程Yc = a +bx 中,b= 17.5;又知n=30 ∑=13500 ,X =12 ,则可

知a = 。240 二.简答题

1. 说明相关系数的取值范围及其判断标准。

(1).相关系数的数值范围是在-1 和+1之间,即-1 ≤ R ≤1 ,R>0为正相关,R<0为负相关。

(2).判断标准:|R|<0.3 为微弱相关,0。3<|R|<0。5为低度相关 ;

0.5<|R|<0。8这显著相关,0。8 <|R|<1为高度相关; |R| =0时,不相关,|R|=1时完全相关。

2. 相关关系与函数关系有什么区别?

函数关系是现象之间的一种确定性的关系,相关关系是现象之间的一种不 确定性的关系,函数关系一般表现为相关关系 3. 什么是相关系数及其计算公式?

相关系数是在直线相关条件下,说明两个现象之间相关关系密切程度的统计分析指标。

r??xy?x?y

1

4. 相关关系的主要特征是什么?

①二现象之间存在一定的依存关系。②但它们不是确定的和严格依存的。 5.相关系数具有什么特点?

(1)两个变量是对称的,不分自变量与因变量,因此,相关系数只有一个。

(2)相关系数有正负号之分,反映正相关与负相关。3若以抽样调查取得资料,则两个变量都应是相同的随机变量。

Syx??(y?yc)2n?2的作用。

6.简述估计标准误差

Syx(1)说明回归估计值的准确程度,

值愈小,说明估计值与实际值平均误差愈小,估计

的准确程度愈高,反之,估计的准确程度低。 (2)说明回归直线的代表性大小。 (3)说明x与y的相关密切程度。

(4)在抽样条件下,它是回归抽样误差的一个估计值。 7. 相关关系的主要特征是什么?

①二现象之间存在一定的依存关系。②但它们不是确定的和严格依存的。 三.判断题

1.利用一个回归方程,两个变量可以互相推算。 × 2. 计算相关系数的两个变量都是随机变量。 √

3. 根据结果标志对因素标志的不同反映,可以把现象总体数量上的依存关系分为函数关系和相关关系。()√

4. 正相关指的就是因素标志和结果标志的数量变动方向都是上升的。()× 5.相关系数是测定变量之间相关密切程度的唯一方法。()×

6. 只有当相关系数接近于+1时,才能说明两变量之间存在的高度相关关系。若变量X的值减少时变量Y的值也减少,说明变量X与Y之间存在正的相关关系。()×

7. 若变量X的值减少时变量Y的值也减少,说明变量X与Y之间存在正的相关关系。()× 8. 回归系数和相关系数 都可以用来判断现象之间相关的密切程度。()√ 9. 若直线回归方程Yc=170-2.5x,则变量度 和 之间存在负的相关关系。× 10. 按直线回归方程Yc = a +bx配合的直线,是一休具有平均意义的直线。()√ 11. 回归分析中,对于没有明显关系的两个变量,可以建立 倚 变动和 倚 变动的两个回归方程。()√

12. 由变量 Y变量X回归和由变量X倚变量Y回归所得到的回归方程之所以不同,主要是因为方程中参数表示的意义不同。()√

13. 估计标准误指的就是实际值 y与估计值yc 的平均误差程度。()√ 14. 在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。()× 15. 研究发现,花在看电视上的小时数与阅读测验得分之间是负相关,因而可以认为看电视是使阅读能力降低的原因。×

16.根据航班正点率(%)与旅客投诉率(次/万名)建立的回归方程为:y= 6.02-0.07x,

? 2

其中回归系数为-0.07,表示旅客投诉率与航班正点率之间是低度相关。√

四.单项选择题

1. 产品产量与单位成本之间的简单相关系数为-0.92 ,并通过检验,这说明二者之间存 在着( A )。

A 、高度相关 B 、中度相关 C 、低度相关 D 、极弱相关 2. 当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()

A 相关关系 B 函数关系 C 回归关系 D 随机关系 B

3. 现象之间的相互关系可以归纳为两种类型,即()

A 相关关系和函数关系 B 相关关系和因果关系 C 相关关系和随机关系 D 函数关系和因果关系 A

4.相关系数的取值范围是()

A、0≤R≤1 B、-1<R<1 C、-1≤R≤1 D、 -1≤R≤0 A

5. 变量之间的相关程度越低,则相关系数的数值()

A 越小

B 越接近于0 C 越接近于-1 D 越接近于1 B

6. 在价格不变的条件下,商品销售额和销售量之间存在着()

A 不完全的依存关系 B 不完全的随机关系 C 完全的随机关系 D 完全的依存关系 B

7. 下例哪两个变量之间的相关程度高()

A 商品的销售额与商品销售量的相关系数是0.9; B 商品销售额与商业利润率的相关系数是0.84;

C 平均流通费用率与商业利润率的相关系数是-0.94; D 商品销售价格与销售量的相关系数是-0.91 D

8. 回归分析中的两个变量( )

A 都是随机变量

3

B 关系是对等的 C 都是给定的量

D 一个是自变量,一个是因变量

C

9. 每一吨铸铁成本(元)倚铸件废品率(%)变动的回归方程为:Yc=56+8X

这意味着()

A 废品率每增加1%,成本每吨增加64元 B 废品率每增加1%,成本每吨增加8% C 废品率每增加1%,成本每吨增加8元 D 如果废品率增加1%,则每吨成本为56元 C

10. 某校对学生的考试成绩和学习时间的关系进行测定,建立了考试成绩倚学习时间的直线回归方程为:Yc=180-5X,该方程明显有错,错误在于()

A、a值的计算有误,b值是对的 B、b值的计算有误,a值是对的 C、a值和b值的计算都有误 D、自变和因变量的关系搞错了 C

11. 配合回归方程对资料的要求是()

A 因变量是给定的数值,自变量是随机的 B 自变量是给定的数值,因变量是随机的 C 自变量和因变量都是随机的 D 自变量和因变量都是不随机的 B

12. 估计标准误说明回归直线的代表性,因此()

A 估计标准误数值越大,说明回归直线的代表性越小; B 估计标准误数值越大,说明回归直线的代表性越小; C 估计标准误数值越小,说明回归直线的代表性越小; D 估计标准误数值越小,说明回归直线的实用价值小。 B 13.相关系数的值总是( )

A.≥0 B.≤1 C.在0和1之间 D.在-1和1之间 E.等于1

14. 对于一给定的数据集合,发现变量X和Y之间的相关系数r =-0.9。这说明( )

A.在X和Y之间不存在线性关系 B.X随Y的减少而增加 C.在X和Y之间存在因果关系 D.这个计算是错误的 E.X随Y的减少而减少

15.研究发现工人的性别与收入之间的相关系数r =-0.61,那么( )

A.平均来看女性收入高于男性 B.平均来看女性收入低于男性

4

C.计算错误,这个r值不可能存在 D.这是没有意义的,因为r在这里无意义

E.这里相关系数-0.61没有太大意义,因为性别和收入之间的相关系数可能是非线性的 16.如果体重和收入之间的相关系数很高并且是正的,那么说明( )

A.高收入使人们吃更多的食物 B.低收入使人们吃更少的食物

C.一般来看,高收入人群花费在食物上的收入比例大于低收入人群 D.一般来看,高收入人群比低收入人群重 E.高收入使人的体重增加

17.一数据集合的散点图如下:观察到的图形是( )

A.非线性的并且含有几个异常值

B.非线性的并且至少含有一个有影响的观测值 C.近似线性并且有正的斜率 D.近似线性但有几个异常值 E.近似线性并且有负的斜率

0.70.60.5Y0.40.30.20.10020406080100120140Xúμ5ìa

18. 20世纪50年代美国失业率的散点图如下,下列陈述中正确的是:( A.在此期间失业率是常数 B.在此期间失业率随时间减少 C.失业率和时间之间存在适度正相关 D.A和C都正确 E.B和C都正确

5

5432105152535455565758195020世纪50年代美国失业率59

19. 当水流过农田时,一些土壤会随之流走,从而导致侵蚀。做实验研究水流速度对土壤流

失量的影响,水流用升/秒度量,而被侵蚀的土壤用千克来度量。数据如下表:

水 流 速 0.31 0.85 1.26 2.47 3.75 被侵蚀的土壤 0.82 1.95 2.18 3.01 6.07 在流速和被侵蚀的土壤量之间的关系是:( )

A.正的 B.负的 C.即不是正的也不是负的 D.无法确定

20. 相关系数度量( )

A.两个变量之间是否存在关系 B.散点图是否显示有意义的模型 C.两个变量之间是否存在因果关系 D.两个变量之间直线关系的强度

21. 欲确定身高(厘米)和体重(千克)之间的相关系数,对两个21岁的男性的测量结果

如下:

身高 178 191 体重 60 75

二者之间的相关系数是( )

A . 1.0 B.正的且在0.25和0.75之间 C.近似于0,但可能是正的也可能是负的 D.0

22. 一位同学想知道约会的男女之间身高是否相似。她测量了自己,她的室友和相邻房间

的女性的身高;然后又测量了每位女性下一位约会男性的身高。数据如下: 女 168 163 168 165 178 165 男 183 173 178 173 188 175 下列陈述中正确的是( ) A.测量的变量是类别型的

6

B.男女之间的身高存在强正相关,因为女性总是比她们所约会的男性矮 C.男女之间的身高存在正相关

D.相关系数在这里没有意义,因为性别是类别型的 23. 下列陈述中正确的是( )

A.相关系数等于两个变量落在同一条直线上的次数的比例

B.只有当所有数据都在一条完全水平的直线上时,相关系数才是+1.0 C.相关系数测量出现在散点图上的异常点的部分

D.相关系数是一个无单位的数,并且总是在[-1.0,+1.0]内 24. 下列陈述中正确的是( )

A.改变x或y的度量单位,不会改变相关系数的值 B.负的相关系数说明数据是强无关的

C.相关系数总是和x变量有相同的单位,而不是和y变量一样 D.相关系数总是和y变量有相同的单位,而不是和x变量一样 25. 关于下面的变量X和Y散点图的结论正确的是( )

0.350.30.250.20.150.10.05000.20.40.60.81

A.因为二者之间几乎是完全相关的,所以X和Y之间的相关系数必接近于1 B.因为二者之间几乎是完全相关的,所以X和Y之间的相关系数必接近于-1 C.X和Y之间的相关系数接近于0

D.X和Y之间的相关可能在-1和+1之间的任何数值。在不知道实际值的情况下我们无法

做出具体判断

26. 下面关于相关系数r的陈述正确的是( )

A.它是相关的强测度 B.-1≤r≤1

C.如果r是X和Y之间的相关系数,那么-r是Y和X之间的相关系数 D.以上都正确

27. 下面哪一个数据集合中X和Y的相关系数r等于1?( )

A.X:-1 0 1 B.X:1 2 3 C.X:1 2 3 D.X:-2 0 2 Y: 3 4 5 Y:-1 -2 -3 Y:1 -2 1 Y:6 0 6

7

28. 对某班级的调查发现学社身高和他所带的硬币数之间的相关系数为r =-0.30,据此可

出结论( )

A.矮个子的人倾向于花更多的钱

B.这是错的,因为-0.30的相关系数没有意义 C.带着硬币抑制身高

D.这是错的,因为身高和硬币之间的相关系数无法计算 E.高个子的人倾向于有更少的钱。 29. 相关系数给出了( )

A.一个变量变化导致的另一个变量变化的测量。 B.两个类别型变量之间的线性联系强度的测量。 C.两个类别型变量之间的联系强度的测量。

D.两个定量变量之间的线性联系强度的测量。

E.一个定量变量和一个类别型变量之间线性联系强度的测量。

30. 两个奥运会的运动员在每个运动项目上打平,比分总是相同的。但不同项目的实际分数

不同。这两个运动员的分数之间的相关系数是( )

A.1.0 B.0.0 C.-1.0 D.无法确定 E.0.5

31. 相关系数是两个定量变量之间的线性关系的强度和方向的一个测度。由变量x和y所表

示的一组数据点之间的相关系数r =0.95,这说明( ) A.x值越大,对应的y值越小。

B.在x和y之间存在强线性关系,x值越大,对应的y值越大。 C.不能证明x和y之间有线性关系。

D.x和y之间存在强线性关系,x值越大,对应的y值越小。

E.所有数据点都在同一条直线上。

32. 如果两个变量的联系方式是非线性的,相关系数:( )

A.总是负的 B.可以计算,但不能解释关系的本质 C.在-1和+1之间 D.总是正的 E.无法计算

33. 根据观测数据发现房子的出售价格和房子中卧室的数量之间是正相关的。所以有

( )

A.较多的卧室使得房子的价格更贵 B.高价格使得房子中有更多的卧室

C.有三间卧室的房子总是比有两间卧室的房子贵 D.房子的售价越高,房子中卧室的数量越多 E.房子的售价越高,房子中卧室的数量越少

34. 为了研究高血压和心血管疾病之间的联系,对一组年龄在35到64岁之间的男性进行了为

期5年的跟踪调查,得出下表中的数据:

8

血 压 低 高 死 亡 总 数 10 2000 50 3500 根据这些数据,下列陈述中正确的是( )

A.这些数据表明血压和由心血管疾病造成的死亡之间有联系 B.高血压男性的死亡率是低血压男性的死亡率的5倍

C.这些数据可能低估了高血压和由心血管疾病造成的死亡之间联系,因为男性倾向于

低报他们的真实血压 D.以上都对

35. 已知变量x和y之间的相关系数为0.83,那么新的变量x* =x/10和y* =5y之间的相关系数

为( )

A.0.083 B.0.83 C.0.415 D.无法确定 36. 若回归直线方程中的回归系数b= 0时,则相关系数( ) ① r = 1 ② r = -1 ③r = 0 ④ r无法确定 37. 下列属于相关现象的是( )

① 利息与利率 ② 居民收入与储蓄存款

③ 电视机产量与鸡蛋产量 ④ 某种商品的销售额与销售价格 38. 当?= 0.8时,下列说法正确的是( )

① 80%的点都密集在一条直线的周围 ② 80%的点高度相关 ③ 其线性程度是?= 0.4的两倍 ④ 两变量高度正线性相关

?39. 在直线回归方程y= a+bx中,回归系数b表示( )

① 当x= 0时y的平均值 ②x变动一个单位时y的变动总量 ③ y变动一个单位时x的平均变动量 ④x变动一个单位时y的平均变动量 40. 回归估计标准差

se的值越小,判定系数?的值越大,则回归直线( )

2

① 拟合程度越低 ② 拟合程度越高

③ 拟合程度有可能高有可能低 ④ 用回归方程进行预测越不准确 41. 如果相关系数?为负,说明( )

①y一般小于x ②x一般小于y

③ 随着一个变量增加,另一个变量减少 ④ 随着一个变量减少,另一个变量也减少

9

42.已知x与y之间存在负相关关系,指出下列哪一个回归方程肯定是错误的( ) ① y=-20-0.82x ②y= 300-1.82x ③y=-150+0.75x ④y= 87-0.32x 43. 若协方差?(x?x)(y?y)大于0,则两变量之间的相关关系是( ) ① 正相关 ② 负相关 ③ 高度相关 ④ 低度相关 44. 由同一资料计算的相关系数?与回归系数b之间的关系是( )

① ?大b也大 ② ?小b也小 ③ ?与b同值 ④ ?与b同符号 45. 居民收入与储蓄额之间的相关系数可能是( )

① -0.9247 ② 0.9247 ③ -1.5362 ④ 1.5362 46. 下列关系中属于负相关的有( )

① 总成本与原材料消耗量 ② 合理范围内的施肥量与农产量 ③ 居民收入与消费支出 ④ 产量与单位产品成本

47. 某研究人员发现,举重运动员的体重与他能举起的重量之间的相关系数为0.6,则( )

① 体重越重,运动员平均能举起的重量越多 ② 平均来说,运动员能举起其体重60%的重量 ③ 如果运动员体重增加10公斤,则可多举6公斤的重量 ④ 举重能力的60%归因于其体重 48. 具有因果关系的现象( )

① 必然具有函数关系 ② 必然具有相关关系 ③ 必然具有线性相关关系 ④ 必然具有非线性相关关系 49. 对具有因果关系的现象进行回归分析时( )

① 只能将原因作为自变量 ② 只能将结果作为自变量 ③ 二者均可作为自变量 ④ 没有必要区分自变量

?????50. 对于有线性相关关系的两变量建立的直线回归方程y= a+bx中,回归系数b( )

① 可以小于0 ② 只能是正数 ③ 可以为0 ④ 只能是负数 51. 大样本条件下,回归估计置信区间的上下限( ) ① 是对称地落在回归直线两侧的两条喇叭型曲线

② 是对称地落在回归直线两侧的两条直线

③ 是区间越来越宽的两条直线 ④ 是区间越来越宽的两条曲线

10

五.多项选择题

1.测定现象之间有无相关关系的方法是()

A 编制相关表 B 绘制相关图

C 对客观现象做定性分析 D 计算估计标准误 E 配合回归方程 ABC

2. 直线回归分析中()

A 自变量是可控制量,因变量是随机的 B 两个变量不是对等的关系

C 利用一个回归方程,两个变量可以互相推算 D 根据回归系数可判定相关的方向

E 对于没有系数可判定的两变量可求得两个回归方程 ABDE

3. 下例属于相关现象的是()

A 家庭收入越多,其消费支出也越多;

B 某产品产量随工人劳动生产率的提高而增加; C 流通费用率随商品销售额的增加而减少;

D 生产单位产品所耗工时随劳动生产率的提高而减少 E 产品产量随生产用固定资产价值的减少而减少。 ABE

4. 直线回归方程Yc =a +bx中的 称为回归函数,回归系数的作用是()

A 可确定两变量之间因果的数量关系 B 可确定两变量的相关方向

C 可确定两变量的实际值与估计值的变异程度 D 可确定因变量的实际值与估计值的变异程度

E 可确定当自变量增加一个单位时,因变量的平均增加值 ABE

5. 计算相关系数时()

A 相关的两个变量都是随机的 B 相关的两个变量是对等的

C 相关的两个变量一个是随机的,一个是可控制的量 D 相关系数有正负号,可判断相关的方向 E 可以计算出自变量和因变量两个相关系数 ABD

6. 可用来判断现象之间相关方向的指标有()

A 估计标准误 B 相关系数 C 回归系数

D 两个变量的协方差 E 两个变量的标准差 ABD

7. 工人的工资(元)依劳动生产率(千元)的回归方程为 Yc 10+70x,这意味着() 11

A 如果劳动生产率等1000元,则工人工资为70元;

B 如果劳动生产率每增加1000元,则工人的工资平均提高70元; C 如果劳动生产率等于1000元,则工人工资增加80元; D 如果劳动生产率等1000元,则工人工资为80元;

E 如果劳动生产率每下降1000元,则工人工资平均减少70元。 BCD

8. 在回归分析中,就两个相关变量x与y而言,变量y倚变量x的回归和变量x倚变量y的回归所得的两个回归方程是不同的,这种不同表现在()

A 方程中参数估计的方法不同 B 方程中参数的数值不同 C 参数表示的实际意义不同 D 估计标准误的计算方法不同 E 估计标准误的数值不同 BDE

9.估计标准误是反映()

A 回归值与实际值平均误差程度的指标 B 估计值与实际值平均误差程度的指标 C 自变量与因变量离差程度的指标 D 因变量估计值的可靠程度的指标 E 回归方程实用价值大小的指标 BCE

10. 一个由100人组成的25-64岁男子的样本,测得其身高与体重的相关系数?为0.4671,则下列选项正确的有( )

① 较高的男子趋于较重 ② 身高与体重存在显著正相关 ③ 体重较重的男子趋于较高 ④ 身高与体重存在低度正相关 ⑤ 46%的较高的男子趋于较重

11. 回归估计标准差说明( )

① 自变量与因变量的平均离差 ② 自变量之间的平均离差 ③ 回归估计的精确度 ④ 回归方程的代表性大小 ⑤ 自变量各实际值与其估计值之间的平均差异

12. 收入水平与受教育程度之间的相关系数?为0.6314,这种相关属于( )

① 单相关 ② 复相关 ③ 高度相关 ④ 正相关 ⑤ 显著相关 13. 如果两个变量之间完全相关,则以下结论中正确的是( )

① 相关系数?的绝对值等于1 ② 判定系数?等于1

2

③ 回归系数b大于0 ④ 回归估计标准差⑤ 回归估计标准差

se等于1

se等于0

12

14. 根据某样本资料得产量(万件)与单位产品成本(百元)之间的回归方程为y= 920-8x,这意味着( )

① 产量与单位成本之间是负相关 ② 产量与单位成本之间是正相关 ③ 产量为1万件时,单位成本平均为912百元 ④ 产量每增加1万件,单位成本平均增加8百元 ⑤ 产量每增加1万件,单位成本平均减少8百元 15. 指出下列表述哪些肯定是错误的( )

①y= 80+5x ?= 0.6128 ②y=-30+5x ?= 0.8746 ③y= 80-5x ?= 0.6521 ④y=-30+5x ?=-0.8746 ⑤y= -100-2x ?=-1.2011

16. 机床的使用年限与维修费用之间的相关系数是0.7213,合理范围内施肥量与粮食亩产量之间的相关系数为0.8521,商品价格与需求量之间的相关系数为-0.9345;则( )

① 商品价格与需求量之间的线性相关性最低 ② 商品价格与需求量之间的线性相关性最高 ③ 施肥量与粮食亩产量之间的线性相关性最高 ④ 施肥量与粮食亩产量之间的线性相关性最低 ⑤ 机床的使用年限与维修费用之间的线性相关性最低 17. 理想的回归直线,应满足( )

① 实际值与其平均值的离差和为0 ② 实际值与其平均值的离差平方和最小 ③ 实际值与其估计值的离差和为0 ④ 实际值与其估计值的离差平方和最小 ⑤ 平均值与其估计值的离差平方和最小

18. 下列现象具有相关关系的有( )

① 降雨量与农作物产量 ② 单位产品成本与劳动生产率 ③ 人口自然增长率与农业贷款 ④ 存款利率与存款期限 ⑤ 利息收入与存款利率

19. 在直线回归方程中,回归系数的数值(②⑤)

①表明两变量之间的相关程度 ②表明两变量之间的变动比例 ③表明两变量之间的密切程度 ④表明两变量之间的计算单位 ⑤在数学上称为斜率 六.计算题

1. 某地区1991-1995年个人消费支出和收入资料如下:

年份 1991 1992 1993 1994 1995 ?????? 13

个人收入(亿元) 消费支出(亿元) 64 56 70 60 77 66 82 75 92 88 要求:(1)计算个人收入与消费支出之间的相关系数 (2)配合消费支出对个人收入的直线回归方程

1?x?ynr??0.9811(?x2?(?x)2)(?y2?(?y)2)nnLxyb??1.169Lxx?xy?a?y?bx??20.998?c??20.998?1.169xy

2.某企业某种产品产量和单位成本资料如下:

月份 产量(千件) 单位成本(元/件) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68 (1)建立直线回归方程,指出产量每增加1000件时,单位成本如何变化?

(2)如果产量为6000件时,单位成本为多少? (3)单位成本为70元时,产量为多少? 解:(1)建立方程:

设产量为x,单位成本为y,可得

??77.36?1.82xy表明产量每增加1000件时,单位成本下降1.82元(2)预测单位成本66.44元(3)预测产量:建立产量倚单位成本的回归直线方程为??35.77?0.4545yx当单位成本为70元时,产量为3.95千件

3.有某种水果200克,放在一定温度的容器中,每隔30分钟测量维生素c的含量,得到如下数据:

时间x 维生素含量y 0 1 2 3 4 10 8 7 6 6 (1) 求y对x的回归直线; (2)求单位时间(30分钟为一个单位)维生素减少的数量; 检验回归方程的效果。

b?LxyLxx??1

14

a?y?bx?9.4 y??9.4?x 根据b的几何含义,单位时间减少一个单位的维生素含量。

4.检查五位学生统计学原理的学习时间与成绩如下表所示: X 学习时数(小时) 4 6 7 10 13 Y 学习成绩(分) 40 60 50 70 90 根据资料:

(1)计算相关系数,并判断相关程度

(2)建立回归方程,说明回归系数的含义

经计算得:

?X?40,?y?310,?X2?370,?y2?20700,?xy?2740 ??n?xy??x?y?5?2740?40?310(1)

n?x2?(?x)2n?y2?(?y)25?370?4025?20700?3102?1300250?7400?0.9558

(2)设yc=a+bx

b?n?xy??x?yn?x2?(?x)2?1300250?5.2

a?y?bx??y?x310n?bn?5?5.2?405?20.4

?yc?20.4?5.2x

5.某企业某种产品产量和单位成本资料如下:

月份 1 2 3 4 5 6 产量(千件) 2 3 4 3 4 5 单位成本(元/件) 73 72 71 73 69 68 (1)建立直线回归方程,指出产量每增加1000件时,单位成本如何变化?

(2)如果产量为6000件时,单位成本为多少? (3)单位成本为70元时,产量为多少? 解:(1)建立方程:

设产量为x,单位成本为y,可得

15

本文来源:https://www.bwwdw.com/article/4wv5.html

Top