社会统计学复习题

更新时间:2023-06-08 09:00:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

社会统计学复习题

社会统计学复习题

一、名词解释

1、社会统计学 2、中位数 3、众数

4、点估计:所谓点估计,就是根据样本数据算出一个单一的估计值,用它来估

计总体的参数值。

5、区间估计:所谓区间估计,就是计算抽样平均误差,指出估计的可信程度,

进而在点估计的基础上,确定总体参数的所在范围或区间。

6、置信区间:置信区间就是我们为了增加参数被估计到的信心而在点估计两边

设置的估计区间。

7、消减误差比例:变量间的相关程度,可以用不知Y与X有关系时预测Y的

误差E0,减去知道Y与X有关系时预测Y的误差E1,再将其化为比例来度量。

将削减误差比例记为PRE。

8、因果关系:变量之间的关系满足三个条件,才能断定是因果关系。1)连个变

量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之

间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)

两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为

自变量,后者称为因变量。

9、正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;

负相关是指一个变量的值增加时,另一变量的值却减少。

10、散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以

直观地观察X与Y的相互关系,即得相关图,又称散点图。

11、同序对:在观察X序列时,如果看到Xi Xj,在Y中看到的是Yi Yj,则

称这一配对是同序对。

12、异序对:在观察X序列时,如果看到Xi Xj,在Y中看到的是Yi>Yj,则

称这一配对是异序对。

13、大数定理:当我们的观察次数n趋向无限时,随机事件可能转换为不可能事

件或必然事件。即,在大量观察的前提下,观察结果具有稳定性。

社会统计学复习题

二、选择题

6.下面能进行除法运算的测量尺度是( )

A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度

7.教育程度是( )的测量。

A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度

8.智商是( )的测量。

A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度

9.籍贯是( )的测量

A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度

10.在社会统计学中,( )是反映集中趋势最常用、最基本的平均指标。

A 中位数 B算术平均数 C 众数 D几何平均数

11.关于学生t分布,下面哪种说法不正确( B )。

A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本 D 可用样本标准差S代替总体标准差

12.在统计检验中,那些不大可能的结果称为( D )。如果这类结果真的发生

了,我们将否定假设。

A 检验统计量 B 显著性水平 C 零假设 D 否定域

13.在用样本指标推断总体指标时,把握程度越高则( B )。

A 误差范围越小 B 误差范围越大

C 抽样平均误差越小 D 抽样平均误差越大

14.当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与

y之间存在( A )关系。

A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

15.评价直线相关关系的密切程度,当r在0.5~0.8之间时,表示( C )。

A 无相关 B 低度相关 C 中等相关 D 高度相关

17.关于相关系数,下面不正确的描述是( B )。

A当0 r 1时,表示两变量不完全相关;

B当r=0时,表示两变量间无相关;

C两变量之间的相关关系是单相关;

社会统计学复习题

D如果自变量增长引起因变量的相应增长,就形成正相关关系。

18.欲以图形显示两变量X和Y的关系,最好创建( D )。

A 直方图 B 圆形图 C 柱形图 D 散点图

19.两变量X和Y的相关系数为0.8,则其回归直线的判定系数为( C )。

A 0.50 B 0.80 C 0.64 D 0.90

20.在完成了构造与评价一个回归模型后,我们可以( D )。

A 估计未来所需样本的容量

B 计算相关系数和判定系数

C 以给定的因变量的值估计自变量的值

D 以给定的自变量的值估计因变量的值

21.两变量的线性相关系数为0,表明两变量之间( D )。

A 完全相关 B 无关系 C 不完全相关 D 不存在线性相关

23.在相关分析中,对两个变量的要求是( A )。

A 都是随机变量 B 都不是随机变量

C 其中一个是随机变量,一个是常数 D 都是常数

24.在回归分析中,两个变量( D )。

A 都是随机变量 B 都不是随机变量

C 自变量是随机变量 D 因变量是随机变量

25.一元线性回归模型和多元线性回归模型的区别在于只有一个( B

A 因变量 B 自变量 C 相关系数 D 判定系数

26.以下指标恒为正的是( D )。

A 相关系数r B 截距a C 斜率b D 复相关系数

27.下列关系中,属于正相关关系得是( A )。

A 身高与体重 B 产品与单位成本

C 正常商品的价格和需求量 D 商品的零售额和流通费率

28、下列变量中属于定序变量的是( )

A、门牌号 B、学生学号 C、职称等级 D、身高

29、用具有频数最多的变量值来表示变量的集中值被称为( )

A、众值 B、中位值 C、均值 D、四分位差 。 )

社会统计学复习题

30、标准差数值越小,则反映变量值( )

A、越分散,平均数代表性越低 B、越集中,平均数代表性越高

C、越分散,平均数代表性越高 D、越集中,平均数代表性越低

31、下面不属于正态分布图特征的是( )

A、有一条对称轴 B、有一条渐近线

C、有一个顶点 D、有2个单位的面积。

32、直方图具备的特征是( )

A、高度代表频次 B、宽度代表频次

C、面积代表频次 D、各分段组可以分开

33、采用回置法,从一副52张扑克牌里抽取两次,抽中两张红桃的概率为( )

A、1/52 B、1/16 C、1/13 D、1/4

34、下列属于定类层次相关分析法的是( )

A、斯皮尔曼系数 B、Lambda系数 C、Gamma系数 D、eta系数

35、当样本量n=25时,我们对其进行均值检验时,应该选用( )方法进行。

A、Z检验 B、F检验 C、T检验 D、上述三者都可以

36、如果,Xi>Xj ,Yi<Yj,那么,就称被调查者i和j这一配对为( )。

A、异序对 B、同序对 C、X的同分对 D、Y的同分对

37、一般认为:积差系数r值等于0.3为( )。

A、完全相关 B、高度相关 C、中等相关 D、无相关

38、下列变量中不属于定类变量的是( )。

A、车牌号 B、手机号 C、学历 D、性别

39、数列2、3、5、1、7、9、2的中位值是( )。

A、5 B、3 C、2 D、1

40、两个正态分布分别为:N(1,25)和N(5,36),将两个正态分布作图,

下列说法错误的是( )。

A、前者图形的顶端更细小 B、前者图形更靠左

C、后者图形的顶端更细小 D、后者图形更靠右

41、直方图里,频次由( )来表示。

A、面积 B、高度 C、宽度 D、组距

社会统计学复习题

42、从一副52张的扑克牌中抽一张牌,抽到一张红桃或者方块的概率是( )。

A、1/5 B、1/4 C、1/3 D、1/2

43、下列属于定类层次相关分析法的是( )

A、斯皮尔曼系数 B、Lambda系数 C、Gamma系数 D、eta系数

44、从某公司抽取200名员工作为样本进行调查,进行推论分析时,除了( )外,其他三个都是我们采用Z检验法的原因。

A、样本容量数符合小样本要求 B、总体符合正态分布

C、满足大数定理要求 D、样本容量达到大样本要求。

45、如果,Xi>Xj ,Yi>Yj,那么,就称被调查者i和j这一配对为( )。

A、异序对 B、同序对 C、X的同分对 D、Y的同分对

46、区间估计里,置信区间内的置信度大小为( )。

A、α B、β C、1-α D、1-β

47、简单线性回归分析中,两变量的层次分别为( )

A、定类—定类 B、定类—定序 C、定序—定距 D、定距—定距

三、填空题

1.( )和中心极限定理为抽样推断提供了主要理论依据。

2.抽样推断中,判断一个样本估计量是否优良的标准是(无偏性)、(一致性)、

(有效性)。

3.在一副扑克牌中单独抽取一次,抽到一张红桃或K的概率是( 1/4 );在

一副扑克牌中单独抽取一次,抽到一张红桃K的概率是( 1/52 )。

5.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分

布就趋于(正态)分布。

6.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的( 显

著性水平 ),它决定了否定域的大小。

7.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性

越( 大 ),原假设为真而被拒绝的概率越( 小 )。

8.参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计

和( 区间估计 )。

社会统计学复习题

9.变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减

去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是

( 削减误差比例 )。

10.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值Yc是服从( );

11.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对

具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学

表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常

又称为( 回归分析 )

12、变量层次一般分为、、和 。

13、统计按其内容主要包括两个方面:分析和分析。

14、定类层次主要的集中趋势法是定序层次主要的离散趋势法是

15、统计推论分为参数估计和其中参数估计又分为

16、置信区间与可信度之间是成即估计的区间越大,则可信度也就

越 。

17、根据样本计算出来的一切统计数字特征值被称为,总体值称为

18、众数运用层次变量

的集中趋势分析,均值用于定距层次变量的 分析,标准差用于定距层次

变量的 分析。

19、正态分布图的形状和位置主要由和决定。

20、测量两个变量的相关系数时,首先考虑的是变量的间是否对称,最后最好选用具备 意义的相关系数。

21、以样本的统计值来估计总体的参数值,有两大类做法,一类是类是 ,二者均要求样本是以 方法抽取的。

22、某一孕妇生男生女纯属偶然现象,但全市出生的婴儿性别比例一直维持在

50%左右,这种现象称为定理。

23、假设检验时,首先需要做出假设和被择假设,并以假设为基础进

行数据推导,如果我们的统计检验值落在,我们就应该接受被择假设。

社会统计学复习题

三、判断题

1.社会统计描述,即通过部分研究对象的统计资料对研究对象的总体的性质进

行推论与归纳。 ( )

2.推论统计需要的统计资料相对而言较少,所以在人力、物力及时间等方面比

较经济,研究和应用的范围也拓宽了许多。( )

3.无论分布曲线是正偏还是负偏,中位数都居算术平均数和众数之间。( )

4.在同样的显著性水平的条件下,单侧检验较之双侧检验,可以在犯第一类错

误的危险不变的情况下,减少犯第二类错误的危险。( √ )

5.统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。

( √ )

6.检验的显著性水平(用 表示)被定义为能允许犯第一类错误的概率,它决定了

否定域的大小。( √ )

7.第一类错误是,零假设H0实际上是错的,却没有被否定。第二类错误则是,

零假设H0实际上是正确的,却被否定了。 ( × )

8.每当方向能被预测的时候,在同样显著性水平的条件下,双侧检验比单侧检

验更合适。 ( × )

9.进行区间估计,置信水平总是预先给定的。 ( √ )

10.由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用

它来定义相关程度可适用于变量的各测量层次。( √ )

11.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关。( √ )

12.不管相关关系表现形式如何,当r=0时,变量X和变量Y都是完全不相

关。( × )

13.通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布

的比较进行的。而如果两变量间是相关的话,必然存在着Y的相对频数条件分布

相同,且和它的相对频数边际分布相同。( × )

14.如果众数频数集中在条件频数分布列联表的同一行中, 系数便会等于0,

从而无法显示两变量之间的相关性。 ( √ )

15.从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而

社会统计学复习题

回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。 ( × )

16、离散趋势是测量数据间的差异程度。 ( )

17、两个定类变量间的相关系数范围在[-1,1]间。 ( )

18、相关系数r等于-1,说明变量之间不存在相关关系。 ( )

19、标准正态分布的曲线对称轴为X=0。 ( )

20、当样本量n>30时,无论n如何增大,样本的统计值倾向稳定。 ( )

21、参数估计就是在一定的抽样误差内设一个可置信的区间,然后联系到这个区

间的精度,将样本的统计值推断为总体的参数值。 ( )

22、假设检验与参数估计最终关心的都是总体的参数状况。 ( )

23、利用样本对总体进行区间估计时,置信度越高,则区间就越窄。 ( )

24、假设检验过程中,如果统计检验值大于临界值,则拒绝零假设。 ( )

25、在积矩相关分析结果r=0,则说明两变量不呈直线相关。 ( )

26、根据研究需要,可以将定距变量降格为定类变量进行分析。 ( )

27、某公司员工的月收入标准差为100元,说明该公司员工收入差距大。( )

28、直方图用于定类层次的变量作图。 ( )

29、推论统计关注的是样本的统计值而不是总体的参数值。 ( )

30、对大样本的假设检验选用Z检验法,主要是因为它满足正态分布。 ( )

31、两端假设检验中,否定域的大小为α。 ( )

32、样本容量多少与研究容许的误差大小呈正比。 ( )

33、从同一总体中抽出的多个大样本的均值组成的数列满足正态分布。 ( )

34、如果两个变量是呈相关关系,那么它们一定呈因果关系。( )

35、在积矩相关分析结果r=0,则说明两变量不相关。 ( )

四、计算题

1.某工厂50名职工每周工资数分配情况如下表,试求:(1)算术平均;(2)中

位数;(3)众数。

社会统计学复习题

2、某车间职工工资分布情况如下表,求该车间职工的平均工资,职工工资的中位数以及标准差。

3、某单位统计报表显示,人均月收入为3030元,为了验证该统计报表的正确性,作了共100人的抽样调查,样本人均月收入为3060元,标准差为80元,问能否说明该统计报表显示的人均收入的数字有误(取显著性水平α=0.05)。

4、某地区成人中吸烟者占75%,经过戒烟宣传之后,进行了抽样调查,发现了100名被调查的成人中,有63人是吸烟者,问戒烟宣传是否收到了成效?(α

=0.05)

5、从某校随机地抽取81名女学生,测得平均身高为163厘米,标准差为6.0厘米,试求该校女生平均身高95%的置信区间。

6、对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。

社会统计学复习题

7、以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma系数。

8、两变量X、Y之间的关系如下表,

(1)求回归方程;(2)求相关系数。 【Y=-0.957X+14.867】【r=0.98】

9、试就下表所示资料,计算关于身高和体重的皮尔逊相关系数。

社会统计学复习题

10、某工厂50名职工每天工资数分配情况如下表,试求 :(1)众数所在的组;

(2)中位数;(3)平均数。

11、下表是对40位员工工作满意度和企业归属感的调查数据,请求出其Gamma系数,并解释其意义。

社会统计学复习题

12、在一个正态总体中抽取一个容量为25的样本,其均值等于52,标准差S=12,求置信水平为95%的总体均值的置信区间。

13、一位研究者试图检验某一社会调查所运用的抽样程序,该项调查是由一些缺乏经验的访问员进行的。研究者怀疑属于干部和知识分子的家庭抽得过多。过去的统计资料表明,该街区的家庭收入是7500元,标准差是1500元;此次调查共抽取100个家庭,样本平均收入是7900元。问:该研究人员是否有理由怀疑该样本有偏估?(选用α=0.05)

14、设x为一般正态分布的变量,请计算:

(1)pr(x>7.1),如果=5,S=2;

(2)pr(x<860),如果=500,S=300;

(3)pr(9.8<Z<10.2),如果=10,S=0.2;

(4)pr(10<Z<11),如果=10.73,S=0.25。

15、为了研究受教育年限和职业声望之间的关系,设以下是8名抽样调查的结果,试求职业声望与受教育年限的回归方程。

社会统计学复习题

16、为了验证统计报表的正确性,作了共50人的抽样调查,人均收入结果有: X=871元,S=21元,问能否证明统计报表中人均收入 =880元是正确的(显著性水平 =0.05)。

17、已知初婚年龄服从正态分布,根据9个人的抽样调查有:x=23.5(岁),s=3(岁) 问:是否可以认为该地区平均初婚年龄已超过20岁( =0.05)。

本文来源:https://www.bwwdw.com/article/fwd1.html

Top