调查分析师调查概论知识点

更新时间:2024-01-06 05:28:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

调查概论

名词解释

1.调查:调查就是使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的部分或所有单元收集感兴趣的指标信息,并将这些信息综合编辑成有用的简要形式的所有活动。

2.名录框:定义为一份所有总体单元的实际的或者概念的名录清单。

3.多重抽样框:多重抽样框是两个或两个以上抽样框的组合。例如。它可能是名录框和区域框的组合或者两个及两个以上名录框的组合。

4.无回答:是指调查时未能从指定的被调查者处获得有效的回答。无回答有两种类型:一种是全部无回答,又称单元无回答,它是指被调查单元没有提供任何信息。另一种是部分无回答,又称项目无回答,它是指问卷中某些问题回答的空缺。

5.派员访问:是派调查员与被调查者面对面进行的一种调查方式。对某些目标总体来说,这是收集数据惟一可行的方法。例如:有些调查无法采用自填的方式;有些大规模调查对象要求调查员在现场确定被调查对象;很多被调查对象没有电话或者识字率很低。 6.直接观察法是由调查员在现场对被调查者的情况直接观察、记录以取得有关信息的一种调查方法。它不是直接向被调查者提出问题要求回答,而是凭调查人员的直观感觉或是利用有关器械,如照相机、录像机或其他器材,记录和考察被调查者的活动和现场事实,以获得必要的信息。

7.小组座谈法是采用小型座谈会的形式,从调查对象中挑选一组有代表性的人,在主持人的组织下,就某个专题进行讨论,从而获得对有关问题的深入了解。

8.问卷的有效性:有效性又称效度或准确性。它是指问卷能准确地反映客观事物特征或属性的程度。如果某之方法准确地反映了我们所要了解的现象或概念,就称该方法是有效的。 9.问卷的可靠性:可靠性又称信度,它是指问卷测量结果的一致性或稳定性。 10.焦点座谈:焦点座谈是由从所研究总体中选出的若干对象对所选主题进行的非正式讨论。通过焦点座谈这种形式,使被调查对象或数据用户以及调查员有机会把他们的观点纳入问卷数据过程。

11.引导性问题P60;引导性问题是指建议或指导被调查者选择某一特定答案时具有倾向性。换句话说,问题措辞方法对问题的回答产生了影响。引导性问题能误导调查回答并影响调查结果。

12.随机化回答方法P66对敏感性问题的一种特殊的调查方法是采取随机化回答方法,这一方法是由美国统计学家沃纳提出来的。这种方法的设计原则是建立在不暴露被调查者对问题的直接回答的基础上。

13.李克特度量方法P74又称加分打分的度量方法,这种度量方法在问卷设计中应用十分广泛。它是由一组反映态度的问题组成,根据被调查者态度反映的不同程度给定分数。

14.项目间比较量表P76项目间比较量表通常采用固定和方法,这种方法是对两个或两个以上的项目给出一个总分,要求被调查者在各项目之间进行划分。这个总分通常是100分,对于计算比例比较方便。 15.样本的抽样概率P81:一个是指在一定的抽样方式下有多少不同的样本可以抽取,某个具体样本被抽中的概率。另一个含义是指某个总体单元被选入样本的概率。 16.抽样比:是指样本的容量n与总体的容量N之间的比率

17.配额抽样:抽样是要从各个子总体中选取特定数量的样本单元,这种特定数量的比例关系就称作配额。故配额抽样本质上是一种满足每个特定子总体样本量的一种手段。

18.滚雪球抽样:如果我们想找到在总体中某种较为稀少的个体,而且我们已经知道其中某

些个体并有可能与其接触,那么就有可能通过询问这些个体,获得他们类似的个体。这样所得的样本就像一个从小山上滚下来的雪球那样逐渐增大。

19.PPS抽样:不等概率抽样,采用抽选的概率与单元规模大小成比例,用英语单词的第一个字母表示,简称PPS抽样

20.整群抽样:由若干个有联系的基本单元所组成的集合称为群。抽样时以群为抽样单元的抽样方法就称为整群抽样。

21.抽样分布:估计量是一个随机变量,它的具体估计值是随着不同的样本单元而变化的,因而就有一定的分布,这个分布就叫做抽样分布。

22.设计权数:设计权数其实就是样本单元的入样概率的倒数,通常假定每个单元的入样概率是已知的,这样我们才能对总体进行估计。对于概率抽样来说,每个单元都有一个已知的入样概率。假如入样概率为1/50,那么每个入选样本代表总体中的50个单元,此时设计权数即为50。

23.自加权设计:如果所有样本单元的设计权数都相同,那么称这样的抽样设计为自加权设计。

24.无回答调整因子:无回答调整因子是原样本单元的权数之和与给出回答的单元的权数之和的比值。

25.事后分层:如果可能从其他方面获得分层信息,或者抽选样本后可以得到更新、更可靠的分层信息,那么在数据收集之后,可以利用数据收集的结果,选用其中合适的变量对收集到的样本进行分层,从而对样本的权数进行调整,这就是通常所说的事后分层。

26.访问手册:访问手册是访问员(调查人员)主要的工作指南,调查人员根据访问手册开展工作。

27.编码:编码是给问题的每项答案赋予一个数值代码,以便于数据录入和作进一步处理的过程。

28.双机录入:双机录入是指将同一问卷上的内容在计算机中录入两次,两次使用不同的录入人员。

29.插补:插补就是在审核过程中辨别出来的数据缺失、无效与不一致等问题的过程。 30.均值插补:均值插补就是对缺失或不一致的值用插补类的均值代替。

31比率或回归插补:比率或回归插补是使用辅助信息及其他记录中的有效回答建立一个比率或回归模型,该模型表明了两个或多个变量之间的关系。

32.热平台插补:热平台插补是使用同一插补类中的供着记录的信息来替代一个相似的受着记录中缺失的或不一致数据的插补方法。

33.冷平台插补:冷平台插补与热平台插补类似,不同之处在于热平台插补使用当前调查的供者,而冷平台插补则使用其他资料中的供者。;冷平台插补经常使用前期的或普查中的数据。

34.中位数:中位数是一组数据按数值大小排序(例如从小到大)后,位置在最中间的值。 35,。众数:众数是出现频率最高的那个数值(对样数据来说,它是出现频率较高的加权数值)。

36、极差:又称全距,是数据最大值与最小值之差(对样本数据来说,是加权最大值与加权最小值之差),由于这个度量只用到了数据分布中的两个值,所以它只给出了数据离散趋势的一个大致的描述,并且很容易受极端值的影响。 37、推断性数据分析就是采取概率抽样所收集的数据来推断总体的特征。所使用的分析方法有置信区间、假设检验、方差分析和线性回归。 38、线性模型是一种统计方法,它用于研究一个响应变量(又称因变量)和多个解释变量(又称自变量)之间的线性关系。

39、泄密控制指那些为避免数据发布侵犯被调查者的隐私而采取的措施。例如,汇总表中带标志的数格可能暴露被调查者的个人机密。有时候,泄密控制会对数据的质量产生负面影响,因为有些数据得不到发表或必须进行修改(通过舍入数据、合并类别、排除小数格等)。泄密控制是为了确保被调查者的个人隐私受到尊重,与此同时最大程度地保持数据的效用。 40.归属泄密是指发布数据时,提供了关于某个特定子总体或特定组的信息,这些信息通常不应为人所知。由于普查(全面调查)的调查结果通常没有或然性,所以归属泄密经常发生在普查(全面调查)中。

简答 论述 多选

1.调查目标的确定:1.明确信息需求2.数据使用者和数据的用途3.确定 2.调查指标和调查对象

抽样调查和全面调查之间做抉择时,要考虑几个重要因素:1.费用2.时效3.总体大小4.小区域(范围)的估计5.属性的多寡6.调查误差7.特殊要求8.其他因素

值得注意的是:全面调查和抽样调查部室完全对立的,根据具体调查的需要,可将这两种方法结合起来使用

3. 一个抽样框包括的内容 1 识别资料 2 联系资料 3 辅助资料

4. 名路况的内容1 生命统计登记 2 商业注册登陆 3 地址和邮政编码 4 电话号码簿 5.抽样框的优良性准则 1 关联性 2 准确性 3 时效性 4 费用 5 抽样框所提供的信息应该使用标准的概念、定义跟方法,并使客户对这些都能理解

6. 抽样框典型缺陷 1 不完全涵盖或称不完全覆盖 2 过涵盖也称过覆盖 3 重复 4 空白单位 5 分类错误

7. 自填式问卷优点 1 自填式问卷一般通过邮寄方式进行,通常采用匿名的方法2 费用比较低3 调查区域广泛

8. 自填式问卷缺点 1 回答率通常低于访员协助式方法 2 当问卷中包含许多有关问卷的调查概念、定义和指南的参考资料时通常就不如调查员在场的效果好 3 自填式方法对被调查者的回答负担较大

9. 访问调查的优点 1 回答率较高 2 访问调查可以使用比较复杂的问卷 3 访问调查的数据比较准确

10. 访问调查缺点 1 面访调查的费用比较高 2 调查的时间比较长 3 某些群体的访问成功率比较低 4 实施质量控制比较困难 5 对调查人员要求高

11.电话调查的优势 1 时效快 2 费用低 3 可能访问到不容易接触到的对象 4 与邮寄调查相比可以及时处理疑难问题 5 易于控制实施的质量

12. 网络调查的优点 1 成本低、范围广、速度快 2 交互性好能够实现问卷多样化设计 3 为各种调查提供了丰富的抽样框 4 有更好的质量控制

13.各种数据的收集方法的比较 1 从抽样框的情况来考虑 2 从目标总体的特征来考虑 3 从调查问题的性质来考虑 4 从调查的经费与资源来考虑 5 从管理的难易程度来考虑 6 从数据质量要求来考虑

14. 问卷测试的重要性好处跟方法 好处有,使问卷对被调查者和调查人员具有友好的界面;有利于收集到正确的数据时问卷的格式更有利于数据编码跟录入;减少数据收集和处理的费用及时间。 问卷调查的方法很多,主要有认知法和焦点座谈法。认知法是考察被调查者回答问题时的思考过程和方法,它有助于评估问题的有效性和识别计量误差的潜在来源;焦点座谈法是由从所研究总体中选出的若干对象对所选主题进行的非正式讨论,通过这种形式使被调查对象或数据用户以及调查员有机会把他们的观点纳入问卷数据过程

15.随机化回答方法 对于某个要调查的敏感性问题,列出正反两个问题,由被调查者从中随机抽取一个来回答。被调查者抽选到哪个问题来回答,并不告诉调查人员,回答的内容是

把抽到的问题与被调查者的实际情况相对照,只回答“是”或“否”。这样,调查人员就不知道被调查人员在回答哪一个问题,从而为被调查者提供真实情况起到了保密的作用。 16. 问卷的格式 1 问题的顺序 2 过度的说明 3 对被调查者的提示或说明4 格式的考虑 17.非概率抽样的优点1.快速简便2.费用相对较低3.不需要任何抽样框4.非概率抽样对探索性研究和调查的设计开发很有用

18.分层抽样的优点

1.分层抽样能提高对总体估计值的精度,从而使抽样效率更高

2.能保证样本对被定义为层的那些子总体的代表性,从而得到有效的估计 3.操作与管理方便

4.能避免得到一个'\差的\样本

5.在不同的层中可以使用不同的抽样框和不同的抽样方法

19.那些设计师自加权的呢?简单随机抽样是一种自加权设计,这是每个单元都有相等的入样概率。同样道理,系统抽样也是一种自加权设计。对于分层抽样,如果按各层的大小等比例分配样本,而且每层内都采用简单随机抽样,那么它也是自加权设计。也就是说,如果各层的抽样比相同,总体中每个单元就具有相同的入样概率,这样的分层抽样设计就是自加权设计。

20.使用辅助信息主要有两个原因:首先,为使调查估计值与已知的总体总值,或者从另一调查所得的估计值相匹配。使用辅助变量的第二个原因是为了提高估计值的精度。 21.调查前的准备:编写手册 职员和调查人员的招聘和培训 编制名录和寻踪

22.访问手册内容:1一般信息 2简介 3问卷说明 4问卷的审核与整理 5单个样本单元的管理 6作业管理 7问题与答案

23.你为什么挑选我?

调查人员应该对随机抽样的方法进行说明,让被调查者明白他是被随机抽取的,他实际上代表了总体中的个体,所以他的回答对于整个调查时非常重要的。

24.常用的追问方法:1.重复提问2.无重复被调查者的回答或用中性的词语提问3.启发的帮助被调查者回忆4.利用适当的停顿或沉默5.鼓励被调查者使他们放心 25.数据质量的监控方法:

严格管理调查人员;2.检查(或现场检查)已完成的问卷;3.严格的文档控制;4.对调查员的询问. 26.审核的目标:更好的理解数据和数据处理过程;2.检查问卷;3.回访被调查者;4.检出填错的或漏填的数据;5.删除无效记录;6.分离需要插补的记录.

27.现场审查的目的:1.确认是否需要改善收集数据的工具2.发现明显的错误3.发现缺失信息4.“净化”被调查者的回答5.确定是否需要进一步培训

28.选择性检查的优点有:1.节省费用且不降低数据质量2.把重点放在影响较大的记录上,从而提高数据质量3.缩短处理时间,加快进度,从而提高时效性4.减少回访比例,减轻被调查者答题负担(这对小单位特别重要,因为他们对回访特别敏感 29.选择性审查的缺点

1.从个体单位的水平看,对数据质量重视较少

2.对于较小的估计域,与对问卷全部审核时相比,非抽样误差可能会增大

3.可能会有来自数据处理人员和数据用户方面的阻力,数据用户可能认为数据缺乏可信度 4.数据中可能存在不一致性,从而给数据用户造成数据质量不佳的印象 30.插补的局限性:

虽然均值插补可能会得到较好的点估计(对总量估计和均值估计等),但由于在插补类均值这一点形成一个人为的“峰值”,从而破坏了分布状态和变量之间的关系。因此,如果用常规的抽样方差公式进行计算,就会低估最终的方差。

31.插补准则

1插补得到的记录应该和审核有问题的记录非常相似。

2好的插补会为评估留下审查的线索,并保证插补的记录具有内部一致性。插补处理过程应该是自动的,客观的,可再现的和有效的。 3插补得到的记录硬挨满足所有审核规则。

4插补值应标明,插补方法所使用的资料也应该清楚的标明。记录中变量的插补和非插补的值都应该保留,以便对插补的程度和影响进行评估。

5仔细选择插补的方法,考虑每一种插补方法的优缺点以及要插补的数据类型。 6插补方法应减少无回答偏差,并尽可能地保持不同变量之间的关系。 7插补系统应事先考虑周全做出规定并编程和调试。 8插补系统应该能处理各种却是和不一致的项目。

9对于供者插补方法,插补得到的记录应尽可能与选中的供者相似。这有利于保证插补记录中插补值与非插补值的组合不仅满足审核规则而且具有多样性。 32.调查报告写作的基本要求

1实事求是2要熟悉调查领域的业务。3观点和数据要结合运用。 33.定义敏感数格的准则:

第一,切除规则第二,(n,k)规则第三,P百分数规则 34.几种处理敏感数格的方法:

1.限制法第一,合并数格 第二,隐藏数格

2.扰乱法第一,系统舍入 第二,随机舍入 第三,有控制的随机舍入 第四,对微型数据文件的泄密控制法

35.减少敏感性问题的方法:

仔细的措辞在一定程度上也能帮助减少敏感问题的影响。有以下一些方法: 1.释疑法2.假定法3.转移法 36.如何抽取PPS样本

1. 随机法2.系统法3.随机系统法

计算

1.例6.1p118 2.p121 3.例6.7 p129-132 4.p137

5.例6.11p142-144 6.例7.2p157-158 续p163-164 7.189 8.209

其他重点内容

1. 评估插补工作,最关心的指标就是对调查估计值的偏差和产生的查补方差。 2. 调查是认识客观世界的一种手段。任何工作都离不开调查。

3. 决策就必须进行市场调查,因此很多调查公司应运而生。

4. 社会经济调查的任务主要是应用统计学的调查、整理和分析方法研究社会经济问题,

目的是科学地反应社会、经济中各种各样的问题,分析问题形成的原因和影响,研究其发展和变化的客观规律,为解决问题制定政策或政策提供依据。简单地说,调查是为决策服务。

5. 调查的第一个阶段是计划,负责调查计划和设计的应该是一个由多方面人员组成的

小组。 6. 进行全面调查还有一些其他的原因,其中之一就是为以后的抽样调查提供抽样框。 7. 值得注意的是:全面调查和抽样调查并不是完全对立的,根据具体调查的需要,可将这两种方法结合起来使用。

8. 防止泄密的方法主要有两种:限制 扰乱。

9. 均值插补局限性:虽然均值插补可能会得到较好的点估计(对总量估计和均值估计

本文来源:https://www.bwwdw.com/article/7opx.html

Top