应用统计学复习思考题参考答案
更新时间:2024-04-12 20:15:01 阅读量: 综合文库 文档下载
- 应用统计学专业推荐度:
- 相关推荐
第一章第二章第三章第四章第五章第六章第七章第八章第九章第十章应用统计学复习思考题参考答案
绪 论 ......................................... 1 统计数据的收集与整理 .......................... 10 抽样分布 ...................................... 21 统计推断 ...................................... 23 方差分析 ...................................... 27 回归分析 ...................................... 30 时间序列分析 .................................. 37 复习思考题 .................................... 43 统计决策 ...................................... 46 产品质量的统计管理 ............................ 55
第一章 绪 论
1.如何理解“统计”一词的含义?
答:统计是指根据研究目的及要求,运用科学的方法,对客观事物或人类实践活动的数据资料进行调查、整理、分析的过程。
从字面上直观理解,“统计”是指对大量事物进行汇总计数,因此可以简单地说统计就是总起来计量,即统而计之。例如计算全国的总人口数、国内生产总值,计算某个企业的职工人数、产品产量,甚至是计算某个家庭每月的收入和支出等等都是统计。
随着社会经济的发展,“统计”的涵义也不断地拓展和延伸。从不同角度看,对“统计”一词可以有不同的理解:
1.统计活动
统计活动也称为统计实践、统计工作,是指根据统计目的及要求,运用科学的方法,对客观事物或人类实践活动的数据资料进行调查、整理、分析的过程。
2.统计资料
统计资料是统计实践活动的成果或产品,既包括调查得到的原始资料,也包括整理和分析而成的系统的统计资料,通常以调查表、统计表、统计图的形式提供。统计资料反映了事物的数量特征及其变动规律。
3.统计学
统计学是关于统计理论和方法的科学,是研究如何对社会总体的数量特征和规律进行描述、推断、认识的一门学科。
上述三种不同的理解又是相互联系,不可分割的。一方面,统计实践活动为我们描述、推断、认识事物的统计规律提供必不可少的统计资料;另一方面,统计实践活动又需要正确的统计理论和方法作指导。
2.简述统计活动的过程。
答:统计调查、统计整理和统计分析是基本的统计活动,所提供的统计资料包括原始统计资料、整理结果和分析结论。进行这些基本活动之前的统计设计,以及之后的资料保存、利用等也是必要的统计活动。
统计活动一般按照统计设计、统计调查、统计整理、统计分析和统计资料的开发利用这几个阶段依次进行。如图1.1.1所示。
统计调查 统计信息 统计 统计目统计设计 统计整理 统计咨询 资料 统计分析 图1.1.1 统计活动过程示意图
统计设计是统计活动的第一个阶段,根据统计目的及要求,统计设计是对统计调查、统计整理、统计分析和统计资料的保存、利用、发布等统计活动进行通盘考虑和安排。统计设计的结果表现为各种标准、规定、制度、方案和办法,如统计分类标准、统计目录、统计指标体系、统计报表制度、统计调查方案、普查办法、统计整理或汇总方案。
统计调查是具体实施的第一个环节,是根据事先拟定的统计调查方案具体收集原始统计
1
统计监督 资料的过程。
统计整理是对调查所收集的原始统计资料进行分组、汇总的过程。 统计分析是运用各种统计分析方法,对整理的统计资料进行深入分析,并联系历史资料和其他有关资料进行纵向和横向、静态和动态的分析,以揭示客观现象和人类实践活动的规律性。
最后要进行统计资料的开发利用、发挥统计的作用,包括提供统计信息、统计咨询和统计监督三个方面的作用,这也是统计的目的及要求。
3.人类统计活动产生与发展的大致时期和过程如何?
人类的统计活动历史悠久,在原始社会时期,人类最初利用手指、石子、贝壳、小木棍以及绳索等工具进行的一般计数活动就蕴藏着统计萌芽。据历史资料记载,“结绳记事”始于我国伏羲时代,西汉时曾经出现伏羲与女娲结绳的画像,在东汉武梁祠的浮雕上还刻有“伏羲仓精,初造王业,画卦结绳,以理海内”的铭文。“为约,事大,大结其绳;事小,小结其绳。结之多少,随物众寡。” 随着社会生产力的发展,人们在生产实践中,逐渐感到“结绳记事”已不能适应生产发展的需要,于是便开始向“书契记数”的时代迈进。“书”指文字,刻字在竹、木或龟甲、兽骨上以记数、记事,称为“书契”。
进入奴隶社会,统治者为了满足国家管理的需要,开始进行较系统的人口、土地等统计活动。例如据历史资料记载,早在公元前27世纪,埃及为了建造金字塔和大型农业灌溉系统,曾进行过全国人口和财产统计。我国在公元前21世纪的夏禹时期,全国国土划分为翼、兖、青、徐、扬、荆、豫、梁、雍等九州,有人口约1335万人,土地约2438万顷。有的统计学者认为这些统计数字是“我国最早的统计数字资料”。到了商代,由于国家机构的完整,以及甲骨文的应用,开始建立了附属于官僚机构的统计组织,并形成了政府统计的萌芽,统计工作在军事、祭祀、田猎等方面已较广泛地开展。
在封建社会,统计已经具有一定规模,并开始建立人口、土地登记调查制度。早期的统计多数是涉及人口、财产和军事等方面的国情国力。
到了资本主义社会,社会生产活动日益复杂,生产要素的流动性大幅度增加,以简单汇总计数为主的静态统计已经不能适应资本主义国家管理的需要。统计工作逐步由人口、财产等领域扩展到工业、贸易、运输业、保险业等领域。随着统计领域的迅速扩大,统计的内容和方法也不断发展。20世纪40年代,伴随着资本主义经济大萧条而产生的凯恩斯主义,对宏观统计实践提出了新的重大需求,逐步建立国民经济统计核算体系。此后,宏观统计活动又进一步从经济统计扩展到科学技术统计。统计实践活动不断丰富和迅速发展为统计学说的创立奠定了深厚的基础。
在现代社会,统计作为政府管理的重要手段和工具,日益受到各国政府的重视。世界各国和重要国际组织都成立了专门的统计机构,制定、颁布了统计法规,统计工作逐步实现经常化、规范化、专门化。统计活动的规模、范围越来越大,从国家、行业、企业范围内统计,到世界范围内统计,从农业、商业、工业、外贸等各个领域统计,到社会经济综合统计,从一般的数据记录、汇总,到数据的综合分析,从静态的统计到动态的统计,从政府统计到民间统计等等。统计活动渗透到人类社会生活、生产经营活动、科学研究等各个方面。统计机构和人员定期或不定期地开展各项统计调研活动,召开统计工作会议,出版统计年鉴、统计论著和学术刊物。统计已经成为社会分工中的一个独立部门和专业。
4.统计学产生与发展的大致时期和过程如何? 统计活动源远流长。但统计学作为一门独立的学科至今却只有300多年的历史。在统计活动不断发展的过程中,基于对统计实践的总结、提炼,统计学应运而生。虽然我国统计活动历史悠久,并且许多古代思想家很早就提出了统计思想和统计方法,进行了一些统计研究,但是一般认为统计学科产生于西方国家。按照统计学的发展历程,我们可以把统计学划分为
2
古典统计学、近代统计学和现代统计学三个时期,如图1.1.2所示。
古典统计学时期 近代统计学时期 现代统计学时期 17世纪中叶 18世纪末 19世纪末 图1.1.2 统计学的发展历程示意图
5.统计学发展过程中有哪些主要学派?其学术观点是什么?主要代表人物及其对统计学的贡献有哪些?
从17世纪中叶到18世纪末,是统计学的萌芽期,亦称古典统计学时期。这一时期出现了政治算术学派和国势学派两个统计学派。
1.政治算术学派
政治算术学派的创始人是英国的威廉·配第(Willian Patty,1623~1676)和约翰·格朗特(John Graunt,1620~1674)。格朗特在1662年发表了一篇《关于死亡表的自然和政治观测》一文,被认为是政治算术学派的第一篇研究论文。这篇论文以人口问题为研究对象,通过大量观测,运用数量对比分析的方法对当时伦敦人口的出生率、死亡率、性别比例等人口数据进行统计分析,揭示其中规律性,例如男性的死亡率高于女性,新生男女婴儿的性别比例大概为14:13。威廉·配第的代表作是1690年出版的《政治算术》一书,书中运用大量的实际统计资料,对英国、法国和荷兰三个国家的经济实力从数量上进行对比分析。政治算术学派强调用数字、重量和尺度来说话,所提出的数量对比分析法为统计学的建立奠定了方法论基础。政治算术是统计学的真正开端,威廉·配第被认为是统计学的创始人。由于未使用“统计学”这一学科命名,所以政治算术被称为有实无名的统计学。
2.国势学派
国势学派,也叫记述学派。国势学派与政治算术学派产生于同一时期,创始人是德国的康令(H.Conring,1606~1681)和阿亨瓦尔(G.Achenwall,1719~1772)。康令第一个在德国的大学讲授《欧洲最近国势学》。阿亨瓦尔在1749年出版《近代欧洲各国国势学论》,首先提出统计学学科的名词,德文词汇是“Statistik”,来源于拉丁语“Status”,原意是指“国家显著事项的比较和记述”或“国势学”,认为统计是关于国家应注意事项的学问。此后,各国相继沿用“统计”这个词,并把这个词译成各国的文字,法国译为Statistique,意大利译为Statistica,英国译为Statistics,日本最初译为“政表”、“政算”、“国势”、“形势”等,直到1880年才正式确定采用汉字“统计学”。因此, “统计”一词就成了记述国家和社会状况的数量关系的总称。国势学派强调用文字记述的形式,把国家的显著事项系统地整理并罗列出来,例如“人口稠密”、“土地广阔”等等,为政治家提供治国必需的国情知识。由于“国势”与“统计”在德文中词源相通,因此,国势学派一直以统计学命名。国势学的缺陷是缺乏数量分析的方法和结论,与现代统计学相去甚远,所以人们将其称为有名无实的统计学。国势学派与政治算术学派共存近两百年,两派长期争论不休,但两派却有一个共同特点,即都是以宏观社会经济问题为研究对象,故通称为社会经济统计学派。
从18世纪末到19世纪末属于统计学的发育成长期,亦称近代统计学时期。这一时期产生了数理统计学派和社会统计学派。
3.数理统计学派
数理统计学派产生于19世纪中叶,创始人是比利时的凯特勒(Adolphe Quetelet,1796~1874)。进入19世纪,数学中的一个分支概率论得到发展,凯特勒首先将概率论原理引入了统计学,出版了一系列关于统计学问题研究的著作,主要有《概率论书简》、《统计学的研究》、《社会物理学》、《论人类》等。他将自然科学的研究方法引入社会现象的研究中,
3
大大丰富了统计学的内容,后经过多人的发展逐渐形成一门独立的应用数学分支,即数理统计学。凯特勒还倡导建立国家统计机构,并担任领导人;倡议并积极推动召开国际统计会议,第一次国际统计会议于1853年在比利时的布鲁塞尔召开,到1885年发展成为国际统计学会,并于1887年在罗马召开国际统计学会第一届会议,以后每两年召开一次。凯特勒对统计学的发展做出了巨大的贡献,被人们称为“近代统计学之父”。数理统计学派强调统计学是一门基础性的或通用的方法论科学。
凯特勒作为数理统计学派的奠基人,其主要贡献是把概率论引入社会现象的研究之中。凯特勒认为,社会现象与自然现象一样,存在其自身的规律性。他强调统计学应当表现或研究这些规律,并运用统计手段去揭示它。凯特勒比政治算术学派的数量分析方法前进了一步。但他侧重于定量分析方法的运用,却忽视了社会经济现象自身的内容和特点。有人说凯特勒在“算术”上进步了,在“政治”上却倒退了。数理统计学以概率论作为理论基础,抽象掉统计学的社会经济现象内涵,变成了抽象的数学分析和推断技术,成为一门方法论学科。
4.社会统计学派
社会统计学派产生于19世纪后半叶,由德国的克尼斯(K.G.A.Knies)、恩格尔(C.L.E.Engel1821~1896)以及梅尔(G.V.Mayer)等人创立。社会统计学在这里也称为社会经济统计学,包括政治统计、经济统计、人口统计、犯罪统计等多方面内容。恩格尔在他的研究中提出了著名的“恩格尔定律”:一个家庭收入越少,家庭收入中(或总支出中)用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中(或总支出中)用来购买食物的支出则会下降。推而广之,一个国家越穷,每个国民的平均收入中(或平均支出中)用于购买食物的支出所占比例就越大,随着国家经济发展水平的逐步提高,这个比例呈下降趋势。根据恩格尔定律计算的恩格尔系数(=食物支出金额/总支出金额)一直作为衡量生活水平高低的一个指标沿用至今。社会统计学派强调统计学是一门研究社会经济现象变动规律的实质性科学。
6.统计学有哪些分科?他们之间的关系是什么?
进入20世纪后,随着数学、社会学、经济学等各个学科的发展,统计学无论是在理论方法上还是在应用上都得到迅速发展。统计学学科体系日趋完善,进入现代统计学时期。现代统计学已发展成一门多分支的科学,并且仍处于不断发展的过程中。根据研究的侧重点不同,人们通常将统计学划分为理论统计学和应用统计学两个大类。
理论统计学是指统计学的数学原理,它根植于纯数学的一个领域—概率论。从广义来说,统计理论可以认为是包括概率论的,此外还包括一些并不属于传统概率论的内容,如随机化原则的理论、各种估计的原理、假设检验的原理以及一般决策的原理,这些原理可以看成是概率论公理的扩增。
与理论统计学相对应的是应用统计学。在统计实践中常常会遇到一些新问题,使原有的统计方法不适应,需要统计学家针对新问题去建立一个与实际情况相适合的统计模型,创造新的统计方法去分析。将统计学的基本原理应用于各个领域就形成各种各样的应用统计学。它包括一整套统计分析方法,有的是适用于各个领域的一般性的统计方法,如数据收集与整理、参数估计、假设检验、方差分析、相关与回归等。有的则是某一专业领域中特有的分析方法,例如经济统计学中的指数分析法、统计决策及产品质量统计管理等。近几十年来,由于统计研究的范围越来越广,一些科学实验也日趋复杂,统计方法也相应地复杂化和专门化,在应用统计方法中必须对因模型和实际情况的不一致而引起的各种误差的性质和大小作出判断,或提出改进的措施。由于统计的工具更加专门化了,它们就缺少通用性,要求一个统计学家熟悉所有的专门工具已不可能。为了适应这种发展的需要,既熟悉统计知识又熟悉某一领域业务的应用统计学家就应运而生,同时也产生了相应的应用统计学。这类统计学的特点是不着重于统计数学原理的推导,而是侧重于阐明统计的思想,并将理论统计学的结论作
4
为工具应用于各个具体领域。本书属于通用性的应用统计学,并侧重于统计学在经济与管理领域的应用。现代统计学的另一个显着特点是计算机技术、网络技术以及信息技术在统计中的广泛应用,使得统计学科的内容更加丰富。通用和专业统计软件的开发和应用成为统计学工作者的一项重要任务。统计学学科体系如图1.1.3所示。
理论数理统计学
数理统计学
应用数理统计学 理论统计学
统计学原理 统计学 自然统计学
应用统计学
社会经济统计学
图1.1.3 统计学的学科体系简图
数理统计学是应用数学的一个分支,在这里作为统计学的一个分支,它以概率论等数学理论为基础,研究随机现象的数量规律,是一门纯方法论的科学,为其它学科提供数学分析和推断的方法与技术。该学科从19世纪中叶创立以后发展迅速,先后由许多统计学家建立了参数估计与假设检验理论、非参数统计理论、相关与回归分析理论、统计决策理论、实验设计理论等数理统计学的新分支。数理统计学又可以分为理论数理统计学和应用数理统计学,前者研究统计理论和方法的数理依据,后者研究量化分析的方法技术。
统计学原理是在统计实践的基础上,对统计理论方法的最一般概括,内容包括统计的对象和任务,统计的理论基础和方法论基础,以及关于统计活动各个环节的理论和方法。统计学原理中结合了数学、概率论和数理统计学的知识,又是统计实践经验的高度总结,是指导统计实践活动的科学依据。一般所说的统计学就是指统计学原理。
社会经济统计学是将理论统计学应用于社会经济领域,以社会、经济、人口、科技和文化等人类自身及其活动为对象的统计方法论,为对社会经济现象数量特征进行的调查研究提供原理、原则和方式方法。人口统计学、教育统计学、司法统计学、社会保障统计学、医药与卫生统计学等等属于社会统计学的重要分支,国民经济统计学、工业统计学、农业统计学、贸易统计学等等属于经济统计学的重要分支。社会经济统计学是应用最广泛的应用统计学。
自然统计学是将理论统计学应用于自然现象领域,是探索地理、地质、气候、天文、生物等非人类现象的数量关系和数量规律的统计方法论。其中较为重要的分支有生物统计学、气象统计学、天文统计学等。
以上多门统计学也不是完全互相割裂的,相互之间存在一定的联系。理论统计学和应用统计学之间是一种相互促进、共同发展的关系。
7.统计学与其他学科之间有些什么联系?
统计学与数学、哲学、社会学、经济学等其它学科也有着不同程度的联系,统计学中广泛应用了数学方法,进行统计研究要遵循哲学的基本原理,对社会经济问题的数量特征进行统计分析必须以社会学、经济学理论为基础,统计研究的结果也丰富了社会学、经济学的内
5
容。统计学与上述相关学科互相促进,共同发展。马克思和列宁对政治经济学与统计学的关系有着精辟的论述:“利润率趋向下降,和剩余价值率趋向提高,从而和劳动剥削程度提高是结合在一起的。因此最荒谬的莫过于用工资率的提高来说明利润率的降低了,虽然这种情况在例外的场合也是存在的。只有理解了形成利润率的各种关系,才有可能根据统计对不同时期、不同国家的工资率进行实际的分析。”“研究政治经济学不能随随便便,不能没有任何基础知识,不能不了解很多极重要的历史问题、统计学问题及其它问题。”
1.统计学和数学的关系
统计学着重于研究客观现象的数量特征。统计学中具有方法论性质的数理统计学是应用数学的一个分支,因此统计学与数学的关系十分密切,且与其他的应用数学有一定的共性。如和数学中的有关定理一样,统计中的一些分布也是客观现象数量特征的一种抽象。统计学中也要使用很多数学方法,学好统计学,尤其是理论统计学需要有坚实的数学基础。但另一方面,统计学与其他的数学分支相比又有其特殊性。
(1)处理的数据不同。统计方法处理的数据必须是受到偶然性的影响而产生差异的数据。偶然现象在统计学中常称为随机现象,因此统计学及其理论基础概率论不同于其他数学分支的一个特点在于它是研究随机现象的一门学科。
(2)处理的方法不同。数学常常是用演绎的方法,即数学中研究结论,通常从若干假设命题或已知的事实出发,按一定的规则通过逻辑推理得到。而统计学在本质上是用归纳的方法,它是根据观察到的大量个别情况,“归纳”起来去推断总体的情况,这一点与概率论的方法也有区别。因此目前国际上也有一种趋势,把统计学看成是与数学独立的学科。
2.统计学与其他专门学科的关系
统计方法有着广泛的实用性,其一般的数据分析方法适用于其他任何科学中的偶然现象,因此它与很多专门学科都有关系。但是统计方法只是从事物的外在数量表现去推断该事物可能的规律性,它本身不能说明何以会有这个规律性,这是各专门学科的任务。例如,用统计方法分析一些资料得出,吸烟与某些消化道疾病有关,这是通过对比吸烟者和不吸烟者的发病率数据得出的结论,它不能解释吸烟何以会增加患这类疾病的危险性,这是医学这一专门学科的任务。所以统计方法只是一种工具,应用它进行定量分析时必须和定性分析结合起来。尤其是将统计方法应用于社会经济领域更应如此,因为社会经济现象比自然现象更为错综复杂,而又不可能象自然科学那样在实验室内排除其他因素进行试验。
8.统计研究的对象是什么?
统计学是一门研究客观现象数量特征和规律性的方法论科学。统计学的研究对象不同于统计对象。统计学的研究对象是客观事物的数量特征和规律性,而统计对象是客观事物本身。例如人口统计的统计对象是人,人口统计学则以人口数量特征为研究对象,是探索人口数量特征和规律性的方法,包括如何收集人口原始数据、如何计算人口总规模、如何描述人口增长规律、如何分析人口与其它社会经济现象的关系等等。
9.统计研究的特点有哪些?
统计研究的特点可以概括为以下几点: 1.数量性
“数字是统计的语言”,数量性是统计研究的基本特点。如图1.2.1所示的统计研究系统,输入的是数据,即客观事物个别的或者局部的原始数据;输出的是客观事物综合的数量特征,包括数量大小和数量的规律性。统计研究系统是一个数据获取和加工处理系统。
输入原始数据 客观 统计研究
事物 系统 输出数量特征
6
图1.2.1 统计研究的数量性示意图
2.总体性
“统”就是总起来、综合起来。统计研究就是总的、综合的数量研究。一般理解的总体是指统计总体,是由同类个体组成的集合体,如人口总体、企业总体、商品总体等等,这时统计研究的目的不是计量个体的特征表现,而是对个体的特征表现进行统计整理和统计分析,得到总体的综合的数量特征。
3.具体性
具体性即客观性。统计对象是具体的,是客观存在的事物或现象。统计数据包括原始数据和计算结果,都是客观现象在一定时间、地点、条件下的数量表现,是具体的数据。这是统计和数学的一个重要区别,数学所研究的数量可以是脱离了具体对象的抽象的数量。社会经济统计的统计对象是具体的社会经济现象,包括人类自身、人类从事的活动以及活动的成果等等,社会经济统计研究得到社会经济现象的数量以及对数量的规律性的认识。
10.统计研究的方法有哪些类别?
统计学是一门方法论科学。人们在无数统计实践经验的基础上,经过逐步概括和总结,形成了一系列专门的统计方法,构成一个统计方法体系。常用的统计方法及其应用如图1.2.2所示。 大量观测法 收集资料方法 统计实验法 统计调查法 统计审核法 统计分组法 整理资料方法 统计方法 统计汇总法 指标法
统计描述法 模型法
统计分析方法 统计推断法 假设检验法 图1.2.2 统计方法体系简图
11.如何理解大量观测法?
所谓大量观测法就是对所研究的客观现象总体中的全部或者足够多的个体进行观测以达到正确认识总体的目的。大量观测法不是一种具体的应用方法,而是研究客观现象总体数量特征的重要思想方法和原则,是统计研究的指导原则。大量观测法要求在通过实验法或者调查法收集原始资料时遵循大量实验和大量调查的原则。对于规模小、个体集中等简单总体进行统计研究,有可能做到对所有个体全部进行观测。比如对一个班组的职工或一个班级的学生这样的总体,就有可能逐个观测。但是对于规模大、个体分散等复杂的总体进行统计研
抽样估计法 7
究时,通常不可能做到对所有个体全部进行观测。有时虽然能全部观测,但需要付出很高的代价,而且在大多数情况下往往不需要对所有个体全部进行观测。比如对于在一个大城市里居住的全体居民或全国人口这样的总体,就不必对所有个体逐个进行观测。取而代之的是选择足够多的个体进行非全面观测。观测的个体越多,对总体的认识就越准确,选择多少取决于统计和统计研究对象的特点、统计要求以及客观条件等多方面因素。采用大量观测法是由于统计研究对象具有复杂多变的特点,如果只选择个别或者少数个体进行观测,甚或挑选个体时带有某种倾向性,就难以得到关于事物总体数量特征的正确结论。
再进一步延伸,在研究某个现象发展变化规律时,也需要收集足够多的时间点上的资料,在进行综合评价时,也要全面考虑影响评价值的因素,这也是体现了大量观测法的思想和原则。
12.统计描述法和统计推断法的区别和联系是什么 统计描述法和统计推断法是统计分析的两类方法。描述包括个别描述和综合描述。统计描述法是综合描述的方法,是通过对所收集的数据进行加工处理,计算综合性的统计指标,描述所研究现象总体数量特征和数量关系的方法。根据所描述问题的特点,可以具体使用综合指标法和数学模型法。综合指标法是指运用各种统计综合指标来反映和研究社会经济现象总体的一般特征和数量关系的研究方法。数学模型法是根据一定的经济理论和假定条件,用数学方程去模拟现实经济现象相互关系的一种研究方法。统计推断法是在对已知事物进行描述的基础上,对未知事物进行推断的方法。根据推断的内容不同可分为抽样估计法以及假设检验法等。抽样估计是用已知的样本信息推断未知的总体信息,假设检验是根据样本的信息验证对总体信息所作的假设是否成立。
统计描述法是统计推断法的基础。从描述方法到推断方法反映了统计学的发展,传统统计学以统计描述方法为主,现代统计学以统计推断方法为主。
统计分析方法是统计方法的核心,其特点是运用数学、概率论与数理统计学等理论与方法对客观现象进行数量分析。现代统计学研究的重点就是统计分析方法。
13.统计的作用有哪些?
统计具有以下三个方面的作用: 1.提供信息服务
提供统计信息是统计的信息职能,是统计的首要职能。信息是有价值的数据,从收集的原始数据到经过加工整理后的中间数据到最后分析得到的综合指标分别是反映客观现象个别、部分以及全部的统计信息,是统计工作的成果。经过整理、分析得到的综合信息更有价值。统计应该提供最有价值的信息,而且要达到准确、及时、全面的要求。没有统计信息,我们就不能全面认识客观现象,做任何事情就缺少了重要的依据。
提供国民经济和社会发展状况的信息是社会经济统计的首要职能,是政府统计系统的首要任务。政府要管理好整个国家,必须掌握准确、及时、全面的社会经济信息。各个基层企事业单位为了自身发展的需要,既要依靠政府统计所提供的各种信息,自己也要做好统计工作,获取自身发展所需的各种信息,包括本身的信息、竞争对手信息、顾客信息、社会信息以及国际信息等等。
二十一世纪人类社会步入了信息时代,计算机技术、网络技术、信息技术的发展为收集、加工处理信息以及进行综合分析提供了有效的手段,统计信息对人们的日常工作和生活、对管理企业以及管理国家的作用越来越重要。
2.提供咨询服务
提供咨询服务是统计的咨询职能。统计工作的任务不仅要完成提供信息的基本任务,还要进一步利用已经掌握的各种统计信息资料,为政府、企业以及个人等提供各种咨询建议和对策方案。对于政府统计部门,其基本任务首先是为政府制定有关政策、制定国家发展战略
8
等国家宏观经济决策提供咨询意见,也要为各个基层单位的运作、人民群众的日常工作和生活提供咨询意见,既为政府服务也为公众服务,为政府服务的最终目的也是为公众服务,政府统计要树立以为公众服务为根本的思想观念。近年来,我国各种民营的咨询服务企业如雨后春笋茁壮成长,咨询业的竞争日益激烈。
3.提供监督服务
提供监督服务是统计的监督职能。监督职能是指根据长期的大量的统计信息,按照标准监督客观现象发展变化状况,确定其是否正常,有无警情。对社会经济的一些重要方面都要进行监督,例如经济发展情况、产品质量、物价、环境、廉政建设、安全生产以及重要资源的开发利用等。有关统计部门在定期发布各种统计信息报告的同时,也应对各种现象进行主动监督。例如质量监督部门及时收集产品的质量信息,判断是否超出质量控制标准,对市场产品进行质量监督,以杜绝伪劣产品在市场流通。企业质量管理部门通过对生产中的质量数据进行分析处理,可以及时掌握当前生产质量状况。一旦发现生产过程处于不稳定状态(超出控制界限的观测数据增多),立即寻找原因排除异常因素,使生产过程回到质量稳定的工艺状态。从而达到对生产过程的监督和控制。
统计监督和其它监督手段相比有数量性和综合性两个显著特点。数量性是指对监督对象的运行是否正常提出数量界限,进行数量监督;综合性是指对监督对象进行综合性的、全局性的统计监督。
综上分析,统计具有信息、咨询、监督三大职能,统计的三大职能是相互联系、相辅相成的。信息职能是最基本的职能,是保证咨询和监督职能有效发挥的基础,咨询和监督职能是信息职能的延伸和拓展,是统计信息开发和利用的结果。
9
第二章 统计数据的收集与整理
1. 统计调查有哪些分类?它们有什么特点?运用于什么样的社会经济现象? 答:统计调查的方式主要有:普查、抽样调查、重点调查、统计报表制度。
1.普查。普查是专门组织的一次性的全面调查,用来调查属于—定时点上或时期内的社会经济现象的总量。普查可以取得被研究事物总体的全面情况。通过普查,从宏观上看,可以摸清—个国家的国情和国力,了解到一个国家的人力资源和物质资源的现状及利用情况。这对于国家制定政策和计划,以及制定经济与社会发展的长远规划都是不可缺少的。例如,我国为了全面掌握全国人口的实际情况,于2000年7月1日零时这个时点上展开了第五次人口普查。从微观上看,普查也可用于某些小范围的市场调查。例如,对市场上某种产品的供应、销售及库存的全面调查。普查具有资料全面、详尽、标准化等优点,但同时也存在因工作量大、耗资多所带来的时效性不强、成本大以及登记性误差较大等缺点,因而一般不宜经常进行。
普查的组织形式有两种:一种是组织专门的普查机构,派专门调查人员对被调查单位直接进行登记,例如人口普查就是这种形式;另一种是利用一定的组织系统,由被调查单位根据本单位的原始记录和实际情况,填写调查表,然后上报。
快速普查是一种特殊的普查,其调查项目少,调查时间短,目的是快速满足经济管理的需要。例如对全国钢材库存的调查。快速普查采用普查的第二种组织方式,其方式就是在布置调查任务与资料报送等环节中越过一切中间环节,直接将普查资料报送到最高一级普查机构进行汇总。
普查项目与指标一经正式确定,就不准任意改变或增减,否则就可能影响资料的汇总与分析,影响统计资料的质量。对同一种普查而言,每次的项目与指标应保持一致,尽量按照一定的周期进行,以便获得社会现象的发展变化规律。
普查涉及的对象与范围很广,需要统一的集中领导与组织安排,必须注意以下事项:规定统一的标准时点与确定统一的普查期限。
2.抽样调查。抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。例如,从一批产品中随机抽取若干件进行质量检验,并计算合格率,然后以此推断全部产品的合格率。又如,从某银行储户中随机抽取部分储户的存款额进行登记,计算每户平均存款额,并用这—指标推算全市居民平均每户的存款额。在统计调查方法体系中,抽样调查由于具备一般非全面调查的长处,同时又可以通过科学的推算达到对统计总体的认识,因而是一种最常用、最重要的获取统计资料的手段。抽样调查与其他调查方式比较,既能节省人力、物力、财力,提高资料的时效性,又能推断出比较准确的全面资料,还因其原理和方法以数学理论为依据,有较高的科学性,所以这种调查方式在产品质量检验、产品质量控制以及市场调查等方面,应用非常广泛。
抽样调查的重要特征是:第一,按照随机性原则确定观测单位。在抽样调查中,究竟要对哪些单位进行调查,不取决于调查者与被调查者的主观愿望,完全随机而定。理论上一般要求总体中的每一个单位都应有同等的可能性被抽到。随机性原则是抽样调查的基本原则,遵守这个原则可以避免统计估计的系统性误差,另一方面只有符合抽样随机性原则,才能计算出抽样估计误差。第二,根据部分单位的调查结果,对总体进行科学推断。抽样调查既是搜集资料的方法,同时也是对统计总体进行认识的方法。就这一点来说,抽样调查和普查的作用是一样的,只不过采用的具体途径有所不同而已。用抽样资料对总体进行认识.需要依
10
据统计估计和归纳推断。第三,抽样误差可以计算。用样本资料推断总体必然会产生误差,但抽样估计误差的大小可以计算出来,并且还能进行控制,这是抽样调查又一非常重要的特点。
抽样调查组织实施起来非常灵活和方便,具有普查等全面调查不可比拟的优势,所以它是现代统计活动中搜集资料广泛使用的手段之一。以社会经济管理领域为例,经常要用抽样调查搜集资料的就有:居民消费调查、民意测验、物价统计、市场行情预测、产品质量抽样检验、工序控制与能力分析、人口调查、工农业生产调查、犯罪调查、库存调查、抽样审计等。
3.重点调查。重点调查是在调查对象中选择一部分重点单位进行的一种非全面调查。这部分重点单位虽然数目不多,但就调查的标志总量来说,在总体中占有很大的比重,调查这一部分单位的情况,能够大致反映被调查现象的基本情况。因此,当调查的任务只要求掌握总体的基本状况与基本的发展趋势,而不要求掌握全面的准确资料,而且在总体中确实存在着重点单位时,比较适合采用重点调查的方法。例如,某批发商业企业,对下属百家商业企业提供某种货源,其中10家大型商业企业的需求量占总需求量的80%,只要调查了这10家重点商业企业的需要,就足以掌握货物需求量的基本情况。在这种情况下,可采用重点调查方式。一般情况下,重点调查的目的主要是为了掌握调查对象的基本情况,不需要利用重点调查的综合指标来推断总体的数量。但在某些特殊情况下,也可以利用重点调查所得的数据资料,对总体的数据作出大致的估计。例如,上例中的l0家商业企业今年对某品牌食用油的需求量为160万桶,根据这个调查数据,大体可估计出本年食用油总需求量为200万桶左右。
重点调查的组织方式有两种:一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。例如,重点工业企业主要经济指标电讯月报,重点工业企业产品价格统计月报,重点工业交通运输企业能源消耗季报等。
与全面调查相比,重点调查的优点是花费较少的人力、物力、财力以及时间获得总体的基本情况,具有更好的时效性与经济性;重点单位具有较好的统计条件,其结果一般具有更好的精确效果,而且,由于所选取的重点单位数目相对较少,就可以集中投入更多的人力、物力去调查更多的内容,获得更为详细的统计资料。
进行重点调查的关键是如何确定重点单位。一般而言,重点单位的多少,要依据调查点目的与任务而定。总的原则是,所选的单位应尽量少些,但它的标志值在总体标志值中所占的比重则要尽量大些。
4.统计报表制度。统计报表制度是根据国家有关统计法的规定,依据自上而下统一规定的表格形式、项目及其指标、报送时间与程序布置调查要求和任务,自下而上逐级汇总上报的统计报表制度。国家利用统计报表制度定期获得国民经济与社会发展情况的基本统计资料,是国家取得调查资料的主要方法之一。同时,统计报表也是一份调查表,报表中的指标项目就是调查项目。我国大多数统计报表要求调查对象全部单位填报,从这个角度上说,应属于全面调查的范畴,所以也称全面统计报表。统计报表制度具有如下的特点:
统计报表制度是为满足国民经济和社会发展的宏观管理需要而精心设计的信息系统,其基本依据是基层单位日常业务活动的原始记录与统计台帐及基层的内部报表,包括了一系列登记项目与指标。为了保证逐级汇总的资料具有可靠的真实基础,统计报表必须符合完整性、规范性与准确性的基本要求。此外,由于整个过程涉及的组织系统相对庞大,所以要求各基层单位建立相对完善的原始记录与统计台帐以及基层企业内部报表制度,建立一支业务熟悉的统计人员队伍,这是保证统计报表资料质量的重要基础。
统计报表所涉及的项目及其指标有着相对固定的格式,一般都是直接由上级部门设计,具有明显的强制性。凡是报表中规定的指标、计算口径、计算方法、报送程序及时间等都必
11
须严格遵守,未经批准不得擅自改变。
统计报表依据至上而下的行政手段保证统计报表制度的实施,采取的是层层上报、逐级汇总的报表呈递路线,具有很强的时效性。
根据不同的标准,统计报表可以分为不同的种类: 按不同的内容与实施范围可分为国家统计报表、部门统计报表与地方统计报表。国家统计报表也称国民经济基本统计报表,是由国家统计部门统一制定并反映全国性的经济和社会发展基本状况的统计资料汇总表,它基本涉及了各产业活动、财政与税收、投资与收益等方面最基本的经济活动资料。部门统计报表是针对本部门业务管理需要而制定的专业统计报表,适用的范围就是本系统内部,目的是为了获得相关部门的业务活动资料。地方统计报表是根据各地方经济与社会发展特色而进行的补充性统计报表。三者之间互有区别,互有联系,其中,国家统计报表是统计报表体系的基本部分。
按报送周期的长短可分为短周期报表和长周期报表。报告的周期长短不同,不仅是时间上的差别,而且更反映其内容与作用不同。在一般情况下,报送的周期越长,所包含的指标项目越多、越详细,反之则越少、越简单。短周期报表包括日报、旬报、月报,填报的项目较少,要求资料上报迅速与及时;长周期报表包括季报、半年报、年报,填报的项目较多,要求统计资料全面、完整与准确。此外,除年报外,上述各种统计报表可称为定期报表,日报与旬报可称为进度报表。
按不同的填报单位可分为基层统计报表与综合统计报表。基层统计报表是由基层企事业单位填报的报表,综合统计报表是由统计部门或主管部门依据基层部门逐级汇总填报的报表。调查单位将随着综合层次的不断提高而不断扩大,相应为县、市或省。
按不同的报送方式可分为电讯报表与邮寄报表。电讯报表采用电报、电话、传真、电视及网络报送,一般以日报、旬报为主;邮寄报表采用的是邮局邮寄或其他方式的人工报送,一般以月报、季报、半年报与年报为主。
2.统计调查方案包括哪几个方面的内容?请针对调查某产品销售情况,设计一个调查方案。
答:一个完整的统计调查方案通常包括:明确调查目的和任务,确定调查对象和调查单位,制定调查项目和设计调查表或问卷,确定调查时间、调查地点、调查方式方法和制定调查的组织实施计划等。
明确调查目的和任务是设计统计调查方案最根本的问题,它决定着调查工作的内容、范围、方法和组织。任何社会经济现象和过程都可以根据不同任务,由不同的目的来收集资料进行研究。衡量一个调查方案是否科学的标准,主要看方案的设计是否体现调查目的要求,是否符合客观实际。
调查对象是指根据调查目的、任务确定的由那些性质上相同的众多调查单位所组成的总体。即统计总体。确定调查对象,需要认真分析所要研究的社会现象,把握其主要特征,明确规定调查对象的具体含义,在此基础上,确定总体的界限,划清调查的范围,以防在调查工作中产生重复或遗漏。调查单位就是构成调查总体的每一个单位,调查总体中的个体,也就是在调查过程中应该登记其标志的那些具体单位。
调查项目是指对调查单位所要调查的具体内容属性,这些属性在统计上又称标志。它是由调查对象的性质、调查目的和任务所决定的,包括一系列品质属性和数量属性。在确定调查项目时,需要注意以下问题:
(1)调查项目涵义必须明确、具体,使人一目了然。否则,会使被调查者产生不同的理解而做出不同的答案,造成汇总时的困难。
(2)在设计调查项目时,既要考虑调查任务的需要,又要考虑是否能够取得实际资料。必要的内容不能遗漏,不必要的或不可能得到明确答案以及无法获得答案的项目不要列入
12
调查项目。
调查项目一般采用调查表或调查问卷的形式。将调查项目科学地分类、排列,就构成调查表或调查问卷。
调查时间是指调查资料所属的时点或时期。从资料的性质来看,有的资料反映现象在某一时点上的状态,统计调查必须规定统—的时点。调查时间包括三方面内容:调查资料所属的时间、调查期限和调查工作进行的时间。
调查地点是指调查单位的空间位置。确定调查地点,就是规定在什么地方进行调查。 调查方式方法是指调查工作的组织方式方法,这主要取决于调查的目的、内容和调查的对象。
调查的组织计划,是指为确保实施调查的具体工作计划。严密细致的组织工作,是使统计调查顺利进行的保证。在实施计划中要明确采用什么方式方法获得统计资料,如由被调查者自填或派人直接采访等;还需明确资料采取什么方法汇总,如采取超级汇总,或者逐级汇总等。调查的组织实施计划应包括以下内容:
(1) 建立调查工作的组织领导机构,做好人员的配备与分工;
(2) 做好调查前的准备工作。如宣传教育、人员培训、文件资料的印发、方案的传达布置、经费的筹措等;
(3) 制定调查工作的检查、监督方法; (4) 调查成果的公布及工作后的总结等。
较大规模的调查还应进行试点调查。通过试点,检验调查方案是否切实可行,以便修改和补充,并积累实施调查方案的经验,提高调查人员的业务技能,更好地完成调查任务。
3.统计分组的方法有哪些?区分简单分组、复合分组、单项式分组、组距式分组、等距分组和异距分组等分组方法,结合实际加以运用。
答: 统计分组是根据统计研究目的,将总体按一定标志区分为不同类型或不同性质的组,使组与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,即同一组内各单位之间具有某些共同的特征。
如何统计分组取决于选择的分组标志的特征、分组标志的数量以及各组的分组标志取值,由此产生不同的分组方法。
1.按标志的特征分组
总体单位的各个标志按分组标志的特征分组区分为品质标志和数量标志。按数量标志分组,就是选择反映事物数量差异的数量标志为分组标志,并在数量标志的变动范围内划定各组的界限,将总体划分为性质不同的若干组成部分。例如人口按年龄,企业按职工人数、商品销售额等分组。按数量标志分组的目的并不是单纯确定各组的数量差异,而是要通过数量变化来区分各组不同的类型和性质。按品质标志分组是研究品质标志的分布特点,例如人口总体按照性别分组,研究不同性别组的区别,按照民族分组则可以研究不同民族组的特点。 2.按分组标志数量分组
统计分组按分组标志多少不同,可分为简单分组和复合分组。简单分组是对研究对象按照一个标志进行的分组。复合分组是对研究对象按两个或两个以上的标志层叠起来进行的分组。即先按一个标志进行分组,然后再按另一个标志在已分好的各个组内划分成若干个小组。
变量数列按照用以分组的变量的表现形式,可分为单项数列和组距数列两种。单项数列就是指以一个变量值代表一组而编制的变量数列。单项数列的组数与数量标志所包含的变量值数目是相等的。处理变量值不多的变量资料时,宜选用此方法编制变量数列。在不同的变量值既多且变动范围较大时,用单项数列分组会使组数太多,不便分析,这时就应编制组距数列。组距数列就是用一定范围的变量值或一定的数值距离代表一组编制而成的变量数列,如下表所示。
13
某企业职工人数统计表
按年龄分组 按性别分组 合计 30~50 30以下 50以上 500 400 200 1100 男 100 300 100 500 女 600 700 300 1600 合计
组距数列可分为等距分组和异距分组。等距分组即各组组距相等的分组。异距分组即各组组距不相等的分组。在标志值变动比较均匀的条件下,可采用等距分组。当标志值变动很不均匀,如急剧的增大、下降,变动幅度大时,可采用异距分组。选用等距分组还是异距分组,应视资科特点而定。其基本原则仍然是将不同质的单位分开。如果等距分组能符合这个要求,则尽量采用等距分组,以便于计算和分析,否则采用异距分组方法。
4. 调查对象、调查单位和报告单位相互之间有什么关系?
答:调查对象是指根据调查目的、任务确定的由那些性质上相同的众多调查单位所组成的总体。即统计总体。调查单位就是构成调查总体的每一个单位,调查总体中的个体,也就是在调查过程中应该登记其标志的那些具体单位。调查单位的确定,取决于调查目的与调查对象。例如,若调查目的是要了解企业职工的情况时,调查对象就是企业职工这一总体,而调查单位就是每一个职工;如果调查目的是了解所有企业的经营情况时,调查对象就是所有企业这一总体,每一个企业就是一个调查单位。在确定调查单位时,要明确调查单位与报告单位(也称为填报单位)的区别,调查单位是调查登记的项目的承担者。报告单位则是指负责向上级提供调查资料的单位。调查单位与报告单位有时一致。有时不一致。例如,工业企业普查时,每个工业企业既是调查单位又是报告单位。两者是一致的,而在工业企业职工普查时,调查单位是每—工业企业职工,而报告单位则是每个工业企业,两者是不一致的。
5.反映总体集中趋势的指标有哪几种?离散趋势的指标有哪几种?各有什么特点和作用?
答:反映总体集中趋势的指标有算术平均数、众数和中位数,这三者的关系与总体分布的特征有关。
算术平均数是最常用的一种平均指标。算术平均数适合用代数方法运算,因此,在实践中应用很广。但有以下不足:算术平均数易受极端变量值影响,使x的代表性变小;当组距数列为开口组时,由于组中值不易确定,使x的代表性变得不可靠。
众数是指总体中出现次数最多的标志值,它能够直观地说明客观现象分配中的集中趋势。在实际工作中,有时要利用众数代替算术平均数来说明社会经济现象的一般水平。例如,在大批量生产的男式衬衫中,有多种尺码,其中40码是销售量最多的尺码,则40码也就是众数,可代表男式衬衫尺码的一般水平,宜大量生产,而其余尺码的生产量就要相应少一些,这样才能满足市场上大部分消费者的需要。众数适用于总体的单位数较多,各标志值的次数分配又有明显的集中趋势的的情况,如果总体单位数很少,尽管次数分配较集中,那么计算
14
出来的众数意义不大。若总体单位数较多,但次数分配不集中,即各单位的标志值在总体中出现的比重较均匀,那么也无所谓众数
中位数是将总体中各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位数。中位数属于位置平均数,它与众数一样,都是从数据位置的角度来反映数据的代表水平,中位数不受极端值的影响,各个变量值相对其中位数的绝对离差之和为最小。所以当一项变量数列中含有极大值或极小值时,较适宜采用中位数;按品质标志定位的事物求其代表水平时可用中位数。中位数的局限性为:计算复杂,不适宜作进一步数学运算;由于是位置平均数,虽不受两端数值的影响,但与众数一样,代表性较差。
变异指标则能综合反映总体的差异性,它们反映总体中各单位标志值差别大小的程度。标志变异指标是评价平均数代表性的依据,标志变异指标愈大,平均数代表性愈小;标志变异指标愈小,则平均数代表性愈大。常用的标志变异指标有极差、平均差、标准差以及离散系数等。极差也称全距,是指总体分布中最大标志值与最小标志值之差,用以说明标志值变动范围的大小。标准差是总体各单位标志值与平均数离差平方平均数的平方根,标准差的平方即为方差。极差、方差及标准差都是反映标志变异程度有计量单位的绝对数指标。总体分布的标志变异程度不仅取决于标志值的差异状态,还受到总体平均数的影响。若对两个总体分布进行变异性比较,当它们的平均数不等,计量单位不同时,则应消除平均数不同和计量单位不可比的影响。离散系数是消除平均数影响后的标志变异指标,用来对两组数据的差异程度进行相对比较,其形式为相对数,因此,也称为标志变异相对数指标。常见的离散系数是标准差系数(V?)。
6.某班45名学生“统计学”考试成绩从低分到高分排列如下: 50 5l 52 56 58 59 5l 62 63 64 65 66 67 68 69 70 71 72 72 72 73 74 74 74 75 75 76 76 77 78 79 80 81 83 84 84 86 86 87 88 90 91 93 97 99
试将上述资料编成等距数列,计算组距、组中值,编制统计表。
解:根据上述资料编成的等距数列统计表及计算的组距、组中值如下表所示。
某班学生成绩统计表 学生成绩分布情况(分) 间断式组限 60分以下 60-69 70-79 80-89 90分以上 组中值(分) 55 65 75 85 95 各组限学生人数(人) 7 8 16 9 5 各组限学生人数百分比(%) 15.6 17.8 35.6 20 11.1
7.根据下表资料,计算强度相对数的正指标和逆指标,并根据正指标数值分析该地区医疗卫生设施的变动情况。 指标 医院数量(个) 地区人口总数(万人) 15
1999年 60 112.5 2005年 89 132.3 解:1999年该地区医院密度情况:
医院密度正指标?60个?0.53(个/万人)
112.5万人112.5万人?1.88(万人/个)
60个医院密度逆指标?2005年该地区医院密度情况:
医院密度正指标?89个?0.67(个/万人)
132.3万人132.3万人?1.49(万人/个)
89个医院密度逆指标?根据该地区医院密度正指标值的变化情况可以看出,该地区2005年医疗卫生设施较1999年有了明显地提高。
8.甲乙两班同时进行数学考试,有关成绩分布如下表所示,哪一个班级考试成绩好些?哪一个班级成绩较为稳定? 甲班 成绩(百分制) 60分以下 60-69 70-79 80-89 90-100 学生人数(人) 3 13 18 13 5 成绩(5分制) 1 2 3 4 5 乙班 学生人数(%) 0 11 39 36 14 解:根据表2.5.7的数据资料计算得
x甲??xi?15i?15ifi?i?f5i55?3?65?13?75?18?85?13?95?5?75.8(分)3?13?18?13?5,
x乙??xi?15i?fi?i?f51?0?2?11?3?39?4?36?5?14?3.5(分)
11?39?36?14s甲??f(xii?1i?x)?12?fi?15??f(xii?15i?75.8)2?10.64
52?1i 16
s乙??i?15fi(xi?x)2?fi?15?i?i?15fi(xi?3.5)2100?1?0.87
?19s9402??(xi?1ni?x)2n?1??(xi?1i?80.3)2?15.52
9?1Vs甲?s甲x?100%?10.64?14% 75.8Vs乙s乙0.87??100%??25%
3.53xs?100% x或Vs?由计算所得甲班和乙班平均分所在的分数段可以所出,甲、乙两班的平均成绩相差不大,由于甲班的离散系数小于乙班的离散系数,说明乙班成绩的分布变异性较大,其平均数代表性比甲班差,甲班的成绩较为稳定。
9.某市奶粉厂有甲、乙两车间生产某种品牌豆奶粉,每包标准重量定为400±5克。从甲车间随机抽得100包、有关资料如下表所示。又已知乙车间奶粉平均重量为400.6g/包,标准差为5.2g。
按豆奶粉重量分组(g/包) 390以下 390-394 394-398 398-402 402-406 406-410 410以上 合计 数量/包 2 9 19 39 18 9 4 100 试求:
(1) 甲车间豆奶粉的平均重量;
(2) 甲车间豆奶粉重量的全距(近似值); (3) 甲车间豆奶粉的不合格率;
(4) 甲、乙两车间豆奶粉的平均重量哪一个更接近标准中心值?哪个车间的平均重量更具有代表性?
(5) 甲车间豆奶粉重量的众数和中位数; (6) 甲车间奶粉重量属何种分布状态? 解:(1) 甲车间豆奶粉的平均重量
17
x甲??xi?17i?17ifi?i?f398?2?392?9?396?19?400?39?404?18?408?9?412?4?400.2(克/包)2?9?19?39?18?9?4 (2) 甲车间豆奶粉重量的全距(近似值)
R甲?xmax?xmin?412?388?24(克/包) (3) 甲车间豆奶粉的不合格率
不合格率?2?9?9?4?24%
100(4) 甲、乙两车间豆奶粉的平均重量哪一个更接近标准中心值?哪个车间的平均重量更具有代表性?
s甲??f(xii?17i?x)2?i?17??f(xii?17i?400.2)2?2.37
fi?1100?1由于甲车间生产豆奶粉的标准差比乙车间生产豆奶粉的标准差小,所以甲车间豆奶粉的平均重量更接近标准中心值,甲车间的平均重量更具有代表性。
(5)甲车间豆奶粉重量的众数和中位数 ? 甲车间豆奶粉重量的众数
从表中的数据得次数最多的一组为第四组,因而第四组为众数所在的组,将相应数据代入下限公式可得:
M0?L??139?19?d?398??4?398.5(克)
?1??2(39?19)?(39?18)? 甲车间豆奶粉重量的中位数
表中的豆奶粉数为100包人,其中位数位次为Lm出中位数在第四组,即在398-402这一组中。
按下限公式计算:
f??2?50,根据累计次数可以看
Me?L?(?f)/2?Sm?1fm?d?398?50?30?4?398?2.05?400.05(克) 39(6) 甲车间奶粉重量属何种分布状态? 甲车间奶粉重量分布状态的偏度为
Sk??(xi?1ki?x)3fi?
3?fi?1k?i?4743.328??3.5632
1331.205 18
甲车间奶粉重量分布如下图所示。
4540353025数量/包数量/包20151050012345678
由计算所得的平均重量、标准差、偏度及分布图可以得出,甲车间奶粉重量总体呈正态分布,且稍呈负偏斜。
10.对某地区农村劳动力进行抽样调查,得到劳动力按年龄的统计资料如下表所示。
年龄(周岁) 25以下 25-30 30-40 40-50 50以上 合计 比重(%) 9 21 42 20 8 100 (1)试计算劳动力平均年龄、方差、偏度及峰度; (2) 绘制劳动力年龄直方图与饼分图
解:劳动力平均年龄、方差、偏度及峰度计算如下表所示。
x甲??xfi?155ii??fi?122.5?9?27.5?21?35?42?45?20?55?8?35.9(周岁)
9?21?42?20?8is2??(xi?1kki?x)fi?fi?12?(xi?15i?35.9)2?77.84
?i?1100?1 19
11.某著名医生声称有75%的女性所穿的鞋子过小。有一个研究机构随机调查了356名女性,发现其中有313名女性所穿鞋子的尺码至少小一号。在显著性水平0.05下,检验假设:
H0:P?0.75,解:这是大样本下总体的比率的检验。 由已知,p?0.88,z?H1:P?0.75
p?0.750.75(1?0.75)/356?5.74,而z?/2?z0.025?1.96,则由
|z|?z?/2知,拒绝原假设。
12.某化纤厂生产的维尼伦,在正常情况下,其纤度服从正态分布,方差为0.052。 现使用新的原材料进行生产,抽取6根进行纤度试验,检测结果为1.35,1.54,1.40,1.55,1.45,1.39。 问利用新的原材料生产,纤度的方差有无显著变化(显著性水平为0.05)。
22解:建立假设 H0:??0.05,H1:?2?0.052。由已知得 s2?0.006827,从
而??2(n?1)s22?0?5*0.00682722?(5)?12.833?,而,?13.6540.0250.975(5)?0.831,20.05故拒绝原假设。
13.某药品研究所要测试两种减肥药的效果,在自愿者中随机选取了100名,且随机地平分成两组,第一组服用减肥药甲,第二组服用减肥药乙,经过一段时间后对试验者的体重测量。结果显示,第一组平均减少5.2千克,标准差为2千克;第二组平均减少4.7千克,标准差为2.3千克。在显著性水平0.05下,试检验这两种减肥药的效果是否有显著差异?
解:这是大样本下的两总体均值差异的假设检验。
H0:?1??2,H1:?1??2
z?x?y(n1?1)s?(n2?1)s11?(?)n1?n2?2n1n22122?5.2?4.799?2?99?2.32?200?210022?1.64,
z0.025?1.96,故接受原假设。
14.有两台铣床生产同一种型号的套管,要比较它们所生产的套管内槽深度的方差,测得深度数据为(单位:mm)
第一台铣床 第二台铣床
15.2 15.2
15.1 14.8
14.8 15.0
14.8 14.8
15.5 15.1
15.2 15.2
15.0 14.8
14.5 15.0
15.0
假设两样本独立,且分别来自两个正态总体,试判断第二台铣床产品的方差是否比第一台铣床的要小(显著性水平为0.05)
解:建立假设
2H0:?12??2;2H1:?12??2
25
由已知得: s?0.09553621,
s?0.02611122,从而,
s12F?2?3.66s2,而,
F0.95(7,8)?1?0.27,
F0.05(8,7)即F?F0.95(7,8),故接受原假设。
15.检查了一本书的100页,记录各页中印刷错误数,结果为 错误个数fi 含fi错误的页数
0 36
1 40
2 19
3 2
4 0
5 2
6 1
?7
0
由此资料能否认为一页中的印刷错误数服从泊松分布(显著性水平为0.05)?
解:这属分布的检验。即要检验总体
H0:总体X服从泊松分布
即P{X?i}??ie??i!,i?0,1,2,?
??x?1.0。 在原假设中参数?未知,由最大似然估计法得?经计算得下表。
fi 36 40 19 2 0 2 1 0
2?i p0.368 0.368 0.184 0.061 0.015 0.003 0.019 0.0005 0.0005 ?i np36.8 36.8 18.4 6.1 1.5 0.3 1.9 0.05 0.05 ?i fi2/np35.217 43.478 19.620 0.656 4.737 总和=103.708 即??103.708?100?3.708,而?0.05(5?1?1)?7.815,故接受原假设。
2 26
第五章 方差分析
1. 何谓方差分析,其研究内容是什么?
解 所谓方差分析,就是通过将观察数据的总偏差平方和进行分解,利用假设检验理论和方法,对因素的各个水平所对应的正态总体的均值是否相等进行检验的一种方法。其研究内容主要有多个正态总体均值是否相等的检验,总体分布中未知参数的估计。
2. 方差分析有哪些类型,各有何特点?
解 一般有单因素和双因素方差分析。单因素方差分析主要基于同一因素下的多个具有相同方差的正态总体;而双因素则基于不同因素下的多正态总体,其中还存在两因素的交互作用。
3. 方差分析中有何基本假定,其基本思想是什么? 解 (1)因素下各水平所对应的总体服从正态分布;(2)这些正态总体有相同的方差;(3)来自于不同水平下的样本相互独立。
方差分析的基本思想:若被考察的因素对试验结果没有显著的影响,即所讨论的各正态总体的均值相等,则试验数据的波动完全由随机误差引起;如果各正态总体均值不全相等,则表明试验数据的波动除了随机误差的影响外,还包含被考察因素效应的影响。为此,通过构造适当的统计量,来描述数据的波动程度。将这个统计量分解为两部分,一部分是纯随机误差造成的影响,另一部分是除随机误差的影响外来自因素效应的影响。然后将这两部分进行比较,如果后者明显比前者大,就说明因素的效应是显著的。
4. 简述方差分析的一般步骤。
解 (1)根据问题的特点建立假设;(2)根据公式计算并得到方差分析表;(3)由给定的显著性水平,查得检验统计量的临界值;(4)作出决策。
5. 设有三台机器生产规格相同的铝合金薄板。随机选取每台机器所轧制的5块铝板,测得它们的厚度(单位:cm)如下表所示。
机器I 机器II 机器III 0.236 0.238 0.248 0.245 0.243 0.257 0.253 0.255 0.254 0.261 0.258 0.264 0.259 0.267 0.262 设每台机器所生产的薄板的厚度服从方差相同的正态分布,试在显著性水平0.05下,检验每台机器生产的薄板厚度有无显著差异。 如果差异显著,试求总体方差、各总体均值的点估计以及均值两两相等的显著性水平为0.05的假设检验。
解 建立假设:H0:?1??2??3;H1:不全相等。 经计算得到方差分析表。
方差分析表 差异源 组间 组内 总计 SS df MS 1.6E-05 27
F P-value F crit 0.001053 2 0.000192 12 0.001245 14 0.000527 32.91667 1.34E-05 3.88529 由于P值小于显著性水平,故拒绝假设H0,即不同机器生产的薄板厚度有显著差异。
?3=0.262;?2?0.256,??1=0.242,?各总体均值的点估计值为各自样本的均值,分别为???总体方差的点估计值为?2sE0.000192??0.000016。 n?t15?3下面进行每两个总体均值的假设检验。 (1)H01:?1??2;H11:?1??2
由于两总体方差未知但相等,故用t检验。经计算得,|t|=5.33 ,而t0.025(8)?2.31,故拒绝H01。
(2)H02:?2??3;H12:?2??3
同上,用t检验。经计算得,|t|=2.77 ,而t0.025(8)?2.31,故拒绝H02。 (3)H03:?1??3;H13:?1??3
同上,用t检验。经计算得,|t|=7.25 ,而t0.025(8)?2.31,故拒绝H03。
6. 将抗生素注入人体内会产生抗生素与血浆蛋白质结合的现象,以致减少了药效。下表是5种常用的抗生素注入到牛体内时,抗生素与血浆蛋白质结合的百分比。试在显著性水平0.05下检验这些百分比的均值有无显著差异。
青霉素 29.6 24.3 28.5 32.0 四环素 27.3 32.6 30.8 34.8 链霉素 5.8 6.2 11.0 8.3 红霉素 21.6 17.4 18.3 19.0 绿霉素 29.2 32.8 25.0 24.2 解 这是单因素方差分析。 建立假设:
H0:?1??2????5;H1:不全相等 经计算得方差分析表
方差分析 差异源 组间 组内 SS 1480.823 135.8225 df 4 15 MS 370.2058 9.054833 F 40.88488 P-value 6.74E-08 F crit 3.055568 总计 1616.646 19 28
由上表可见,在显著性水平0.05下,基于现有样本,拒绝原假设H0,即这些百分比的均值有显著显著差异。
7. 为了检验广告媒体和广告方案对产品销售量的影响,某营销公司做了一项试验,考察3种广告方案和2种广告媒体,得到的销售量数据如下表所示。
报纸 A B C 8 12 22 14 10 18 广告媒体 电视 12 8 26 30 18 14 试检验广告方案、广告媒体或其交互作用对销售量的影响是否显著? 解 这属双因素方差分析问题。
方差分析表 差异源 样本 列 交互 内部 总计
由此可见,因素广告方案对销售量的影响是显著的,而广告媒体及两因素的交互作用对销售量的影响不显著。
SS 344 48 56 96 544 df 2 1 2 6 11 MS 172 48 28 16 F 10.75 3 1.75 P-value F crit 0.010386 5.143249382 0.133975 5.987374152 0.251932 5.143249382 29
第六章 回归分析
1. 什么是相关分析?相关分析与回归分析的关系是什么?对社会经济现象进行相关分析时应注意什么问题?
答: 相关关系反映的是客观事物之间的非严格、不确定的线性依存关系。这种线性依存关系有两个显著的特点:①客观事物之间在数量上确实存在一定的内在联系。表现在一个变量发生数量上的变化,要影响另一个变量也相应地发生数量上的变化。例如,劳动生产率的提高会对成本产生影响。②客观事物之间的数量依存关系不是确定的,具有一定的随机性。表现在给定自变量一个数值,因变量会有若干个数值和它对应,并且,因变量总是遵循一定规律围绕这些数值的平均数上下波动。其原因是影响因变量发生变化的因素不止一个。例如,影响工业总产值的因素除了职工人数外,还有固定资产原值、流动资金、生产技术水平和能耗等因素。
回归分析与相关分析都是研究和测度两个或两个以上变量之间关系的方法。相关分析是研究两个或两个以上随机变量之间线性依存关系的紧密程度。通常用相关系数表示,多元相关时用复相关系数表示。回归分析是研究某一随机变量(因变量)与另外一个或几个普通变量(自变量)之间的数量变动的关系。由回归分析求出的关系式,称为回归模型。
这两种分析的区别是,相关分析研究的变量都是随机变量,并且不分自变量与因变量;回归分析研究的变量要首先明确那些是自变量,那些是因变量?并且自变量是确定的普通变量,因变量是随机变量。这两种分析的联系是,它们是研究客观事物之间相互依存关系的两个不可分割的方面。
在实际工作中,一般先进行相关分析,由相关系数的大小决定是否需要进行回归分析。在相关分析的基础上建立回归模型,以便进行推算、预测。
2. 已知下列数据组
x y 2 6 3 8 5 11 6 14 7 16 9 19 10 22 12 25 (1)建立一元线性回归模型; (2)计算相关系数R,取显著性水平??0.05,对回归模型进行显著性检验; (3)计算估计标准误差
Sy。
n?xiy??xi?y?解:(1) bii??1.931138 22n?xi?(?xi)??a?yni??xi?2.08982 ?bn? 回归预测模型为:y?2.08982?1.931138x (2)R?
n?xy??x?yn?x?(?2x)2n?y?(?2y)2?0.997634
R0.05(6)?0.7067
30
由于R?0.997634>R0.05(6)?0.7067,故在??0.05的显著性水平上,检验通过,说明两变量之间线性相关关系显著。 (3)s?y
3.某省1978~1986年居民消费品购买力和居民货币收入统计数据如下: 年份 1978 1979 1980 1981 1982 居民消费品购买力 8.5 11.1 16.3 15.8 17.6 居民货币收入 11.6 14.1 17.1 19.6 22.1 年份 1983 1984 1985 1986 居民消费品购买力 20.5 27.8 36.5 39.2 居民货币收入 25.6 36.3 40.5 47.8 ?y2?a?y?b?xyn?2???0.496495
根据上述统计数据,试
(1)建立一元线性回归模型;
(2)对回归模型进行显著性检验(取?=0.05);
(3)若居民货币收入每年平均增长19%,试预测该省1987年居民消费品购买力; (4)对1987年居民消费品购买力做区间预测(取??0.05)。
n?xiy??xi?y?解:(1) b ii??0.84448722n?xi?(?xi)??a?yni??xi??0.54457 ?bn? 回归预测模型为:y??0.54457?0.844487x (2)R?
n?xy??x?yn?x?(?2x)2n?y?(?2y)2?0.988732
R0.05(7)?0.6664
由于R?0.988732>R0.05(6)?0.6664,故在??0.05的显著性水平上,检验通过,说明两变量之间线性相关关系显著。
(3)y??0.54457?0.844487x=-0.54457+0.844487×47.8×(1+0.19)=47.5
?(4)
?0?t?y(n?m)?sy1?21?nnn(x0?x)222?x?(?x)
31
9(x0?x)1=?47.5?2.365?1.7262681??=47.5±5.56 2299?(?x)2?x即:1987年居民消费品购买力做区间预测为41.94~53.06
4.运用多元线性回归预测技术,对有关数据进行计算,结果如下: y??653.964?1.309x2?0.728x3?83.026x4
(-2.17) (6.76) (2.27) (1.984)
R=0.97849 R=0.97418 n=19 F=227.398 S=22.445 DW=1.0429
22(1)取显著性水平?=0.05,对回归模型进行R检验、F检验、t检验和DW检验; (2)对检验结果加以分析。 解:
? R检验
R=0.9891,R0.05(19?4)?0.4821,因R>R0.05(15),故在??0.05的显著性水平上,检验通过,说明相关关系显著。
? F检验
?i?y)?(yF??i)?(yi?yF?(m?1,n?m)?F? t检验
因为|t1|、|t2|、|
0.052(m?1)(n?m)2?305.37,
(3,15)?3.29,因F>>F0.05(3,15),说明回归效果非常显著。
t3|均大于
t40.052(15)?2.131,故拒绝假设??0、??0,??0,即
123?1、?2,?显著异于0,
3?=1.984<
t0.052(15)?2.131,故接受假设??0,即?不显
44著异于0。
5.某市1977~1988年主要百货商店营业额、在业人员总收入、当年竣工住宅面积的统计数据如下:
在业人员当年竣工住年份 营业额 (千万元)y 总收入(千宅面积 (万万元)年份 营业额 (千万元) 在业人员当年竣工住总收入(千宅面积(万平万元)x 2平方米)x 3y 1983 1984 1985 1986 1987 1988 12.2 16.7 15.5 18.3 26.3 27.3 x 2方米)x 31977 1978 1979 1980 1981 1982
8.2 8.3 8.6 9.0 9.4 9.4 76.4 77.9 80.2 86.0 85.2 88.2 9.0 7.8 5.5 5.0 10.8 6.5 116.2 6.2 129.0 10.8 147.5 18.4 186.2 15.7 210.3 32.5 248.5 45.5 32
根据上述统计数据,试
(1)建立多元线性回归模型;
(2)对回归模型进行R检验、F检验、t检验和DW检验(取??0.05);
(3)假定该市在业人员总收入、当年竣工住宅面积在1988年的基础上分别增长15%、17%,请对该市1989年主要百货商店营业额作区间估计(取??0.05)。
解:(1)应用excel软件数据分析功能求得多元线性回归模型的参数为: b0=0.2233,b1=0.1,b2=0.077 据此,建立的线性模型为
??0.2233+0.1x2+0.077 yx
3(2)对回归模型进行R检验、F检验、t检验和DW检验(取??0.05) ? R检验
R=0.9808,R0.05(12?3)?0.6029,因R>R0.05(9),故在??0.05的显著性水平上,检验通过,说明相关关系显著。
? F检验
?i?y)?(yF??i)?(yi?yF?(m?1,n?m)?F? t检验
2(m?1)(n?m)2?113.88,
0.05(2,9)?4.26,因F>>F0.05(2,9),说明回归效果非常显著。
t1?0.157,t2?5.188,t3?0.849
因为
t2大于
t0.052(9)?2.262,故拒绝假设??0,即?显著异于0,t1、t3均小于
22t0.052(9)?2.262,故接受假设??0,
1?3?0。即
?1,
?3不显著异于0。
? DW检验
DW??(ei?ei?1)i?2n2?eii?1n2?55.44?2.79 19.84当?=0.05时,m?3,n?12时,查DW检验表,因DW检验表中,样本容量最低是15,故取:d?0.82,d?1.75,即DW统计量在3.18?4?dL>DW=2.79>4-
LUdU=2.25之间,由
此可以得出检验无结论。检验结果表明,不能判断回归模型是否存在自相关。
(3)假定该市在业人员总收入、当年竣工住宅面积在1988年的基础上分别增长15%、17%,请对该市1989年主要百货商店营业额作区间估计(取??0.05)。
??0.2233+0.1x2+0.077x3 y=0.2233+0.1×248.5×(1+0.15)+0.077×45.5×(1+0.17)
=32.9
33
预测区间为
??t?y02(n?m)S=y??t0.025(9)S
0=32.9?2.262?1.4848 =32.9?3.3586
即:当1988年在业人员总收入为285.775千万元,当年竣工住宅面积为53.235万平方米时,在?=0.05显著性水平上,营业额在:29.5413~36.2585千万元之间。
6.某企业某产品1981~1988年利润率与单位成本统计数据如下表所示。 年 份 利润率% 1981 1982 1983 1984 10 13 15 16 单位成本(元/件) 95 88 84 82 年 份 利润率% 单位成本(元/件) 1985 1986 187 1988 18 20 22 25 79 75 70 66 根据表中数据,解答下列问题
(1)配合适当的曲线模型;
(2)对回归模型进行显著性检验(取??0.05);
(3)若该企业1989年的单位成本为63元,预测1989年的利润率; (4)当该企业1989年总产量为8000件时,利润总额为多少? 解:(1)绘制散点图
设利润率为y, 单位成本为x,绘制散点图,如下图所示。由散点图可以看出两者呈线性关系,可以建立一元线性回归模型。
利润302520151050020406080单位成本100
n?xiy??xi?y? b ii???0.514622n?xi?(?xi)
34
??a?yni??xi?58.4757 ?bn? 回归预测模型为:y?58.4757?0.5146x (2)R?
n?xy??x?yn?x?(?2x)2n?y?(?2y)2?0.9975
R0.05(8?2)?0.7067
由于R?0.9975>R0.05(6)?0.7067,故在??0.05的显著性水平上,检验通过,说明两变量之间线性相关关系显著。
(3)若该企业1989年的单位成本为63元,则1989年的利润率为
?y?58.4757?0.5146x?58.4757?0.5146?63?26.06
(4)当该企业1989年总产量为8000件时,利润总额为
利润总额?63?26.06%?8000?131342.4(元)
7.某地区农业总收入与小型农机销售额统计数据如下: 小型农机销售额(万元) 农业总收入(亿元) 年 份 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 y 79 70 82 84 85 84 157 154 174 198 年 份 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 2 x 5.4 4.8 5.8 6.3 6.9 6.3 7.3 8.9 10.6 16.1 根据上述数据,
(1)试建立一元线性回归模型,并计算
R,S和F统计量;
(2)试建立带虚拟变量的回归模型,并计算(3)试比较两种不同的回归模型。
解:(1)建立的一元线性回归模型为
R,S和F统计量;
2n?xiy??xi?y?(1) bii??10.4731 22n?xi?(?xi)i??a?yn??xi?22.7180 ?bn 35
回归预测模型为:y?22.7180?10.4731x R?n?xy??x?yn?x?(?2?x)2n?y?(?2y)2 0?0.881
R2?0.776 2sy??y2?a?y?b?xyn?22???20.7874
?i?y)?(yF??i)?(yi?y(m?1)(n?m)2?24.27
t1?1.2226,t2?4.9269
(2)建立带虚拟变量的回归模型
引入虚拟变量Di来反映经济政策的影响。设Di的取值为:
?0,?Di??1,i?1979年 i?1979年则带虚拟变量的回归模型为
y?63.42938?2.76534x1?65.42192x2
st1y?4.9341,F?274.5536,R?0.9946
?10.9638,t2?3.1784,t3?10.8742
(3)试比较两种不同的回归模型
带虚拟变量回归模型的各项指标均通过检验,其中虚拟变量的t统计量为10.874,说明虚拟变量对因变量有显著影响。对比上述两个模型可以看出引入虚拟变量之后,回归模型的估计标准差从20.7874降到4.9341,而可决系数由0.8821上升到0.9946,回归模型的拟合度明显提高。
36
第七章 时间序列分析
1. 什么是时间序列?它在社会经济统计中有何重要作用?’
答:时间序列是指某一统计指标数值按时间先后顺序排列而形成的序列。例如,工农业总产值按年度顺序排列起来的序列;某种商品销售量按季度或月度排列起来的序列等等都是时间序列。时间序列一般用y1,y2,?,yt,?表示,t为时间。
在社会经济统计中,编制和分析时间序列具有重要的作用,主要表现在:
(1)为分析研究社会经济现象的发展速度、发展趋势及变化规律提供基本统计数据。 (2)通过计算分析指标,研究社会经济现象的变化方向、速度及结果。
(3)对若干相互关联的时间序列进行分析研究,可以揭示现象之间的联系程度及动态演变关系。
(4)建立数学模型,揭示现象的变化规律并对未来进行预测。
2. 编制时间序列应注意的原则是什么?
编制时间序列的目的就是要通过对序列中的各个指标值进行分析,来研究社会经济现象的发展变化及其规律。因此保证时间序列中各个不同时间上的统计指标具有可比性,是编制时间序列的基本原则。可比性原则具体体现在以下几个方面:
答:1.时间序列中各指标所属时间长短应前后一致 对于时期序列,因指标数值的大小与时间长短有直接关系,因此要求时期序列中各指标所包含的时期前后必须一致,有利于对比。 对于时点序列,由于各指标值反映的是现象在某一时点上所达到的水平,因此不涉及指标所属时间长短的问题,但只有保持相同的时间间隔才能准确地反映现象的变化状况。 值得注意的是,指标所属的时期长短与各指标值之间的时间间隔的大小是两个不同的问题。对于时期序列,其间隔尽量相等;对于时点序列,相邻时点的间隔尽量相等,这样才能便于对比分析。
2.时间序列中各指标所反映现象的总体范围应一致
例如,要研究某地区工业发展情况时,在所确定的研究时间内,该地区的行政划分发生变化,则变动前后的指标计算范围就不同,因此指标值就不具有可比性,这时,必须对资料进行必要的调整。只有经过适当的调整保持了总体范围的一致性,进行动态比较才有意义。
3.时间序列中各指标的经济内容应一致
在统计年鉴中经济指标的含义和内容随着时间的变化,有时会发生变化。因此在编制时间序列时,就需要调整,使前后指标所包含的内容一致。
4.时间序列中各指标的计算方法应相同
在指标的总体范围、经济内容相同的情况下,只有对指标的计算方法一致时,计算结果才有可比性。例如要研究劳动生产率的变动,产量指标是用实物量指标还是用价值量指标,劳动力指标是用全部职工人数还是用生产工人数,若进行对比,前后必须一致。
5.时间序列中各指标的计算价格和计量单位要一致 统计指标的计算价格和计量单位要统一,因为价格有现行价格与不变价格之分,只有前后价格一致时,计算结果才具有可比性。
3. 有哪些常用的动态分析指标?它们各有什么意义?
37
答:常用的动态分析指标为 1.时间序列的水平分析指标 (1)发展水平
发展水平即时间序列中每一具体指标数值,反映的是经济现象在各个时期内实际达到的规模或水平。发展水平可以是绝对数、相对数或平均数。
通常时间序列用a0,a1,a2,?,an表示。我们把a0称为最初水平,an称为最末水平,处于二者之间的各时期的指标值称为中间水平。在进行动态分析时,所研究时期的发展水平称为报告期水平,用作对比基础的发展水平称为基期水平。应当注意的是,随着研究目的、任务的改变,现在的报告期水平,可能是将来的基期水平,这个时间序列的最末水平可以是另一时间序列的最初水平 (2)平均发展水平
平均发展水平又称为时序平均数或动态平均数,是将时间序列中不同时期的发展水平加以平均,从动态上说明现象在某一时期内发展的一般水平。时序平均数与一般平均数有共同之处,即它们都是将研究现象的个别数量抽象化的数字,都表明现象的一般水平。但也有不同之处,主要表现在:
一般平均数是将同一时期内指标总量与总体中包含的个体数对比的结果,而时序平均数则是将不同时期的指标数值的总和与时间项数对比的结果;
一般平均数是总体内各个体之间指标值的平均,而时序平均数是时间序列中各时间单位间发展水平的平均;
一般平均数是从静态上说明现象的一般水平,是根据变量序列计算的,而时序平均数是从动态上说明现象的一般水平,是根据时间序列计算的。 时序平均数可根据绝对数时间序列计算,也可以根据相对数时间序列或平均数时间序列进行计算。
(3) 增长量
增长量是时间序列中两个不同时期发展水平之差,又称为增长水平。表明现象在一定时期内增长的绝对数量。
增长量=报告期水平-基期水平
增长量由于基期水平选择不同,可分为累积增长量和逐期增长量。逐期增长量是报告期水平与前一期水平之差,用公式表示为:ai?ai?1;累积增长量是报告期水平与某一固定期水平之差,用公式表示为:ai?a0。
逐期增长量的和等于相应的累计增长量,两个相邻期的累计增长量的差等于相应的逐期增长量。
逐期增长量:a1?a0,a2?a1,?,an?an?1累计增长量:a1?a0,a2?a0,?,an?a0
它们之间的关系为: (a1?a0)?(a2?a1)???(an?an?1)?an?a0
(4)平均增长量
平均增长量是时间序列中各逐期增长量的时序平均数,也称为平均增长水平,表明现象在一定时期内平均每期增长的绝对数量,也属于时序(动态)平均数范畴,可以用简单算术平均法计算。
38
平均增长量=逐期增长量之和累计增长量 =逐期增长量个数时间数列项数-12.时间序列的速度分析指标
反映现象发展变化的速度指标主要有发展速度、增长速度、平均发展速度和平均增长速度四种,它们之间具有密切的关系,其中发展速度是最基本的速度指标。
(1) 发展速度
发展速度是以相对数形式表现的动态分析指标,它是两个不同时期发展水平指标对比的结果,说明报告期水平是基期水平的百分之几或若干倍。计算公式为
发展速度=报告期水平 基期水平发展速度由于基期选择的不同,可分为环比发展速度和定基发展速度。环比发展速度是报告期水平与前一期水平之比,说明现象逐期发展程度;定基发展速度是报告期水平与某一固定时期水平之比,说明现象在较长一段时期内的发展程度。
环比发展速度:定基发展速度:aa1a2a3,,,?,na0a1a2an?1
aa1a2a3,,,?,na0a0a0a0(2) 增长速度
增长速度是增长量与基期水平之比。如果其值为正,表示水平增长了;如果其值为负,表示水平下降了。因此增长速度说明报告期水平比基期水平增加或降低了百分之几。用公式可以表示为
增长量报告期水平-基期水平增长速度===发展速度-1
基期水平基期水平增长速度按基期水平选择的不同分为定基增长速度和环比增长速度。
环比增长速度是逐期增长量与其基期水平之比。环比增长速度就是我们通常所说的环比增长率,用公式可以表示为
a?an?1a环比增长速度=n?n?1?环比发展速度?1
an?1an?1定基增长速度是累积增长量与其基期水平之比。定基增长速度就是我们通常所说的定基
增长率,用公式可以表示为
a?a0an定基增长速度?n??1?定基发展速度?1
a0a0值得注意的是,一定时期内,环比增长速度的连乘积不等于定基增长速度。
发展速度大于1,则增长速度为正值,表明现象的增长程度,发展速度小于1,则增长速度为负值,表明现象的降低程度。在实践应用中,需要把发展速度和增长速度同隐藏在其后的绝对量———发展水平和增长量结合起来。进行动态分析时,既要看速度,又要看水平,有一个很有代表性的指标,即增长1%的绝对值。它是逐期增长量除以环比增长速度,也可以表示为
增长1%的绝对值=基期水平(或前一期水平)×1% (3)平均发展速度与平均增长速度
平均发展速度与平均增长速度通称为平均速度。平均发展速度是各个时期环比发展速度的平均数,说明现象在一定时期内逐期平均发展速度变化的程度。平均增长速度说明现象在
39
一定时期内逐期平均增长的程度。平均增长速度可依据增长速度与发展速度的关系通过平均发展速度求得。
平均增长速度=平均发展速度-1
4. 怎样测定长期趋势和季节变动?怎样测定循环变动和不规则变动? 答:
一、长期趋势和季节变动的测定 1.长期趋势的测定
长期趋势分析就是要排除一些偶然因素的影响,研究现象发展变化的规律,并对其发展变化的总趋势做出判断,因此就必须对原有序列进行科学的处理,也就是对原有的时间序列进行修正。 (1)移动平均法
移动平均法也称为时间序列修匀,逐期移动,计算某些时期的长期趋势值。移动平均的目的是消除其他变动S、C、R ,因此根据分析资料的不同,如果是年度资料,移动平均的项数取循环变动的周期;如果是季度资料,移动平均的项数取4;如果是月份资料,移动平均的项数取12。
(2)趋势方程法
趋势方程法也称为数学模型法或时间序列的回归分析法。根据长期趋势是直线还是曲线(二次抛物线、指数曲线等),建立的长期趋势方程分别为:
??a?bt?ct;指数曲线:y??a?bt ??a?bt;二次抛物线:y直线:y22.季节变动的测定
时间序列的值与季节有关,如产品销售等的季节效果。分析时间序列季节因素目的之一是,发现何时实际数据与平均值(趋势)不同,找出变化幅度,以便计划生产,储存和制订政策。
(1)简单平均法
简单平均法也称为同期平均法,就是根据多年的月(季)资料,算出该月(季)平均数,然后将各月(季)平均数与总月(季)平均数对比,从而得到季节比率,用它来说明季节变动情况。
季节因子=同月(季)平均数?100%
总月(季)平均数由于季节因子是作为一年(季、月)中指标上下浮动的平均效果,因此它们的和应该为1200%或400%。如果它们的和不等于1200%或400% ,就需要对季节因子进行修正。 季节因子的修正因子方法为:用1200%除以月份季节因子之和或用400%除以季度季节因子之和得到的修正系数,然后乘以原季节因子得到修正后的季节因子。
(2)趋势剔除法
趋势剔除法适用于存在明显的长期趋势的时间序列。它的思路是:先测定时间序列的长期趋势,将趋势值从时间序列中剔除,然后再测定季节变动。
? 加法模型中季节因子的确定
考虑简化的时间序列加法模型:y?T?S?R
其中,趋势T可由前面得出(最小二乘法得直线,或滑动平均所得曲线),再设R?0(因为R应为0),则
40
y?T?S?S?y?T
即加法模型中的季节因子可以由上式得到。
由于季节因子是作为一年(季)中指标上下浮动的平均效果,因此它们的和应该为零。如果它们的和不等于零,就需要对季节因子进行修正。 季节因子的修正因子为:l?因子总和
周期中点数在每个季节因子上减去修正因子后就是修正后的季节因子。 ? 乘法模型中季节因子的确定
由简化的时间序列乘法模型:y=T×S×R 其中,T可以由前面得出,设R=1,则
S=y/T (7.3.10)
即可得出乘法模型的季节因子。对于原始时间序列,对每个季节利用此公式得到每个季度的季节因子,然后对同一季节的季节因子再作算术平均,得出4个季节因子。由于季节因子是由算术平均求得的,因此它们的百分比数的和应该为400(按季度),如果它们的和不等于400,就需要对季节因子作修正,因而对于乘法模型的因子修正为:
l?周期中点数?100 (7.3.11)
因子总和 在每个季节因子上乘以修正因子后就是修正后的季节因子。
对于乘法模型也可以用几何平均来求季节因子,最后再进行修正。
二、循环变动和不规则变动的测定 1.循环变动的测定
一般而言循环因子很难识别,因为由其定义知道,循环因子的识别关键是要有大量的历史数据,通常我们得到的数据相对而言比较短,因此很难识别出循环因子。在社会生活中已知的一些循环有:
(1)Kuznet长波:各国的国民生产总值和人口迁移大体有20年的循环。 (2)商业循环:在贸易等流通领域,通常有1—12年的循环。
循环因子分析的意义在于探索现象变化的规律性。分析现象之间循环因子的内在联系,为微观和宏观决策提供数据支持。
可应用剩余法测定循环因子。剩余法就是首先假定影响时间序列变动的各因素是乘积关系,即以乘法模型为基础Y=T·S·C·R;然后从时间序列中剔除长期趋势和季节变动,即Y/T·S=C·R;最后在此基础上,通过移动平均剔除不规则变动R,剩余的即为循环因子值C。
2. 不规则变动的测定
在不计循环因子的前提下,加法模型中随机因子(也称为残差)可由下式算出:
R?y?T?S
其中,S为修正后的加法模型季节因子。在乘法模型中,随机因子为:
R?yT?S
残差为y?TS,其中S为修正后的乘法模型季节因子。
41
问题是,在时间序列分析中,何时用加法模型?何时用乘法模型?常用的方法是看残差平方和或残差平方和的平均值,在加法模型中残差即为随机因子,在乘法模型中残差等于y-TS。残差平方和或残差平方和的平均值小的那种模型较好。
5. 某商品4月份的库存量如下表: 日期 库存量(台) 1~4 49 5~7 52 8~13 39 14~20 29 21~23 43 24~28 38 29~30 51 试求该商品4月份平均库存量。
解:该商品4月份平均库存量为
a??a1f1?a2f2???anfnf1?f2???fn4?49?3?52?6?39?7?29?3?43?5?38?2?51
4?3?6?7?3?5?2?40.3
6.某经济开发区2003年上半年各月初居民人数资料如下表所示。 时间(月/日) 人数(百人) 1/1 1360 2/1 1396 3/1 1418 4/1 1594 5/1 1672 6/1 1800 7/1 1912 试求该经济开发区2003年上半年各月平均居民人数。 解:该经济开发区2003年上半年各月平均居民人数为
a1/2?a2???an/2n?11360/2?1396?1418?1594?1672?1800?1912/2? 7?1?1586a? 7.下表列出了我国1992~1997年第三产业从业人员数的有关资料,试计算第三产业从业人员数占总从业人员数比重的年平均数。 年份 从业人员(万人) 解:
65554?66373?67199?67949?68850?69600?67587.5612979?14071?15456?16851?17901?18375第三产业平均每年从业人员数a??15938.836a169.25第三产业从业人员数占总从业人员数比重的年平均数c???23.58±47.5平均每年从业人员数b?1992 65554 1993 66373 14071 1994 67199 15456 1995 67949 16851 1996 68850 17901 1997 69600 18375 第三产业从业人员(万人) 12979
42
第八章 复习思考题
1.简述综合指数和平均指数的编制原理。
解:综合指数的编制主要在于同度量因素时期的选择上,常用的L指数和P指数在同度量因素时期的选择上是不同的。L指数将同度量因素固定在基期上,而P指数则将同度量因素固定在报告期上。
平均指数的编制由个体指数和基期或报告期的总水平这两个量编制而成,这主要取决于所给定的资料。
2.什么是指数体系,其有何作用?
解:指数体系广义上是指若干个有相互联系的统计指数所形成的体系;狭义上是指若干个有联系的指数之间存在的某一数量关系。
指数体系的主要作用表现在三个方面: (1)对经济现象进行因素分析,测定某一现象的总变动中各相关因素影响作用的方向、影响的程度,以此分析现象变动的具体原因。
(2)应用于相关指数之间的换算。 (3)对编制单个综合指数的借鉴作用。
3.什么是指数因素分析?
解:利用指数体系测定两个(或多个)因素的变动对总量指标影响的方向与影响程度 利用指数体系分析的一般模型为(以两因素分析为例)
??p1q1?q1p0?p1q1?????p0q0?q0p0?p0q1? ??pq???11?p0q0?(?q1p0??q0p0)?(?p1q1??p0q1)??
4.针对一个具体问题就L氏指数和P氏指数的差异进行分析。 见教材。
5.下表是某销售公司三种产品的销售资料。 商品名称 甲 乙 丙 计量单位 千克 件 只 销 售 量 基 期 8000 2000 10000 报告期 8800 2500 10500 价 格(元) 基 期 10.0 8.0 6.0 报告期 10.5 9.0 6.5 (1)试用拉氏公式编制三种商品的销售量综合指数、销售价格综合指数; (2)试用帕氏公式编制三种商品的销售量综合指数、销售价格综合指数。
解: (1) Lq??qp?qp1000?109.62% ,Lp? 43
?pq?pq0100?107.05% ;
(2) Pq??qp?qp1011?109.67% , Pp??pq?pq1101?107.11% 。
6.某厂生产的3种产品的资料如下。 总生产费用(万元) 产品名称 彩电 冰箱 洗衣机 基 期 454 300 552 报告期 536 338 585 个体产量增加(%) 4.0 13.5 8.6 试计算:
(1)3种产品的生产费用总指数;
(2)以基期生产费用为权数的加权算术平均产量指数; (3)以报告期生产费用为权数的加权调和平均产量指数。
解:(1) 3种产品的生产费用总指数=
536?338?585454?300?552=111.72%;
(2) Aqpqk???pq0000q?454?104%?300?113.5%?552?108.6E4?300?552536?338?585=108.13%;
(3) Aq??pqpq?kq1111?536104%?338113.5%?585108.6%=107.93%
7.某菜场的3种蔬菜的销售资料如下。
销售额(元) 品种 黄瓜 土豆 西红柿 基 期 448.0 308.0 403.2 报 告 期 475.0 288.0 510.0 个体价格指数% 95.0 90.0 125.0 试以上述资料计算:
(1)3种蔬菜的销售额总指数;
(2)以报告期销售额为权数的加权调和平均价格指数; (3)分析价格和销售量的变动对销售额的影响结果。
解:(1)3种蔬菜的销售额总指数=
475.0?288.0?510.0448.0?308.0?403.2=109.82%;
(2)Appq??pq?kp1111?475.0?288.0?510.0475.095%?288.090%?510.0125%=103.66%;
(3)Aqqp???qpk1100?p475.0?288.0?510.0448.0?95%?308.0?90%?403.2?125%=105.49%
由此说明,3种蔬菜的销售价格总体上上涨了3.66%,使得销售额增加了45元;3
44
种蔬菜的销售量总体上上涨了5.49%,使得销售额增加了66.2元.
8.已知某地区2004年的农副产品收购总额为360亿元,2005年比上年的收购总额增长12%,农副产品收购价格综合指数为105%。试讨论:
(1)2005年与2004年相比,农民因销售农副产品共增加多少收入?
(2)2005年农副产品收购量比2004年增加了百分之几?农民的收入因此增加了多少? (3)由于农副产品收购价格提高5%,农民的收入增加了多少? (4)验证以上三方面的结论是否一致性?
解:(1)2005年与2004年相比,农民因销售农副产品共增加的收入=360*12%=43.2亿元;
(2)收购量指数=112%/105%=106.67%,即收购量增加了6.67%,收入增加了24亿元; (3)由于农副产品收购价格提高5%,农民的收入增加19.2亿元。
45
第九章 统计决策
1.什么是统计决策?统计决策需具备哪些条件? 答:1.什么是统计决策
统计决策是在不确定情况下,应用数理统计进行决策的通用性的方法论科学。统计决策的显著特点是:
(1)统计决策建立在统计分折和统计预测的基础上,是一种定量决策。择优行动所导致的结果不是准确的、唯一的数值,而是可能实现的平均水平,即期望值; (2)统计决策是在不确定情况下,应用概率来进行决策的计算和分析,是一种概率决策。 2.统计决策需具备哪些条件
完整的统计决策问题,需要具备三个基本要素:决策目标、自然状态、备选方案。 (1)决策目标
决策目标是决策者要达到的目标,是统计决策的出发点和归宿。一般说来,决策者的目的是要设法使其所管理的系统或实体(如一个企业、—个部门、一个地区、甚至一个国家)的各种社会和经济活动按照其预先设定的程式运行,以达到预期的结果(如效益最佳、损失最小、投资最省等)。作为决策问题的目标,应当是能够通过一定方法转化为可测量的、能够直接或间接量化的指标,且具有或可以获得足够的观测数据。在决策分析中,有的问题只有—个目标,有的则需要同时满足多个目标。
(2)自然状态
自然状态是指不依赖决策者主观意志而转移的客观条件或外部环境,也是影响决策的因素。对同一个决策问题,几种自然状态不能并存,只能出现其中一种。如商业活动中空调的销售问题:天气热,销售快;天气凉,销售慢。天气状况就是自然状态,天气热与天气凉为天气状况的两种具体的自然状态,二者不可能同时出现。又如,—个大型工程建设的投资决策往往需要从社会、经济、生态、环境等各方面进行评估,每一方面的评估结果都可以用优、良、中、差等不同的级别表示,每一个级别都可以看作是工程建设后,关于社会、经济、生态和环境等影响的一种自然状态。在实际中只涉及怎样对其进行利用和数学表述,通常不能够改变这种自然状态。但是影响决策的因素也可以不是客观的自然环境而是可以人为控制的因素,例如市场竞争和军事对抗中竞争对手的影响因素。
(3)备选方案
在决策过程中,可供选择的行动方案总是有两种或两种以上。如果在解决某个问题时,只有一种办法或一种方案,就无需进行决策,只需照办即可。因此,凡是需要决策的问题,总是存在至少两种方案。如空调可以经销,也可以不经销。这样空调销售决策就有备选方案。
2.试述统计决策的原则和步骤。 答:统计决策的原则和步骤如下: (1)明确目标
明确目标是决策的前提条件,在确定目标时,要有全局观点,根据实际的需要与可能,把长远利益和现实利益结合起来统筹考虑。 (2) 拟定行动方案
根据确定的目标,拟定多个可行的行动方案,所谓可行性就是从整体出发,要求技术上合理,经济上合算。对于比较复杂的决策问题,方案是否可行,需进行可行性研究和论证。 (3) 探讨并列出未来可能的状态
统计决策中的可能状态是指那些对实施行动方案有影响而决策者又无法控制和改变的
46
因素所处的状况。这些影响因素非常广泛,例如天气情况、物价变动情况、市场供需状况、和竞争者行动情况等。对于大多数决策问题,这种不以决策者意志为转移的影响因素可能很多,以致难以逐一研讨其可能出现的状态。因此,通常只选择对行动决策有重大影响的因素加以考虑,以这个因素或这些因素的状态或组合状态作为该决策问题的可能状态。
(4) 估计各可能状态出现的概率 在实际工作中,决策者通常通过计算历史资料或类似资料的频率直接估算可能状态的概率。
(5) 估算各个行动方案在不同可能状况下的损益值。
(6) 运用统计知识进行定量的决策分析,应用给定的决策标准作出决策。
3.统计决策有哪些类型?其持点各是什么?
根据决策分析的决策目标数量和自然状态类型,统计决策有多种分类方法。 1.按照决策目标数量分类
根据决策目标多少的不同,决策可分为单目标决策和多目标决策。 (1) 单目标决策
单目标决策是指围绕单一目标而进行的决策。如是否经销彩电的决策,就只需要考虑是否获利和获利是否达到一定的目标来进行。
(2)多目标决策
多目标决策是指需要同时考虑两个或两个以上目标的决策。如某企业要在几种产品中选择一种产品生产,就既要考虑获利大小,又要考虑现有设备能否生产以及原材料供应是否充足等因素来选择其中一种,只有使这些相互联系和相互制约的因素都能得到最佳的协调、配合和满足,才是最优的决策。
2.根据自然状态类型分类
根据决策的自然状态是否完全确定,统计决策可划分为确定型决策、风险型决策和不确定型决策三种类型:
(1)确定型决策
确定型决策是指决策的自然状态完全确定,即在未来情况已知的条件下,按照既定目标和决策准则选定方案的决策。例如,某企业用两种原料生产三种产品,当每种产品的原料消耗是固定的,而且每种产品所获得的利润也是已知的,用—定数量的原料组织生产时,有多种选择的方案,要从中选出获利最大的方案,就是一种确定型决策。确定型决策可采用单纯的优选法,根据已掌握的数据,直接进行比较,选取所需方案,或者根据问题需要,建立一定的、与实际情况尽可能相符的数学模型,经过运算优选出满意的行动方案。相对而言,这是一种比较简单、直观的决策。 (2)风险型决策
某事件中存在着两个以上的不以决策者主观意志为转移的自然状态,在几种不同的自然状态中未来会出现哪一种状态,决策者不能肯定,但各种状态出现的可能性即概率,可由决策者预先估计或计算出来。这种决策是以概率或概率密度函数为基础的,具有随机性,因此也称为随机型决策。例如,空调销售问题,当各种天气出现的概率已知、空调是否销售的问题就是风险型决策。统计决策大多属于这种类型。
(3)不确定型决策
不确定型决策是指决策者在对未来情况未知,对各种自然状态及其概率也一无所知的情况下所进行的决策。例如,某企业对于一种从未投放过市场,从而也无法预测其销售状况的新产品,要决定是改装原有设备小批量生产,投放市场,这样投资获利或损失都比较小,还是投资购进新设备大批量生产,这样投资获利或可能造成的损失都较大,就是一种不确定
47
型决策。因为,在这个决策问题中,虽然新产品的市场前景可以大致估计为好、一般、差三种状况,但这三种自然状态出现的概率都无法知道。由于在各种自然状态出现的概率不确定的条件下,决策者往往能够凭借以往的经验或主观判断,对未来情况的发生,给定某一概率,并据以进行决策。从这个意义上讲,不确定型决策也可视为风险型决策,可以说统计决策的核心是风险型决策。
4.某企业为了扩大生产经营业务、准备生产一种新产品,生产这种新产品有三个可行方案:A1—改造本企业原有的生产线,A2—从国外引进一条高效自动生产线;A3—是按专业化协作组织生产。由于对未来几年内市场需求状况无法了解,只能大致估计有需求高、需求中等和需求低三种可能,其中需求高这一状况出现的可能性好像偏大。每个方案在各需求状况下的收益估计值如下表所示。
单位:万元 方案 A1 A2 A3 需求状况 需求高 180 240 120 需求中等 115 140 90 需求低 50 35 70
(1)试用乐观准则进行决策; (2)试用悲观准则进行决策; (3)试用折中决策准则进行决策 (4)试用后悔准则进行决策; (5)试用等可能性准则进行决策。
解:1.应用乐观准则进行决策
(1)先从各方案中选取一个收益最大的值
A1中最大收益值为:max{180,115,50}?180万元 A2中最大收益值为:max{240,140,35}?240万元 A3中最大收益值为:max{?15,33,73,110}?110万元
(2)选出最大值中最大值
max{180,240,110}?240万元
最大值210万元对应的方案为A2,即为最优方案。根据乐观准则进行决策,该公司应从国外引进一条高效自动生产线。 2.按悲观准则决策
(1)先选出各种自然状态下每个方案的最小收益值
A1中最小收益值为:min{180,115,50}?50万元 A2中最小收益值为:min{240,140,35}?35万元
48
A3中最小收益值为:min{120,90,70}?70万元
(2)选出最小值中最大值
max{50,35,70}?70万元
最大值70所对应的方案为A3,即为最优方案。根据悲观准则进行决策,该公司应按专业化协作组织生产。
3.应用折中决策准则进行决策
取?=0.6,根据折中准则法,选出每一方案的最大值与最小值。 解:A1:max{180,115,50}?180,min{180,115,50}?50万元
A2:max{240,140,35}?240万元,min{240,140,35}?35万元 A3:max{120,90,70}?120万元,min{120,90,70}?70万元
E(A1)?0.6?180?(1?0.6)?50?128
E(A2)?0.6?240?(1?0.6)?35?158
E(A3)?0.6?120?(1?0.6)?70?100
因此根据折中准则法,该公司应选择行动方案A2。 (4)应用后悔准则进行决策
(1)首先从决策收益表中确定各种自然状态下的最大收益值,需求高记为P1,需求中等记为P2,需求低记为P3,得到
max(Pax(180,240,120)?240, max(P2)?max(115,140,90)?140, 1)?mmax(P3)?max(50,35,70)?70
(2)用每列的最大收益值减该自然状态下各方案的收益值,得到后悔值,如表下表所示。
表9.2.2 收益统计表
可选方案 后悔值 P1 A1 A2 A3
60 0 120 P2 25 0 50 P3 20 35 0 max(Pij) 60 35 120 (3)选出每个方案的最大后悔值,得:
49
正在阅读:
应用统计学复习思考题参考答案04-12
《祖国山川颂》 黄药眠12-05
医疗纠纷处理工作制度03-28
圣诞祝福语(英文)08-18
小组合作观察记录表05-16
财务工作未来工作展望(共2篇)07-30
软肋骨炎怎么治疗养生小知识12-30
丰田商学院:精细化管理的68个细节09-28
有机化学实验 - 期末试卷(闭卷)10套10-11
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 思考题
- 统计学
- 复习
- 答案
- 参考
- 应用
- 外研版Book 2 Module 1 单选题
- 陕西省西安交大附中2018届高三第六次测试文综地理试题 - 图文
- 班组安全活动记录
- 盛泽东盛步行街招商策划报告
- 组态王日报表例程
- Lambda 750 紫外-可见-近红外分光光度计使用说明
- 场外考试步骤及注意事项
- 探究学习问卷调查
- 地球物理与信息技术学院2008年硕士研究生招生复试方案 - 图文
- 论五四运动的精神 论文
- 财务工作者爱岗敬业先进事迹材料
- 某工程创建AAA级安全文明标准化诚信工地申报材料(经验、具体做
- 第四章 方程求解
- linux内核源码阅读工具eclipse qemu
- 2018年RBA(6.0)审核手册(中文版)
- 武汉软件工程职业学院《计算机应用基础》A卷试题
- 南信大基础生态学 重点
- (0063)综合英语六复习思考题
- 2018年襄阳市中考英语试题、答案
- 初中音乐教师招考复习资料