语言学概论讲义,精致版

更新时间:2023-03-13 08:19:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

语言学概论 导言及第一章

一 语言学的性质

语言学:以语言为研究对象的一门独立的科学。

汉语/英语/日语/。。。语言学,研究某一民族或国家的语言,具体性、细致性、实践性 语言学概论,研究人类语言的共同规律,抽象性、概括性、理论性 二 语言学研究的方法和分类 (一) 从研究方法和角度分:

1、历史语言学:用历史的方法考察语言的历史演变,研究其变化规律。

2、对比语言学:用比较的方法对不同的语言进行对比研究,找出它们的相异之处和共同规律。

3、历史比较语言学:采用历史和比较两种方法发现几种语言在历史演变中对应的规律,拟测出语言的亲族关系。 4、描写语言学:截取语言发展某阶段的横断面,以静态描写的方法,记录语言的结构。 (二)从研究的时间关系看:历时语言学——共时语言学 (三)从研究对象看:个别语言学——普通语言学 (四)从研究范围和程度看:微观语言学——宏观语言学 (五)从研究的侧重点看:理论语言学——应用语言学 三 语言学的回顾与小结 1、语文学阶段:

·语文学是一门研究古文献和书面语的学问。 目的:读懂古文献 ·语文学的特点:(围绕“小学”展开) a. b. c. d.

研究的对象是古文献和书面语 带有主观臆测性

不是一门独立学科,而是经学、哲学、文学、历史的附产品 为后来真正独立的语言学提供了材料、奠定了基础

2、历史比较语言学阶段 威廉·琼斯、葆朴、格里木等

特点:a. 语言学已成为研究语言本身发展规律的独立学科。 b. 研究对象还是文献语言 c. 仍带有某些主观臆测

d. 为人类普通语言学的产生打下基础 3、结构主义语言学阶段 索绪尔

特点:a. 严格区分语言和言语,侧重研究语言 b. 重视共时语言的研究c. 重视口语的研究 d. 重视结构和系统的思想 4、形式语言学 乔姆斯基

特点:a. 追求人类语言普遍语法规则,并力求高度形式化 b. 用演绎推理的方法,解释人的语言能力 c. 研究“理想的人”的语言能力 d. 由面向人的语言学转而面向机器 5、功能语言学 韩礼德 系统/功能 6、交叉语言学 认知语言学

社会语言学

文化语言学

应用语言学

四、语言学在科学体系中的地位

与其他人文学科:哲学、文献学、文学、历史学、考古学、社会学、人类学等 与各个自然科学:生物学、医学、数理逻辑、信息科学、认知科学 既受其他学科研究的影响,也影响着其他学科。

语言学在揭示语言根本性质的过程中,需要不断借鉴融合其他学科的理论方法,不断开拓新的研究视角,提供具有创造性的理论,成为一门领先科学。 五、语言学的作用和意义P5

应用价值 六、语言的功能

(一)社会功能:信息传递功能/人际互动功能

(二)思维功能:语言和思维的关系/生理基础/儿童语言习得与思维发展/聋哑人的语言和思维/思维能力的普遍性和思维方式的特殊性

1 语言和思维的关系

思维是人脑借助语言、表象或动作对客观现实的能动反映。 抽象思维是运用概念、判断和推理的形式进行的思维活动。 抽象思维离不开语言,必须以语言为工具。 2 思维能力的普遍性和思维方式的特殊性 语言能力和思维能力是人类共有的能力。 这一共有能力要在具体的社会环境中实现。

每个社会环境都具有特殊性,每个社会的语言结构形式也具有特殊性。

人的思维在很大程度上依托于语言,因此每一种语言都包含着一个认识客观世界的特殊方式,包含着一种独特的思维方式。

第二章 语言是符号系统

一 语言与言语 1 语言和言语的区分

索绪尔 “第一条分叉路” 确定语言研究的对象

言语:v.即讲话、写作的行为动作;n.即所讲的话、所写的话,是行为动作的结果。 ——〉言语就是个人讲话、写作的行为和结果。

对“言语”的收集和研究是无法穷尽的,而在人们说话和说的话中存在着一个系统,即包括音义结合的词汇系统和语法规则的系统,语言就是这一套规则系统。不同语言的规则系统有不同的具体内容。

言语是说、写和所说、所写;

语言是人们用以说、写和存在于所说、所写中的音义结合的词汇系统和语法系统。 2 语言和言语的关系(区别与联系)

区别:a. 语言系统是社会公有的交际工具,是相对稳固的、静止的。言语是人们运用工具交际的过程和结果,是相对自由的、动态的。 b. 语言的本质因素是社会因素。言语具有社会因素外,还具有个人因素。 c. 语言系统的各结构成分是有限的,而言语是无限的。 联系:a. 言语是第一性的,语言是第二性的。

b. 语言来源于言语,又反作用于言语,对言语有强制性的规范作用。 c. 语言在言语中变化、发展。 3 区分语言和言语的意义 a. 澄清了日常用语的模糊概念。 b. 明确了语言研究的不同领域:

(1)对言语的研究:如:言语的交际过程(编码、发出、传递、接收、解码);语用学(即专门对话语进行语用分析,如言语行为理论、会话原则等,属于言语语言学);篇章分析;言语交际学;等。

(2)对语言的研究:个别语言的内部要素和系统;语言规则系统变化和发展的规律;人类语言系统的普遍规律;各语言之间的

发展规律;等等。

二 语言是符号系统(内部结构) (一)语言是一种符号 1语言符号的性质和特点

·符号是被约定用来指代某种事物的标志。

特点:符号必须具备形式和内容两部分;符号和符号所指的事物之间没有必然联系,是人为约定的;符号的种类:视觉、听觉、触觉、等。

·语言是一种音义结合的符号。声音是语言符号的形式。

语言符号的特点:任意性(相对可论证);强制性;线条性;系统性 (二) 语言符号的系统性 1 语言符号的层级体系 底层:一套音位

上层:音义结合的符号和符号的序列:语素-词-短语-句子 2 组合关系和聚合关系

语言符号系统是一种分层装置,靠组合和替换来运转; 组合关系和聚合关系是语言系统中的两种根本关系。

组合:符号与符号间有条件的横向组合;是一种现实在场的、有顺序、可数的横向关系。

聚合:在链条某一环节上能互相替换的,具有相同作用的符号,聚积成类的关系;是一种联想的、无顺序、不易精确数出来的纵向关系。语言单位按不同的特征聚合成类聚合关系为组合关系提供可选择的“货源”。 三 语言符号系统是人类特有的

1 人类语言符号和其他动物“语言”的根本区別 2 语言是其他动物和人类之间无法逾越的鸿沟 第一、二章 复习思考

1 从历史发展来看,语言学与其他人文学科,与自然科学思潮的关系怎样?

2 阅读P11—P14 “语言思维功能的生理基础”一节,大致描述大脑的左右半球分工。

3 阅读P14—P17 “儿童语言习得与思维的发展”和“关于聋哑人的语言和思维”两节,概括主旨。 4 “符号”和“征候”有何区别?

5 为什么说“语言符号的意义是对它所指代的一类心理现实的概括”(P24ph2)?“心理现实”和“客观现实”是什么关系? 6 简述“语言符号的层级体系”。 7 “我们爱唱歌 你们喜欢跳舞 他们想跑步 大家学打猎”

以上体现了怎样的组合关系和聚合关系?

8 阅读P32-P36“人类语言符号和其他动物“语言”的根本区别”一节,解释与动物交际方式相比,人类语言的“任意性”、“单位明晰性”、“结构二层性”指什么?

9 解释“能产性”、“传授性”、“不受时、地环境限制”。

10 鹦鹉能够学说人话,是否说明语言并非是其他动物无法逾越的鸿沟?

第三章 语音和音系

第一节 语音——音位 区别和联系

一 语音和语音学

语音是人类发音器官发出的代表一定语义的声音。它是语言存在的物质形式。人们只有通过语音才能感知语言的存在。没有语音,语言符号也就不复存在。

语音具有两种属性:自然属性和社会属性。自然属性又包括物理属性和生理属性。

语音的社会属性体现在:

①语音传递意义的功能是社会赋予的;②一种民族语言或方言里用什么声音表达什么意义,是任意的,是由社会因素决定的;③不同民族的语言或方言都有各自不同的语音系统;④有些音在几种语言里都有,但它们在各自的语音系统里的作用和地位是不一样的。

语音的最小单位——音素:从音质角度对语音进行切分所得到的最小单位。 语音学及其分支

A、发音语音学(生理语音学):研究发音器官在发音阶段的生理特性。是传统语音学的主要内容。

传统语音学主要是从听音、记音入手来研究语音的,也就是凭耳朵听辨语音,用一定的符号把听到的声音记录下来,加以分析,说明所研究的这种语言或方言一共有多少个不同的语音单位,这些语音单位是在发音器官的什么部位、用什么方法发出来的,它们又是怎样组合在一起的,组合在一起时发生了什么变化,最后归纳出这种语言或方言的语音系统。

B、声学语音学:研究语音传递阶段的声学特性。它用声学知识来解释各种语言现象,大大促进了语音学的研究工作。 C、听觉语音学(感知语音学):研究语音感知阶段的生理和心理特性,也就是研究耳朵是怎样听音的,大脑是怎样理解这些声音的。 二 音位和音系学

音位是指一种语言或方言中能够区别意义的最小的语音类型单位。侧重语音的社会属性。 音位和音素都是最小的语音单位,但二者不是一回事,它们既不相同,但又有联系。

音素是从音质角度划分出来的最小语音单位,也就是说,是从语音的物理属性和生理属性角度划分出来的,只要是音色上有差别,就是不同的音素,而不管它是否区别意义。

音位是从语音的社会属性角度划分出来的最小语音单位,只有具有社会性特点,具有区别词形和区别词义作用的语音单位才是音位。

音系学,即音位学,研究一种具体语言或方言的语音系统,包括对一种语言特定时期共时语音系统的分析和对历史语音变化的研究两个方面。如,音韵学可以看作是中国传统的音系学。 三 音标

音标:记录音素的标写符号称为音标。

《汉语拼音方案》是记录汉语普通话语音的一套标写符号。

国际上通用的语音标写符号称为国际音标。它是国际语音学会于1888年拟订的一套记音符号。它可以用来记录任一语言的语音音素。

第二节 从声学看语音(语音的物理属性) 一 语音的四要素:

音高:声音的高度——声音振动的频率 音重(强):声音的强度——声音振动的幅度 音长:声音的长度——声音振动的持续时间

音色:声音的特色——发音体、发音方法、共鸣器形状 二 音质的声学分析

乐音与噪音 纯音与复音 基音与陪音 基频 共振与共振峰 三 声学仪器和软件

第三节 从发音生理看语音(语音的生理属性) 一 发音器官

1发音体—声带 2动力器官—肺

3共振腔—口腔、鼻腔、咽腔、(喉腔、唇腔) 主动发音器官—被动发音器官 可变共振腔—固定共振腔 主共振腔—副共振腔 二 音素的分类(元音和辅音)

元音和辅音的区别:①气流是否受阻②各发音器官的紧张情况③气流的强弱 三 元音

1元音的分类

①按舌位高低分:高、半高、中、半低、低 ②按舌位前后分:前、央、后 ③按唇形圆展分:圆唇、不圆唇

2元音舌位图(八个基本元音)

第四节 文字的发展与传播 自源文字——他源文字

一 自源文字P176及其发展P178 苏美尔古文字 古埃及文字 殷商甲骨文 二 他源文字 1 意音表词文字 2 辅音文字 3 音位文字 4 音节文字

三 文字适应语言和文字的相对独立性 第五节 书面语 一 口语和书面语 口语——书面语

二 书面语的保守性和书面语的改革与规范 文字改革有广义和狭义之分:

1、文字的改革:指的是在原有的文字基础上进行调整或字母体系的改换。

汉字的简化、异体字的规范属前者,印度尼西亚文字的更换属后者(印度字母-阿拉伯字母-拉丁字母) 2、狭义的文字改革:是指文字体系的根本变革。 简述元音共振峰理论及其价值。

怎样确定一组音素是不是同一个音位的音位变体? 音质音位和非音质音位分别指什么? 举例说明常见的词法范畴 举例说明常见的语法手段 举例说明显性意义和隐性意义

举例说明汉语和印欧语划分词类的标准有何不同

指出下列词的类型(单纯、复合、派生):骨头、镜头、刀子、电冰箱、苜蓿、老师、溶化、绿化、学者、护士、惯性、初三、北爱尔兰、拉丁美洲、呼和浩特、琉璃

试用直接成分分析法分析下列两个同形结构的不同意义: 假如在这个时候,不适当地灌水施肥,就会造成庄稼徒长。

假如在这个时候,不适当地灌水施肥,就会使棉桃因缺乏营养而脱落。 用直接成分分析法分析下列歧义句: 他同意这一点很重要。 不适时地添减衣服就会感冒。

请以“同学们用铁锹在地上挖了几十个树坑”为基本句,变换为以下各种句式: 以“铁锹”为疑问点的特指疑问句: 以“几十个树坑”为主语的被字句: 以“几十个树坑”为全句主语的主谓谓语句: 以“同学们”为中心的名词性偏正结构: 以“同学们”为主语的把字句: 用变换手段对下列歧义句进行分析: 打败对方的主力队员。 老李没见到。

举例说明词义的模糊性及其作用

举例说明词义跟语音及客观事物之间的关系 用义素的观点解释什么是同义词、反义词。

请对下列两组名词进行义素分析:A锤子、镰刀、斧头B椅子、凳子、长凳、沙发

“揉”能和下列哪些词搭配,不能和哪些搭配,试用义素分析法说明:泉水、皮肤、面团、玻璃、衣服、砖块

指出下列名词中的词根和词缀:牛顿、黑咕隆咚、工业化、中子、老鼠、夏至、石头、老人、逻辑、蜘蛛网、俱乐部、电子、垫子、孔子、水龙头、“四化”

举例说明词义在不同语境中的变化情况。

P172 文字的“共性”和“不同”分别是就哪个层面而言的

第七章 语言演变与语言分化 第一节 语言发展的原因和特点

一、语言发展的原因

(一)社会的发展是语言发展的基本条件(发展动力) 1、社会的进步导致语言的发展

(1)新事物、新概念的不断产生导致语言的发展;

(2)思维水平的提高、对事物认识的不断深化,引起语言的发展变化。 2、社会的分化、统一、接触导致语言的发展 分化 —— 社会方言、地域方言、亲属语言 统一 —— 民族共同语

接触 —— 借词、规则借用、语言融合等

(二)语言结构要素之间的矛盾引起语言的发展(它决定着语言发展的特殊方向)假借字、古今字、P192远古汉语音韵系统

二、语言发展的特点

1、渐变性(指语言发展的速度缓慢,不能突变) 2、不平衡性:

语言系统中各要素由于和社会联系的紧密程度不一样,造成各要素发展速度不一样;

社会分化是产生地域方言或亲属语言的社会原因,而语言发展的不平衡性是产生地域方言或亲属语言的内部原因。

第二节 语言的分化

一、语言随着社会的分化而分化(简述)

“社会(阶层/行业/社团)分化”;地域分化;国家/经济体 二、社会方言

1、定义

社会方言是社会内部不同年龄、性别、职业、阶级、阶层的人们在语言使用上表现出来的一些变异,是言语社团的一种标志。

2、P198-199社会方言的多变性 三、地域方言

1、定义

地域方言是全民语言在不同地域上的分支。

2、方言的分区 方言——次方言——土语

(《中国语言地图》分为五个层次:大区——区——片——小片——点)

3、确立方言的标准

是否处于统一的社会之中;语言本身是否有本质差异。 四、亲属语言和语言的谱系分类

1、亲属语言

从同一种语言分化出来的彼此具有同源关系的几种独立的语言称为亲属语言。

2、谱系分类

根据语言的亲属关系对语言所作的分类叫谱系分类,也称语言的发生学分类。 分类的结果:语系——彼此有亲属关系的诸语言所构成的集合体; 语族——同一语系中各语言的分支; 语支——同一语族中各语言的分支; (狭义)语群——语支下一组有亲属关系的语言。

3、世界语系简介

1.汉藏语系 2.印欧语系 3. 高加索语系

4.乌拉尔语系 5.阿尔泰语系 6.达罗毗荼语系 7.南亚语系 8.南岛语系 9. 闪-含语系

10.尼日尔—科尔多凡语系 11.尼罗—撒哈拉语系 12.科依桑语系 13.北美印地安诸语言

①汉藏语系简介 语 系 汉藏 苗瑶 语 族 汉语 壮侗 1、侗水 2、壮傣 3、黎语 苗语 瑶语 藏缅 藏语 缅语 彝语 景颇 汉藏语系语言的主要特点

a除个别语言或方言外,每个音节都有固定的声调;

b单音节词占大多数,双音词主要由单音词复合,派生词少; c在词的类别上存在大量的量词;

d词序和虚词是表达语法意义的主要手段。

②印欧语系简介 语 系 印欧 2、波罗的 3、拉丁 1、日耳曼 西日耳曼 北日耳曼 东日耳曼 西拉丁 东拉丁 英语、德语、荷兰语、卢森堡语 瑞典语、丹麦语、挪威语、冰岛语 哥特语(已消亡) 立陶宛语、拉托维亚语 拉丁语、法语、意大利语、西班牙语、葡萄牙语 罗马尼亚语、 欧洲、美洲、亚洲等地。 语 族 语 支 语 群 中 各 语 言 分 布 地 区

汉语 侗语、水语、仫佬语 壮语、傣语、布依语 黎语 苗语 瑶语 藏语 缅甸语、阿昌语、纳西语、哈尼语、白语 彝语 景颇语 中国、越南、老挝、泰国、缅甸、不丹、锡金、尼泊尔、印度等地。 语 支 语 种 分 布 地 区 4、斯拉夫 东斯拉夫 西斯拉夫 南斯拉夫 俄语、乌克兰语、白俄罗斯语 波兰语、捷克语、斯洛伐克语 塞尔维亚—克罗地亚语、斯洛文尼亚语、马其顿语、 保加利亚语 5、凯尔特 北凯尔特 南凯尔特 爱尔兰语、苏格兰语 威尔士语 梵语、印地语、孟加拉语、尼泊尔语、克什米尔语、吉卜赛语 波斯语、塔吉克语、库尔德语、阿富汗语等 6、印度—伊朗 印度 伊朗语支

其他 印欧语系语言的主要特点

a语音上塞音较多,并有清浊对立;

b词有词重音,一般无声调; c词语有丰富的形态变化;

d多数语言中数词结构相似,无量词;

e多数语言中派生词多于复合词。

第三节 语言的统一

一、语言随着社会的统一而统一 二、民族共同语的形成

1、民族共同语(共同语)

民族共同语是指一个民族内部共同使用的语言。 基础方言:作为共同语基础的方言称为基础方言。 基础方言的确立决定于社会的政治、经济、文化等原因。

汉民族共同语——北方方言——政治的原因(宋元以来北京一致是中国的政治中心;优秀的白话文著作和戏曲扩大了白话的影响)

英吉利民族共同语——伦敦方言——经济的原因( 18世纪60年代开始的产业革命使伦敦成为经济的中心,人员的聚居和流动扩大了伦敦方言的影响)

意大利民族共同语——多斯岗方言——文化的原因(出生于佛罗伦萨共和国的著名诗人但丁、彼特拉克和文学家薄伽丘等文学作品广为流传,扩大了多斯岗方言的影响)

2、民族共同语与方言的关系

共同语是建立在某种基础方言之上的,同时它还要吸收其他方言中的有用成分来丰富自己,因此它是方言的一种高级形式。它的出现是为了消除方言间的隔阂,而不是消灭方言。 三、民族交际语

民族交际语是多民族国家中各民族间共同使用的语言,又称“国语”。

第八章 语言系统的演变

一、语音的演变

(一)语音演变的规律性

1、条件性:语音演变要受种种条件的限制,符合条件的将发生变化,不符合条件的就不会发生变化。如汉语的“浊音清化”和“浊上变去”的规律。

2、时间性:语音演变的规律指在一段时间内起作用。在某个时期起作用的规律,到了另一个时期,即使具有同样的条件也不会发生同样的语音变化。如汉语中的舌尖前音在齐齿呼韵母前时发生腭化的规律。

3、地区性:语音演变只在一定的地域内进行,在某一地区发生的音变不一定在另一个地区也同时发生。

(二)语音演变的内容 1、聚合关系的变化

(1)音位的合并(中古汉语浊音清化后和原有的清音合并)

b——p p b——ph ph (2)音位的分化

如汉语从重唇音[b、p、ph 、m]中分化出轻唇音 [f]:番禺——番茄;棒——俸/奉 2、组合关系的变化

如:中古汉语z、c、s可以和齐齿呼、撮口呼韵母相拼,现代汉语则不可以。 二、语法的演变

(一)聚合规则的发展

汉语的语法发展表现在一下三个方面: 1、产生了量词; 2、出现了一批词缀;

3、产生了重叠法这种语法手段。 (二)组合规则的发展

语法中组合规则的变化,注要表现为词序的变化。以汉语宾语位置的变化为例: 先秦时代,在肯定句中,名词、代词作宾语有置于动词之前的残迹: 惟命是从、惟利是图(成语)

以尔车来,以我贿迁。(《诗经?卫风?氓》)

先秦时代,在否定句中,人称代词作宾语,在动词前后都可以: 人莫予毒(成语)

我无尔诈,尔无我虞。(《左传?宣公十五年》) 有事而不告我。(《左传?襄公十八年》)

在疑问句中,疑问代词作动词或介词宾语时,该宾语位于动词或介词之前: 吾谁欺?欺天乎?(《论语?子罕》) 大王来何操?(《史记?项羽本纪》) 何以赠之?琼瑰玉佩。(《诗经?秦风?渭阳》)

介词“以”的宾语,在介词前后似乎都可以: 夜以继日。(《孟子?离娄下》) 以铁耕乎?(《孟子?滕文公下》)

(三)语法演变中的类推

所谓类推,是指在语言的某种规则模式的的影响下,语法和词汇等形式趋向于整齐划一的过程或结果。例如: 古英语 现代英语 book [buk](单数)——bes[bis](复数)—— books(复数) cow[kau](单数)—— kine[kain](复数)——cows(复数) 例外情况

man(单数)—————men(复数)——— men(复数) sheep(单数)———— sheep(复数)———sheep(复数) 三、词汇和词义的发展

(一)新词的产生和旧词的消亡

因新事物的出现而产生新词:收音机、电唱机、录音机、电视机、电脑?? 表示旧事物的词语因旧事物的消亡而消亡:爵、太监、宫女、丞相??

(二)词语的替换

所指事物没有消亡,而指称这些事物的词因与之同义的新词的出现而被淘汰。如: 避讳引起的替代:世——代 社会制度的变化:俸禄——薪水

社会意识的更新:车夫——司机 戏子——演员

避混淆引起的替代:其:作语气词,加强反问语气,用“其”——国无主,其能久乎?(《左传?襄公二十九年》) 作名词,用:“箕”——箕畚运于渤海之尾。(《列子?汤问》)

(三)词义的演变

1、定义:词义的演变是指词的形式不变,而意义发生了变化。 2、词义演变的原因

a、现实现象的变化导致词义的演变。例如: 床:安身之几坐也。(《说文解字》) 人所坐卧曰床。(刘熙) b、人类认识的深化导致词义的演变。例如: 鲸:海大鱼也。(《说文解字》) c、词义间的相互影响导致词义的演变。例如:

(a)若一组相关的词中有一个词的词义发生变化,那么与其相关的另一个词的词义也可能发生变化。 深:从上到下或从里到外的距离大。——深奥、不易懂。——关系密切、深厚。?? 浅:从上到下或从里到外的距离小。——浅显、易懂。——关系不深、浅薄。??

(b)若词汇系统中产生了一个与原有的某个词的意义相当的新词,那么原来的那个词的词义也可能发生变化。 步:行也。(《说文解字》) 如:安步当车。 走:趋也。(《说文解字》) 如:走马观花。 3.词义演变的途径(参看教材P271) a通过词义的引申产生新义

直接引申:从本义直接派生出新的意义。

月(月亮)——记时单位(一年分为十二个月) ——形状象月亮的:月琴、月饼 间接引申:在直接引申的基础上再次引申而产生新的意义。

习:数飞也。(《说文解字》)——反复练习——反复练习后产生的习惯 月(月亮)——记时单位(一年分为十二个月)——每月的:月刊、月产量 比喻引申:通过比喻而产生新的意义。

荆棘:山野中丛生的带刺的小灌木。——比喻困难障碍极多。 眉目:眉毛和眼睛,泛指容貌。——比喻事情的头绪。 4、词义演变的结果

a、义项的增减(就词的意义的数目来说) 义项的增加:如“月”、“习”

义项的减少:如“兵”——兵械、士兵、军队、戕害、用兵器杀人?? 现代汉语中没有“戕害”“用兵器杀人”两义项。 b、词义的扩大、缩小和转移(就词的某一个意义来说)

词义的扩大 菜:草之可食者。(《说文解字》) 现代汉语中荤菜、素菜皆可。 河:黄河。 今指一切河流。

词义的缩小 妻子:妻子和子女。 今专指婚姻关系中的女方。 子:儿子和女儿。 今专指儿子。 词义的转移 手足(手和脚)——比喻为兄弟 爪牙(褒义)——爪牙(贬义)

第九章 语言的接触

社会的接触导致语言的接触; 语言接触表现为: 一、不成系统的词汇借用

借词(外来词)

借词是指音与义都借自外民族语言中的词。 汉语的借词P210 借词与社会212

二、语言(区域)联盟与系统感染P206 P214语言联盟 P215系统感染

三、语言替换与底层残留 P218语言替换-P225 P225底层遗留

四、通用语、民族共同语进入方言或民族语的层次P227 五、洋泾浜和混合语

P233“洋泾浜”I can not. ——My no can. P236混合语 ?

国际辅助语(世界语)

第十章 语言学的新发展——交叉学科 第一节 社会语言学 一 社会语言学的兴起 ? ?

社会语言学研究语言和社会的相互关系,或者说是联系社会来研究语言。

社会语言学兴起于20世纪60年代。1964年,第一次社会语言学会议在美国加利福尼亚大学召开。1966年,布莱特(W·Bright)将此次会议论文汇集成册出版,这是最早的社会语言学论文集。 ?

社会语言学的产生背景:

1. 语言学内部,主流的结构主义语言学及转换生成语言学忽略了对语言的社会功能、语言的差别和变异的关注。社会

语言学把语言的差别和变异作为研究对象,对传统语言学起到了补充和修正的作用。

2. 历史和社会角度,二战后,欧美国家由于移民或其他历史原因造成的双语或多语混杂现象严重,种族矛盾加剧,人

口流动频繁,使语言问题变得复杂。在这一背景下,如何协调各种语言和语言变体,促进交际而不是制造矛盾和冲突,充分发挥语言的各种功能,等等问题迫切需要研究和解决。

3. 社会科学研究方法上的进步。从20世纪30年代开始,社会科学普遍采用抽样调查和统计学的方法,从把握事物总

体的数量关系来揭示事物之间的内在联系。社会语言学就是采用定量研究的方法来发现社会变量和语言变量之间的共变关系的。

二 社会语言学的研究对象和领域

社会语言学是一门边缘学科,总起来讲,社会语言学研究的对象主要包括五个方面:

(1)一个国家或地区的语言状况如双语、多语或多方言状况,以及各类言语共同体使用语言的状况和特征; (2)各类语言变体的构造特点及其社会功能;

(3)社会以及不同集团对各种语言或语言变体的评价和态度以及由此产生的社会效应; (4)由于社会、文化、经济、政治等原因以及语言接触所引起的语言变化的方式和规律; (5)交际情景与选择语码之间的关系以及语码选择与人际关系的相互作用。

尽管语言学家研究的侧面和采用的方法不尽相同,但大体上说,社会语言学研究可以分为以下五种类型:

(1)语言学的社会语言学。其研究对象是人们日常生活中所说的言语,核心问题是语言变异,基本出发点是把语言看作是

一个有序异质的系统,强调研究的语料必须取自现实生活,研究的目的是为了充实和完善语言学。

(2)社会学的社会语言学,亦称为语言社会学。其研究重点是语言和社会之间的全局性的相互作用,其主要任务是解决社会所面临的重大语言问题。如语言规划、母语维护等。其研究成果常被用于语言决策和语文建设。

(3)语用学的语言学。它以会话为主要研究对象,来探讨会话原则和策略,研究会话结构和风格。

(4)民族学的社会语言学。它是从民族文化的角度去考察语言的使用情况以及语言在人类交际活动中的作用,侧重研究言语交际的方式、特点和规范。其研究的核心是人类的交际能力,最终目标是建立综合性的人类交际学。

(5)社会心理学的社会语言学。其研究重点是全社会或某个社会集团对使用某种语言变体的评价和态度。 三 社会语言学的基本概念

社会语言学涉及许多概念,最基本的有语言变体、言语共同体和交际能力等。

(1)语言变体:分析社会语言现象时所采用的基本单位。语言变体可以用来指语言、方言或语体,也可以用来指单个的语音、语法和词汇项目。使用变体这一术语给语言学家带来了很多方便。譬如,“变体”作为一个中性名词,摆脱了传统的“语言”“方言”“地方话”“土语”等具有价值判断的名称所附带的感情色彩和偏见。语言变体可能被理解为某种标准语言的变种,为避免误解,语言学家也采用语言代码(简称语码)这一术语,与语言变体替换使用。

(2)言语共同体:是划分语言使用者的基本单位,因此又称言语社区或言语社团。社会语言学要研究的是言语共同体里实际发生的现象,而不是装在头脑里的东西。总的来说,言语共同体是指在某种语言运用上持有某些共同社会准则的人员的集合体,其大小可按照研究的需要和抽象的程度来划分,某个国家或地区,某个城镇或乡村、各种团体,都可以视为言语共同体。

(3)交际能力:是研究社会语言学基础理论的一个主要突破口。交际能力这一术语是海姆斯(Hymes)针对乔姆斯基的“语言能力”提出的。乔姆斯基研究的语言能力是研究理想的说话人或听话人所掌握的语言知识。这个理想的说话人或听话人具备完美的语言内在知识,并且在运用知识时,不受记忆力、注意力、兴趣、动机的限制,不会犯语法错误。显然,这样一个抽象的人在实际生活中是不存在的。实际上,现实生活中的人们由于所处的社会阶层不同,生活条件不同,教育机会不同,语言能力也就不同。在海姆斯看来,乔姆斯基所谓的语言能力应当被称之为语法能力。一个人没有语法能力不行,但只有语法能力也是不够的。人们在运用语言进行交际时,不仅要考虑是否合乎语法,还要考虑是否得体,也就是人们常说的“语法性”和“可接受性”。人们掌握的语言能力应该包括什么时候说话,以什么方式说话,跟谁说什么样的话。这种运用语言进行社会交往的能力就是交际能力。 四 社会语言学的研究方法

(1)社会语言学通常采用实地调查的方法,通过对语言材料的定量统计分析得出概率性的结论。从研究方法来看,社会语言学更接近于社会学和自然科学。

(2)社会语言学研究语言变量和社会变量的相关性,研究的对象是社会变体(或称社会方言),涉及的社会变量有社会阶层、性别、年龄等。

(3)研究之初,首先要确定的就是社会变量。在确定社会变量之后,接下来就是抽样。

社会语言学一般采用的是随机抽样的方法。即在某一范围内抽取少量样本。随机抽样的目的是要避免研究人员为了得出某一结论,在抽样时带有偏见,从而影响结论的可靠性。当然,随机抽样的结果也只能是一种概率的统计,可能带有误差。

随机抽样需要按照一定的计算方法和程序进行,研究人员需要在这方面花费大量的精力和时间。

随机抽样在操作上不是一件十分容易的事情。因此,研究人员更经常采用的是非随机抽样的方法,从总体中抽取一部分样本作为调查对象。

非随机抽样无法计算误差和可信度,因此不能根据样本推断总体情况。与抽样相联系的是适度的结论,避免过度概括。譬如,调查对象是某所高校的在校生,其结论不能超越该范围,得出某地区甚至全国性的结论。

(4)社会语言学研究搜集语料的方法主要方法是观察法、问卷法、访谈法和实验法。无论采用哪一种方法,都要保证语料的真实性,排除干扰和偏见。研究人员在搜集语料时,往往陷入一种矛盾之中:在自然语境中,通过个别访谈来获得所需语料往往比较困难。在正式访谈中,受访人可能会觉察到采访人的意图而有意调整自己的语体,这样搜集到的语料可能又有失真实。设计问卷也是一件复杂的工作,研究人员所设计的问题要尽量清晰明确,开放式问题在提法上要注意中立性。搜集来的语料只是一堆原始信息,研究人员需要对这些信息进行分类和统计,最终得出结论。 第二节 心理语言学 一 什么是心理语言学

“心理语言学”是心理学和语言学相交叉而产生的学科,它还充分吸收了哲学、社会学、计算机科学等学科的研究成果和方法。作为一个语言学的分支学科,心理语言学诞生于20世纪的50年代。1952年,美国社会科学研究委员会成立了一个语言学与心理学委员会。该委员会1954年在印第安纳大学召开了一次学术讨论会,会议的成果结集为《心理语言学:理论和研究问题概述》出版,这标志着心理语言学的正式形成。

心理语言学的研究内容主要包括语言与思维的关系、语言的生成和理解、语言习得的心理机制和过程等。本章将择要介绍以下两个方面的内容。 二 语言与思维

思维和思想不同,思维是认识现实世界时动脑筋的过程,是指人们对客观对象进行概括分类,形成概念,并运用概念进行判断、推理的过程与能力,而思想是人们对现实世界的认识及其结果。

作为交际工具的语言与思维过程及其结果表达都有着非常密切的关系:思维需要语言这一媒介才能进行,思维的结果也需要用语言固定下来、传播开去。

语言和思维这两个紧密相关,难以分开的部分,有没有先后之分?如果有,谁先谁后?中外哲学、思维科学、心理学、语言学等都提出了一些说法,概括起来主要有:

(1)同时论 持这个观点的人,认为没有语言,思维就不能形成;没有思维,语言也不能形成。因此语言和思维是互相依赖,同时产生的。古希腊哲学家亚里士多德最早提出思维是通过语言而实现并存在下去的观点。后来,德国语言学家洪堡特认为,语言是形成思想的工具,思维和语言活动不可割断,思维无法在没有语言的情况下存在。

(2)独立论 这种观点认为语言与思维没有多少关系,各有自己的发展过程。该观点可以追溯到古希腊哲学家柏拉图。他认为思维是一种不能用语词说出来的洞察。持这一观点的学者认为,由外界引起的感觉是认识的源泉,比如,思考一个几何图形问题,人能只看着图,在一个直角三角形中,直角以外的那两个角之和也是直角的度数,此时人只是思考这个问题,不需要用语言来帮助。任何有声和无声的语言都不需要。有些学者甚至把语言排除在抽象思维之外。这种把语言和思维完全割裂开的观点不能解释为什么人的大多数思维活动不但需要而且离不开语言的情况。比如,人在思考的时候,会不自觉地喃喃自语,这种自语由实验证明是与思维同步进行的。

(3)先后论 虽然语言出现后成了思维的载体,但是语言出现之前人类就有了思维,甚至在语言出现之后,有时候也存在着不需要语言参与的思维活动。英国哲学家洛克(J.Locke)认为思维可以独立于语言,知识起源于感觉,并且,心灵是一块白板,无论是语言初创时还是现在,都先有观念而后才有名称。爱因斯坦认为,一个人的智力发展和他形成概念的方法在很大程度上取决于语言,但是,思维还能采取语言以外的形式,这种情况下,思维先于语言产生。因为,人脑在思考问题的时候,会运用视觉等记号和意象,而不一定总是依赖书面或口头的语言,这些意象的活动和组合是在由文字或别的记号建立的逻辑结构之前就已经进行了。我们在生活中有这样的现象,一个会骑自行车的人,途中需要转弯时,两手会不自觉地协调完成动作,根本不需要先有一系列的概念,再由概念构成判断,并通过语言指挥大脑才能完成了这一过程。支持这一论点的学者从人类的系统发生学和个体发生学及病理学方面都给出了科学的论断:从三十万年前到五万年前的早期智人的声道分析得出他们还不能发出最简单的元音,但他们已经能制造工具,因此人类是先有了思维而后才有语言。类似的情况也能在儿童那里观察到,婴儿五个月后即能根据颜色和形状区别物体,但一般都需要到两岁左右才能说话;在失语症或聋哑人身上,他们发现,失语症病人由于大脑左半球语言中枢受伤而失去部分或全部语言能力,但他们的思维没有因此而消失;聋哑人中没有学会手势语和聋哑文字的人仍然具有一定的思维能力。这就证明人的大脑中管思维的部分与管语言的部分并不完全相同(见下图一),很有可能思维先于语言产生。因此,虽然这个论点不是一个完美和最后的定论,但是,与其他观点相比,它有更强的可接受性。

三种说法从不同的角度对思维与语言的关系作出了解释,要得出最后的结论可能还需要人类学、病理学以及心理学的更深入的研究。但到目前为止,这样的理解应该是可取的:从发生学角度看,思维应先于语言产生,这有人类脑体进化过程的依据。但人类在此基础上产生了语言之后,语言就紧密地与思维相连,成为思维的最重要的工具。 ?

思维与语言的联系

语言是思维的最重要工具,但两者之间的依赖关系具体是如何表现的,就需要对思维及其类型作具体的分析。根据思维特征,一般将它分为三类。

(1)感性思维 狭义的感性思维是一种直观的,运用感觉器官感受外界事物的活动。如视觉能辨别旗帜的颜色,听觉能辨别音乐、话语,知觉能使汽车驾驶员看到有行人过马路时产生判断,会紧急刹车等等。广义的感性思维也包括表象思维,这比感觉器官的功能更强一些,例如,汽车驾驶员在驾车时通过对以前来过此地的记忆,并进行想象并设计自己最近和最佳的路线,

这就使用了记忆表象和想象表象。

(2)抽象思维 是指以概念、判断和推理等复杂逻辑形式进行的思维活动。概念是反映客观事物一般的本质属性的思维形式,是思维的细胞。比如“自行车”,舍弃了新旧、大小、有无车篮、何种质地、两人座还是三人座等非本质特征,最后概括出“一种两轮交通工具,骑在上面用脚蹬着前进”这个本质的特征。判断是确定事物性质或事物间关系的思维形式,它分肯定判断和否定判断。推理是由一个或几个已知的判断推导出未知判断,或者由一个或几个前提得出新的结论的思维形式。例如“我们班的人都去天安门了,所以去天安门的人中有我们班的同学”是直接推理;“我们班的人都去了天安门,而小王是我们班的,因此小王必定也去了天安门”是间接推理。

(3)发散思维 指随着感性认识和理性认识而产生的综合心理活动,也称求异思维,它是从一点出发沿着多个方向达到思维目标的思维方式。也有心理学家将它定义为一种不依常规、寻求变异、从多个方面寻求问题答案的思维形式。这种思路好比自行车车轮一样,许多辐条以车轴为中心向扩散。感情的喜恶,意志,传统意识等等。文学、音乐、舞蹈、绘画、雕塑、摄影等,一般也被看作是发散思维(或者是发散思维中的形象思维)的表现形式。发散思维处处存在,比如中国传统认为婚礼应该是红色调为主,如果老年人看到有人穿白色的服装参加婚礼,难免觉得“不吉利”。对动物“狗”,每个民族对它的感情也是不同的,在中国“狗腿子,狗仗人势,狗嘴里吐不出象牙??”等等,就表明了中国人对“狗”这个形象的态度,而如果把这些词汇告诉西方人,甚至说有的人还吃狗肉,那一定是大部分西方人所不能接受的了。

上述三种思维形式与语言有什么样的对应关系呢?

(1)在感性思维中,语言的作用好象不是很大,尤其是直观思维,是对客观事物的一种直接感知。直观的感性思维是动物和人类共有的,动物中“老马识途”、“狗急跳墙”等说明动物具有这样的思维能力。这也说明,感性思维是思维活动较低级的阶段,感性思维只有在语言参与以后才上升到抽象思维的高级阶段。

(2)发散思维是一种综合的心理活动,是思维活动对人类社会生活其他方面产生的影响。这种思维活动比抽象思维更难以体会和把握,但同时,语言和这些思维活动的关系也相对疏远了。此时甚至可以这么说,语言已不是这种思维的工具,甚至也成了受其影响的对象了,比如前面关于“狗”的例子,并非“狗”这个词语本身表达的概念就是这样,而是人们把某种情感赋予了这个词。又如音乐,绘画等,人们不需要借助语言来创造和欣赏他们,而直接与这些艺术形式发生联系,然而这样的艺术形式却又是实实在在的人类思维活动的结果。由此看来,语言在这两种思维中起作用,但这两种思维对语言的依赖并不明显。3个义项,就表达了三个相关的概念,英语里的词语fire,也属于同样的情况;而同义词却是用多个词语表达同一个概念,如父亲与爸爸等就是该类情况。最后,很多的词语除了理性意义外,还附加上了表达色彩,而概念就没有。

(3)与以上两种思维不同,抽象思维却是必须依赖语言才能进行的。我们要叙述一种思维活动或情感活动,就得找出一个合适的词来表达。如实践告诉我们,发展生产力不但需要人力,更需要科学技术,我们就用“科学技术是第一生产力”这个形式来表达。

因为要表达概念,就得使用词语,比如在没有实物的情况下描绘“自行车”这个物体,就得用语言;而一些脱离具体形象的抽象概念,如“反叛,顺从,政治,民主”等,更是非得使用语言不可了。又如,在商店买完东西要付钱时,突然发现自己没带钱包,那时产生了一种情感,应该用什么语言来表达呢?——“尴尬、着急、难为情”,我们此时就用这些词准确地说出了当时的情感。如果需要作出判断,就得用到句子,我们试图用一个句子来表达某一具体思想时,如果句子的语义内容与大脑中的思想重合,那么这个思想就在语义内容中获得了充分的表达;如果没有重合,我们就不断地更换词或句子的结构形式,直至重合为止。要表达“北京比其他任何城市都富有文化气息”这个判断,就得用那么多词组成句子来实现;推理更是复杂,象上面要说明“小王也去天安门了”这一结果,得用几个句子,或者是复句来表达。如要讨论或者论证某些论点,甚至需要用段落和篇章来完成。可见,具体来说,语言是通过词汇意义,语法意义与思维发生联系的。例如,我们在语篇中运用插入语“首先”、“其次”、“再者”、“最后”等,这些语言标志使思维层次一目了然,“可见”、“总而言之”、“综上所述”等插入语,都是层次转换的标志。也常用明确的语言,如关联词、人称代词等等来交代层次的划分和逻辑关系。即使逻辑思维中运用的公式代码,其实也只是语言的转化符号。当我们需要说明某个数学运算的求解过程,还得把公式变回语言的表达形式。

用语言表达抽象思维内容有两个方面,一是用词汇意义和语法意义把思维的内容表达在一系列句子的语义内容中;二是用外部形式上的语言标志,显示出思维的内在逻辑结构。由此,我们也可以看出,抽象思维实际上就是以语言作为工具或在语言材料的基础上进行的思维活动。从上述的分析中,可以看出,抽象思维活动是必须以语言为媒介的。 三 语言习得 ?

学习与习得

认知法的理论基础是转换生成语言学和认知心理学。这种认知理论认为:活的语言是受规则支配的创造性系统,所以,它要作为一个有意义的学习系统来教授;语法规则是心理的现实,所以,语法规则的学习是有意识的,语法规则的运用是自动的,但这并不是说,语法规则的学习也是自动的。同时,人有学习语言的特殊机制,所以,学习是内在的,而不是外在的。活的语言是用来思维的,跟意义和思想联系在一起,学习另一种语言,就是要用另一种语言思维。可见,这种方法充分的重视和发挥了成人的认知能力,这是它最大的优点。 ?

功能法

功能法又叫意念法或交际法,20世纪70年代初产生于西欧,创始人是英国语言学家威尔金斯。它是近年来国外颇为流行的外语教学法流派之一。

当时,西欧各国对具有外语交际能力的人才需求很大。但由于学外语的人的职业特点和工作性质不同,对运用听、说、读、写各项技能的要求各不相同,这样就产生了教学目的的多样性。传统的翻译法和听说法有其局限性,于是功能法便应运而生。功能法从社会语言学、心理语言学、转换生成语言学等相邻学科和学派中吸取其最新成果作为自己的理论基础。它是以功能为纲,有针对性地培养学生的交际能力,教学过程交际化。功能法十分重视语言的交际功能,主张学习语言从功能到形式,从意念到表达,认为这是学习外语的有效途径。

实践证明,这是一种很有生命力的教学法流派。功能法目前遇到的最大难题是如何把语言结构与功能结合起来。

(4)第二语言教学法流派的分类、特点以及发展趋势

第二语言教学法流派很多,但是归纳起来,大体上可以归纳为传统法和改革法两类。传统法包括:语法—翻译法、阅读法(旧阅读法、新阅读法)、自觉对比法、认知法等;改革法包括:直接法(贝力兹法、折衷直接法、循序渐进直接法)、听说法(口语法、视听法、情景法)、自觉实践法、功能法(又称交际法)、结构—功能法等。

传统法与改革法的侧重点不同,前者重在语言(language),后者重在言语(parole)。各种教学法流派的产生大都有某种哲学、心理学、教育学和语言学理论作为基础。一般说来,随着时间的推延,理论基础越来越雄厚,科学性也渐强。一种教学法的生命力取决于它对外语教学规律的认识程度。外语教学的复杂性决定了教学法的多样性,一种新的教学法的产生并不意味着老的教学法的死亡,各种教学法常常并存,彼此互相排斥、又互相吸收。到目前为止,还没有出现一种完美无缺的教学法。教学法不是一种死的理论,从某种意义上来说,是贯穿在教和学过程中,把教与学相结合的充满生命力的有机体。教师的责任就是要根据教学对象的需要和教学目标确定自己的教学法。

20世纪60年代以后,新的教学法出现了若干新的趋向:即各教学法流派趋向综合。早在流派纷呈的时候,国外有些学者作为第三者就采取折衷的办法,把互相矛盾、互相对立的东西调和起来。然而折衷并不能解决问题,如上个世纪20年代的混合法、60年代的折衷法都比较零乱,不成系统。现在人们更多地主张用分析、综合的方法对待各种教学法流派,研究教学中的各种问题。

同时,冲破方法流派的束缚,从不同的领域和不同的角度,全面地认识外语教学问题。各种教学法都认识到了外语教学的某些方面,但都不全面。因此,需要从语言学、心理学、教育学和文化人类学等各种不同的领域和角度全面地认识外语教学,逐渐深入到外语教学领域内的各个方面。现今的研究也正是朝着这个方向发展:探索外语总体设计、大纲制订、课程设计的新路子;探索课堂教学中的人际关系;探索的重点由“教”转向“学”;充分发挥学生的能动性;探索交际性教学的途径。

(二)语言规划

语言规划,又叫语言建设或者语言计划(Language Planning),是指政府或社会团体为解决在语言应用中出现的社会性问题有计划有组织地对语言文字进行的各类调整工作的统称。它是一个国家或政府语言政策的具体体现。

语言规划在顺应语言发展规律的前提下,必须接受国家语言政策的指导,或者通过国家语言政策来促进。语言规划的实施者可以是直接隶属于政府的行政机构,也可以是具有一定权威或影响力的民间团体、学术机构。现在中国制定国家语言政策的职能部门是隶属教育部的国家语言文字工作委员会。

“语言规划”这个名称是1957年首先由语言学家威因里希(Ureil Weinrich)提出的。但实际的语言规划行为有悠久的历史。在我国,远在秦代就有语言规划,秦始皇把六国文字统一为小篆,实行“书同文”,这就是人类历史上一次大规模的语言规划。在欧洲,远在罗马帝国时期,实行了以拉丁文统治多民族大帝国的“书同文”政策。经过中世纪的黑暗时代以后,各个民族纷纷独立。文艺复兴时期解放了思想,意大利、法国、西班牙、瑞典都成立过负责语言研究的机构,以保持和维护本民族语言的

纯洁性,促进语言社会交际功能的发挥,为以后的工业化作了文化上的准备。这些也都是早期的语言规划。

在本质上说,语言学应是一门描写性的学科,而不是一门规范性的学科。在语言学的研究史上,从规范主义到描写主义是一个根本性的进步。公元前5世纪的古希腊语言学的基本特征就是规范性的。语言规划的基本特征也是规范性的,不过这种规范主义是对现代语言学描写主义的一个必要的补充,它不是简单地重复古希腊的规范主义,而是要在对语言现象描写的基础之上来制定语言的规范,语言规划的限定往往具有前瞻性和预见性。 ?

语言规划的内容

语言规划的内容涉及到一个国家用什么语言作为法定的官方语言,在什么方言的基础上建立作为国语的民族共同语及如何普及共同语,共同语用什么文字来书写,共同语及其文字怎样规范和完善,国内少数民族语言和国语以及他们内部的不同地区的方言之间制定什么样的发展关系,在多民族的国家中制定正确的民族语言政策,采用什么外语进行第一外语教育,为没有文字的语言创制文字,对已有的文字进行改革,等等。

语言规划的内容是随着社会的变化而调整的,就我国来看,20世纪50-60年代,语言规划的内容是,执行各民族语言平等政策,保障人民群众的语言权利,确立普通话在全国通用的地位并大力推广普通话,进行文革改革,加强现代汉语规范化。

到了80-90年代,在前阶段任务的基础上,增加了以下内容:进行语言文字信息处理和管理,加速推广、普及普通话,加强语言文字规范化、标准化。

(三)语言文字信息处理 ?

语言学和已实现的信息处理技术

目前还没有真正建立起可以应用于信息处理的语言学知识系统,或者说现有的语言学知识还不能应用于全部信息处理领域。但很多技术和研究已经成功地融合进语言学知识,同时,计算机对语言学的现代化研究也发挥重要作用,尤其表现在以下几个领域:文本检索和数据统计、语料库和语料分析以及文本的自动校对和摘要等等。 1.汉字输入

(1)汉字编码和键盘输入 (2)汉字识别技术

汉字识别是指一种自动高速的非键盘式汉字输入方式,属于模式识别和人工智能范畴。汉字识别系统通常由“扫描、交互式版面分析的前处理、单字识别器和自动分词汉语词上下文匹配后处理”构成。汉字识别方式主要分三大类:联机手写汉字识别、印刷体汉字识别和手写汉字识别。 2. 语音识别和合成技术

语音合成是让计算机模拟人的发音器官的动作并发出类似声音的一个过程。目前汉语的语音合成已经实现自动生成声韵调结合的音节及一些简单的语句,并已在生活中使用,如语音电话,语音报号等等。

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术,即让计算机模拟人的听觉器官的反应来接受语言信号并作出反应,或给以语言答复,目前语音识别已经初步使用,即念一个字或词,计算机能识别并输入计算机甚至还变成文字符号,如现在的电话语音拨号。

语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步。我国语音识别研究工作起步于20世纪50年代,近年来发展很快。研究水平也从实验室逐步走向市场。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。

语音识别技术发展到今天,已经能够满足通常应用的要求,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域。一些电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息,并且取得很好的结果。调查统计表明多达85%以上的人对语音识别的信息查询服务系统的性能表示满意。可以预测,在近五到十年内,各种各样的语音识别系统产品将出现在市场上。构造一个具有和人相比拟的语音识别系统,是人类面临的一个大的挑战,人类正在向成功迈进。 3. 文本检索和数据统计

现在计算机已经能代替手工,在大量文献中查阅相关的资料,收集需用的例句,作出分类和统计等。从语言学的角度说,文本检索跟文字处理有密切关系。一般说只要提供给计算机一定的文字信息,包括人名、著作名、刊物名等,计算机就可以自动进行检索和分类统计;如要收集跟某个词语有关的例句,统计词语在不同文本中出现的频率,分析口语文本和书面文本的语句长度差异等,计算机也可以根据给出的目标词语和符号自动完成检索。 4. 语料库和语料分析

文本检索和数据统计当然首先要有输入或储存在计算机中的语言材料,这就是语料库。语料库中的语言材料是真实的书面语或口语,并且在真实材料的基础上,做语言学的加工和分析。西方最初的语料库可追溯到中世纪,20世纪50年代以前的语料库都属于人工语料库,其建库和应用缺乏系统设计原则和有效统计手段。20世纪50年代后,第一代百万词的计算机语料库开始出现,90年代初语料库则出现了迅猛发展的势头。

语料库的发展大致可分为三个阶段。第一阶段为初始阶段。这个阶段包括从十八世纪开始到20世纪50年代计算机语料库出现前的各种手工语料库。初期的语料库主要应用于圣经与文学研究、词典编纂、方言研究、语言教育研究、语法研究等领域。第二个阶段从20世纪60年代到80年代,这个阶段以电子语料库的兴起为主要特征。各种计算机语料库纷纷建成,它的发展以容量不断增加和种类的不断扩展为主要特征。语料库发展的第三个阶段是90年代后的壮大阶段,如果上一代的电子语料库是以百万计的话,这一代的语料库则以千万甚至亿计。90年代初,语料库在英国、美国、日本及欧共体国家几乎是突然普及开来,这既与语料库在语言研究中的应用有关,也与语料库方法在涉及商业的领域的广泛应用分不开,诸如词典编撰、语音识别、语音合成以及机器翻译等。

从对语料加工的程度来看,一般将语料库分为两种:一种是未标注任何附加信息的原始文本,称作“生”语料库,这就是上面说的用于一般检索和统计的语料。这种语料库的建成手续比较简单,但是应用时的功能也相应比较单一。另一种是标注了一定附加信息的加工文本,称作“熟”语料库。当然根据标注信息的多少,语料库“熟”的程度又有不同。从语言学的角度说,建立“熟”语料库不但需要的语言学知识更多,即实际上标注的都是语言学信息;从另外一个角度上说,它对语言学研究的用处也更大,即可以有目的地对经过标注的语料进行分类和分析,从而获得更多的语言现象参数和语言学知识。语料库在词典编纂和计算机辅助教学等方面也有重要作用。因此,在语料库的设计阶段,一定要做好充分的准备,要对语料库的功能目标有清楚的了解。

5. 文本自动校对和摘要

对文稿、书稿进行校对和把一篇较长的文章加以压缩,整理出摘要,这对人来说可能不是一件太困难的事情,但交给计算机来完成就涉及到比较复杂的语言学知识了。

文稿校对对有些语言可能比较简单:如英语的拼写检查,只要在计算机中储存了一部词典和词形变化的词表,就可以完成;英语的语法错误,也可以通过确认限定动词和其他词语的关系来判断。但对有些语言来说文稿校对就比较困难,如汉语的文字错误,就字形看是无法判断其与音义的关系是对还是错,而词语是否写错或用错,更要切分词,再联系上下文,才能看出来,这就需要向计算机提供词语切分和词语搭配的更多信息。

文稿摘要一方面是利用语料库信息,如选择时间、地点、动作等要素词语,文本中复现频率最高的关键词,和各自然段的首句等;还需要利用必要的语言学知识,如通过一定的关联词语连接起重要的语句等等。文稿的校对和摘要技术虽然就目前水平看还不够完善,但它们实际上又是机器翻译、语句理解和生成等更复杂的信息处理研究的基础性实验工程,因此又有着超出其本身作用的重要价值。 ?

语言学在信息处理中的应用前景

上面讨论的是目前已经实现或初步实现的信息处理技术。当然实际上已经开展的信息处理研究还远不止这些,其中有些研究跟语言学的关系也更加紧密。但在这些信息处理研究中,有的仍在积极地研究中。虽然现在已有相关产品投入商业应用,但从技术上来说有的还需要不断改进,如机器翻译技术等;有的研究工作甚至只能说刚刚起步,如人机对话(包括复杂语句的理解和合成)和人工智能(包括会说话的机器)等研究。这些研究项目既是信息处理研究的目标,也是语言学应用研究的目标。从语言信息处理技术本身看,以下几个方面的研究将是未来一段时间的主攻方向: 1机器翻译

机器翻译是一门涉及语言学和计算机科学的综合性工程。相对于人的翻译而言,机器翻译的研究目标是利用计算机及软件把一种自然语言的文本转换为另一种自然语言,其中,我们称第一种自然语言为“源语言”,翻译后的自然语言称“目标语言”。这门新学科是研究翻译两种或多种语言的自动化问题的。它是一门多学科交叉的学科,是语言学、数学、计算机科学、自动化

科学等学科相互渗透的产物。

美国、英国和前苏联是最早开始机器翻译研究的国家。我国也早在1957年就开始了机器翻译的研究。

人工翻译需要懂得源语言和目标语言的词汇和语法规则,如果有生词和语法困难,就得依靠词典和语法书,那么,对机器而言,也必须具备这些材料。一般来说,机器进行翻译,是先将有关的文件数据放入外存贮器,翻译时再调入其内存贮器。因此,每一次的机器翻译,机器都要对词典和语法进行一次查询,而且次数非常多。同人工翻译一样,机器翻译也必须根据上下文解决一词多义、惯用语等复杂的语言问题。具体分解机器翻译的工作过程,一般分为以下几步:原文输入,效率较高的录入是原文自动输入,更为理想的是通过光电阅读装置自动识别,并自动转换成机内部代码。原文分析,通常需要经过词典分析和语法分析两个阶段。词典分析具体来说,是对各种综合词典、成语词典、结构词典以及多义词典进行查询。语法分析,是指根据源语言和目标语言的语言规范进行综合,调整各种结构成分的位置。译文综合,其中心任务是调整次序。一般的复句,在各分句内部各种成分调整后,各分句都作为一个相对独立的语段进行处理;而复杂的复句,如双重的关联词使用、包孕式的复句则采用先加工插入句再加工主句的方法。译文综合还有一个任务是进行修辞加工,针对特定的目的语特点,添加或者删减一些词。如英译中时,遇有“though”句,英文中没有“but”,但在中文中添加“但是”,这样就更符合目标语的语言习惯。最后一步是译文输出,这其实是一个检索的过程。因为译文综合时已将译文的序列进行了调整,那么现在就是从内存句子加工场中将汉语的词义部分取出,如果汉语词义是代码形式,需查词典转化成汉字,如果已经是汉字,直接调出即可。译文可在用户电脑终端屏幕显示,最后用打印机将译文打印出来。

20世纪80年代中后期,出现了新的基于语料库的机器翻译方法,这种方法绕过了对语言进行深层分析,直接利用大规模收集互为译文的双语语料,利用这些语料来进行翻译。这类翻译一般采用两种方法,一是利用实例,通过在原有的译文资料中找到最为相似的翻译实例的方法来获得语言翻译;另一种为基于统计的机器翻译,主要通过对大量的双语语料的统计,翻译可以通过计算双语之间的复杂共现和分布概率的方法,进行选择,完成翻译。

现今发达国家已开发出文字翻译机器,如日本理光公司推出的数字式翻译复印机。语音翻译方面,日本ATR研究所、美国梅隆大学和德国西门子公司共同研究,已于1993年试验成功自动翻译电话,并进行了10多分钟对话。日本还研制成功一种通过计算机与通信网络连接的自动翻译电话。最近美国又有公司推出一种旅游用的名为“WORLD MATE”的袖珍翻译机器,它准备了2250个常用短语(15种语言,每种各150个短语),能为使用者到世界各国旅游提供语言交际上的帮助。

现在,我们正处于信息爆炸的时代,世界上的科技文献90%以上是外文的。据联合国教科文组织统计,英文占60%,德文占10%,法文占10%,俄文占10%,情报资料的增长速度每6至10年增加一倍。所以,机器翻译可以实现大量使用不同语言的技术情报的互译,这对促进各国交流和世界文化发展是非常有利的。据估计,在不远的将来,机器翻译作品有可能问世流行。 2人机对话

人机对话同样是一项难度很大的高层次的语言信息处理技术。与机器翻译相比,人机对话有不同的要求:机器翻译是计算机模拟人工翻译的智能过程,是把一种语言的句子(包括书面的句子和口头的句子)经过计算机处理而翻译成另一种语言的相同意思的句子;而人机对话则要求计算机首先能懂得一个句子的意思,然后把这个句子作为一种指令接受下来,并利用自己的程序指令,按照要求作出相应的动作,或者作出相应的回答。

人机对话不可能一蹴而就,其发展过程大致可以分为两步。其中初级或较低的目标是通过预先编制的程序来控制计算机跟人“对话”。就是说先要把人说的或写的话变成计算机能“懂”的语言,然后让计算机按照事先编制的程序去执行这种指令。例如利用键盘输入,利用语音识别等手段向计算机输入这种指令。这种研究目前也取得了一定成果,如国内实验开发的“铁路客运查询系统”,就是最初级的人机对话系统。这种查询系统输入的都是相对较随意的问话,回答也有一定的灵活性。但目前这种人机对话系统规模很小,能够接受的自然语言的语句也不多。

人机对话较高的目标是要使“人”和“机”真正能够做到像“人”和“人”那样自由对话。不难想象,如果要想让计算机能够像人那样,坐在你的面前听你的陈述和问话,然后一一给出回答和建议,这里包含的技术不仅仅是前面所说的信息输入,语音识别之类的单项技术了,而更需要各类技术的综合,比如需要向计算机提供内容极丰富的百科知识,而且还要给计算机提供更加复杂和有效的语言学知识,例如词汇、语法、语义和语境等知识,如果是口头对话,还要有语音知识(包括不标准的口音,规则的停顿和易位等的识别),对问题的关键词抽取,还需要有正确答案的匹配等等,这样计算机才可能理解人说的话的意思,并且作出正确的回答。 3人工智能

人工智能,人工智能也叫智能机器人,或简称AI,有时也称作机器智能。美国斯坦福大学教授John McCarthy于1956年首

先引入了这个术语,他将人工智能定义为:使一部机器的反应方式就像是一个人在行动时所依据的智能。

它与一般工业机器人最大的不同就在于,它能够理解人说的话和能够像人一样说话;而它跟机器翻译和人机对话的不同之处就在于它不但能够自动翻译,能够回答问题,还能够执行人的语言指令,甚至还能象人那样,根据当前的现实情况随时进行判断和推理,并作出文字形式或语音形式的报告。很明显这涉及到更加复杂的类似于人的思维程序技术和语言处理技术。从语言学的角度看,如果说机器翻译和人机对话是一种以语言形式(要翻译的语句或要回答的语句)作为参照物的语言信息处理技术,那么人工智能就是一种以非语言形式(客观事件和外部场景)作为参照物的语言信息处理技术。也就是说,智能机器人不但要能对看到的符号和听到的话作出被动的语言反应,而且要能在没有看到任何东西和听到任何话语的情况下,自己就能像人一样主动地作出判断、推理并给出语言表达。显然,这种技术除了需要词汇、语法、语义、语境等语言学本体知识的支持,还有赖于跟生理学、心理学相关的人类抽象思维模式和语言生成机制等更广泛的语言学研究成果的支持。

到目前为止,该领域中在基于预先定义好的系列规则之上的计算机模拟智能方面,已经做了大量的工作。人工智能目前在计算机领域内,得到了越来越广泛的重视。并在机器人、经济政治决策、控制系统、仿真系统中得到应用。

可见,无论是直接依赖语言学知识的信息处理研究,还是间接地以语言学为基础的信息处理研究,语言学都将在其中起到重要的甚至是决定性的作用。总之,现代语言学跟计算机和其他技术科学的结合,正在开创人类文明史上的新时代。在这个崭新的时代里,人们将以前所未有的方式和进程改变世界的面貌。

本文来源:https://www.bwwdw.com/article/kjfx.html

Top