实验语音学

更新时间:2023-10-07 04:06:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

引言

语音学是研究人类说话声音的科学。言语交际实际上是由连接说话人大脑和听话人大脑的一连串心理、

生理和物理的转换过程完成的。可以分为\发音、传递和感知\三个阶段,现代语音学也就根据这三个阶段分为三个主要分支:生理语音学:研究发音器官在发音阶段的生理特性;声学语音学:研究语音在传递阶段的声学特性,当前由于言语工程的发展需求,声学语音学的到了迅速发展;感知语音学:研究语音感知阶段的生理和心理特性,也就是研究耳朵是怎样听音的,大脑是怎样解释这些声音的,和心理学紧密相关,近年来由于研究手段的提高和多样化,研究深度和广度都有所加强。

现代语音学的发展已经经历了近一个世纪,它的大量研究成果运用于语音合成、识别等言语工程。在信息时代正发挥着日益重要的作用。它的发展大致可分为如下阶段:

1.1920年以前:研究语音大多是通过口和耳,一些欧洲的语音学家已经开始使用生理和物理实验的手段从事语音研究了,早期的仪器有浪纹计和假腭。

2.1920-1940:在欧洲同时出现了几个语音研究中心,他们用X光照相来研究发音机理;后来随着电话的发明,语音的声学分析也随之发展了。

3.1940-1960:这是语音学蓬勃发展的时期,发明了较好的仪器设备,形成了三个发展方向:声学分析、言语产生和言语感知的研究。

4.1960-1980:随着电子计算机的广泛应用,言语合成和识别的技术迅速发展,从而促进了语音学与言语工程学的结合。

5.1980-现在:随着计算机语音产品逐渐从实验室走向市场,言语工程学越来越强烈地要求语音学基础理论研究的合作与配合。语言学已经意识到对自然语音信号的理解远远不能达到要求,在实现自然言语理解这一目标方面任重而道远。

我们设立网上《现代实验语音学教程》,目的是以专题的形式,为语音研究人员和学生提供一些有意义的线索和资料,向大家展示语音学基础知识、现代语音学在言语工程中的应用,以及国内外语音研究的状况和发展趋势。欢迎大家给我们提供宝贵意见(联接地址)。

发音的生理基础

发音器官Speech Organs

这是人的从头部到肺部的纵切面图,包括了发音器官的三大部分:肺部、喉部、口部。发音器官又可以分为喉上器官和喉两大部分,喉上器官由口腔、鼻腔和咽腔几个部分组成。的发音器官又可细分为:1.上下唇、2.上下齿、3.齿龈、4.硬颚、5.软颚、6.小舌、7.舌尖、8.舌面、9.舌根、10.咽头、11.会厌软骨、12.声带、13.喉头、14.气管、15.食道、16.口腔、17.鼻腔。

喉 Larynx :喉部是语音的主要声源,这是喉纵切面图,包括侧面和正面。

声带 Vocal Cords : 从喉部纵切面图可以看到声带。声带是两条有弹性筋肉的带,事实上是气管内壁延伸的末端。前端固定在甲状软骨上,后端固定在杓状软骨的的声带突上。两条声带之间隔以声门裂,声门裂前方是音声门,后方是气声门。当呼吸时,声门大开。当发声时声门关闭,呼出的气流必须冲开声门而出,由于伯努利效应,声门复归关闭,当声门下气压足够大时,又冲开声门。如此反复开闭,

就形成声带周期性的颤动,发出乐音性质的声音。

喉腔、咽腔、口腔、唇腔和鼻腔组成人类发音器官的声腔,是非常灵活富于变化的共振腔。声带音通过声腔时,由于声腔形状的种种不同变化,产生不同的公正共振,形成种种不同的声音。

语音产生的研究方法简介

言语产生的研究目的:研究包括脑活动(Motor Activity)在内的发音器官动作特性以及相关的声学信息,最后是语音的感知方面。其目的在于揭示语音产生的机理(Mechanism)。 研究路线:利用各种生理医学实验检查设备,测量发音器官各环节的生理性(力学的、形态学的), 建立言语产生各环节的模型,并利用模型去设计合成器(如发音器官合成器、各类参数合成器和言语编码技术);借此来检验模型的合理性。

参考资料: Fujimura,O.(1990) Methods and goals of speech production. Language and Speech. 33(3),195-258.

一.回顾:

1.十八世纪六十年代美国从事聋哑儿童语言教学的老贝尔(电话发明人 M. Bell的父亲)的语音学教科书 就是语音教学发音器官示意图; 腭位图的发明就是为了研究腭裂病人的语音特点; 1895年 x光发明不到两年就用于语音研究, 第一次看到了发元音时的真实口腔形态; 20世纪40年代在贝尔实验室发明语图仪的目的也是为了聋哑人语音教学,利用语图仪所写的第一部著作因此取名

2.中国早在30年代就有了金属假腭, 但真正开始发音器官动作研究始于1958年(腭位照相)和1960年(x光照相);1983年前后始有声带x光断层照相、普通话发音器官动作电影和电视录相,同期又进行了声带肌的 EMG实验。

二.研究方法和设备及理论:

1.大脑血氧的研究:大脑血氧成分的变化反映言语活动时的兴奋部位和程度。利用功能性核磁共振成像技术(Functional Magnetic Resonance Imaging,FMRI )来研究正常言语、病理言语和歌唱条件下的大脑活动。类似的设备还有磁共振谱镜成像(Magnetic Resonance Spectroscope Imaging,MRSI)磁脑照相术(Magnetoencephalography,MEG)等。 参考资料:

Ray D. Kent & Kristin Tjaden (1997), Brain Functions Underlying Speech. In The Handbook of Phonetic Sciences, edited by W.J.Hardcastle & A.Marchal. p.221-254

2.言语空气力学特性研究(Aerodynamics),测量言语活动时声门上、下的气流气压特性:

2.1 肺:各种言语(正常言语、病理言语、艺术言语)和各种呼吸方法条件下的肺气流气压特性,如肺活量、潮气量等;

2.2 喉空气动力学特性:引起声带振动必要的气流气压特性;声门下压与声带振动频率及声带振动幅度关系;声门阻抗与声效率等; 2.3 各种音素的气流气压特性:

研究方法:真实的测量(Aerophone II可以测量10多个参数);机(力学)电(路)模拟 参考资料

《实验语音学概要》

《言语科学语言与技术》p.111

Christine H. Shadle (1997) The Aerodynamics of Speech. In The Handbook of Phonetic Sciences. edited by W.J.Hardcastle & A.Marchal. p.33~64 3.肌肉电流研究(Electromyography, EMG):

利用多道肌电仪及镍钩电极测量各种呼吸方法、各种喉部条件和各种音素产生时,特别是音高改变时, 肋间内外肌、喉内外肌和舌腭肌的紧张程度.最著名的研究单位是 Haskins Lab. 参考资料:

《实验语语音学概要》

Christy L. Ludlow et al (1997) Correlations among intrinsic laryngeal muscles during speech gestures. In Speech Production and Language. p.19~32

4.嗓音声源的研究:

4.1 声带解剖生理:喉部的各软骨、肌肉、神经的形态学、力 学特性;

4.2 嗓音声源的振动理论和模型: 4.3 嗓音声源的声学特性:

4.4 研究方法、设备和相关问题: 4.5 音调控制研究: 参考资料:

《实验语语音学概要》

Hajime Hirose (1997) Investigating the Physiology of Laryngeal Structures. In The Handbook of Phonetic Sciences, edited by W.J.Hardcastle & A.Marchal. P.116~136 Ingo R. Titze (1997) Regulation of fundamental frequency with a physiologically-based model of the larynx. In Speech Production and Language. p.33~54

5.发音器官动作特性的研究:

5.1 静态x光照相、普通断层照相和计算机断层照相(CT): 5.2 动态x光电影(视频录像)和x光微光束(x-ray microbeam) 技术:

5.3 共振成像技术 (Magnetic Resonance Imaging,MRI): 用来获取元音、擦音等可延时发音的语音的声道形状,也 可用于言语产生和感知的研究(大脑血流分布的变化)。由 于成像需要的时间较长,所以不适用瞬时变化的语音。

5.4电磁发音动作描迹仪(Electro-Magnetic Articulograph, EMA): EMA系统(Carstens Articulograph AG 100, 3D Articulograph AG 500)被用来描迹发音器官运动. 在这个系统中, 发射线 圈围绕发音人头部设置成电磁场. 10个换能器被置于舌和 面部的有关位置上. 当发音时, 系统能计算出各换能器的位 移(X,Y). 其功能有:

(1) 可实时地使用於连续言语; (2) 3-D 显示;

(3) 易于与声学分析比较研究;

(4) 易于构筑发音器官模型和设计发音器官合成器;

(5) 可用于研究大脑受损引起的失语症及口吃、聋哑等病理语言。 参考资料:

[1] Taehong Cho(2001),Effects of Prosody on Articulation in English. UCLA Dissertation In Linguistics Number 22.

[2] Joseph S. Perkell (1997), Articulatory Processing. In The Handbook of Phonetic

Sciences, edited by W.J.Hardcastle & A.Marchal. p.333~370

[3] Maureen Stone (1997), Laboratory Techniques for Investigating Speech Articulation. In The Handbook of Phonetic Sciences, edited by W.J.Hardcastle & A.Marchal. p. 11~32 [4] Proceedings of ACCOR Workshop on EMA in Phonetic Research. FIPKM 31/1993. ISSN 0342-782x

5.5 静态腭位照相和动态腭位图研究: 参考资料:

鲍怀翘等(2001)普通话动态腭位数据统计分析。第五届语音学讨论会文集(No.099) LCLA Working Papers in Phonetics No.85 ()

6.语音多模态研究(Multi-Modal of Speech):

所谓多模态是指语音的声频(声学特征)-视频(唇形、脸部表情和其 他副语言特征)-生理特征综合性研究。其目的主要是用于语音合成 和语音识别等语音工程方面,也有助於聋哑人和盲人的交际。语 音多模态研究是当前语音学研究的热门课题。 6.1 唇形研究: 6.2 多模态数据库:

Websit: http://www.uclsa.edu/linguistic/phonetics/ Link to all of Phonetic study units

辅音

一.辅音的特点

1.口腔内有阻塞或阻碍

2.气流较强,特别是清辅音 3.器官在遇阻部分是紧张的

4.多数辅音为不带音的清辅音,少数辅音为声带颤动的浊辅音

二.辅音的分类 1.按发音部位分类 唇音:b,p,m,f

舌尖前音:d,t,n,l,z,c,s 舌尖后音:zh,ch,sh,r 舌面前音:j,q,x,

舌根音:g,k,h,ng(鼻韵尾) 2.按发音方法分类

塞音:b,d,g(不送气) p,t,k(送气)

塞擦音:z,zh,j(不送气) c,ch,q(送气)

擦音:f,s,sh,x,h(清擦) r(浊擦) 边音:l

鼻音:n,ng(鼻韵尾) 半元音:如,i,u,ü 起头的零声母音节的起始部 3.按发音方式分类 清音与浊音:(略) 送气与不送气:(略)

三.辅音的声学特性 1.在声谱上的表现

不同辅音在语图上的基本模式 不同辅音的时长、幅型的比较 2.主要声学参量 强频区与下限频率 音轨与过渡音征

嗓音起始时间(VOT)

元音

一.元音的特点

1.声带颤动,其波形呈准周期性变化。

2.器官均衡地保持紧张,口腔内无明显阻碍。 3.气流较弱。

二.元音的分类

元音的分类方式很多,如按舌位高低、前后分;按唇形圆展分等。根据本课程的特点,下面按调音器官的变化来分别叙述。 1.单元音(10个) 舌面元音:a, i, u, ü, o, e, ê 舌尖元音:-i, -ii 卷舌元音:er

2.二合元音(9个) 前响: ai, ao, ou, ei, üe 后响: ia, ua, ie, uo 3.三合元音(4个) iao, iou, uai, uei

三.元音的声学特性

1.共振峰--表征元音音色的主要声学参量(1)共振峰的形成 (2)声腔的关系

2.元音共振峰的基本模式 (1)单元音的模式 (2)复合元音的模式 3.元音共振峰的测量

声调和语调

我国语音学家和方言学家在研究汉语和少数民族语言声调时,一直把语音音高相对于发音人的F0音域(范围)作为其研究的基础。

对语音基频(F0)做规整,实际上是用数学方法对语音F0知觉为音高过程进行模拟,把F0转换成与F0音域呈线性关系的语音音高。这儿主要介绍跟声调和语调有关的语音基频与语音音高关系问题。

1. 纯音频率与其音高:纯音的音高(林达悃,1985,1995; 吴宗济和林茂灿,1989):在音频范围内,如果将纯音频率从小到大逐渐变化,听感上就会产生一种与此相对应的逐渐变化,对声音从\低音\到\高音\的逐渐变化进行描述,这就是音高(pitch)的变化。尽管声音的频率是决定音高的主要因素,但声音强度对音高也有作用。S. S. Stevens和J. Volkman (1940,转引自林达悃(1985))为了表征音高这一主观心理物理量,引入了一个量度音高的单位,称之为美(Mel.)。定义响度为40方(phone)和频率为1000赫兹(Hz)的纯音(即标准音),其音高为1000美。以此为基础,对各种不同声音的音高做出了标度。确定音高的方法显然要采取主观听辨的办法。实验证明,随着频率的增加,音高也将提高,不过,以美为单位的音高增长率,逐渐小于以赫兹为单位的频率增长率,这就是说以美为单位的音高与以赫兹为单位的频率之间是对数关系。但是,低于500赫兹的情况就不同了。低于500赫兹时,以美为单位的音高与以赫兹为单位的频率之间近似成线性关系。E.Zwiker R.Feldkeller(1967, 转引自转引自林达悃(1985))对主观音高感受与频率之间关系作了研究,进一步发现以美为单位的Z音高,在500赫兹以下与频率呈线性关系。他们也把一般的可听声中的纯音分成若干个倍频程,并且选取从131赫兹开始的倍频程为\倍频程\,与此相应的音调叫做131美。

1.2 复合音音高:复合音音高因其构成成分的不同而不同。具有一定带宽的白噪声,即有一组频率集中分布在某一频率范围内,而且彼此相隔很近,强度又几乎相等的复合声,其音高大约等于这一频带中心频率的音高。对于包含有一定数目谐音,并且它们之间的频率差又是一个不太小的恒定频率差的复合声,其音高等于组成这一复合声的的各频率成分中最低频率的音高,即基频的音高。如果某一复合声的各组成成分频率间隔很大,并且它们又不满足谐音关系,听到的很可能是各个组成成分频率的音高。纯音音高与复合声音高的机理是不同的。有人把纯音音高称为\频谱音高\,而把复合声音高称为\有效音高\。

1.3 \虚音高\问题:一般地说,声音的音高取决于物理上具有能量的频率。但是,如果某一复合声仅仅在1200Hz, 1400Hz,1600Hz和1800Hz等频率上有能量,人们听到的却是一个200Hz的纯音音高。换句话说,这个复合声的基频还是200Hz, 尽管实际上它并不具有能量。人们进一步研究发现,这个复合声的波形周期是5毫秒。这表明,听觉系统可以产生一个以该周期(f=1/T=1/5′10-2=200[Hz])为依据的音高感觉。这种以复合声的周期为依据而产生的一种音高感觉,实际上是由不具有能量的基频引起的。人们把这种基频叫作\虚基频\。语音基频一般在60-400Hz之间,可是,日常电话的频带在

300-3300Hz,也就是说,人耳在电话中接收到的语音波往往缺少基频成分,而人们在电话中感觉到的语音音高是\虚基频\引起的。

1.4 音乐音高:乐音音高有两种表示方法。在物理上用频率值表示乐音的绝对音高,两个音之间的距离则用频程表示,如1/3倍频程和倍频程等等。在音乐上则用音名表示。在一般情况下,两者是相互对应的,如高音部的音符A所对应的音高频率为440Hz。两音之间的距离以音程即\度\的关系描述。乐音可以从低到高按一定音程进行排列,称为音阶。

用音程描述两个乐音之间的距离,引入了\律\的概念。目前我国和世界大部分地区普遍采用的是\十二平均律\。在十二平均律中,把一个倍频程分成十二个相等的音程,每一个音程称为半音音程,通常称半音。

n=12 ′ log2 F0/ F0 rec ―――(1)

(1)式中n=1,2,3,……12,F0 rec若取C1=261.63Hz, 可根据(1)式求出C1到C2倍频程中任意一个半音的频率值,也可以用(1)式,求出任意F0以F0 rec =261.63Hz为参考值的多少个半音。

1.5 语音音高与F0:语音F0与语言学意义上音高之间关系,实际上是十分复杂的。基频F0在语音音高中起十分重要作用,但强度,时长和音色的作用却不可忽视。为使规整的F0能真正反映语言学意义上的音高,做F0规整必须考虑其他声学参数的作用。Rose(1987,p. 347)指出,考虑到语言学音高与其他声学参数关系的研究现状,只好先对F0本身作规整了。研究结果表明,F0过渡段对语言学音高没有作用。在我们给出的规整F0曲线中,包含了F0过渡段部分。人们在讨论声调和语调音高(tonal pitch)与F0关系时,除F0过渡段以外,仍然可以习惯地把F0等同于语音音高,认为语音音高跟F0是同义词,音高就是指F0,F0就是音高。但是人们不要忘记自己所谈音高的含义。

1.6 语音F0的规整:我们认为语音音高与F0音域之间的关系是线性的,所以用下面公式求F0的J规整值:

J=5 ′(F0 - F0 min )? ( F0 max - F0 min )―――( 2 ),

(2)式中F0 max 代表某发音人某句话的最大值,F0 min 是同一发音人同一句话F0 的最小值,如果是对某发音人某句话进行规整的话;F0是这句话基频的任意值。(2)式中,分母( F0 max - F0 min )是某句话(也可以是其他要规整的语音单元)F0 最大值与最小值之差,而分子(F0 - F0 min )是任一频率F0 与这句话F0 最小值之差;分子与分母的比值最大为1,最小为0,对任意一个F0而言,这个比值具有归一化的意思。因为(2)式右边有系数5,所以不说这个公式具有归一化作用,而说具有规整功能。 把F0 max,F0 min 和F0代入(2)式,可以得到不同F0的 J值,它就是F0的规整值。F0 J值近似地代表语音音高大小。本文是对某个发音人某句话的F0进行规整的,规整后F0的 J值最大为5,最小的为0。公式中的系数用5可以表达F0曲线的升降起落,也就是说语句中音高变化可以用通常的5度值来讨论,如单字调和变调用5度值讨论一样。Rose (1987)在研究汉语吴方言声调时,对测量到的F0进行了规整,认为规整的F0曲线反映了音高知觉。他指出,对F0作规整最常用的策略有两种,一种他称为FOR变换(fraction of range transforms,范围或音域变换),另一种是Z-score变换(z-score transforms)。他认为,这两种规整都属于线性关系。FOR变换的公式如下: F0 norm =(F0 - F0 min ) ? ( F0 max - F0 min )―――(3), (3)式右边四个符号的意义与公式(2)的相同。 Z-score变换用的公式如下:

F0 norm =(F0 i - F0 ave.)/ s――― (4)

(4)式中,F0 ave代表所要规整的各个频率平均值,s代表F0平均值(F0 ave)的一个偏差,F0 i是待规整频率,F0 norm是经规整得到的数值.

P. Rose用(4)式对F0作规整,本研究用(2)式对F0作规整,用(4)式对音节时长作规整. 2. 汉语声调的声学征兆及其感知

2.1 汉语声调的声学征兆:对汉语声调进行声学语音研究,做得较为彻底的算北京话(普通话)了。人们用不同实验都得到了与阴平,阳平,上声和去声相应的声学曲线包括F0曲线和时长。研究任何汉语方言声调的声学表现,都要得到其相应的F0曲线,时长以及振幅曲线以至共振峰。

2.2 F声调的感知:汉语声调的感知特性,做得较多的也算北京话了,因为它是普通话的语音基础。这里主要介绍汉语声调的范畴知觉和声调信息分布两个问题。

2.2.1 声调的范畴感知:研究范畴感知要做两个试验,一个实验叫辨认测验,另一个叫区分测验。这两个测验分别得到刺激声的辨认函数和区分函数。范畴感知有两个特点。一是在区分函数上有一些能非

常精确区分的高峰和一些其区分百分数只比猜测的稍好的低槽;二是区分函数上的高峰和低槽跟辨认函数之间有很大的一致性,即高峰是由从不同音位范畴取出来刺激声对子所引起的,而低槽是由从同一音位范畴之内取出的刺激声对子所引起的。当然,这些刺激声对子的声学参数的差值是在通常的听觉辨别阈限之内的。汉语普通话阴平和阳平之间存在着音位界限,因为它的辨认函数出现陡峭,区分函数在陡峭处出现高峰。普通话阳平和上声有范畴边界,区分函数中在这个边界出现高峰。可是泰语暹罗话声调的结果却是连续知觉。在某些音段范畴知觉基础之上,采用选择性适应方法,估计在通向大脑的神经中有特征觉察器,声调怎样?。

2.2.2 声调的信息分布:声调信息分布是研究声调信息是由字音的整个带音部分,还是由其韵母或主要元音所携带。分单念的声调信息分布,两音节里的声调信息分布,和语句中的信息分布三部分来谈。

2.2.2.1 单念声调的声调信息分布:我们采用感知试验方法研究这个问题。做感知试验总要制备一种刺激声。我们的实验结果是,对北京话单说的声调来说,不仅可以把浊辅音声母及介音,而且也可以把鼻音韵尾或元音韵尾排除在信息分布区之外,因而,单说的北京话声调信息主要由主要元音及其过渡所携带。从此说明,字音里的F0并不都能引起声调的感觉,即F0跟字音声调音高之间相联系的函数是不连续的。

从1974年开始,国内外学者从声学的或感知的角度研究这个问题,其争论点在鼻音韵尾是否跟声调分布区有关。

2.2.2.2 普通话两音节间的过渡及其感知:通过声学分析和感知试验表明,普通话和福州话两音节组中的声调信息都主要由音节主要元音及其过渡所携带。普通话VV和VCV中F0上升和下降过渡之所以未能被听见,是因为它不发生在主要元音上;福州话VV和VCV中F0上升部分之所以被听见,是因为它涉及了主要元音。这个问题涉及了D.House的音调感知理论。

2.2.2.3 自然语句中声调感知;自然语句中各个音节F0曲线跟单念的尤其是很不一样,其声调信息分布跟朗读单音节或多音节的会不会一样,值得研究!

2.3 声调能力的大脑侧向问题:大脑两半球对语言的作用,科学家做过很多研究。早期的研究主要是靠对失语症病人的临床观察,后来人们又找出新的研究方法,企图从正常人身上找到证据,比较著名的一种叫做两岐听力试验。人们一般认为,大脑左半球不但专司语言,而且还专司理解和分析。因而,人们自然会提出声调会不会也由左半球来管这个问题。有学者认为广东话声调是右耳占优势的(1974),而另一些学者认为普通话声调没有明显的右耳优势(1983);有学者认为泰语暹罗话声调更容易被右耳听见(1975)。看来这方面研究需要运用一些新方法进行研究,以求得到确切结论。这种新方法包括脑电仪等。

3. 语调问题

3.1 汉语语调的声学语音学研究发展:八十年代以来,用实验方法研究汉语语调取得的成就,使人们对汉语语调的认识深化了许多。吴宗济(1980; Wu,1990)语调的基本观点是, 多音节变调是语调的不变单元和这个单元 (吴先生用'模块移动'术语)在频率轴和时间轴上的移动。沈炯(1985, 1994)发现,语调是由一连串声调音域组织起来的音高调节形式,声调是在语调音域中滑动的曲拱,并指出语句中?quot;调冠\,\调腹\和\调尾\。劲松(1992)认为:北京话语调是句子末一节奏单位中重读音节上的音高变化。沈晓楠(Susan Shen, 1990)认为,汉语至少有三种不同的语调调子(intonation tune),她称它们为\调子一(Tune I)\,\调子二(Tune II)\和\调子三(Tune III)\;\调子一\用于是非问句,\调子二\是'Wh'疑问句,\调子三\是选择问句。郑秋豫( Tseng,1990)在研究声调与语调关系后指出以下问题:(1)下倾作用确实存在

于汉语,但只出现于她所研究语句的一小部分; (2)下倾理论不仅解释力很弱,而且它所声称的普遍性也太过分;(3) 呼吸群理论是揭示语调更好的途径;(4) 句法和语调之间的相互作用确实存在; (5) 对现行理论无法解释的语调模式,人们不应忽视;(6)现行的语调理论对天然话语(spontaneous speech)及朗读话语 (read speech) 更加困难; (7) 下倾理论对篇章也许比起句子更行得通。以上关于汉语语调的研究成果,为我们研究打下良好基础。沈晓楠的这个成果受到著名语音学家D. Robert Ladd的重视,引用于他写的《语调音系学》专著中(1996)。从郑秋豫提出的几个问题看到,语调研究必须从实验句以及朗读语句转向自然口语,使语调研究贴近语言和语音实际。

3.2 我们研究汉语语调的策略和方法:我们运用新近发展的自主音段节律音系学理论

(Autosegmental-metrical theory, AM theory),从语句的韵律结构出发,使用即席的电话对话语料及有关自然对话语料,使用声学分析(对语音基频和时长作规整)和感知试验结合在一起的方法,研究功能语调。以下对功能语调做些定性说明。

3.2.1 是非问句:是非问句分不带任何疑问符号与带疑问符号的两种。

3.2.1.1 举例说明不带任何疑问符号的是非问句:\餐厅吃饭可以打折?\是不带任何语气词和疑问指代词等的是非问句。这句话来自即席的店电话对话语料库(\)。从这句话和相应叙述句的五度制规整F0曲线进一步证实,它的疑问信息来自这句话句末\打折\,而且疑问句的由F0高低线所形成的F0音域比相应叙述句的高;从这句话规整的声学曲线看,\打折\就是这句话后一个韵律短语的最后韵律词。

3.2.1.2 带\吗\等的是非问句:带\吗\是非问句之前的F0高低线与语句重音有什么关系?带\吗\是非问句之前的F0高低线与叙述句的有无系统差异?\吗\本身F0曲线与什么有关等问题,都要给出答案。

3.2.2 特指问句:特指问句中疑问代词和副词的声学表现是什么,整个特指问句的F0高低线是如何活动的?它跟是非问句的和叙述句的有何异同?特指问句疑问点的声学表现是什么,必须给回答。

3.2.3 选择问句:选择问句的最后部分和前面部分的声学语音表现是一样的吗,整个选择问句的F0高低线是如何活动的。它跟是非问句的,特指问句的的和叙述句的有何异同?选择问句疑问点的声学表现是什么。

3.2.4 反问问句(略)。

3.3 我们从韵律结构不仅要得到语句的高F0线,而且寻找其F0低线,从中研究F0高低线的不同作用;从F0高低线入手深入探讨它与重音等的关系,以回答吕先生提出的疑问点等问题;同时着力探询各种疑问句尤其是非问句疑问信息的声学表现,在定性结果基础上,给出功能性语调的声学语音学模式。

音节

一.关于音节

二.汉语普通话的音节结构 1.普通话的声母 2.普通话的韵母 单韵母 复韵母 介音 鼻韵母 儿话韵

三.协同发音 1.关于协同发音

2.主要类型:先期的与后续的 3.协同发音效应的主要表现 共振峰过渡

目标值不到位或过位 音征互载 音变

四.音联 1.关于音联 2.音联的类型

普通话语流中四个等级的音联(许毅,1986年): (1) 闭音联--音节内部各音位的音联 (2) 音节音联--音节间的音联 (3) 节奏音联--节奏单元间的音联 (4) 停顿音联--语流中的短暂停顿

区别特征

一.《区别特征》\(DF)理论的形成与发展

《区别特征》是《现代音系学》中的一项分析语音的手段,她是由传统的《音位学》跟新兴的《实验语音学》结合的产物,起源于20世纪初期的\布拉格学派》创始人、特鲁别次柯依 Trubetzkoy 的《音系学原理》 Grubdzuge der Phonologie 1939所提出的音位对立的\偶分\概念,首先应用于方言调查上的音位分类标准,其后由其继承人雅可布森加以发展,在他和他的学生哈勒所著的《音位学与语音学的关系》作了初步介绍,提出能是适用于一切语音分析的12对的对立面:(R. Jakobson and M. Halle: \)。同时他们又和瑞典的通讯工程师方特合著了《言语分析初探,区别特征及其关联》,从世界各种语言(主要是印欧语和非洲语)的语音中,选取不同音位,为区别特征提供例证,(Jakobson-Fant-Halle: \their Correlates\),成为研究《区别特征》的经典著作。

20世纪中期,美国加州大学的语音学教授、非洲语音学者拉第福给德、麻省理工学院的乔姆斯基都对《区别特征》的对立项加以补充,使其更能满足分析语音的需要(P. Ladefoged: \Linguistic Phonetics\,1971又: N. Chomsky: and M. Halle: \)。

二. 雅可布森的十二\最小对立面\举例: 1.响音特征 Sonority Features

声学的--具有(或不具有)一套清晰的共振峰结构 (1) 元音性/非元音性 Vocalic/ non-vocalic

生理的--主要的或单独的声门上的的激动,在口腔中有自由通道。 (2) 辅音性/非辅音性 Consonantal/non-consonantal

声学的--具有(或不具有)在第一共振峰上降低了频率的特征。 生理的--在口腔通道中具有(或不具有)阻碍。

(3) 鼻音性/口音性(鼻化/非鼻化)Nasal/oral (nasalized/non-nasalized) 声学的--具有(或不具有)稳定的鼻音共振峰特性,伴随音强的减弱。 生理的--口共鸣器有(或无)由鼻腔来补充的条件。 (4) 集聚性/分散性 Compact/diffuse

声学的--在可听声频的相对狭窄而居于中心的区域(1KHz左右)具有集中的能量(或集中能量不在中心区域)伴随着总能量及其时间上分布的增大(或减小)。 生理的--区别在于声腔形状和容积在收紧点偏后或偏前的关系 (5) 突发性/延续性 Discontinuous/continuant

声学的--在静止区(至少在声带颤动区)之前和/或之后由能量分布于较宽的频区,表现为一种爆发或为一种元音共振峰的急速过渡(或无此种表现)

生理的--声源的突起或立停,由于口腔的迅速关闭和/或开启而使爆发音与擦音有别。 (6) 粗糙性/柔润性 Strident/mellow

声学的--具有(或不具有)较强的噪音、伴随着较高频率的加强和较低频率的减弱的特性 生理的--粗糙边缘的/光滑边缘的。 (7) 急刹的/非急刹的 Checked/unchecked

声学的--在一个短时间内,能量以较高速度释放出来(或在一较长时间内,能量以较低速度释放),同时有较低的(或较高的阻尼)。

生理的--气流由于腹部呼出或吸入的遏制而局部减弱(或不减弱)。急刹的音位有三种不同的发音,如:挤喉音、缩气音或搭嘴音。

(8) 浊音性/清音性 Voiced/voiceless

声学的--具有(或不具有)周期性的低频激励源。 生理的--声带有(或无)周期性颤动。 (9) 紧音性/松音性 Tense/lax

声学的--声音稳定部分的时长、同时在频谱上的清晰共鸣区都较长(或较短)。

生理的--在维持一段发音状态、在使声腔从中性部位作较大的变动、在气压的提升上所需要形成的发音动作,进行得完整而认真。(或草草带过)。

社科院语言所语音室版权所有 2000-2002

语音合成

语音合成技术是利用计算机一类机器,按人们预定的程序和指令,人为地产生出音素、音节、词和句子的技术。 语音合成技术不但可以用于人-机-人通信系统,而且也是语音学研究的一种重要手段。人们可以利用语音合成技术人工语音的听辨试验,从而揭示语自产生和语言感知的机制。\如今,未经合成的验证,没有一个人敢于发表语言产在语音特性的研究中。用得较多的是共振峰合成和声道模拟合成。前者以共振峰为控制

参数,只要求在输出终端上模拟出实际语音的谱特征,肋叉称为终端(模拟)合成;后者是 以声道截面函数为控制参数,甚至以调音参数为控制参数,故又称调音合成。两类合成器相 辅相成,都是深入研究语音特性不可缺少的工具。

一.共振峰合成器的基本原理

共振峰合成器是建立在语音产生模型的基础之上的,即一个语音是由声源激励、声道共鸣和口鼻辐射共同作用的结果面是浊声源,下面是噪声源。浊声源是一个模拟声门波形的信号发生器,常用下式来产生类似三角波的声门波形(图

0.5[1-cos(n n/Np)]

0

(0≤n≤Np) (Nn≤n≤N0)

(A2.40)

g(n)= cos[n(n-Np)/2Nn] (Np≤n≤Nn)

式巾N0是由基频F0和采样频率Fs决定的数(N0= Fs/F0),Np和Nn是控制声门波开启状

态和合拢状态的时长的数。频谱分析表明,这种声门波的频谱包络下降斜率约-12dB/oct。图A2.32中的噪声源用一所代表的数字滤波器来完成。

框图A2.32中间部分是合成器的核心,它是由 三条支路 组成 的声道滤波器:A支路 有三个 串联 的共振峰滤波器

陈平:三种语境(上下文,环境,世界知识)。

1.3.3 Jonathan J.Webster(2001)的观点

“语境的研究主要集中在三个方面:(a)场景(field):发生了什幺?(b)语旨 (tenor):谁参加了?(c)方式 (mode):如何发生的?我们在分析篇章和话语时,我们也会问:发生了什幺?谁参加了?如何发生的?跟语境的三个方面相对应的是意义的或者说是语义的元功能(metafunctions):表述功能(representational),人际功能(interpersonal),篇章功能(textual)。”(Jonathan J. Webster 2001) 人类 语言 文化 语言

场景 发生了什幺? 表述功能

环境 语旨 谁参加了? 人际功能 篇章/话语 方式 如何发生的? 篇章功能

1.4 篇章

Leo Noordman at el.(1999:133) \ 特点:功能(function),层次 (hierarchy) 和关系 (relation) 功能:作用。 层次:主从句。 关系:相互有联系。

陈平的例子:“有的句子单用时语义十分清楚,但连在一起则令人莫名其妙。”(p.69) (1)a. 一个队员倒挂金钩将球打入网内,吐一口痰罚五毛钱。(陈平的例子p.69)

b.他外出总带保镖,花棚里到处都是萝卜味。(同上)因为语言不是一个完美的逻辑体系,所以,\合语法\和\不合语法\之间的区别,常常是模糊的,特别是当我们实际使用语言时更是这样,而不像Biber和Finegan(1991)所认为的那样:'理想内省的语料'。Jan Aarts区分了\合语法的句子\和\可接受的句子\,下面是Aarts的例子,这是一个合语法的句子,却是无法接受的句子: (2) My grandfather's grandfather's father's grandfather's grandfather's father's grandfather's father grandfather's grandfather's father's father was an Indian. (given in Ziff 1974)

(我的祖父的祖父的父亲的祖父的祖父的父亲的祖父的父亲的祖父的祖父的父亲的父亲是印度人。()Ziff 1974)而下面这个例子是可接受的,但却是不合语法的:(3) And what a performance by the man who some of us thought that may be the pressure of being the favorite of Wimbledon might not let him win.

(Nijmegen 的语料)\到底什幺是篇章,什么样的东西我们可以称为篇章,什么东西使得一个个小句组成了篇章?Jan Renkema在他的《话语研究》( Discourse Studies 1993)一书中列出了把连续的小句看成篇章的七项标准(pp. 34-40),这七项标准是: 1. 外部联系(Cohesion) 2. 内部联系(Coherence) 3. 目的性(Intentionality) 4. 可接受性(Acceptability) 5. 信息性(Informativeness) 6. 环境因素(Situationality) 7. 内部篇章性(Intertextuality) . 外部联系:

Renkema对外部联系的定义是:\当对一个具有篇章性的成分解释需要依靠篇章中另一成分时,外部联系就出现了?quot; (p.35) Halliday 和 Hasan把外部联系分成五种:互指(reference)、替换(substitution)、省略(ellipsis)、连词(conjunction)和词汇联系(lexical cohesion)。他们认为,篇章的外部联系性组成了篇章。 (1) 互指

包括人称代词、指示词或表比较的词,指的是篇章中某个成分和另一成分之间的关系是一种指代的关系。我们拿一个英文句子举例:\beneath the Look in box, click that file or folder to select it.\句中的代词 it和指示词 that 指的是同一个东西: the file or folder you want to create a shortcut for。 (2)替换和省略

替换和省略跟互指不同之处在于,替换/省略从语法上看是用词不同,为了避免重复同样的词、词组(group)和小句,作者会用某个其它的词来替换,或者就采取省略的办法,省略可称为\用零形式替换\。在英语里,最常见的替换名词是one/ones 和 the same;动词是 do。Halliday 和 Hasan用了这样的例子:

a. Did you light fires? ? Only wood ones. (94) b. A: I'll have two poached eggs on toast, please. B: I'll have the same. (105)

c. Does Jean sing? ? No, but Mary does. (118)

互指和替换的明显的不同之处是通过第二个例子表现出来的,Halliday 和 Hasan指出,the same 并非指两个相同的鸡蛋,而是名词词组的替换。 (3)连词

是一种表达篇章中的功能语句之间的联系或语义联系的机制。Halliday 和Hasan认为连词可表示四种关系:增加关系(additive)、对照关系(adversative)、小句关系(causal)和时间关系(temporal)(p.238)。连词跟互指和替换/省略不同,互指和替换/省略是通过互指和形式的延续来体现外部联系;而连词是通过建立一种篇章中两个延续的语句之间的关系来体现外部联系的?quot;也就是说,第二个语句的解释需依靠第一个语句\。 (4)词汇

词汇在外部联系中也起到很重要的作用,虽然不是很明显。Halliday 和 Hasan提出两种词汇外部联系:重述联系(reiteration)和搭配联系(collocation)。重述联系又可分为五种:重复联系(repetition)、同义联系(synonymy)、上下义联系(hyponomy)、转喻联系(metonymy)和反义联系(antonymy)。搭配指的是在一个特定的语境中同时出现的词。

我们看到,外部联系涉及篇章中语义上的(互指)、语法上的(替换/省略)和词汇上的(词汇联系)联系, 内部联系:

而内部联系反映了一种在篇章中不是很明显地表现出来的关系。一个有内部联系的篇章具有\一种整体性和统一性\等的\修辞结构理论和篇章分析\,刊Mann 和 Thompson主编的《话语描写》

(Discourse Description 1992)。篇章中的每个成分或每个部分互相作用,构成了一个篇章的整体意义,这就是内部联系。

篇章中之所以会出现内部联系,是由于\目的性\和\可接受性\造成的。 目的性:

作者是经过深思熟虑为了某个目的而写成某个篇章的。这就是Renkema所说的\用意性(\intentionality):作者有某种用意,想通过某个信息而达到某个特殊的目的。 可接受性:

另一方面篇章是可接受性。对某个篇章来说,读者必须认为这确实是个篇章。除了这个篇章可理解外,

读者对这个篇章的可接受程度取决于各种因素,如:环境因素和篇章内部因素。 环境因素:

理解篇章需要依靠环境,即环境因素。 篇章内部因素:

还要考虑整个篇章的上下文,即篇章内部因素。Keep和 McLaughlin (《电子迷宫》, 网址:

uvic.ca/~ckeep/hfl0278.html) 对篇章内部因素的看法是,\严格地说,某个篇章的建构,只是体现在阅读的那一刻。而读者以前所读的东西,他的经历以及他在某种文化中所处的地位,也形成了重要的篇章内部性?quot; Keep 和 McLaughlin对篇章内部因素这个术语的来源是这样解释的:

这个术语来自拉丁语 intertexto, 指编织东西时把东西组织起来。篇章内部因素这个术语最早由法国符号学家Kristeva在六十年代引进来的。在《词、对话和小说》等文章里,Kristeva 打破了作者的\影响\和篇章的\来源\这些传统的概念,她认为,table settings (碑文或法典)和诗歌这些重要的意义系统是这些系统转换旧的意义系统的方式来构建的。一个文学作品并不能简单地看作是某个作者的个人的产品,而是这件文学作品和其它文学作品的关系作用的产物,是语言本身结构的产物。\任何篇章,\她认为, \都是通过引文的镶嵌来创造的,任何的篇章都是其它篇章的转换和同化的结果\。 信息性:

然而,除非作者是完全抄袭,一个篇章总要有自己的新东西。当然,这个篇章是建立在旧信息之上,在某种程度上,转换了其它篇章的东西,但是,这个篇章还是有自己新的东西。也就是说,这个篇章可被称为具有信息性。 2. 理论

2.1 理论要点

1)人们在进行面对面的交际或写文章时,往往不是用一个孤立的句子,而是应用大量有组织的句子。 2)使用语言和理解语言时,语境是一个不可缺少的因素。

3)不管是交际中的口语,还是成篇的书面语,小句与小句之间,句子与句子之间,段落与段落之间,都存在结构上的或语义上的联系。

4)人脑中的语言是以语块(chunk)的形式储存的。

5)篇章对句式及其变体的选用有制约作用,句中也存在着篇章现象。(徐赳赳 1997) 2.2理论

2.1 故事语法(Story Grammar)

Leo Noordman (1999:136): A story grammar consists of a number of rewriter rules. A rewriter rule rewrites a particular unit into other units, and specifiers in this way the content of the rewritten unit. The first rule is that a story (circle island, the controversy plus theme, plus plot, plus resolution. The setting has characters (the senators, the farmers), a location and a time. The theme consists of one or more events and the goal of the story (digging a canal for water supply). (徐赳赳 2002) 2.1 宏观结构理论(van Dijk)

\可以使用不同的方法把许多信息单位压缩成次级大结构,再把次级大结构压缩成初级大结构,也就是成为相应的摘要或者主题。对此,T. van Dijk (冯·戴伊克)提出4种不同的宏观规则(或称基本程序):①去掉不重要或次要信息,②选出基本信息,③把信息加以概括,④选出主题或主题句\(刘鸿绅 1987:129)。\跟Wotjak的相同点就是van Dijk也把他的微观、宏观结构定义在语义上。但他是从话语的目标和任务出发,把话语中的一个句子以及两个按顺序连续排列的句子的结构定义为微观结构。

\的贡献在于他进一步提出了建立在话语更高层次上的宏观结构。他指出,类似上述的方法都只注意到了话语中句子与句子之间的直线关系(linearer Zusammenhang)但话语却并不仅仅是由这样的直线关系组构而成,而是还具有建立在话语的总体之上或建立在话语中一个较大的单位的总体之上的结构,这个结构就是话语宏观结构。\(钱敏汝 1988:87-88)\(1977)提出了篇章的语义宏观结构这个概念,试图以它来说明篇章意义的连贯。简单地说,篇章语义结构是个层次结构,上一层次的语义是由抽取下一层次的组成单元的共有的命题内容作成的,如果在整个篇章的意义结构的最上一层有个或有一组命题能包容整个篇章的命题内容,那么这个篇章便是连贯的。最上边这个层次既是整个篇章的宏观语义结构,通常所说的话题或主题\(廖秋忠 1991[1992:186])。 评论:

\从篇章和信息的角度来看,van Dijk 提出的这些总结构可以被看作为篇章生产和解说的模式,但在理论上,还有许多含糊不清之处(刘鸿绅 1987:165)。\

\的这种做法做起来相当烦琐。但话题、主题或共同的命题等概念却是有用的,用来说明独白的说明文、论证文甚至叙述文的连贯与否问题不大。但用来处理对话之间的连贯问题较多(廖秋忠 1991[1992:186] 。\

2.2 话题延续性理论(Givon)

\把话题延续性分成三种。这三种延续性可以在主题段(the thematic paragraph) 内,或通过主题段表现出来,也可以通过结构/语法/句法/在小句中依次表现出来。这三种延续性为: (a) 主题延续性(thematic continuity) (b) 行为延续性(action continuity)

(c) 话题/参与者/延续性(topic/participant continuity)

其中以主题延续性范围为最大,是其它延续性的发源地。在一个主题段落内,主题延续性与行为延续性和话题/参与者延续性紧紧联系在一起。行为延续可以在不必改变主题延续性的情况下产生变化。话题/参与者延续性则是三种延续性中最具体的,因此,它可以在话题内,不必改变行为延续和主题延续的情况下而产生变化。如果我们分等级,那么就是: 主题延续>行为延续>话题/参与者延续 ……

Givon (1983)提出三种测量法,即回数法(lookback),歧义法(ambiguity)衰减法(decay)。\徐赳赳 1990:326)

(5) 翰伯同志是1988年8月26日去世的。临终前一天25号上午,他1还去三联书店参加《读书》杂志社每月一次的服务日活动,和编辑们谋办刊物的事,和著译者们谈选题编书的事。谁也没料到,这次会见竟是他2和出版界和读书界同志们和朋友们的最后一晤,此回一别竟永诀。9月8日向他3遗体告别时,人们在频频呼唤他4,他5已不再声息了。

2.3 修辞结构理论

1986年8月19-23日在荷兰召开的第三届国际篇章生成研讨会上﹐W. C. Mann和 S. A. Thompson 提交了一篇论文\《修辞结构理论﹕篇章结构的描写和建构》)﹐初步提出了RST理论的框架。1987年﹐在美国南加州大学信息科学研究所内部发行的刊物上﹐他们又发表了近百页的论文\organization\《修辞结构理论﹕篇章结构理论》)﹐系统地阐述了该理论。其理论要点是: 1) 关系性(relation)

RST理论认为﹐一个篇章中的各个小句﹐不是杂乱无章地堆在一起的﹐这些小句与小句之间﹐存在着各种各样的语义关系﹕a. 各种语言都有一套数量不一的语义关系。b. 在这套语义关系中﹐其中某些关

系使用的频率很高﹐某些关系则很少出现。c. 绝大部份的语义关系是不对称 (asymmetry of relation)的﹐也就是说﹐绝大部分的关系是\辅助\的和\核心\的关系。 2) 功能性(function)

RST理论认为﹐ 篇章的整体性 (unity) 和联接性 (coherence) 都源于功能性﹐因此RST理论研究句子与句子之间的关系是从功能的角度考虑的。\理论着眼描写那些使得篇章成为人类交际有效的和能理解的工具的功能和结构。\3)层次性(hierarchy)

整个篇章中的各个小句的组合﹐是有层次的。其特点是﹕a. 两个小句之间的语义关系是最低层的﹐然后几个小句和几个小句之间的关系组成高一层次﹐最后再由更大的语言单位之间的语义关系组成整个篇章。b. 每个篇章的层次多少是不固定的﹐层次的多少是由篇章中的句与句之间的语义关系的复杂程度所决定的﹐通常来说﹐语义关系越复杂﹐层次也就越多。c. 层次的均衡性(homogeneity of hierarchy)。也就是说﹐每一个层次都可采用相同的功能描写。

举例分析:

目的关系 (purpose)

核心语句的制约因素 提出一个行动

卫星语句的制约因素 提出了未现实的行动

核心语句+卫星语句的共同制约因素 卫星语句提出了通过核心语句的行动而实现的内容 结果 读者认识到,引进核心语句中的行动是为了实现卫星语句的内容 结果的位置 核心语句和卫星语句

1. To see which Syncom diskette will replace the ones you are using now,

2. send for our free \目的关系 1 2

(例子摘自example cited in Mann and Thompson, 1987:64) 3.研究课题

3.1 个别词研究

Chu, Chauncey (屈承熹1998) 第3章:话语中的情态副词

作者把汉语的情态副词分成三类:1)断言副词:\是﹑真是﹑可是\。2)评估副词:\可(是)﹑就(是)﹑也﹑都﹑又﹑居然﹑本来﹑简直﹑果然﹑其实\。3)判断副词:\一定﹑绝对﹑也许\。他认为许多汉语情态动词具有联系小句的特点﹐对于能出现在句首的情态副词﹐这种联系性比较明显。对于那些只能出现在小句内的情态副词, 很难看出具有这种联系性。作者对\就﹑才\﹐\并﹑倒﹑也\和\又﹑还﹑再\这三组情态副词作了详细的分析﹐重点考察它们的联系功能﹐同时也找出每组副词之间的微小的使用区别。

第4章:句末小词

句末小词指的是\啊/呀﹑吧﹑了﹑呢﹑吗和嘛\等小词。作者在前人研究的基础上﹐从功能的角度﹐对这些句末小词逐个进行了详细的考察﹐他认为:有些小词的功能只在单一层次上有所表现﹐\吗\在语义-句法层次上是表示疑问的;\吧\和\啊/呀\在情态层次上分别表示非确定性和个人参与性;\呢\在话语的层次上起到联接小句的作用。有些小词的功能在多层次上都有所表现﹐句末小词\了\跟副词\了\不同

本文来源:https://www.bwwdw.com/article/re6d.html

Top