信息科学与电子工程专业英语(王朔中)课程翻译下 - 图文

更新时间:2023-12-22 21:39:02 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

Unit 11 数字图像处理

Unit 11-1

第一部分:二维数字图像

图像是表示一些物理参数空间分布的二维信号,典型的物理参数是光强,而更普通的是能量的任一种形式。例如,运动图像以及多光谱的遥感图像是三维或者是更高维的信号。现代数字技术使得处理多维信号成为可能,所使用的系统可从简单的数字电路到先进的并行计算机。这种处理的目的可以分为3类:

- - -

图像处理:输入图像?输出图像 图像分析:输入图像?输出测量数据

图像理解:输入图像?输出高层次的图像描述

我们将介绍的重点集中在图像处理的基本概念上。篇幅所限,我们只能对图像分析以及图像理解进行一些介绍性的说明。另外我们将限于讨论二维图像处理,尽管将要描述的大部分概念和方法很容易扩展到三维或更高的维数。

我们从一些基本定义开始。在“真实世界”中定义的一幅图像可以看成是两个实变量的函数,例如:以a作为在实坐标位置(x, y)处幅度(亮度)的图像a(x, y)。一幅图像可以看成是包含许多子图像,这些子图有时称之为感兴趣区域,ROI,或者仅仅是图像中的区域。这一概念表明图像通常包含许多对象,每一个对象可以是一个区域的主要部分。在一个复杂的图像处理系统中,应该能对于选择的区域进行特定的图像处理运算。于是图像的一部分可以进行抑制运动模糊的处理,而另一部分可以作改进色彩渲染的处理。

一幅给定图像的幅度几乎总是要么是实数,要么是整数。后者通常是量化的结果,将一个连续的范围如0到100%转换为离散的(灰度)级。然而,在某些图像形成过程中,信号可能涉及到光子计数,这意味着幅度本来是量化的。其它的图像形成过程,如磁共振成像,直接的物理测量会产生一个复数,具有实的幅度和实的相位。除非另有说明,我们认为幅度是实数或者是整数。

一幅二维离散空间中的数字图像a[m, n]是由二维连续空间中的模拟图像a(x, y)通过采样得到的。采样过程常称为数字化。对采样过程的数学表示将在稍后介绍。现在,我们来看一些和数字图像有关的基本定义。图11.1显示了数字化的效果。

2维连续图像a(x, y)被划分成N行M列。一行一列的交叉点被叫做一个像素。整数坐标[m, n]被赋予的值是a[m, n],其中:m = 0, 1, 2, ... , M?1 ,n = 0, 1, 2, ... , N?1。实际上,大多数情况下,我们认为是射到二维传感器表面的物理信号a(x, y)实际上是许多变量的函数,包括深度、颜色、时间。除非另作说明,本文我们考虑的是2维的,单色的静止的图像情况。

图11.1的图像被划分成了N = 16 行以及M = 16列。赋予每个像素的值是像素的平均亮度,其四舍五入到最近的整数。将二维信号在给定坐标位置的幅度表示成具有L个不同灰度级的整数值的过程通常称为幅度量化,或简称量化。

在数字图像处理中,某些工具是非常重要的。这些包括数学工具,如:卷积、傅立叶分析以及统计描述,和处理工具,如:链式码与游程码。在这里我们介绍这些工具没有任何特别的动机,在后

1

面的章节中我们会对此予以介绍。

许多图像处理应用是要产生被人观察的图像,而不是比方说为了自动的工业检验。因此,了解人类视觉系统的特征和限制是很重要的,即要了解二维信号的“接收器”。一开始就认识到以下几点是很重要的:1)人的视觉系统尚未被充分了解;2)不存在与人眼评价相当的判断图像质量的客观度量;3)不存在所谓“典型”的观察者。然而,感知心理学的研究已经对视觉系统提供了一些重要的见解。

Unit 11-2

第二部分:数字图像——定义和应用

图像无处不在,这毫不足怪,因为我们人类依赖于图像,我们用眼睛的感知超过所有其它的感知刺激。我们吸收的几乎所有的信息都是图像的形式,不论是看一张照片,看电视,欣赏一幅画,或是读书,这一切都利用了图像。图像对于我们是如此自然,因而总是尽力将几乎任何信息都转换为图像。例如电视天气预报用图像表示某一地区的温度分布,以不同颜色代表不同的温度,医学扫描装置可将人的新陈代谢活动显示成图像,用亮点表示强的活动性,等等。此外,我们的视觉通常是我们感官中最有效的:举例来说,考虑一个电脑键盘。每个键的功能都用了一个小图像(一个字符)表示。我们也可以通过一个特定的凹凸纹理来识别每个按键,但它的效率远不及前者。我们甚至可以尝试给每一个按键一个特定气味,但很容易想象在打字时我们的麻烦。

我们也擅长于许多图像处理任务。举例来说,我们眼睛的聚焦:当我们看东西时,我们的眼睛传递给大脑的第一个图像可能是未聚焦的,然后大脑试图通过调节眼睛晶状体纠正这一点,一个新的图像就会从眼睛发送到大脑,等等。这种反馈过程是如此之快,甚至我们没有意识到这一点。另一个例子是立体视觉:我们的眼睛将两幅二维图像传到大脑,而大脑能在瞬息之间将它们合成为一幅三维图像。

图像处理技术将人类使用图像的自然方式和数学结合起来。这就提供了独特的混合,因为可用严格数学方法描述图像和图像处理又不失图像的直观性。

图像处理可以定义为:图像中信息的处理和分析。当然这个定义是非常宽泛的,包括自然的和人为的处理,从一副眼镜的使用到哈勃望远镜传输的图像的自动分析。我们可以发现身边图像处理的简单方式,包括:

- 使用眼镜或隐形眼镜

- 亮度,对比度等,电视或监视器的控制 - 用相机拍摄和冲洗照片

- 大自然的例子:水面上景色的反射,水雾中景色的失真,等等。 高级图像处理的应用例子包括:

- 司法科学:视频监控摄像机图像的增强,图像中的脸,指纹,DNA码等的自动识别和分类。

- 工业:检验生产部件,应用于CAD /CAM。

- 信息处理: 手写和印刷文本(经常被称为OCR;光学字符识别)的识别,印刷图像的扫描和分类。

在医学中,使用病人的一幅或多幅医学图像,可以发现图像处理的许多应用,例如:

2

- 可视化。 例如:在我们制作一个三维物体的三维可视化之前,我们首先需要从二维图像中提取物体的信息。

- 计算机辅助诊断。 如:现在通常为超过一定年龄的女性定期拍乳房X光片,以发现早期的乳房癌。实践中图像数量如此巨大,因而用自动计算机图像处理来完成部分筛选工作十分有益。 - 图像分割即将图像分割为有意义的结构。例如:将脑图像分割为这些结构:脑白质、脑灰质、脑脊髓液、骨质、脂肪、皮肤等。从改善可视化到肿瘤生长的监测,在许多工作中分割是有用的。

- 图像配准,即同一病人两幅或更多图像的严格对准。若要将这些图像中包含的信息结合起来形成一幅有意义的新图像,这种对准是十分必要的。

图像处理应用可以有很多目的。大多数时候,目的是在一个或几个这些类别中: - 图像增强,例如,减少噪声或图像锐化。

- 模式识别,例如,图像中某种形状或纹理的自动检测。

- 将数据量减少为更容易处置或解释的信息,例如将图像减小为一幅较简单的图像、一组对象或特征、或者一组测量结果。

- 图像合成,如由二维照片重建三维场景。

- 图像拼接。当从同一个场景获取两种不同形态(类型)的图像时,将它们拼接起来涉及配准,其后是数据减少和图像合成。

- 数据压缩。为了缩小包含图像的计算机文件的大小,以及加快网络中图像传输的速度,数据压缩常常是必需的。

我们关心的只是数字图像处理,而不是模拟处理,理由是,模拟处理需要专用的硬件,这使得建立一个特殊的图像处理应用成为一项艰巨的任务。此外,在许多图像处理领域中模拟硬件的使用正在迅速地成为过去,因为它常常能被更具灵活性的数字硬件(计算机)所取代。

但究竟什么是数字图像呢?数字图像获取与处理的示意图如图11.2所示。顶部有某个成像设备,如摄像机,医疗扫描仪,或其它任何可将物理现实的量度转换为电信号的设备。成像设备产生一个连续的电信号。因为这种模拟信号不能直接用计算机处理,信号通过数字化仪转换为离散形式。最后产生的图像便可直接用于数字图像处理应用。

数字化仪完成两个任务:采样和量化(见图11.3)。在采样过程中,图像中连续信号的值在特定位置被采样。在量化过程中,真实值被离散化为数字数值。量化后的图像我们称为数字图像。这样就回答了本节开头的问题:数字图像只不过是一个数值的矩阵。每个矩阵元素,即已量化样本,被称为图像元素或像素。对于三维图像则称为体积元素或体素。

我们可以用两个坐标(x; y)表示图像中每个像素的位置。按照惯例,(0; 0)像素,即原点,是在图像的左上角,X轴是从左向右,Y轴自上而下(见图11.4 )。这可能要用一点功夫去习惯它,因为它不同于常规的二元函数的数学表示法,也不同于常规的矩阵坐标。如果一幅数字图像仅仅是一个数值矩阵,有人可能会说:数字图像处理只不过是一种对矩阵进行运算的数学算法的集合。幸运的是,现实情况远非所说的那么枯燥乏味,因为在实际中,我们很少使用图11.3所示的矩阵表示,而是对图11.3的中间图像进行处理,实际上是同一幅图像,但将光强度赋予每一个数,对人而言它通常更有意义。你会发现图像处理算法将被描述为数学算子作用于像素值或像素矩阵,这些算法的运算结果也将被用图像形式显示出来。

3

Unit 11-3

第三部分:图像处理引言

图像由各种物理设备产生,包括照相机和摄像机、X光设备、电子显微镜、雷达、超声设备等,并用于各种目的,包括娱乐、医疗、商务、工业、军事、民用、安全、科学。各种应用的目的都是使观察者(人或机器)提取被成像的场景中的有用信息。

原始图像通常并不直接适合于这一目的,必须以某种方式进行处理。这种处理称为图像增强;而观察者从图像中提取信息的处理则称为图像分析。增强和分析根据其输出性质即输出的是图像还是关于场景的信息来区分,也根据所面临的挑战和所使用的方法来区分。

图像增强通过化学、光学、电子方法实现,而分析则主要由人工和电子方法实现。用于观察者的(视觉)增强方法或用于(计算机)自主分析的数字图像处理技术在成本、速度、灵活性方面具有优越性,随着个人计算机价格的急剧下降和功能的快速提升而成了实用的主要方法。 挑战

图像并不是被观察的物理对象性质的直接测量,而是诸多物理因素相互作用的结果:光照强度及其分布、光照与构成景物的物质之间的相互作用、反射光或透射光从三维空间到二维图像平面的投影几何关系、以及传感器的电子特性。不像某些其它工作例如编写编译程序那样有正式理论为基础的算法,可将高级计算机语言翻译成机器语言,不存在从图像中提取感兴趣的景物信息如位置或某一制成品质量的算法和可比的理论。

这种困难常被初学者低估,因为人的视觉系统似乎可轻而易举地从景物中提取信息。人的视觉通常比我们目前乃至可预见的未来能够设计制造的任何东西复杂得多。于是我们必须注意,不要根据人们对某一数字图像处理应用的印象来评估其难易程度。

一个首要的指导原则也许是人类更擅长于判断而机器更擅长于测量。因此,比方说在传输带上确定一个汽车零件的确切位置和大小很适合于数字图像处理,而要对苹果或木材的质量定级却更具挑战性,尽管不是不可能的。按照这些原则,需进行大量计算而极少需要判断的图像增强就是很适合于数字处理的。

对处理时间的严格要求常使问题变得更复杂。很少用户在意电子表格的数据刷新时间是300毫秒而不是200毫秒;但是,譬如说大部分工业应用却必须在机器周期所要求的严格限制以内完成操作。还有许多应用如超声图像增强、交通监控、摄像机防抖动等要求对视频流进行实时处理。

为了具体了解对处理速度的挑战,设想一下,一台标准黑白摄像机的视频流每秒有1000万个像素。在撰写本文时,一台典型台式PC也许可在处理每个像素所允许的100ns时间内执行50条机器指令,而能用区区50条指令完成的处理十分有限。

此外,许多图像处理应用还受到成本的严格限制,因此我们经常面临工程师们望而生畏的三重难题:要求设计的产品同时具备性能优良、运行快捷、价格便宜的优点。 图像获取

所有图像处理应用始于某种形式的照射,典型的是光线但广义的是某种能量。有时必须使用环境光线,但更为典型的是根据具体应用设计照明。在这些情况下事情的成败往往就在于此:任何高明的软件都无法将因为照明不良而丢失的信息恢复出来。

照相机就是一个能将辐射能量分布转换为存放在RAM中的数字图像的装置。过去这一过程分

4

成两步:将能量转换为电信号即照相机的功能;用数字化设备将信号转换成数字形式并存储。现在两者之间的界线正在变得模糊,照相机将通过USB、以太网、IEEE 1394接口直接将图像送入计算机。

照相机技术以及所产生的图像特性几乎无例外地受到最大实际应用量的驱动,其中之一是消费电视。因此大多数的摄像机具有半个多世纪以前电视广播标准所制定的分辨率和速度特性。

典型的可见光单色摄像机的分辨率为640?480,每秒输出30帧图像,并支持电子快门和快速复位(任意时刻回复到一帧初始状态的能力,从而可避免在开始捕获一帧新图像前的等待)。这种摄像机是基于CCD传感器技术的,能产生优良的图像,但相对于其它具有同样数量晶体管的多数芯片而言其价格很高。

随着大容量个人计算机多媒体应用的激增情况首次发生了变化。首先影响到的是显示器,它已有相当一段时间给我们提供了比广播更高的速度和分辨率。人们可期待照相机/摄像机也随之跟上,包括由民用数字照相机所推动的高速度、高分辨率器件,娱乐业、互联网远程会议和用户视觉界面应用所推动的低分辨率和极低价格的设备。

廉价器件可能会产生更大的影响。这些是基于新出现的CMOS传感器技术的,其生产工艺与大多数计算机芯片相同,因而得益于生产批量大而价格低廉。目前它的图象质量还达不到CCD标准,但随着技术的成熟是注定会改进的。 图像增强

数字图像增强算法大致分为两类:点变换(像素映射)和邻域运算。 1. 点变换

点变换产生的输出图像中每个像素都是一个相应输入像素的某种函数。这一函数对于每个像素都相同,通常是由图像的全局统计特性导出的。点变换一般运行很快,但仅限于进行全局变换,例如调整整幅图像的对比度。

点变换包括许多可用于分等级值像素的图像增强。这些算法常由基于查找表的单一软件程序或硬件模块实现。查找表的运行速度快,可以编程用于实现任何功能,以合理的速度提供最终的普适性。而MMX以及类似的处理器则能以比查找表快得多的速度通过直接计算来执行各种功能,其代价是软件复杂性的提高。当某种功能是通过图像全局统计特性来计算时,像素映射是最为有用。例如人们可以处理一幅图像,在输入信号的均值和标准偏差,或者最小值和最大值的基础上,获得所要求的增益和补偿(偏移)。

直方图指标是一种有效的像素映射点变换,对输入图像进行处理使之具有与某一参考图像同样的像素值分布。其像素映射关系很容易从输入图像和参考图像的直方图得到。直方图指标是进行图像分析前的一种有用的增强技术,这种分析的目的是对输入图像和参考图像进行某种比较。

阈值分割是一种常用增强技术,其目的是将图像分割成目标和背景。计算阈值,大于(或小于)阈值的就当作对象,否则就是背景。有时用两个阈值来确定对应于目标像素的一个范围。阈值可以是固定的,但最好是根据图像的统计特性计算得到。也可以用邻域处理进行阈值分割。在所有这些情况下得到的结果都是一幅二值图像,即只有黑白两色而没有灰阶。

颜色空间转换用于转换不同的颜色表示方法,例如将照相机提供的RGB空间转换成图像分析算法所要求的HIS(色调,亮度,饱和度)空间。由于精确的颜色空间转换涉及的计算量很大,在对

5

时间有严格要求的应用中常采用粗略的近似。这些近似方法十分有效,但在选择一种算法以前应该对速度和精度间的权衡有所了解。

时间平均是处理反差极低图像最有效的方法。像素灰度映射对信号和噪声的作用相同,因此对于提高图像增益的作用很有限。邻域运算可以降低噪声,却会损失图像的保真度。降低噪声而不影响信号的唯一方法是对不同时间的多幅图像求平均。不相关噪声的幅度以参与平均的图像数目的平方根被衰减。将时间平均与扩大增益的像素映射法相结合可处理反差极低的图像。时间平均的主要缺点是用照相机获取多幅图像需要花费较长的时间。 2. 邻域运算

在邻域运算中,每一个输出像素都是一组输入像素的函数。这组像素通常围绕一个对应的中心像素的某个区域,因此称为邻域,例如3?3邻域。邻域运算可实现频率滤波和形状滤波,以及其他复杂的增强操作,但是运行起来较慢,因为对于每个输出像素而言,邻域内的像素必须重复计算。

由于有了可追溯到200年前Fourier信号理论的广泛数学框架,线性滤波器是邻域处理中最容易理解的。线性滤波器有选择地放大或衰减空间频率成分,可达到平滑和锐化等效果,通常是重采样和边缘检测算法的基础。

线性滤波器可用卷积运算定义,其输出像素由邻域内各像素乘以叫做“核”的同样形状区域内的相应值,然后将乘积相加得到。线性滤波器可直接由卷积实现,也可以利用FFT在频域实现。尽管频域滤波在理论上更为有效,实际上几乎总是用直接卷积的方法。由于使用小的整数运算和时序存储器寻址,卷积比起FFT来与数字硬件更加匹配,更容易实现,在边界条件的处理方面几乎没有问题。

边界检测有相当长的历史和大量的文献资料,从简单的边缘检测到更适合于图像分析中考虑采用的复杂算法。我们可以有点随意地将边缘检测看成是一种图像增强,因为其目的是突出感兴趣的边缘特征,而将其他一切都衰减掉。

图像中由目标产生的阴影是目标特性中最不可靠的因素,因为阴影是由照明、表面特性、投影几何学、感光器件特性这些因素复杂地结合而成的。而另一方面,图像中的不连续区通常直接对应于目标表面的不连续性(例如边缘),因为其他因素不易导致不连续性。图像中的不连续性即使在光度学方面不一致,在几何即形状方面通常却是一致的。因此作为边缘检测目的,不连续部位的确定和定位是数字图像处理中最重要的任务之一。

粗糙的边缘检测器只是标出相应于梯度大小的峰值或二阶微商过零点处的像素。精密复杂的边界检测器则给出有序的一串边界点,以及亚像素位置和各像素处的边界方向。最商用的边缘检测器还可以在一个很宽的范围内调节空间频率响应,并以高速运行。

设计成可以通过或阻止指定形状而不是空间频率的非线性滤波器在数字图像增强中十分有用。我们首先考虑的是中值滤波器,它在每个像素位置的输出是相应输入邻域的中值。粗略地讲,中值滤波器的作用是将小于邻域尺寸的图像内容衰减掉,让大于邻域范围的图像内容通过。

数字重采样是指照射到传感器上的能量连续分布被重新采样的情况下估计图像的过程。不同方式采样,用不同的分辨率或以不同方向采样常常是有用的。

另一类重采样算法是坐标变换,能产生亚像素数量的偏移、旋转和改变图像尺寸、在直角坐标系和极坐标系之间相互转换。输出像素的值由输入值的邻域内插得到。三种常用方法是:速度最快的最近邻法,更精确但速度较慢而且会损失一些高频分量的双线性法,非常精确但是最慢的三次卷

6

积法。

Unit 12 生物识别技术

Unit 12-1

第一部分:指纹识别

在所有的生物技术中,指纹识别是最早期的一种技术。我们知道,每个人都有自己独特的、不可变更的指纹。指纹是由手指表皮上的一系列峰谷组成的。指纹的独特性是由这些峰谷的形状以及指纹的细节点所决定的。指纹的细节点是指纹局部凸起处的一些特性,这些特性出现在凸起的分叉处或是凸起的截止处。

指纹匹配技术可以被分为两类:基于细节的指纹匹配技术和基于相关性的指纹匹配技术。基于细节的指纹匹配首先要找出细节点,然后在手指上对应出与它们相关的位置,如图12.1所示。但是,使用这种方法存在一些困难。要精确地提取指纹的细节点是很困难的。而且,这种方法不能很好地考虑指纹峰谷的整体形状。基于相关性的指纹匹配技术可以解决部分基于细节的指纹匹配方法存在的问题,但它也存在一些自身的缺陷。基于相关性的匹配技术需要给出已注册过的特征点的精确位置,并且该方法会受图像平移和旋转的影响。

图12.1 基于细节的指纹匹配

基于细节的指纹匹配技术在匹配不同大小的细节模型时(未注册过的)会存在一些问题。指纹

上局部的凸起结构不能完全由指纹细节实现特征化。我们可以尝试另一种表达指纹的方法,它可以获得更多的指纹局部信息并且得到固定长度的指纹编码。于是,我们只需要计算两个指纹编码之间的欧几里得距离,匹配过程有望变得相对简单。

研发对于指纹图像中噪声更稳健并能实时提供更高精度的算法是重要的。商用指纹(身份)认

证系统对给定的错误接受率要求具有很低的错误拒绝率。在这点上,任何一项简单的技术都很难实

7

现。我们可以从不同的匹配技术中汇总多个证据从而提高系统的总体精确度。在实际应用中,传感器、采集系统、性能随时间的变化是关键因素。为了评价系统性能,我们有必要对少数使用者在一段时间内进行现场试验。

每天我们可以从法医鉴定、出入口控制、驾驶证登记等多个方面的应用中采集并保存大量的指

纹。基于指纹的自动识别系统需要把输入的指纹与数据库中大量的指纹进行匹配验证。为了缩短搜索时间、降低计算复杂度,要以准确而一致的方式将这些指纹分类,从而使输入的指纹只需与数据库某一子集中的指纹进行比对。

指纹分类是将指纹划分入多个预定义指纹类型中的一类中的一项技术。这些预定义的指纹类型

是由提供索引机制的文献建立的。图12.2表示了不同类型的指纹。它们有螺纹状的、右旋状的、左旋状的、弓形的、帐篷形的。输入指纹首先粗略地被匹配为预定义的类型中的一类,随后,输入指纹仅与这一大类指纹库中的子集作更精细的比较。

图12.2 不同类型的指纹

指纹自动匹配中关键的一步是自动并且可靠地从输入指纹图像中提取出细节。然而,细节提取

算法的好坏很大程度上依赖于输入图像质量的好坏。为确保自动指纹识别或确认系统的性能对于不同指纹图像质量具有稳健性,必须在细节提取模块中加入指纹增强算法。快速指纹增强算法能根据对局部指纹脊方向和频率(密度)的估计自适应地改善输入指纹图像中脊和沟结构的清晰度,如图12.3所示。实验证明加入增强算法可以显著增强指纹认证的精度。

图12.3 指纹增强

Unit 12-2

第二部分:说话人辨认介绍 介绍

现代安全系统范围很广, 通常要通过多层系统才能完全被突破。除了标准的锁和警报系统以外,

还有很复杂的方法来保护重要资料。其中多数的方法为可以允许或者不允许一个特定人员获取资料——计算机系统必须能够检测出指纹、读取个人眼孔图样、或者确定说话者的真实身份。最后一点是本文讨论的重点——说话人辨认。说话人辨认经常会与其他类似的术语混淆。以下对这些术语的精确定义做出解释。

8

说话人识别:确定是谁在说话。

说话人辨认:初始情况下不知道说话人是谁,必须在与模板比较后确定说话人的身份。通常会说话人确认:确定说话者是否就是他(她)自称的那个人。仅将说话者的话音与一个样板进行语音识别:识别出人们说话时的语句。换句话说,识别出一个人在说什么而不是谁在说话。这

有很多相关的模板。

比对,即他(她)自称的那一个。

个术语经常与声音识别相混淆。声音识别是识别出说话人。 关键问题

通常来说,语音识别问题是很复杂的,涉猎很广的。其中主要的一个问题是语音信号的复杂度

很高。在如图12.4所示的语音信号中,很难对大量系统做出解释并提交给系统。

图12.4 直流偏置改变后的diablo的波形图

一个明显的问题在于信号不规则。自然的语音信号始终起伏不定。语音模型的另一个自然特性是信号的音量和幅度起伏不定。不同的人会用不同的方法来强调音节、字母和单词。如果两路信号音量不同,它们就很难进行比较。同样,语音信号在很短的时间内会有很多峰值,它们对应于人们说话时每个单词的音节。尖峰的增加使两个信号的比较变得更为困难,因为结果容易偏向于高的峰值,导致对那些结果的解释发生错误。提供给系统的输入信号的速度高低是另外一个问题。使用者说自己的名字时语速不同于他们平常的讲话速度,这可以改变识别结果,因为这时是将同一模式的两个不同版本进行比较。问题在于他们讲话经历的时间长短不同,这必须考虑在内。最后一个问题,当使用语音认证的方法来测试一个信号的时候,某个人可以尝试模仿另一个人的语音。如果说话者有很好的模仿能力,那么这个说话者很有可能被系统接受。

为了处理信号的不规则以及周围环境对信号的噪声影响这两个问题,必须先让信号通过平滑滤波器。滤波器要完成两项任务:消除过度的噪声和消除高频起伏,仅仅保留信号的大小。这样,你就可以得到容易辨识处理的清晰信号了。

为了解决说话者音量不同的问题,信号在被测试前必须用相同的音量归一化。每个信号都要被归一到零的附近,这样每个信号都会有近似相等的最大值和最小值。

为了测试每个人的语音峰值点,我们在平滑信号以后使用包络函数来检测信号中的峰值点。如果信号通过某个门限,我们将检测它并把它与数据库中的相关信号做比对。这个过程将对共振峰进行分析而不会分析整个信号。每个人语音信号中的共振峰、或是元音声都可以被拿来做测试以区分说话人身份。

为了处理输入信号速度的多变性问题,我们要同时使用共振峰分析和包络函数分析法。我们可以通过信号峰值的包络来确定哪个元音是有用的。对应的实际共振峰本身也将不发生变化。要解决

9

语音模型的模仿问题,我们再一次地分析个人语音信号的共振峰。从而我们可以实际确定说话人是否是他声称的那个人。在大多数情况下,模仿者的共振峰信号不能完全匹配存放在数据库中的原始共振峰信号,这样,模仿者将被安全系统所拒绝。 包络检测

当系统从声音信号中实际读取某些值时,最重要的一件事是指出怎样把信号截断。一个很显然的方法是用音节来中断一个单词或是一连串词组。尽管因为音节中仍含有辅音而有些难以解读,但元音(总是)构成音节的主要部分,更不要说信号中较响亮的部分了。总而言之,用音节来中断单词是一个很好的开始。

当我们把信号通过一个平滑滤波器以后,就会得到清晰的波峰。然而,问题依然存在——我们如何得到这些峰值中的一个呢?这么做的目的是在开始读取信号的时候选取一个正确的门限。最重要的是要设法在保持每个信号的峰值的同时区分出多个峰值。例如,当门限设得太低时,噪声将进入系统。不过更有可能的是在阈值取得太高的情况下某些音节可能被忽略掉。

这使我们的问题有了一个很好的解决方案——门限切断了信号的采样值而不是时域值。我们需要时域值来对结果的频率进行分析,这样,我们就可以在每个音节中考虑共振峰声音了。于是回到最初的时间(时域)信号而不是采样信号,我们得到如图12.5所示的所需结果,其中每个包络的起点和终点对应于音节起点和终点。

图12.5 带包络的语音信号

这样一来,信号的大部分被保留,所有的元音也被保留,信号中去掉的大部分都是辅音。现在,我们有很多几乎完全是元音的信号。这样,我们又回到最初的那个问题——我们如何来分析这些元音呢?更进一步地,我们如何通过分析元音来解读一个信号呢? 共振峰分析

要解读一个信号,我们先要从确定一个信号等式开始。做到这一点的最好的方法是使用自回归模型。自回归模型就是通过已知输入信号值搜索当前信号估计值的一个简单模型。该模型的等式如下所示:

这个模型由三部分组成:常数部分、误差或噪声部分、自回归和形式。回归和表示当前的输入值仅取决于先前输入的那些值。变量p是这个模型的阶数。阶数越高,这个表达式的精度就越高。因为系统的阶数可以趋向无穷大,所以我们几乎可以得到这个(信号)系统的一个精确表达式。

10

搜索共振峰

一旦有了传递函数,就只需要取出包络所包含的音节,使它们通过这一传递函数(所代表的滤

波器)。当你得到传递函数的频率响应之后,你就可以得到一张很好的输出图像。这提供我们一些可以实际去解读的东西。特别是你可以很清楚地看到元音的共振峰,这意味着你可以很清楚地得到频率响应的峰值。这些峰值可以区分元音。例如,观察同一个人发出的这些元音,它们在外观上有明显的差异(见图12.6)。

图12.6 不同元音的共振峰样本 左边是“a”,右边是“ee”

观察前两个共振峰,对每个元音它们的频率和大小有明显的差异。甚至是同一个元音,不同的人(说)也会有不同地峰值。例如,比较不同的说话者发(cat中的)“a”(见图12.7)。即使频率响应的结构相似,(不同讲话人所发的)元音各自具有稍微不同的共振峰,在出现的频率和达到的高度方面有所不同。因此,我们终于有了可以分析信号的方法。现在只剩下最后一步——把这些共振峰与整个组中的共振峰做比较。

图12.7 说话人元音比较:两个说话人发“a”这个音(的频谱图)

最后一步:辨认说话人

当所有的事情都完成之后,系统剩下来要做的事情是很简单的一部分——将输入共振峰和数据

库中的共振峰作一个简单的比较。第一步是要确定我们实际讲的是哪个元音。就是对前两个共振峰的位置的简单测试。如果它们在某个元音的前两个共振峰的范围内,那它们就表示这个元音。这个范围储存在数据库中。这些范围对每个独立的元音都有很好的定义,并且(这个范围)可以适用于组内的所有成员。例如元音的第一个共振峰落在某一范围内,此范围包括组内恰好高于最高频率的第一共振峰和恰好低于最低频率的第一共振峰。如果它不在元音的范围内,那么这个元音就是错误的,系统将继续尝试下一个元音。这个过程将被重复直到找到一个元音(与输入元音一致)或者所有在数据库中的元音都尝试完。如果某个共振峰不属于系统中的所有的共振峰,那么这个元音将被忽略掉。

11

第二步是实际比较。输入元音的频率响应是与每个先前存储在系统里的元音的频率响应的标量

积。这里的元音是指在第一步中确定的元音。得分矩阵是由标量积产生的。得分矩阵将输出一个介于0和1之间的值,1表示完全匹配,0表示完全不匹配。

这个过程对单词中的每个元音重复操作。再把得分矩阵加在一起,然后系统把得分最高的一个

认定为说话人。但是,如果这个人的语音信号没有通过门限值,那么系统将给出没有匹配的系论。

Unit 13 信息安全

Unit 13-1

第一部分:信息安全——介绍和简史

信息安全就是保护数据,防止被未授权地访问、使用、披露、破坏、更改或扰乱。信息安全,常与计算机安全及信息保障这些术语替换使用,因为这些领域之间都是互通的,并且有着一个相同的目标——保护信息的机密性、完整性及可用性。然而,它们之间有着细微的差别,主要表现在选择的切入点、采用的方法、以及关注的领域上。信息安全关注的是信息的机密性、完整性及可用性,对于信息的类型,比如电信号、印制品或其他类型,没有限制。

长久以来,国家和军队的首脑们就意识到信息保护的重要性以及必要性,包括军事能力、军队数量及军事行动。一旦这些信息落入敌人之手,后果将是灾难性的。政府、军队、金融机构、医院和私人企业收集了大量关于雇员、顾客、产品、研究以及金融状况的机密信息。其中大部分的信息通过电脑收集、处理并存储,然后在互联网上传输到其它计算机。万一有关商业客户、财务状况或新生产线的机密信息落入竞争者手中,这样的安全事故就可能导致商业的损失,商务诉讼,甚至企业破产。保护机密信息是一种商务需要,很多情况下也是道德和法律要求。至于个人,信息安全对隐私有着重大影响,这在不同的文化里有着不同的理解。

在书信交流的早期时候,国家和军队的首脑们就意识到,使用特定的机制来保证书信通信安全以及运用特定的方法来检测篡改是很必要的。从书信交流的早期以来,人们理想的安全交流要有蜡做的封口和其他的密封方式,从而表明文件的真实性,防止篡改,同时保证交流的安全性。 据信是朱利叶斯?恺撒发明了恺撒密码,用来防止他的机密消息万一落入敌人手里时被解读。 第二次世界大战给信息安全带来了很大的进步,同时标志着信息安全作为一个专业领域的开始。二战见证了在信息的物理保护上的进步,表现为用设置路障和护卫兵的方式将信息送到信息中心。同时它也见证了数据形式化分类的引入,这种分类建立在信息敏感性和谁能接触它的基础上。二战期间还在准许(当事人)接触机密信息以前进行背景审查。

从20世纪早期到21世纪早期的这几年里,电信业、计算机硬件、软件、以及数据加密产业有着迅速的发展。人们容易获得体积更小,功能更强,价格更低的计算装置,使得电子数据处理能够被小公司和家庭用户所用。通过被广泛称为互联网或万维网的网络,这些被计算机迅速地连接起来。

电子数据处理和互联网电子商务的迅速增长和扩展,同时伴随大量国际恐怖事件的发生,激起了寻求更好的(保障信息安全)方法的需求,以保护这些计算机及其存储、处理、传输的信息。出

12

现了计算机安全,信息安全、信息保障这些学科领域以及各种专业机构,都以保证信息系统的安全性和可靠性为共同目标。

Unit 13-2

第二部分:信息安全的基本原理

20多年来,信息安全的核心原理一直由3个关键概念构成:机密性、完整性、可用性。我们称之为CIA三要素(confidentiality, integrity and availability)。 机密性

通常当我们要办驾照、租房、医保或者申请贷款等时候,想要不暴露自己的个人信息事实上是不可能的。诸如姓名、地址、电话号码、出生日期、社保号、婚嫁状况、子女数量、娘家姓、收入、工作、病史等等,这些都是我们非常个人和隐私的信息,但经常我们仍需要提供这些信息来进行商业活动。我们通常信任向他们透露这类个人信息的人员、公司、机构会采取措施确保我们的信息将得到保护,不会无意或有意向未被授权者披露,同时这些信息将仅仅被有权并且真正需要得知该信息的人所分享。

具有机密性的信息必须只能被授权的人访问、使用、复制和披露,并且应当仅在需要的时候进行访问、使用、复制和披露。当被认为是具有机密性质的信息已被(或者可能已被)未受权接触该信息的人所接触、使用、复制、披露时,即发生了泄密。

例如:当你在处理机密文件时,让一个没有得到授权的人从背后偷看你的屏幕,而屏幕上正显示机密数据的时候,即发生了泄密;如果包含有100000个雇员津贴信息的笔记本电脑被从车里偷了(或者在eBay上卖了)也会造成泄密,因为这些信息到了没有授权的人的手上。把机密信息通过电话告诉给未授权者也是泄密。

所以机密性是对那些持有他人个人资料的机构维护他人隐私的一项要求。 完整性

在信息安全中,完整性意味着未经授权,数据不能被创建、修改、或者删除。这也意味着存储在数据库系统中某一部分的数据与存放在该系统另一部分(或另一系统)的其它有关数据相一致。例如:当数据服务器电源突然中断或者执行了未经维护的不当关机,就会造成对完整性的破坏。当雇员不小心或者恶意删除了重要数据,也是一种对完整性的破坏。当网上购物者能修改他们所购买产品的价格时,信息的完整性就被破坏了。 可用性

信息可用性是指当需要某一信息时,信息本身、用来处理信息的计算机、保护信息的安全控制都处于有效可用的状态,并且功能正常。反之则是服务拒绝(DOS)。 结论

信息安全是一个以应有的关注和认真态度对信息和信息系统不断进行(保护)的过程,使之不

13

被非授权者接触、使用、披露、破坏、修改、扰乱。信息安全这一永无止尽的过程包含不断的训练、评估、保护、监视和检测、对事件的响应和修复、形成文档、检查。

1989年,卡内基梅隆大学建立了信息网络学院,美国的第一家致力于信息网络的研究和教育的中心。该学院与一些职业化组织在20世纪末和21世纪初对电脑安全、信息安全以及信息保障进行规范和整合。

可通过自学、高等院校学习、为期仅一周的强化训练营进入这一领域。很多学院、大学和培训公司提供在线的培训项目。信息安全职业对安全专业人员的需求日增,这些专业人员具有网络安全审核、入侵测试、数字取证调查方面的经验。

Unit 13-3

第三部分:入侵检测系统

入侵检测系统(IDS)通常检测主要通过英特网对计算机系统所做的有害的操作,这些操作可表现为破译者的攻击。人们使用IDS来检测多种无法被传统防火墙检测的恶意的网络数据流和对电脑的占用。这包括针对脆弱业务的网络攻击,由数据驱动的对应用程序的攻击,基于主机的攻击如特权扩大、非授权登录并访问敏感文档、恶意软件(病毒,特洛伊木马,蠕虫)。

IDS由几个部分组成:产生安全事件的传感器,一个用来监控事件和警告并控制传感器的控制台,一个由传感器记录事件到数据库,并且用一规则系统通过收到的安全事件产生警告的中央引擎。按传感器类型和位置以及引擎产生警告的方法可用多种方法对IDS进行分类。在很多简单的IDS实现中,这三个部分都被整合在一个单独的设备或装置中。 入侵检测系统的类型

在以网络为基础的入侵检测系统中,传感器位于被监控网络的瓶颈处,通常是非武装区域DMZ或者是网络的边界。传感器捕获所有网络数据流并且分析每个独立包的内容来检查恶意数据流。在系统中使用基于协议的入侵检测(PIDS)和基于应用协议的入侵检测(APIDS)来监测传输和协议的非法或不当数据流,或者语言(如SQL)的收缩。在以主机为基础的系统中,传感器通常包含一个监控所有主机活动的软件代理。也会有这两种系统的混合模式存在。

——网络入侵检测系统是独立的平台,他通过测试网络数据流并且监视操控主机来辨识入侵。网络

入侵检测系统通过连接到集线器、配置过端口镜像的交换机或者网络分接头来获取网络访问。Snort就是一个网络入侵检测的例子。

——基于协议的入侵检测系统包含一个系统或代理,典型情况下该系统或代理位于服务器前端,监

控并分析连接设备(用户PC或系统)之间的通信协议。

——基于应用协议的入侵检测系统有个通常和一组服务在一起的监控并且分析在特定协议上的应用

的系统或者代理。例如,在一个带有数据库的web服务器中,当它访问数据库时,这将监测中间件/商务登录的特定SQL协议。

——基于主机的入侵检测系统有一个代理在主机上,它能够通过分析系统调用、应用日志、文件系

统修改和其它主机活动及状态来识别入侵。

——混合型入侵检测系统组合了两种或多种的方案。主机代理数据和网络信息整合后形成一个对网

14

络的认知。Prelude就是混合型的例子。 被动系统与反向系统

在被动系统中,入侵检测系统传感器探测潜在的安全漏洞,记录信息并且对控制台及(或)使用者发出报警。在一个反向系统(又称为入侵防止系统IPS)中,IDS对可疑行为做出反应,将连接复位或重新对防火墙编程以阻止网络数据流受到疑似恶意来源的影响。这样的情况可能自动发生或有操作者控制。

尽管他们都与网络安全相关,但入侵检测系统与防火墙是不同的,防火墙通过对外部的观察来防止入侵的发生。防火墙限制网络间的访问防范入侵,并且不会对网络内产生攻击报警。入侵检测系统会衡量可疑的入侵,一旦发生就发出报警。入侵检测系统也同时监视系统内部的攻击。 这在传统上通过检查网络通信,确定常见计算机攻击的启发和模式(常称为标识),采取警示操作者的方法来实现。会中断链接的系统被称作入侵保护系统,是应用层防火墙的另一种形式。 物理入侵(被动)检测系统由他们以几英尺的精度准确定位入侵企图绝对地点的能力来区分。系统报告企图入侵突破的坐标位置,可用于激活相应的监控摄像机预置状态或人员派遣。 入侵检测规避技术

入侵检测系统的规避技术通过对IDS和目标计算机制造不同的状态来躲过检测。对手通过自己操纵攻击或者操纵包含攻击的网络流量来达到此目的。

Unit 14 远程医疗和生物医学信号处理

Unit 14-1

第一部分:远程医疗

远程医疗可以简单到两名医务工作者通过电话讨论病情,或者复杂到通过卫星技术和视频会议系统在两个不同国家的医学专家之间进行实时的医疗咨询。同时这种医疗也包含使用无人操纵的机器人。通常,远程医疗指的是通过通信和信息技术来进行临床保健。

远程服务(也称为缺席服务)是一项古老的业务,通常通过通告来实现;缺席医疗服务具有漫长而成功的历史,由于有了现代通信技术,它已发展成为现在我们所了解的现代远程医疗。

在其早期的表现中,非洲的村民们使用烟作为信号警告人们离开村庄,避免严重的疾病。在20世纪初,生活在澳大利亚偏僻地区的人们用由自行车踏板驱动的发电机提供能源的双向无线电来与澳洲皇家飞行医生服务进行通信。

有时,电子保健和远程保健这些概念会和远程医疗混淆起来。就像医疗和保健两个词有所不同一样,远程医疗通常仅指提供临床服务,而远程保健可以指临床和非临床的服务,后者如医学教育、行政管理和研究。电子保健这个概念特别在英国和欧洲通常是一个总括词,包含远程保健、电子医疗记录、和其他保健信息技术中的元素。 远程医疗的类型

远程医疗基于两个概念来实行:实时(同步)和保存并转发(异步)。

15

实时远程医疗可以像电话那样简单,也可以像机器人外科那样复杂。它的实现需要双方同时在线,并在他们之间有通信连接,允许实时交互发生。电话会议设备就是当前同步远程医疗中运用最广泛的类型之一。另外还有外部设备可以接到计算机或视频会议设备上,在交互检查中提供帮助。就好比,远程耳镜可以让远方的医师“观察”病人耳中情况,而远程听诊器可以让咨询医师听到病人的心跳。有助于这种咨询的医学专科包含精神病学、内科医学、康复学、心脏病学、小儿科学、妇产科学以及神经学。

保存并转发的远程医疗包含获取医学数据(如医学图像、生物医学信号等等),然后在方便的时候将这些数据发送给估计不在线的医生或医学专家。该方式不需要双方同时在线。皮肤医学、放射医学和病理学是有益于异步远程医疗的一些普遍专科。一个结构适当、更适宜电子形式的病史档案将是这种转发中的一个必要因素。.

远程医疗对于那些生活在孤立社区或偏远地区的人群最为有帮助,而且事实上目前正应用于所有医疗领域。有关远程医疗的运用都有一个特性,就是用”tele”(远程)做前缀,比如,放射学家使用的远程医疗就被称为远程放射学。同样的,心脏病学家使用的远程医疗就被称为远程心脏病学,等等。

远程医疗也是全科医生与远地专家之间有用的交流工具。

远程医疗的焦点主要是咨询,意味着全科医生向专家咨询,或者一位专家向另一位专家咨询。使用已知的设备,如血压计,在家中监控病人并把信息传给看护人员的方式正成为一项快速发展的服务。这些远程监控方案主要是针对当前高发病率的慢性病,并主要在第一世界中运用。发展中国家正在出现一种新的远程医疗实施方法,常称为“基本远程诊断访问”,通过该系统用设备对病人进行检查,而实际上由另一个国家的联线医生来进行检查和治疗。这一新的医疗实践技术和原则,给一些问题的解决,比如向非洲南部区域提供基本保健服务的问题,带来了一大希望,因为基本远程诊断咨询不仅可监测已诊断出的慢性病,还可对病人通常会求助于全科医生的疾病进行诊断和管理。 远程放射学

远程医疗是指远距离的传输保健方法和交流保健信息。远程放射学则是一种将射线图像(X光)从一处传到另一处的功能。要实现这个过程,需要三个基本要素:一个图像发送站点、一个传输网络、和一个接收/图像重新检查站点。

远程放射学的实现从图像发送站点开始。这个第一步需要射线图像和一个调制解调器。图像进行扫描,然后发送到调制解调器。

传输网络可以是电线、光缆或微波。在数字信号发送到调制解调器之后,电脉冲会通过传输网络发送到接收/图像重新检查站点。接收/图像重新检查站点由一个调制解调器、一台有充足存储容量的计算机,一台显示器组成,有时也有一台打印机以给终端用户提供硬拷贝。通过传输网络生成的电脉冲由重新检查站点的调制解调器接收。在到达重新检查站点后,这些脉冲将会转换为原始的数字图像,然后这些图像将被存储,并可在诊断时通过显示器观看。硬拷贝被打印出来以提供更多的便利。

显然,随着关注远程医疗仪器的公司数量的增加,以及这些公司专业度的上升,可以预见在不远的将来,远程医疗将成为医师、医院及兽医诊所运作的一种重要的方式。

16

Unit 14-2

第二部分:计算机层析成像

层析成像指的是通过从许多不同方向照射物体,根据透射或反射的数据对物体断面成像。这一技术对诊断医学的影响是革命性的,因为它使医生能以前所未有的精度看到体内的器官,并且对病人来说是安全的。层析成像最初的医学应用是用X射线对组织进行成像,这是基于X射线被人体组织的衰减系数实现的。后来利用放射性同位素、超声、磁共振也成功地实现了医学成像,在每一种情况下用不同的参数成像。

还有大量的非医学应用也可使用计算机层析成像方法。研究者已经将此方法用在许多方面,例如通过钻孔成像测绘地下资源,无损检测中断面成像的某些特殊案例,确定天球面上的亮度分布,以及电子显微镜三维成像。

层析成像基本上是一个由投影重建图像的问题。严格来说,某一角度的投影是图像在该角度所指定的方向上的积分,如图14.1所示。然而在宽泛的意义上,投影是指物体从某一角度受到照射时由发出的能量所形成的信息。若辐射源是衍射性的如超声波或微波,可使用“衍射投影”一词。

虽然从纯数学的角度,对于如何根据投影数据重建图像这一问题的解要追溯到1917年Radon的论文,但当前在断层成像方面令人激动的成就源自Hounsfield发明的X光CT扫描,他因此项发明而于1979年获得了诺贝尔奖。他和与独立发现某些算法的Allan Cormack分享这项大奖。他的发明显示,尽管投影数据并未严格满足高效实现重建算法赖以成立的理论模型,仍有可能计算精度达千分之一的高质量断面图像。该项发明同时也表明,有可能通过用相当复杂的数学运算处理大量测量数据(现在对X射线CT接近100万之多),仍然可获得非常精确的图像。

可以说自从Hounsfield的发明以来,X光CT图像改进的快速度在很大程度上要归功于重建算法方面的发展。Hounsfield用代数方法重建了大小为80?80的噪声颇大的图像,精度为百分之一。随后是卷积反向投影算法在这种成像中的应用,这些后来的算法最初由Ramachandran和Lakshminarayanan发展起来,以后Shepp和Logan使之被广泛采用。这一算法大大减少了重建所需的处理时间,得到的图像在数值上也更为精确。其结果是X射线层析成像扫描装置的制造商开始生产能重建256?256和512?512图像的系统,所形成的形态细节清晰可辩,并与解剖结果完全一致,在这一意义上这些图像几乎达到了照相术上完美的程度。

在X射线CT取得巨大成功的情况下,近年来更多的注意力集中于将这一成像技术进行扩展,一方面扩展到核医学和磁共振中,另一方面扩展到超声和微波领域。在核医学中,我们的兴趣在于重建人体内放射性同位素分布的断面图像;在磁共振成像中,我们希望重建对象的磁学性质。在这两个领域都可以建立起如图14.1中这类投影来重建图像的问题。用超声波和微波作能源时,尽管其目的和X射线CT相同,即重建某一参数(例如衰减系数)的断层图像,但情况却有所不同。X射线是非衍射性的,也就是说它们沿直线传播,而微波和超声却具有衍射性。当使用衍射源照射物体时,尽管当场的不均匀范围远大于波长并用折射率作为成像参数时,可以满足于直线传播的假设,波实际上是向四面八方散射的。对于必须考虑衍射效应即由波散射引起不均匀性时,层析成像原理上可以用基于Fourier衍射定理的算法实现。

17

Unit 15 遥感

Unit 15-1

第一部分:遥感技术综述

在150多年前,现代遥感技术伴随着照相机的发明应运而生。尽管一开始,很早期的照片是地面的静态图片,19世纪40年代,为了绘制地形图,当照相机被放在系留气球上来拍摄照片,俯视地球表面的想法和实践开始了。19世纪末最新的平台也许是在欧洲作为新奇事物的著名的鸽子群。到了第一次世界大战,安装在飞机上的照相机能够提供相当大表面区域的俯视图,这在军事侦察方面是价值无量的。从那时到20世纪60年代早期,航空照片是从垂直或倾斜角度描绘地球表面的唯一标准工具。

人造卫星遥感技术可以追溯到太空时代早期,实际上,它最初是在太空飞船上使用多种传感器对表面成像的方法。20世纪60年代,随着太空计划出现,环球轨道宇航员很像旅行者通过太空船的窗口进行拍照。

现在“遥感”这个词被普遍用来描述在不与目标直接接触的情况下,对目标进行识别、观察和测量的科学技术。这一过程包含检测和测量从远处目标反射回来或发射出来的不同波长的辐射,由这些辐射,可按种类、物质、空间分布对目标进行识别和分类。 辐射

除非是绝对零度(?273?C),物体总是以一种特殊的方式反射、吸收和放射能量。这种能量,被称为电磁辐射,它以波的形式发射,其能量能够从一个地方传输到另一个地方。例如,树,空气,太阳,地球和所有的恒星和行星都一直反射和放射大范围的电磁波。这些波是由亿万个振动的电子、原子、分子发出的,它们以独特的波长组合发出和吸收电磁辐射。一个物体发射电磁波的量主要依赖于它的温度。物体温度越高,电子振动就越快,发射出的电磁波峰值波长就越小。 电磁波谱

电磁现象的基本单元是光子,它是某一波长的电磁波能量可能的最小量。独个光子能以波的形式运动,速度可达光速300,000 km/sec,就像波浪在海洋中传播一样。一个光子的能量决定该光的频率。光子的能量越大,该光的频率就越大,反之亦然。

完整的电磁波排列组成电磁波谱。之所以称其为电磁波是因为它们包含了当带电粒子(电子)加速时产生的组合的电波和磁波。电磁波谱划分成几个区域并分别命名。在高频端是γ射线和x射线。在紫外线区域的电磁波的波长范围大约从1纳米到0.36微米。可以很方便地用以下两个单位度量频谱的中频段:微米,它的长度相当于一米的百万分之一,或者是纳米,它的长度相当于一米的十亿分之一。可见光区域的范围从0.4微米到0.7微米。红外波段的范围为0.7微米到100微米。红外线在其较短波长上(接近0.7微米)可以用特殊的薄膜探测,而在其较长的波长上感觉是热量。

以毫米到米为单位来测量较大波长区域。微波区域从1毫米到1米,它包含了用于雷达系统的所有波段,雷达系统是自己主动产生辐射,发射到感兴趣目标并从感兴趣目标反射回来。频率最低

18

的区域,波长大于1米,称为无线电波。 吸收带和大气窗口

有几种电磁辐射很容易地穿过大气层,而其他的则不能。大气层允许辐射穿越的能力随辐射波的波长或类型而变化。构成大气层的气体吸收某些特定波长的辐射而允许另一些波长的辐射通过大气层。

能够被水蒸汽,二氧化碳和臭氧等大气层气体吸收的电磁波谱区域称为吸收带。吸收带传输量很低,对应于特定的波长范围。

对比于吸收带,有些电磁波谱的区域,大气对于特定的波长是透明的。这些波段称为大气窗口,因为它们能让辐射很容易穿过大气到达地面。

大多数装在飞机或太空平台上的遥感仪器工作在一个或多个这样的“窗口”范围里,这是通过将其检测装置调谐在能穿透大气层的特定频率(波长)上而实现的。当遥感仪器的视距覆盖到正在反射太阳光或放射热量的物体时,这种装置就收集和记录辐射的能量。然而大部分的遥感系统都被设计用来收集反射能量,某些传感器,特别是那些气象卫星上的传感器,直接测量吸收现象。大气对部分中红外和所有的远红外波段的电磁波辐射几乎是不透明的。相比之下,在微波段的大部分辐射不受阻碍,因此雷达波能到达地面。 像素,比特和颜色

利用无线电波,从地球轨道卫星得到的数据能以一种常规的方式发送到具有适当装备的地面基站。当接收到这些数据后,它们被转换为能够在电脑屏幕上显示的数字图像。卫星图像由许多小方块组成,每一个方块拥有不同的灰度或颜色。这些方块称为像素,表示那部分图像记录的相对的反射光能量。

每一个像素描述图像上的一个正方形区域,它是传感器分辨不同尺寸对象的能力的度量。比如,在Landsat卫星7上的增强型专题制图仪拥有最大为15米的分辨率,因此每个像素描述的区域为15米*15米,或者225m2。较高的分辨率意味着传感器能辨别更小的对象。通过合计一幅图像的像素数目,能够计算某个场景的范围。例如,如果你能计算在人造彩色图像中的绿色的像素点数目,你就能计算整个植物带的覆盖范围。

太空船使用8位二进制数字,它的范围为00000000 到 11111111(即十进制中的0到255)。用8比特的数据,我们将图像中最暗的点赋值为0,最亮的点赋值为255。这就在黑和白之间产生256个灰度值。正是这些二进制数字使得太空船可以发回各行各列的像素,而通过电脑能明白每个像素数值。

大多数遥感图像的另外一个重要因素是颜色。虽然变化的黑白图像具有较大的信息量,但人眼能区分的不同灰度色调局限在大约20到30级。另一方面,人眼能区分20000或更多的色彩,这使得目标物体内小的但往往是重要的变化会被辨别出来。

因为不同的频带(或波长)拥有不同的对比度,计算机能从黑白遥感数据中产生彩色图像。计算机屏幕能使用蓝光,绿光和红光显示三种不同的图像。结合这三种光波长将产生我们眼睛能看见的彩色图像。这是通过显示黑白卫星图像完成的,它与蓝,绿,红光的不同波段相对应来实现波段间的相对对比度。最终,当这三种颜色结合在一起,一幅彩色图像,称为伪彩色图像,就产生了。 遥感方法

19

有两种遥感仪器——被动的和主动的。

被动仪器检测从观测场景反射或发出的自然能量。被动仪器只感知被观测对象发出的辐射或来自某个源而不是仪器的被对象反射的辐射。反射太阳光是被动仪器最常检测的外部辐射源。科学家们常使用各种各样的被动遥感仪器。

1.辐射计:一种在频谱某些波段上定量测量电磁辐射强度的仪器。辐射计通常又按其覆盖的频谱范围来区分,例如可见光、红外、微波。

2.图像辐射计:一种具有扫描能力,能提供用以生成图像的像素二维阵列的辐射计,称为图像辐射计。扫描可以机械实现或用探测器阵列电子实现。

3.分光计:一种设计来检测,测量和分析入射电磁辐射光谱成分的仪器,称为分光计。通常,图像分光计用光栅或棱镜分散辐射来分辨光谱。

4.分光辐射计:一种能测量在多重波长段中辐射强度的辐射计。这些频带经常具有高分辨率,是为特定参数的遥感而设计的,如海面温度、云地特性、植被、大气层的微量化学成分等。

主动仪器自己提供能量(电磁辐射)来照射要观察的对象或场景。它们从传感器向目标对象发送一个脉冲能量然后接收被对象的反射或反向散射的辐射。科学家们使用许多不同种类的主动遥感仪器。

1.雷达(无线电探测和搜索):雷达用一个工作在射频或微波频率的发射机来发出电磁辐射,用一个方向性天线或接收器来测量从远处目标反射或反向散射回来的辐射脉冲的到达时间。由于电磁波以光速传播,到达对象的距离就能被确定。

2.散射仪:散射仪是一种高频微波雷达,专门设计用来测量反向散射辐射的。海平面上在微波频谱区域对反向散射辐射的测量能够获得海平面风速和风向图。

3.激光雷达(光检测和搜索):激光雷达利用激光发射机发射光脉冲,带有敏感检测器的接收机来测量反向散射或反射光。到达对象的距离通过记录在发射的和反向散射的脉冲之间的时间决定,并用光速来计算传输的距离。激光雷达能测定气体中的悬浮微粒,云层和大气的其他成分的大气概图。

4. 激光测高计:激光测高计利用激光雷达测量仪器平台离开表面的高度。通过独立地获取平台相对于平均地球表面的高度,就能确定地表面的地形图。

Unit 15-2

第二部分:使用遥感技术监控全球变化

为了适当地反应自然和人为因素对湿地的影响,资源管理者必须考虑他们的方法和评价,遥感技术是一种重要工具来监控湿地对于全球气候变化和海平面上升造成的在水文情势和水质方面的变化的反应。

大片的湿地,沼泽和红树林覆盖美国大部分的海岸线。海岸湿地除了作为营养物的重要来源以外,它还是鱼类和虾类的繁衍地以及许多鸟类,毛皮动物的栖息地。它们对沿海休闲也是重要的,并且能保持水质,成为防止海岸侵蚀的屏障。

在美国,湿地萎缩是由沼泽的填充,开挖水渠、河道,河流淤泥向海面转移造成的。土壤保持

20

的实践和防洪结构,比如说大坝和防洪堤,都防止沉淀物到达湿地。夹杂着这些人类因素的作用,海平面的上升更是对海岸湿地会造成严重的影响。值得关注的是,海平面在全球以每年1mm到2mm的速度上升。然而,预测这种上升的速度还在继续增长并且到2100年海平面将升高50cm。这些问题特别切合于海岸湿地,在那里横跨内陆每一公里的海拔高度上升可能只有10厘米。 如果温室效应被证实是全球气候变化的部分原因,还要超出这些(上升的)水平。

海岸水文地理学受控于表面形貌学,地表水系,土壤特征和本地潮汐动态学。随着海平面上升速度的加快,潮汐动态会对低的海岸湿地的水文变化起主导作用。对这些湿地的影响将导致土壤盐分水平,洪水持续时间和频率以及海水质量也发生变化。因此预测这些变化会对目前和未来湿地动植物种类分布造成怎样的影响是必要的。为了做这些预测,首先确定沼泽地类型和水文地理学的关系是必要的。美国地理调查局科学家们所进行的遥感研究集中于将地面和卫星测量结合起来,开发测量和监视对确定这些联系极为重要的工具。他们也开发了一些技术以形成海岸地形来模拟基于无覆盖连接和海平面上升的假设造成的未来湿地变化。 湿地类型

结合从Landsat TM卫星、彩色红外照片、ERS-1卫星雷达上获取的数据,构建了沼泽和森林体系的累进分类,改进了分类精度,导致佛罗里达州几乎单一黑色的沼泽地中有差异地区的细致区分。在植物特征和水文地理学间的关系能准确描述之前,这类对海岸地形区分的改进是必要的。 植被量

与生物数量有关的植被指数是由被动的微波数据和Landsat TM卫星数据产生。基于红光和近红外光波长的光学TM植被指数主要是与单位面积的绿色物体数量变化相关联。基于测量在6cm 和21cm微波波长发射的能量的微波植被指数,主要是反映植被水含量。图像是非常的相似。如果微波仪器被证实是能够合理评估这些湿地中生物数量的仪器,就能根据这全天候天气和昼夜工作的传感器来开发一个监控项目。 监测洪涝

卫星雷达用于绘制潮汐流地图,这是对海岸植被分布重要的控制。雷达图像直接将沼泽地洪涝与低落的雷达回波联系起来,这些图像是在几乎连续不断的一段时间里对地面水文学测量的记录。结合洪水和表面地形的各点测量,全天候的,昼夜工作的仪器允许动态地监测洪水状态和洪水深度水面的生成。 水面微地形学

用三个洪水范围向量和两个海拔高度等高线构建了低矮海岸沼泽的地形学表面模型,洪水范围向量由卫星图像数字化得到,等高线由美国地理调查局的地形四边形得到。除了突变的边界和超出给定等高线范围的地形高地和低地,747点的测量结果和建模的海拔高度平均约14厘米,但更常见的是平均约8厘米。这个地形精度比当前用于这片区域的150cm地形学方案改善了5/9。 土壤湿度和深度

通过测量微波区域内发射的能量,海岸沼泽和森林系统中地下水层的深度和土壤湿度能被绘图。然而这些结果是初步的,水文地理参数的空间图案是与海岸湿地系统的知识一致的。如果可以证明它是用来测量土壤湿度和地下水深度的可靠评估器,这种技术就能使我们了解这些因素是如何与保

21

持湿地功能相关联的。

通过遥感,就能够动态收集湿地特征状况的信息,这些信息使我们能快速地并反复地评估大片区域的变化。通过提供高速的、低成本的、更新的数据,遥感技术就能提供重要信息来管理由于自然或人为因素影响造成变化的海岸湿地。

Unit 16 计算机:系统和编程

Unit 16-1

第一部分:照管好你的电脑

退到DOS系统时代,计算机相对地容易照管。那你最担心的事情不过是硬盘崩溃或文件列表的破坏。是的,硬盘变成了碎片,不过早期硬盘很小。在那些年(1985-1991),我拥有20兆字节的硬盘。Windows变得越来越普遍,计算机开始演化,很多事情变化很快。计算机小了,硬盘大了,价格低了。

即使今天,计算机仍是一项重要的投资,你应该照管好这项投资。仅需要一点关心,你就可以用很长时间。很容易去做,不需要花费很长时间。长久来看,如果你能照管好计算机,你将会更加喜欢它。因此,让我们看看你能做哪些事情让你的计算机健康,平稳地运行。 整理碎片

无需复杂的解释-硬盘会分成碎片!安装和卸载软件担保它这样。不久会出来“关于…”的文章,但是现在只要知道你的硬盘是注定要分成碎片的。碎片涉及到程序和数据的路径文件,记录在硬盘上。它与你的硬盘在物理上变成碎片不同,但是如果你的硬盘变得太碎,看起来就好像崩溃一样。

当你的硬盘变成碎片的时候,使得你的硬盘工作困难。你的计算机似乎较慢。有时似乎是很慢。不同于其他类型的软件,处理磁盘碎片的软件数量较少。我个人选择Executive Software公司的软件Diskeeper Professional。连接到他们的服务网站,他们也有家庭和企业版的。令我喜欢它的原因是,它有一次设置,终身无忧的特点。在我所有的计算机上,Diskeeper通常每晚10点运行到次日上午4点。我喜欢它因为当我不工作的时候它可以运行,更重要的是我知道碎片整理的完成与否。当我很忙的时候也不可能忘记。因此,无论采取什么方式,都要使你的计算机进行碎片整理。那样会使你的计算机快速稳定地运行,也会使你的硬盘寿命更长。 病毒保护

有很多计算机病毒在传播。也有蠕虫、特洛伊木马和炸弹。此处,我们把这一切都叫做“病毒”。摧毁你的计算机最快的方法之一是没有病毒防护。然而一些病毒最初仅是骚扰性的,而许多非常有破坏性。它们能破坏你的文件和数据,甚至你的硬盘。要保持你的计算机处于最佳状态,只有运行

22

反病毒软件并保持不断更新才是明智的。如果你有反病毒软件却不更新它,那是毫无意义的。就像拥有人寿保险单但不付钱一样。现在有许多反病毒软件:诺顿反病毒、F-Prot 反病毒软件、Windows下的Vexira 反病毒软件,McAfee病毒扫描软件。

我个人用的是McAfee病毒扫描软件,我的每个计算机都在订阅这个软件。我喜欢这个软件,因为联网时它会时时自动更新。它比较有效,迅速,全面。无论你用哪种反病毒软件,请记住最重要的是保持更新。 间谍软件防护

间谍和恶意软件最近成了热门话题。人们关心的是他们的隐私和权利。间谍和恶意广告软件都能够降低你的计算机速度,也能导致其他的问题。得到更多关于恶意广告软件的信息就查看名为什么是恶意软件的文章。当你查看名为什么是间谍软件的文章时,可以找到更多关于间谍软件的信息。重要的是通过运行软件将会排除这些威胁,保护你和你的计算机。仅包括一些程序:间谍软件医生,布鲁特反病毒软件,GhostSurf软件。

我个人喜欢GhostSurf 2006版,因为它能防止恶意广告软件和间谍软件,并且在网络上保护我的隐私。无论用哪种软件,请确保更新它。 注册清除和修复

Windows注册包括你计算机上的每一件事的总和。不幸的是,它有时也包括在你计算机里用过而没有被清除的东西。这些垃圾增大了注册的容量使其运行很慢。就像碎片硬盘一样。因此,为了使你的计算机处于最佳状态,我建议用程序清除注册。仅有几个软件可以应用,包括:注册机、注册急救、Windows注册修复SE、注册修复、混合程序。

现在有几种比较好的程序可以执行多种功能,使你的计算机稳定地运行。这些软件能清除注册,移动垃圾文件,改变Windows搜索和运行的路径及其他功能。我最喜欢的几个包括:TuneUp系统优化软件、高级系统优化、系统修理工。

我用的是最近发布的2006版TuneUp系统优化软件,它能够清除垃圾文件,清除记录,分析启动项以及做其它更多的事。 结论

你的计算机是你应该照管的一项投资。如果你好好照管它,它将会对你帮助很大,寿命更长。通过整理硬件驱动,病毒和间谍软件防护,清除注册,移除垃圾文件,你能够使你的计算机以它本来的速度运行。

Unit 16-2

第二部分:计算机导购指南——PC与苹果计算机 介绍

计算机是21世纪人类日常生活的一个重要部分。我们每天都把大量的时间用在计算机上,用它来工作、学习。我们所使用的绝大部分计算机都被称作个人计算机(简称PC)。随着IBM在1981年推出了PC,个人计算机市场的序幕也由此拉开。自那时起,市场上的计算机公司和计算机制造标

23

准就不断地起起落落,兴盛交替。后来就形成了2套标准:由苹果公司制造的苹果计算机,以及由其他公司制造的PC。

在1984年,苹果公司设计制造了第一台名为Macintosh的个人计算机。自那时起,苹果公司就是唯一一家制造,销售和支持Macintosh个人计算机的公司。苹果公司拥有对Mac/Macintosh机中包括硬件和操作系统在内的完全控制权。

其他的就是那些我们所熟悉的电脑制造商,如Dell,IBM和Gateway等。在这个指南中的剩余部分,当提到PC时,指的就是这些公司制造的计算机,而不是苹果公司制造的计算机。这些公司出售由各外围设备公司提供部件而组成的计算机,将它们集成在微软视窗操作系统之上。没有一家公司拥有对PC中硬件的完全控制权。 过去

尽管对所有硬件和操作系统拥有完全的控制权看起来是一个好主意,但这一方针最初使苹果公司受挫。二十世纪80年代和90年代,PC的发展基本上主宰了个人计算机市场,使苹果公司所占市场份额远远落后。由于市场上苹果计算机的数量不够多,再加上苹果计算机的可选择软件少,许多常用软件都无法在Mac平台上使用,但是PC能够兼容各种软件。

封闭性的平台而没有竞争,加上可选择软件不足,使得许多有兴趣购买个人计算机的人对苹果计算机印象不佳。于是就有了苹果计算机不如PC兼容性好的看法。 现在

然而个人计算机市场从新千年开始就越来越有活力。更多的PC制造商能够进入这个市场,并保持竞争力。微软视窗操作系统和Intel奔腾处理器成为个人计算机的制造标准。尽管苹果公司仍通过对硬件和操作系统的完全控制权来保证Mac平台封闭,苹果计算机已具有自己的特色:极佳的稳定性和视觉效果。是否是封闭式平台没有关系,苹果计算机现在可以做PC能做的任何事情,因而摆脱了与PC不兼容的印象。

苹果计算机和PC很好共存于当今世界,硬件兼容,软件有效。 为什么要买PC?

几乎所有人都熟悉今天的PC。PC就是一台由Dell、Gateway、Compaq等公司所制造的带有微软视窗平台的计算机。微软视窗是一个标准的软件操作系统, 大量现有软件都是为这个操作系统设计的。如果你要用计算机来完成某些工作,你必然可以找到许多在微软视窗平台上工作的软件帮助你完成这个工作。PC是现在最常见计算机类型,对软硬件有极佳的兼容性。

购买PC的主要优势在于PC能够兼容个人计算机市场的所有软硬件。 为什么要买苹果计算机?

在过去的几年里,苹果计算机的质量和速度都得到很大提高。从Mac OS X及最新的iMac和G3/G4/G5系列苹果计算机发布以来,苹果公司在把计算机使用变得简单轻松方面取得巨大进步。现在苹果计算机的操作就很简便,而且平均出错率也低于PC。苹果公司也同样致力于提高可选择软件的数量,因此现在有大量软件可同时应用于PC和苹果计算机。

购买苹果计算机的主要优势在于苹果计算机更易操作,出错少,也可以做PC能做的任何事情。 结束语

24

当你购买一台计算机时,你要知道无论是PC还是苹果计算机都有它们各自的优缺点,没有一个明显的界限来帮你做出决定。

在做决定时,你要知道PC和苹果计算机能做相同的工作。无论是浏览因特网,收发电子邮件,即时聊天,创建文件或者演讲文稿,收听、编辑或创建一段音乐或视频,PC和苹果计算机同样可以做好这些事。

最终的决定往往还是由个人偏好决定的:你想要一台使用简单轻松的计算机,还是想要一台可以与市场上任何软硬件都兼容的计算机呢?

Unit 16-3

第三部分:面向对象编程语言

面向对象编程语言(OOPLs)实现面向对象设计的自然选择,因为它们直接支持类、继承、信息隐藏和动态绑定等对象概念。因为面向对象编程语言支持这些对象概念,这使面向对象的设计更易实现。用面向对象编程语言开发的面向对象系统,在系统的设计和实现上难度较小。这就提高了该系统的可维护性:通过改进软件系统及其组成,我们可以修改系统错误,提高系统性能或其他系统特性,使系统适应变化的环境。这项技术的根源可以追溯到19世纪60年代早期,Nygaard和Dahl开发了第一个面向对象语言Simula 67。19世纪70年代随着施乐公司的Smalltalk的开发,这项技术得到新的发展。现有的面向对象编程语言有C++,Objective C,Smalltalk,Eiffel,Common LISP对象系统,Object Pascal,Java 和 Ada 95.

传统编程语言和面向对象编程语言都可用以编写面向对象的应用软件,但在面向对象编程环境下编写会更简便。面向对象编程语言的专家把面向对象编程语言分为混合编程语言和纯面向对象编程语言两类。混合编程语言是在非面向对象模式的基础上,加入一些面向对象概念。C++(C语言的超集),Ada 95,CLOS(LISP的对象加强版本)都是混合编程语言。纯面向对象编程语言是完全基于面向对象准则的编程语言。Smalltalk,Eiffel,Java和Simula都是纯面向对象编程语言。

在应用数量方面,最流行的面向对象的编程语言是C++。它用于商业开发的一大优点就在于和人们熟知并已使用的C语言句法相似,从而降低了培训费用。此外,C++支持包括类,继承,信息隐藏,多态性和动态绑定等所有面向对象概念。C++的劣势在于它多态性和动态绑定的程度未达到大多面向对象程序员的期望。Ada 95 是一个可靠的标准化语言,适用于开发大型复杂可靠的系统。

除C++,Ada以外,另一个常用的编程语言就是Smalltalk。它的优势在于它的一致性和灵活性,其劣势在它不为大部分人所熟悉,这就提高了培训费用。此外它与现有系统不兼容,而与现有系统兼容恰恰就是C++的主要优势。

我们强烈推荐用面向对象语言来实现面向对象分析(OOA)和面向对象的设计(OOD)。AT&T贝尔实验室使用面向对象的设计和面向对象编程语言,在一个称为CADCS的大项目中实现了缩短产品开发时间、提高代码和分析设计所得结果的重用率。这个庞大的项目包含有超过三十五万行C++代码,这些代码可以在遍布美国的超过100个远程系统的一个中央处理器上运行。在CADCS项目两个版本的开发期间,与采用传统软件开发技术和编程语言的相似规模项目相比,OOD技术的应用和随后面向对象编程语言的实现减少了30%的开发时间,节省了20%的开发人力。

25

像贝尔实验室这样的机构发现,通过在导向和训练课程中引入面向对象的编程技术,开发者能够对OOPL构建进行适当(充分)的学习和实验。这就导致了面向对象技术的使用增加,如许多CADCS软件就可以在相似的项目上重复使用。

如Ada 95和C++等面向对象的编程语言都可用于开发传统的非面向对象软件。通过避开面向对象编程语言的特点就可以开发这些软件。有许多现有商业、国防部及政府的应用软件都是这种类型的。

对于用计算机辅助软件工程(CASE)开发工具产生的OOPL代码,开发者必须决定要产生哪种编程语言:C++,Ada 95,Smalltalk,Java还是CLOS。使用某个OOPL会限制CASE工具的选择范围,因为特定的某个CASE工具可能不支持某些编程语言。然而,要是不必考虑语言生成,那么可以基于功能和设计能力来选择CASE工具而不管用什么OOPL来实现。

不同的OOPL支持不同程度的对象概念,如继承,不同的OOD不一定完全按照OOPL来构造。因此我们可以根据使用OOD来选择使用哪一种OOPL。如果OOD还没有确定,那么使用哪种OOPL就由开发者的培训情况来决定。

OOPL在全球许多商业环境,国防部,政府应用及政府项目上得到广泛应用。每个OOPL都有许多相关的资料和培训课程。

在接受OOPL的专业培训和购买相应的编译器后,我们就可以使用OOPL技术了。完全培训开发人员的成本表明,只有对于新开发项目(而不是已有系统的维护),而且只有在试验性项目顺利完成后,才应该引入该项技术。

传统编程语言或面向对象编程语言都可用来开发面向对象和非面向对象的应用软件。为了完全实现对象概念的优势,直接用面向对象的编程语言来写应用软件要显得更为简单。

Unit 17 计算机和网络

Unit 17-1

第一部分:计算机的进展 计算机和信息技术的进展

计算机和信息技术的诞生可以追溯到许多世纪以前。数学的发展引起了计算工具的发展。据说17世纪法国的Blaise Pascal构建了第一台计算机。在19世纪,常被推崇为计算之父的英国人Charles Babbage设计了第一台“分析机”。该机器有一个机械的计算“工厂”,类似于19世纪早期的提花织布机,采用穿孔卡片来存储数字和处理要求。Ada Lovelace和他(Charles Babbage)致力于设计并提出了指令序列的概念——程序。到1871年Babbage逝世,这台机器还没有完成。

将近一个世纪以后,随着电子机械计算机的发展(程序)这一概念再次出现。1890年,Herman Hollerith采用穿孔卡片帮助美国人口普查局分类信息。与此同时,电报电话的发明为通信和真空管的发展奠定了基础。这一电子器件能够用于存储二进制形式的信息,即开或关,1或0。

26

第一台数字电子计算机ENIAC(电子计数积分计算机,见图17.1)是为美国军队开发的,并于1946年完成。普林斯顿的数学教授Von Neumann对(程序)这一概念作了进一步深入的研究,加入了存储计算机程序的思想。这就是存储在计算机内存中的指令序列,计算机执行这些指令完成程序控制的任务。

图17.1 ENIAC:第一台数字化电子计算机

从这一阶段开始,计算机和计算机编程技术迅速发展。从真空管发展到晶体管,大大减小了机器(计算机)的尺寸和成本,并提高了可靠性。接着,集成电路技术的出现又减小了计算机的尺寸(和成本)。20世纪60年代,典型的计算机是基于晶体管的机器,价值50万美金,并需要一个大空调房和一名现场工程师。现在相同性能的计算机只要2000美元,并且放在桌上(就可使用了)。随着计算机越来越小,越来越便宜,计算速度也更快——通过叫做芯片的单个集成电路来实现。 微处理器和微型计算机的发展

微型计算机随着集成电路(或芯片)技术的发展而发展。这一技术使得计算机逻辑被“烧入”芯片层中。一个面积为5 mm2的芯片可以包含计算机处理器运行程序所需的所有逻辑。这一技术突破使得计算机的体积大大缩小,特别是相比于元件连接在电路板上的晶体管逻辑电路。尺寸的缩小使得每秒可以进行数百万次的逻辑转换。

20世纪70年代早期,大规模集成电路问世。这一发展使处理器能安在一个芯片上,也使芯片能用于存储器,代替昂贵的铁氧体磁芯存储器。这些进展导致了微型计算机(或个人计算机)的诞生,最初是针对爱好者市场。在20世纪70年代初,这种机器为家庭和办公使用而生产。所有早期的微型计算机中,苹果和IBM计算机系列幸存下来,并成为市场上主要的计算机。

图17.2 IBM公司出产的个人计算机

操作系统是在硬件(计算机本身)和用户之间提供界面的软件。它管理硬件,使用户能够操控

27

计算机。微软公司为IBM计算机开发了第一个操作系统——微软的DOS系统(微软磁盘操作系统),是目前DOS和Windows操作系统的鼻祖。许多制造商开发了可运行微软公司DOS系统的IBM计算机的克隆(或复制品)。IBM系列是基于Intel 8086芯片系列,这一芯片系列后来发展成为高速奔腾处理芯片。与此同时,苹果计算机公司也创建它的计算机系列。Macintosh系列之后,Apple 2E计算机的问世首次广受市场欢迎,这都基于Motorola公司的68000微处理芯片系列。

随着技术的发展,集成在一个芯片上的电路数量增加了。超大规模集成(VLSI)芯片的转换速率是以每秒数亿次来计算的。VLSI技术使个人计算机的处理速度比早期芯片快数百倍。

增加的处理功能与存储芯片的容量和速度呈同步增长。此外,制造自动化和小型化是重要因素。外围设备(提供输入、输出、存储手段的硬件设备)也在速度和其他功能方面得到发展以保持与计算机本身功能的同步增长。显示器、打印机和存储设备都随已有技术的改进应用和新技术的引入而快速发展。甚至有了外围设备的新品种,如扫描仪和声音合成器,这些新产品进一步增强和拓宽计算机的使用方式。

例如,从仅仅用于文本输出显示的单色显示器到有图形显示功能的彩色显示器的变迁。磁盘驱动器的存储容量惊人地增加了,从原来的以千字节(1000 字节)计算到现在以十亿字节(1,000,000,000 字节)计算。

对于任何计算机主板是主要部件,它包括微处理器和存储芯片。它还包括总线,所有外围设备能连到你的机器的高速链接,以使外设相互通信以及和微处理器通信。有些外围设备是插入主板总线的电路板形式,而其它的是用电缆连接的外部设备。大多数外围设备都有一些主板逻辑。

在微型计算机功能和用途的巨大增长中最令人瞩目的事实是:这种增长在不提高用户承担的价格情况下实现,因为自动化和小型化使得制造工艺的改进成为可能。今天最新的个人计算机与1980年的价钱差不多,考虑到通货膨胀的话就更低。

随着计算机功能变得更加强大,所增加的大部分功能都在软件上得到充分发挥,结果使计算机更易使用。个人计算机的大规模销售依赖于它是用于办公场所或家庭的、不需要对用户进行大量培训的产品。软件发展是从XEROX公司开始,它开发了图形界面和鼠标来选择要执行的操作,而不是使用命令键盘。苹果公司采用了图像用户界面(GUI)的概念并用在它的Mac计算机上。这些“点击”机器制定了一个可用性标准,现在用于每台个人计算机的Windows 图形用户界面仿效了这一标准。

微型计算机技术仍在发展中。以后的计算机可以适应话音的输入和输出。强有力的通信工具的开发和广泛使用使因特网大为普及,计算机网络的普及又引起了(计算机)工业和相关技术的新一轮发展高潮。市场的持续成功依赖于软件的不断开发,使机器更加易用和具有更多功能。微型机软件正朝着人工智能方向发展。一个例子是“聪明”商务软件,它帮助用户分析行为模式数据并将这些模式用于新的情况,让用户据此做出决策。 使用微型计算机

在微机上广泛使用的最早工具是文字处理(软件)、电子表格、和数据库系统。因为用户无需专门编程知识,所以这“(软件)三巨头”使计算机很快变得有用。文字处理软件由简单的写信工具演变成一个具有桌面出版能力的产品。电子表格也已变成了集合统计和财务分析、客户编程和高质量图片制作的标准工具。微机数据库已从一个简单的文档管理工具发展成为在多文档之间处理复杂应用的工具。

28

像Microsoft Office这些集成包能使应用模块“互相交流”。有了这些软件包,你可以在文字处理器中创建报告,其中包括由电子表格所产生的图,电子表格又是根据数据库中选择的数据制作的。更有甚者,你现在可以创建“活”(随时可以修改的)文档。当电子表格中的数据发生改变,报告也改变。工具之间的链接嵌入在文档中。Microsoft公司的这种形式称作“对象的连接和嵌入”。你可以从图形库中添加其它图片,也可以用内建的通信软件通过因特网输入资料。整个文档可用文字处理器或多媒体显示管理器专业地显示。文字处理器也能检查拼写和语法,也可以创建目录和索引。集成包可能还包含专业的显示管理器,它允许你开发幻灯片,在计算机或任何屏幕上展示。 客户/服务器技术使不同的微机可以共享信息、数据库文件、打印机等,并可以互相通信。一种平行开发称作工作组计算,把重心放在软件上,软件使一个组织(机构)中的信息流自动化以方便电子会议和类似的活动。

此外,还有大量更专业的应用软件包,如为图形设计开发的Corel Draw软件;为设计绘图开发的AutoCAD软件;以及为自动记账和结算功能开发的财务软件,如ACCPAC。在医药、教育、艺术和每一个其它的人类活动领域,每天都发现计算机技术的新用途。

平台之间的兼容性问题正在解决。现在,大多数主要软件产品可以处理由主要竞争对手的产品所创建的数据。用户需要从旧版软件产品到新版软件的平稳过渡,因为它们往往在自己计算机的记录上投入很大。综上所述,新版的软件可以自动地转换早期应用软件产生的文件。

Unit 17-2

第二部分:局域网 局域网的需求

局域网的广泛应用背后的驱动力可能是计算机硬件价格惊人的不断下降,再加上计算机硬件能力的增强。计算机系统的价格一年一年地大幅下降,而性能和容量大幅上升。这一不断前进的科技革命已经能开发具有惊人复杂性和功能的应用。例如,需要当今基于微处理器系统的强大功能的桌面应用包括以下几种: ? 图像处理 ? 语音识别 ? 视频会议 ? 多媒体制作

? 文件的声音和视频注解

现在工作站系统支持极为复杂的工程和科学应用,也支持仿真系统,并将工作组原则用于图像和视频应用中。此外,商业事务正在依赖于愈来愈强大的服务器来进行交易和数据库处理,并支持已经取代了以往大型中央计算机的大规模客户/服务器网络。

29

以上所有因素导致功能增强的系统数量的增加,这些系统都在单个工作点:如办公大楼、工厂、操作中心等等。同时,完全需要互相连接这些系统以共享和交换系统间的数据以及共享昂贵资源。

共享数据的需求是(系统)互联非常强烈的原因。计算机资源的个人用户并非孤立操作。他们需要与其他用户交换信息,在准备文件或进行分析时访问多来源数据,与工作组其他成员共享与项目有关的信息。

对昂贵资源共享的需求是网络发展的另一大驱动力。处理器硬件的价格比海量存储设备、视频设备、打印机、以及其他外围设备成本的下降速度要快得多。结果是需要在大量用户间共享昂贵仪器来证明设备的成本(是合理的)。这种共享需要工作在连接用户和资源的局域网上的某种客户/服务器结构。 局域网的应用

局域网的应用种类非常广泛。为了对局域网所要满足的需求种类做进一步深入研究,以下部分讨论了这些网络的几个最重要的普通应用范围。 个人计算机的局域网

通常的局域网结构是支持个人计算机的。由于这种系统的价格较低,机构中个别经理人员常为本部门的应用如电子表格和项目管理工具、访问互联网而独立购买个人计算机。

但是一些部门级的处理器不能够满足机构的所有需求;(我们)仍旧需要中央处理设备。比如经济预测模型一些程序规模太大以至于无法在一台小型计算机上运行。公司范围的数据文件,例如清算帐目和职工工资册,都需要一个中央控制但又可以被大量用户访问的设备。此外,还有些其他种类的文件,虽然是专用的,但必须被大量用户共享。而且有充足理由将各个智能工作站不仅与中央设备相联,还要彼此相联。一个项目或团队的成员需要共享工作和信息。因此,满足以上要求的最有效的方法就是建立一个网络。

部门局域网的所有用户可以共享像磁盘或激光打印机这些昂贵的资源。此外,这一网络(指部门局域网)可以连入更大的公司网络设备。例如,公司可能拥有一个大楼局域网和一个广域的专用网络。通信服务器可以控制(用户)访问这些资源。

支持个人计算机和工作站的局域网在各种机构中已经普及。即使是那些仍旧严重依赖主机的站点也已经将许多处理负荷转移给个人计算机网络。采用个人计算机方法的最好实例可能是实现客户端/服务器的应用。

个人计算机网络的一个关键要求是低成本。尤其是链接网络的成本必须大大低于链接设备的成本。因此,对于普通的个人计算机,链接成本在几百美金是合理的。对于成本更高、性能更好的工作站,较高的链接成本是可接受的。无论如何,这意味着网络的数据传输速率可能受限。总之,数据传输速率越高,成本就越高。 后端网络和存储区域网

后端网络是用来连接像主机、超级计算机和大型存储设备这类大型系统的。这里,它的关键要求是大块数据在小范围内有限数量设备间的传输。可靠性高通常也是需求之一。以下是(后端网络的)一些典型特征:

? ?

高数据传输速率。为了满足大容量的需求,每秒100Mb或以上的数据传输速率是必须的。 高速接口。在大型主机系统和大容量存储设备间的数据传输操作是通常通过高速并行输

30

入/输出接口实现的,而不是通过传输速率较慢的通信接口传输的。因此,站点和网络间的物理连接必须是高速率的。 ? ? ?

分布式接入。要使大量设备以高效和可靠的接入来共享媒体,需要某种分布式媒体访问控制技术。

有限的距离。在机房或少量相邻房间之间通常使用后端网络。

有限数量的设备。计算机房中昂贵的主机和大容量存储设备的数量一般以几十台计。

后端网络通常被使用在需要大量数据处理预算的大型公司或研究机构。由于涉及的规模,工作效率的微小差别意味着百万美元的差异。

考虑使用专用主机的站点。这意味着相当大的一种或一系列应用。随着站点负荷的上升,现在的主机可能被性能更高的主机所取代,可能是一个多处理器系统。对于某些站点,单系统的替代可能无法跟上(负荷上升的脚步)。设备性能的发展速度会被需求的增长速度所超越。设备最终会需要多台独立的计算机。这些再次成为使设备相互连接的强烈原因。系统中断的代价是昂贵的,所以应该具有方便而快捷地将应用转移到备份系统的能力。它必须可能在不降低运行系统(的前提下)测试新的程序和应用。大型的块存储文件必须可以被不止一台机器访问。负载水平应该可能使利用率最大,性能最优。

显然,后端网络的某些关键要求与个人计算机网络的刚好相反。需要高传输速率来跟上通常涉及到大块数据传输的工作。实现高速度的设备是昂贵的。幸亏考虑到联在上面的设备更要贵得多,这种价格还是合理的。

与后端网络相关的另一个概念是存储区域网络(SAN)。存储区域网络是处理存储需求的独立网络。存储区域网络解决特定服务器的存储任务,并创建一个共享存储设备跨接高速网络。整套网络化存储设备可以包括硬盘、磁盘库、和CD阵列。大多数存储区域网络采用光纤信道。有许多服务器也可能是主机的大型局域网设施中,每台主机和服务器都有各自的专用存储设备。如果客户端需要接入特定的存储设备,它必须通过控制这台设备的服务器。在存储区域网中,存储设备和网络间没有服务站点,存储设备和服务器直接链接网络。存储区域网的安装提高了客户存储的访问效率,也实现了存储端与存储端之间的直接通信来实现备份和复制功能。 高速办公网络

传统上,办公室环境包括从低速到中速数据转输需求的各种设备。然而,由于传统局域网的有限速度(最高传输速率为每秒10兆)不够了,办公室环境中的新应用已经开发。桌面计算机的图像处理器使网络数据流史无前例地增加。这类应用的实例包括传真机、文件图像处理器以及个人计算机和工作站的图形程序。考虑典型的一页(文档)上每英寸200个图像单元或像素,(即黑白的点)的分辨率(足够但不是高分辨率的),它产生3,740,000比特的数据,即8.8英寸乘以11英寸乘以每平方英寸40,000像素。即使采用压缩技术,这类(图像处理)仍产生极大的负荷。此外,磁盘技术和价格性能比也已经发展了,十亿字节的桌面计算机存储容量是典型的。这些新的需求提出了对高速局域网的要求,相比于后端系统,这种局域网能支持数量更大、地域分布更广的办公系统。 骨干局域网

分布式处理应用和个人计算机的愈来愈多带来了对局域网的灵活策略的要求。对整个公司范围内数据通信的支持要求具有这样的网络服务,它能够跨越所涉及的距离,并能将一座大楼(或一群

31

楼宇)内的设备相联。虽然假设有可能开发单个局域网来互连所有数据处理设备,但在大多数的方案中这大概不是实际的选择。单个局域网策略有以下几点不足:

? 可靠性。单个局域网中,一个服务中断,即使是短时的,都可能导致用户的严重破坏。 ? 容量。单个局域网可能随着接入网络的设备的数量而饱和。

? 成本。对于互连和通信的不同需求,单个局域网技术不是最佳的。大量低价微机的出现使得可以低价提供这些设备的网络支持。支持低价连接的局域网将不适合满足所有需求。 一个更具吸引力的选择是在楼宇或部门中采用更低成本、更低容量的局域网,并以高容量的局域网互相连接这些网络。后者(这种高容量的局域网)被称为骨干局域网。 工厂局域网

工厂环境正渐渐被自动化设备所主宰:包括可编程控制器、自动化材料处理设备、考勤系统、机器视觉设备和各种形式的机器人。为了管理生产或制造过程,必须将这些设备联在一起。确实是这样,这些设备的性质本身就是能够提供这种互联。微处理器设备有从车间现场收集信息并接受指令的潜能。恰当地使用信息和指令有可能改善生产过程并提供精确的机器控制。

工厂越自动化,通信的需求就越大。只有将所有的设备互联,提供协同工作的机制,才能使自动化工厂运作。实现互联的方法是工厂局域网。工厂局域网的关键特性包括如下几点:

? ? ? ? ?

容量高。

能处理各种数据通信。 地域范围大。 可靠性高。

能够指定和控制传输时延。

总之,工厂局域网是瞄准机会的市场需求,是比典型办公室环境更灵活可靠的局域网。 总结

正如我们看到的,局域网用于支持各种需求和大范围的应用。然而,用于不同目的的基本技术是相同的。共同技术和标准的使用已促进了局域网大范围普遍的激增。

32

Unit 18 英特网和多媒体

Unit 18-1

第一部分:多媒体 多媒体

从前,“英特网”和“多媒体”两个单词很少出现在一句话中。虽然可以从FTP站点上下载GIF图片或声音文件在PC上观看或收听,但是这样的英特网体验离多媒体异乎寻常的娱乐表现还很远。确实,在万维网惊人的流行出现之前,访问英特网就好像是在阅读《华尔街日报》的头版一样:虽然可以获得很多有用的信息,但是形式很苍白,没有图片,单调得无法吸引人的眼球。

1993年,一个叫Mosaic的计算机程序改变了这一切。Mosaic是一个浏览器——允许用户使用英特网的程序。真正的多媒体(包括文字、图片、声音和电影的各种媒体的混合)第一次进入英特网。今天你不但可以下载那些类型的文件,还可以在线体验。你也可以在自己的网页上发布你的信息,包括混合的媒体。

互联网不断流行,但我们大多数只有有限的带宽资源,而在真正的多媒体世界里我们需要快得多的接入速度。在28.8kbps的速度下,下载一个几分钟的视频或音频文件需要很长的时间。所以如果你等着看《乱世佳人》或者听Wagner的《指环》,那还是放弃这个念头吧。用户厌倦长时间地等待文件下载。

由于这个瓶颈,人们只能从网站上获取文本和图形文件。文本和静止图像一般都比较小,因此你不需要等待太长时间就能看到它们,但是等待满是图片的网站,你很快就会意识到这种经历是多么令人沮丧。虽然网站上可能有音频和动画,但是需要快得多的连接速度来发送和接受大型的音频和视频文件,让我们能充分利用英特网多媒体。

请先稍等一下。我们所说的多媒体究竟是什么呢?不严格地说,多媒体就是多种媒体(比如文本、图形、声音、电影或计算机中的任何东西)的调和。当然,我们通过电影和电视早就和多媒体打交道了,但使用多媒体一词则几乎无例外地是与计算机技术有关的。比如数以千计的CD-ROM、电脑游戏和教育软件都提供了与视频、音乐和解说相结合的在计算机屏幕上看到的文本。

多媒体已在英特网上好多年了。但是由于图形,动画和声音文件太大了,往往有几兆,下载这些文件需要耗费大量的时间。因此几年前对于正常的用户来说,多媒体的可利用性被明显地限制了。

对我们来说,真正的多媒体从某种程度上来说就是能够让我们在没有长时间等待的情况下做到我们已经能够做到的一切。多媒体应该成为一个交互式的尝试,但是在低速连接的情况下,英特网多媒体不是真正的交互。真正的多媒体应该以足够快的速度传递信息,在将视频节目传送到你的计算机时不会有时间让你去喝杯咖啡。

多媒体和英特网的紧密结合是有意义的。人们喜欢电脑上的多媒体,多媒体是有吸引力的、有趣的,另外经常使复杂的计算机变得容易使用一些。确实它起作用了:一些多媒体教学程序有意要让那些还刚会走路的孩子们喜爱。一度难看而且只有文字的互联网当然需要有一些图片和声音,再加上容易点击,使它易于被大众理解接受。

33

比如,几年前使用英特网查询天气预报意味着你要知道如何登陆大型计算机或小型计算机,如何远程登陆到一台远程计算机,并浏览一系列基于文字的菜单或提示信息。一旦你掌握好了这个过程,就能很快查询到天气预报,但这种操练可不适合那些缺乏勇气或惧怕计算机的人。而现在为了获得天气预报你需要做的只是运行万维网浏览器然后点击。迎接你的不是冗长的天气趋势的描述而是天气情况的图解地图。这个例子仅仅是多媒体改变英特网的开始。大量消费产品和服务正在使英特网对于所有喜欢它的人更加容易。

大多数人会同意,互联网上多媒体的出现是好事,尽管(某些)老用户可能会争辩说现在互联网的使用方便使得网上空间对于他们的口味而言变得有点拥挤了。然而,英特网上的多媒体已呈现在我们面前。 交互性

交互性的概念非常重要,它提出了多媒体不常被提起的另一方面——实时多媒体。即使是最快、最漂亮、技术最先进的电脑游戏及模拟都是在制作时发生的,为了在特定时间和间隔发生,其多媒体被组合包装和编程。但真实世界是实时的,交互行为不断地发生,事物变化和适应的速度是以秒计的。那些交互怎么样?它们是如何在一系列连接着的计算机上发生的?互联网一开始是被设计成信息共享资源的,而不是一项实时通信技术,这种实时交互怎样才能通过互联网在全球范围实现呢? 这时,Mbone起作用了。

最初,Mosaic的神奇只对拥有强大工作站的用户们有用,但是很快互联网被大量用着普通计算机的普通用户接受。同样地,今天那些拥有强大的计算机工作站和足够宽带可消耗的人们正使用着最新最流行的多媒体工具——实现这些奇迹,如实时视频会议,共享虚拟“白板”的合作和媒体点播服务的程序。 什么是英特网

英特网是世界上最大的计算机网络,它收集了全世界的小型网络,计算机和其使用者。商务在线服务是英特网的重要部分。你的公司或学校的计算机是连在英特网上的。甚至,炸面圈店里坐在你旁边的人也有英特网账号。

英特网上的用户可以互相交换电子邮件,在计算机间复制文件(即使计算机间相隔几千英里),玩游戏,访问信息数据库,在电子酒吧里聊天,还有更多。实际上,在英特网上人们可以使用计算机以无数惊人的方式与其他人交流——从有用的到无用的。一些人每天花费很多时间浏览万维网或在新闻组里阅读和发布消息,只需简单登陆账户你就可能在网上买到从打印机到匹萨的所有东西。 多播和Mbone

在历史上,英特网经历了不只是革命的贡献。首先是使用电子邮件和用户网络的全球通信的革命,随后是FTP和Gopher彻底改革了信息共享,再后万维网改革了信息显示的方式。政府,杂志,电视网络,商业和许多其它组织都转向网络,使之成为联络观众的一种新方法。

但是所有革命中最重要的就是Mbone,它将使英特网成为实时多媒体通信的温床。实质上它已经成为一个标志,用于交互式会场、教室、电视、电影院、视频游戏以及只有在关于信息高速公路的鼓噪中才能梦想的那种寓教于乐。最终,Mbone能实现各种功能。如果我们愿意,就可以在没有联邦通信委员会的许可或发射机的情况下,开始我们自己的网上电视秀;或者可以在在线课堂中教来自十个不同州的学生;或组织全球的研究人员举行重要的在线会议。

34

传统上,英特网已经被建立成每次只给一个用户发送信息。发送的信息总有一个明确的目的地,如电子邮件信息,总是试图联系某个特定的同事。一个访问网页的请求被发送到一个单独的主机,然后主机将请求的信息发回给单个接收者。虽然计算机可以每秒处理上几百万个这类请求,但是信息的传输仍然是一对一的:一台计算机在发送信息,只有一台计算机在接收这个信息。

这样的安排好像很完美,直至你要同时给多个人发送信息时你考虑会发生什么事,比如考虑一个附有图形的邮件。如果你将这个消息发送给在英国的朋友,将占用一定的带宽。现在你可以同时将一封电子邮件发送给2人、3人、甚至20人。如果你将邮件发送给20个人,那么你将产生20倍的英特网传输量。因此,如果一个乐团要将他们的实况音乐会通过英特网传送给15万他们的密友,你可以想象很快英特网就会阻塞。

英特网下一代突破性的工具将是IP多播程序。Mbone程序正是IP(英特网协议)多播的实施落实。IP多播程序改变了道路规则,它使用户能向正在“收听”的任何人,而不是一个特定的个体或计算机,“广播”信息包。只发送一个信息包,它并非被分别传送给每个接收者,而是同时传送给所有的特定目的地。

为什么这么有趣呢?因为IP多播有一种全新的方法在英特网上发布信息。你可以用扩音器向每个想听的用户广播,而不是电子对等的一对一的交谈。而收听的人也可以马上发回信息,不仅仅给你,也发送给其他任何人。

Mbone正蓄势待发,它宣告着世界通信将发生彻底的不可逆转的变化,也可以说它正宣告着自身的革命。

Unit 18-2

第二部分:网络在多媒体应用中的作用 展示多媒体信息

在多数大学校园里,网络的可用带宽是有限的,一般是100Mbps以太网,这就意味着个人用户可用的最大可用带宽大约为10Mbps。随着时间的推移,可用带宽会逐渐增加,人们处理多媒体信息的能力也将更有保证。

有两种常见情景:一种是在教学场所展示多媒体,这些多媒体资料是由网络服务器提供,经局域网转发的;另一种是使用孤立系统。使用网络时有两种主要方法:通过基干网同时组播到许多节点,或是使用多点ISDN结构。无论哪种方案,教学过程都能传送到教学资源共享计划中相互协作的各分散节点上。

基干网(Mbone)技术在互联网上运行,它设计用来连接许多的节点,但是它使用通路(pathway)技术,通过在节点之间尽量共享路由使互联网上的数据流达到最小。Mbone技术可以交互使用,使得每个节点都能在教学过程中与其他所有节点进行交流。

这与同时在众多节点之间进行的多点ISDN会议不同,这里所有的节点都与中央多点控制单元(MCU)相连。MCU的切换通常是用话音驱动,这样有音频出现的节点就向所有接收点发送信息。直到不久以前,这个系统还要求所有节点以相同带宽工作(如ISDN-2的带宽128Kbps),这导致整个网络都以最慢节点的速度运行。最近的技术进展允许进行混合作业,从而使有些节点能在384Kbps速率下以高分辨率工作,同时又允许使用128Kbps设备的小节点也成为远程会议的一部分。

35

教学中使用的多媒体材料可以通过各种不同的网络传送给使用者,可以是内部或校园局域网,也可以是接到不同的区域和机构的广域网,其由教育网( JANET 和 MANs)或公共服务提供商如ISDN来支持。以上的每项技术都将在本文中讨论。

人们认为在教学中提供的支持信息越复杂,对学生来说越有利。复杂性越高要求制作的工作量越大,在展示中要求更复杂的仪器,所以教师总是应当寻求与所用材料相一致的最简单最清晰的表示信息方式。如果信息可完全用线条图表示,那么高分辨率图像对学生就没有什么优越性了。因为多媒体无论是制作还是展示都价格不菲,因此必须确认使用的必要性。高分辨率图像视觉效果优良,但是所添加的细节必须有利于学生知识的增长。

多媒体的优势在于将多种不同的媒体结合在一起,实现信息的同步比如影象和声音的结合,这在总体上使信息得到增强。要记住,“人们”自己就能以好几种媒体自然地传递信息,例如病人会提供有关症状的视觉、触觉、甚至嗅觉信息来表达一种具体的临床症状,同时还会进行描述,并接受有关疾病后果的询问。另一个例子是通过远程视频链路联接到教学场所,这种链路可提供远方的视频和音频信息,例如开放式远程学习技术的应用。

在实践中,恰当地运用多媒体使教师给学生提供多方位的刺激,这使得教学内容更能充分理解,更有趣。在教学中提供更多不同刺激的能力也包括学生自主学习;在电脑屏幕上展现各种彩色图像和声音效果能增强传达给学生的信息。毫无疑问,眼睛总是被各种色彩和形状所吸引,在教学中色彩和形状最常用来吸引学生的兴趣。 网络系统

如果机构里还有过去留下的网络如传送模拟音频视频信号的光纤,它们可以有很好的作为。例如在TLTP INSURRECT项目中仍使用一种叫SONY LVR的视盘服务器来储存静止和活动的图像,并用LIVENET光纤将这些模拟图像传送到教学场所。该项目还通过SuperJANET ATM视频网络将图片传送到编解码器,用于发送到远处的教学场所。SONY服务器可以储存多达54,000帧图像,可以是以静止图像也可以是视频短片。这个SONY系统可以由RS232A命令来控制,这些命令通过局域网或互联网从远处的节点发送过来。这样就能在演讲厅中用笔记本电脑很方便地控制幻灯片的播放,无论是在本单位内部还是进行远程控制。视频序列的播放也可以用互动方式来控制:停止,开始,快进和快退。将来数字网络将逐渐遍布校园,但必须记住:模拟网络很可能提供更大的带宽,因此能传送分辨率更高的图像。

在INSURRECT项目中,使用LIVENET模拟电路在UCLA(洛杉矶加州大学)整个校园里传送视频和音频信号,同时也运用编解码器将信号通过SuperJANET ATM视频网络传送到远处的节点。有一个节点(Bristol)不在SuperJANET上,TCP/IP成功地通过100Mbps的SMDS1链接实现了传输。在早期的实验中,在将音频通道与视频同步中遇到了一些困难,不过随着项目的进展有所改进。

以太局域网在大学校园中很普遍,在这些网络上可基于IP向教学场所提供高分辨率信号,但对于视频信号却没有预留带宽,因此信号质量将随以太网的使用情况而变化。我们注意到,现在的局域网电视会议系统使用校园网络中的IP,但是却使用ISDN网关与远处节点相连,因为ISDN确保可用的带宽保证了图像的质量。

ATM 网络可工作在25Mbps到 155Mbps 的典型带宽下,局域网和广域网皆可。ATM 网络常 1

SMDS stands for Switched Multimegabit Data Service.

36

用作传输媒介,使用多种协议如IP,SMDS和局域网仿真。在某些实际应用中,使用最基本的ATM技术来发送音频和视频信息。在许多校园中运用的是各种不同技术的混合。一种典型情况就是以ATM为主干,连接以太网。ATM主干系统应当尽可能接近主要的教学场所。

在教学中,常需要连接两个以上的节点,此时Mbone和多点结构就很必要了。多点会议使用星形的网络结构,并能够实现交互,因为MCU各个节点支持视频和音频的双向传送。音频信号用来控制声音交换系统中的交换功能。

组播对IP网络特别适用。人们开发了组播骨干网,在各节点间选择路由,使尽可能多的数据流共享同样的路由,在链路最后阶段才分流,以节省网络资源,使数据流量最小化。在理想情况下,组播网络能与所有的节点两两相连,而且这种网络能支持互动的信息交换。 什么是ISDN?

ISDN即综合业务数字网是一种通过电话线实现高速数据连接的电话服务,它基本上是利用已有的联线将电话网转变为全数字式。ISDN能在站点间传送大量数据,由于其固定带宽,可支持压缩的视频传输,因此可保持音频和视频的同步。

ISDN比其它高速传输数据的方式便宜得多,但是比起普通的电话线还是太贵。在某些领域里,能与14.4Kbps调制解调器、传真和电话自动答复机可靠地配合工作的普通电话线被称为POTS,即普通旧式电话服务2。人们曾认真尝试在这样的线路上传送视频,比如可视电话,但是就总体效果来看它的分辨率还达不到教学的要求。

由于ISDN传送的是数字信号而不是模拟信号,所以它不能和常规的调制解调器或电话答复器一起工作,这是它的一个主要缺点。你需要特殊的,昂贵的设备来实现ISDN速度下的各种功能。不过ISDN比标准的调制解调器快得多,而且在世界许多地方都能使用,包括澳大利亚、西欧、日本、新加坡、法国和美国的部分地区。

Unit 19 人工智能

Unit 19-1

第一部分:什么是人工智能

人工智能,简称AI,是一项包含了计算机技术,生理学和哲学的综合技术。AI是一个宽泛的课题,由从机器视觉到专家系统的多个不同领域组成。AI所包含的这些领域的共同点在于它所创造的机器能够“思考”。

为了分辨计算机是否会“思考”,我们有必要定义一下什么是智能。智能在多大程度上包含譬如解决复杂问题、进行概括和建立关系这样的能力?包括感知和理解能力吗?在学习,语言和感官知觉领域的研究帮助科学家们制造智能机器。专家们所面临的最大的挑战之一就是如何制造出一个能 2

POTS: plain old telephone service.

37

够模仿人类大脑行为模式的机器,而人类的大脑由上亿个神经细胞组成,被认为是世界上最复杂的东西。或许度量机器智能最好的方法就是由英国计算机科学家Alan Turing提出的测试。他说,当一台计算机可以骗过人,相信它是一个人而不是机器时便可称得上是智能的。

人工智能由一群专注的研究人员推动着,已由最初的研究走过了很长的一条路。AI的起源在电子学之前,可以追溯到Boole和其他一些哲学家和数学家们,他们根据那些已成为AI逻辑基础的原则建立起了最初的理论。随着1943年计算机的发明,AI开始吸引研究人员的注意。这项技术终于可用于模拟智能行为了,或者看起来是这样。在这之后的40年中,虽然面临过许多困难和阻碍,AI已由最初只有十几位研究人员参与发展到现在有几千名工程师和专家们共同致力于研究;从最初的只能下西洋跳棋的程序发展到今天已设计出可以诊断疾病的系统。

AI技术始终站在计算机科学的前沿。先进的计算机语言,以及计算机接口和文字处理软件都要归功于人工智能的研究。AI研究引出的理论和认识将为未来的计算机科技发展指明方向。虽然现在所制造出的AI产品仅仅只能反应不久的将来研发出的产品的一小部分功能,但是它们迈出了走向未来人工智能的一步。随着人们的不断探索和追求,人工智能已经影响,也将继续影响我们的工作、教育和生活。 有计划地使用AI

我们研究AI应用已有多年,了解了所有的术语和相关的情况。但是我们真正应该知道的是如何着手使用一些AI技术。我们怎样作为个体来使用这些技术呢?

首先,我们必须对面临的变化有所准备。我们的保守往往成为进步的挡路石。AI跨出了对社会非常有用的一步。具有人工智能的机器可以完成需要遵循详细指示和灵活思维警觉的工作。具有学习能力的人工智能可以胜任那些工作,但只有人们准备改变他们的保守观念使之成为可能才行。这让我们想起很久以前人们就接受了轮子这项伟大的发明,而并没有认为它是从文化遗产和传统中带走了什么。

第二,我们必须对AI的能力有所了解。越多地使用机器,需要我们的工作量就越少,随即人类所要承受的伤害和压力也越小。人类是通过尝试来学习的物种,我们必须给AI一个机会来证明AI是对我们的祝福而不是抑制。

最后,我们必须对AI技术有最坏的打算。像AI这样如此具有革命性的技术肯定有许多瓶颈需要攻克。总是有那样一种担忧,以为要是人工智能是建立在学习基础上的,那么机器会不会在得知富有和成功是好事后,去发动战争反对经济强国和著名人物呢?一个新系统有那么多情况可能出错,所以我们必须尽可能为这种新技术做好准备。

而且,即使我们对机器存在畏惧,它们的能力却是无限的。不管我们教AI什么,在未来机器将会提示它是否给出肯定的结果。AI就像孩子一样,需要被教育成体贴的,彬彬有礼的,聪明的孩子。他们应该学会聪明地做重大的决定。作为公民,我们应当保证AI的程序员们都正确地工作着,一切都走在正轨上,这样未来才不会发生意外。 专家系统的范围

专家系统能够像一个专业人才一样工作。而且计算机系统可以很快地训练,实际上没有操作费用,不会忘记学习过的东西,不会打电话请病假,退休或是要休假。除此之外,智能计算机还可以处理大量的信息,而人类不能。

38

但是这些系统可以多大程度上替代人类专家呢?或者,它们可以完全替代人类?例如有人曾经把智能计算机看成是人对核武器进行控制的替身,说是计算机对于威胁可做出比人更快的反应。我们不能忽视拥有一个计算机专家所带来的好处。比如,预报天气借助于许多可变的参数,计算机专家能够更准确地集中他所有的知识。尽管如此,计算机却无法借助人类专家所拥有的预感,预感往往能帮助我们预测结果。

总之,在天气预报或查找软件bug的情况下,专家系统有时比人类更加准确。但是在其他领域,比如医学,虽然计算机对医生的诊断是有用的,但是人类医生仍是不可替代的。可见,在某些范围内专家系统有能力帮助人类,在某些情况下甚至能代替人类,谨慎地使用计算机专家将使人类受益。

Unit 19-2

第二部分:人工智能的方法

人类已赋予自己智慧之人的称号,因为我们的智能对日常生活和自我感觉是如此重要。人工智能(AI)这一领域尝试去理解智能实体。这样,研究它的第一个原因是更多地了解我们自己。但是不像同样关注智能的哲学家和物理学家那样,AI力求构建智能实体并去理解智能。研究AI的另一个原因是这些构建的智能实体本身很有趣,而且也有用。即使是在其发展的早期,AI就已产生了许多重要和令人印象深刻的产品。虽然无人能具体地预测其未来,但很明显,具备或超越人类智能水平的计算机将在我们的日常生活和未来的文明进程中具有巨大的冲击力。

AI涉及了一个终极的难题,即一个又慢又小的大脑或是电脑如何能感知、理解、预测和操纵一个远远比其大而复杂的世界?我们如何使某些东西具备这些特性?这些是难题,但是不同于寻求超光速运动或反重力装置,人工智能研究者有确凿的证据证明这种探索是可能成功的。所有研究者必须要做的事是照一下镜子,看一看镜子里智能系统的一个实例。

AI是最新的学科之一。它正式始于1956年,当时造出了人工智能这个名词,尽管在此以前有关工作已经开展了5年。同现代遗传学一起,AI经常被其他学科的科学工作者称为“最愿意从事的领域”。学物理的学生可能有理由感到所有的好主意早已被伽利略、牛顿、爱因斯坦等科学家提出了,人们需要经过多年的研究才能贡献出一个新的想法。而在另一方面,AI对全身心投入的爱因斯坦们仍有尚待解决的问题。

AI目前包含许多子领域,从诸如感知和逻辑推理等的通用领域,到下棋、证明数学定理、写诗和诊断疾病等具体任务。通常其他领域中的科学家(会)逐渐转移到人工智能研究中来,他们在这里发现了能使他们自己毕生从事的智力工作实现系统化和自动化的工具和语言。与此相似,AI工作者们可以选择把他们的方法应用于任何人类智能化努力的领域中,在这个意义上,它确实是一个通用领域。 什么是AI?

我们现已揭示了为什么AI是激动人心的,但我们还没有说它究竟是什么。我们可能会说:“好,它和编写聪明的程序有关,那就让我们着手来写一些”。但科学的历史证明瞄准正确的目标是非常有益的。早年寻求长生不老药和点石成金秘诀的点金术士恐怕是迈错了步。只有改变目标,用早期天文学家预言星宿和行星运动那样的方法寻求能给出人间世界准确预言的明确理论,科学的方法和有成效的科学才会出现。表19.1给出的定义沿着两个主要的方面发展。上面一行是关于思维过程和推

39

理的,而下面一行涉及行为。同样的,左面一列的定义按照人的表现来衡量(系统是否)成功,而右面一列的定义按照智能的理想概念来衡量,我们将其称为理性。如果一个系统做的是正确的事,那么它就是理性的。

就如人们所预期的,以人为中心的方法和以理性为中心的方法之间存在着矛盾。我们应该指出人和理性行为之间有区别,我们并不是在“情绪不稳”和“精神失常”的意义上暗示人必然没有理性,人们仅仅需要注意我们通常会犯错误。即使了解全部象棋规则,也不会都是象棋大师。而且很不幸,不是每个人在考试时都能得到A。以人为中心的方法必然是一个经验的科学,包括假设和实验验证。理性主义者的方法包括数学和工程的结合。每个群体中的人们有时互相批评其他群体的工作,但事实是每个方向都得到了有价值的见识,让我们更仔细地互相关注。 像人一样行事:图灵测试法

由艾伦·图灵提出的图灵测试是设计用来提供一个令人满意的可操作的智能定义。图灵把智能行为定义为在所有认知任务中达到人的水平,足以骗过讯问者。粗略来说,他提出的测试就是,计算机应该被一个人通过电传打字机询问,如果询问者不能断定那一端是计算机还是人,那么就通过测试。测试的详情以及如果计算机通过测试是否确实就是智能的将在下面讨论。眼下对计算机编程使其通过测试就有足够的工作要做。计算机需要拥有以下的能力:

自然语言处理,使其能成功地用英语(或其他人类语言)交流。 知识表达,存储讯问前或讯问中所提供的知识。 自动推理,利用存储的信息回答问题并得出新的结论。 机器学习,适应新的环境,检测并向外推断模式。

图灵测试故意避免在询问者和计算机之间的直接物理接触,因为对一个人的物理模拟对于智能来说不是必要的。不过所谓“完全图灵试验”需要包括视频信号,这样询问者就可以对被测试者的感觉能力进行测试,同时也包括询问者“通过舱口”传递实物的可能性。为了通过完全的图灵测试,计算机需要有:

计算机视觉,用于感知物体。 机器人的能力,以便到处走动。

在AI中,并未化费太大的努力以尝试通过图灵测试。像人一样行事的问题主要来自AI程序必须与人交互,如一个专家系统解释它是如何得出诊断,或者自然语言处理系统与用户进行对话那样。这些程序必须遵照人类交流的某些通常习惯行事以使他们能被理解。在这样一个系统里基本的表达和推理可能是基于人类模型的,也可能不是。 像人一样思考:认知模型方法

如果我们想说某一程序像人一样思考,我们必须有某种方法决定人是如何思考的。我们必须深入人类思维的实际活动。有两种方法去做:通过内省,当我们的思维出现时抓它们;或者通过心理学实验。一旦我们有足够精确的思维理论,就有可能用计算机程序进行表达。如果程序的输入输出和定时行为与人的行为相匹配,那就证明程序的某些机理也可以在人体内运行。例如,发明“通用解题装置”的纽厄尔和西蒙并不会满足于他们的程序能正确地解决问题。他们更关注于比较程序推理步骤和人解决同一个问题的步骤。这和同时期只关心获得正确答案而不管人们会怎样做的其他研究者形成对比。认知科学这一交叉学科领域将人工智能领域中的计算机模型与心理学中的实验技术

40

结合起来,试图构建人类思维精确并可测试的理论。虽然认知科学本身是一个令人着迷的领域,我们并不想讨论太多。然而,真正的认知科学必定建立在实际人或动物的实验研究基础之上。我们只是要说明,AI和认知科学继续互相促进,特别是在视觉领域、自然语言和学习方面。 理性思维:思考方法的法则

古希腊哲学家亚里士多德是第一个尝试对“正确思维”即不可辩驳的推理过程进行归纳的人。他著名的三段论法提供了争论结构的模式,给定正确的前提就能得出正确的结论。例如,“苏格拉底是人,人终有一死,苏格拉底也如此”。人们假定这些思想法则支配思维活动,它们开创了逻辑学领域。

十九世纪后期和二十世纪初形式逻辑的发展提供了描述世界上各类事物的精确表示法和他们之间的关系。(与常规的算术表示法形成对照,算术主要提供数值相等和不等的表述)。到1965年已经只要提供足够的时间和存储空间,就会有计算机程序以逻辑表达方式描述问题,而且只要有解,就能找到这些解。(如果没有解,程序可能永远不停地寻找答案)。人工智能领域中所谓的逻辑主义实践派期望构造这样的程序以创建人工智能系统。

这个方法有两个主要的障碍。首先,获取非正式的知识而用逻辑表示法所需的正式术语描述它们并不容易,特别是当知识不是100%确定时。其次,原则上能解决问题与实际上真正去解决它之间有巨大的差别。即使是问题仅有几十个事实就有可能耗尽任何计算机的资源,除非有关于首先尝试哪个推理步骤的某种指引。虽然这两个障碍都适用于任何构建计算推理系统的尝试,但他们首先出现在逻辑主义实践派的传统中因为对表达和推理系统的能力有明确定义并有相当好的理解。 理性行事:理性代理方法

理性行事的意思是在给定某人信念的情况下,为了达到其目的而实行的行为。一个代理就是某些感知和行事的东西(这可能是这个词的不寻常的用法,但你将会习惯它)。在这个方法里,AI被看作是研究和构建理性代理。

在AI的“思维法则”方法中,整个重点在于正确的推断。有时做出正确推断是按照理性行事的智能代理的一部分,因为理性行事的方式之一就是合乎逻辑地推出这样的结论:某一给定的行为将能达到目的,然后照此行事。另一方面,正确推断并不是理性的全部,因为通常有这样的情况,没有什么正确的事情要做,但仍然必须要去做一些事。同样有些理性行事的方式,他们不能被合理地称为包括推理。例如,把手从火热的炉子上抽回来只是一种反射行为,这要比经过深思后采取的缓慢行动要成功得多。

所有的图灵测试所需的认知技巧就是允许理性行事。这样,我们需要有能力去表达知识和用它进行推理,因为这使得我们能在各种各样的情形下达到好的决策。我们需要能用自然语言产生易于理解的语句,因为说这一些语句可帮助我们适应复杂的社会环境。我们需要学习并不仅仅是为了博学,而是因为对世界如何运转有一个较好的观念能使我们产生更有效的策略来处理它。我们需要视觉并不仅仅是因为能看见很有趣,而是为了对行为所能达到的效果有一个更好的概念。

41

Unit 20 人为错误和系统设计

Unit 20-1

第一部分:从灾难中学习

虽然泰坦尼克号和兴登堡的灾难已经过去了几十年,但它们却开始引起人们对于现代系统安全工程的极大关注。两者都是当时规模最大的,最先进的技术,相当于今天正在开发并用于许多行业,对安全要求很高的基于计算机控制的系统。这些灾难的例子最可怕之处也许不是那些在事后分析中看到的明显错误,而是它们和近期所发生事故之间的相似之处。

泰坦尼克号沉没最令人震惊之处在于卷入这起事件的人们竟自鸣得意到难以置信的地步。爱德华时代末年是对工程和科学进步充满信心的年代,将如此多生命送上绝路的决定也许正是这种极度自信的结果。然而,曾于1985年发现失事的皇家油轮泰坦尼克号的著名海洋学家罗伯特?巴拉德博士,将泰坦尼克号和发生于1986年1月的挑战者号航天飞机失事这两起事件划上等号,指出正是对技术的过分自信和对自然环境力量的藐视导致了两起事件中指挥者的疏忽。

甚至官方报告也反映出一种毫无根据的自信,报告中讨论了救生艇准备的不足,除了委婉地指出这些救生艇已陈旧之外没有提出任何明显的批评。同样地,报告提到望远镜,泛光灯和其他瞭望员的辅助设备达不到与泰坦尼克号的级别,却没有承认这些是设备上的缺陷。“发生了令人遗憾的事故,但责任在其他方面”这样的基调可以在更近期的许多事故报告中看到。

泰坦尼克号的灾难也提出了一些技术问题。船体外壳的结构是如何定下来的?船舱的数量,舱壁的高度和保证生存的所需设施是依赖什么分析数据决定的?也许对当时的技术水平来说提出这样的问题不公平,但是现代也有相似的案例。例如,(我们可以)把(船)可能发生正面冲撞的假设与汽车制造厂对新车进行撞车试验这种几乎完全一样的假设相比较,对撞车试验的规定直到1997年才得到加强。

兴登堡事件还强调了其他一些同样挑战着现代工程师们的安全工程问题。这些问题中最明显的一个可能就是改变设计后需对安全性做重新评估。在兴登堡事件中,这样的改动有两方面:对先前成功的设计做了修改(放大);当意识到没有足够的氦能使如此巨大的船体浮起来后对设计思路也做了修改。建造如此巨大轻巧的结构对工程提出的严峻挑战令人钦佩地得到了解决,但是却没有考虑到改变采用的纤维处理所造成的似乎很小的影响。特别令人感兴趣的是,在已知静电积累是一个明显问题的情况下,已经注意到了对框架和金属部件提供放电回路。

最近由兴登堡的制造者齐柏林公司所揭露的隐情也很有趣。同样地,也有许多现代的相似案例:诸如Piper Alpha, Bhopal 和Seveso事故等都企图隐藏其善后情况,或者至少能低调地处理先前事故的证据,操作中存在的问题和安全管理的不足。

这些意见可以应用到任何行业的安全工程与管理中。本质上,安全是一种经验性的纪律;运用过去出错时的经验教训可以避免意外,而历史数据正是经验最重要的资源之一。过去150年航空事业的发展正说明了这一点。这些早期的发展是以“试飞-修改-试飞”模式为特征的,也许更确切的是“试飞-但愿存活-修改-试飞”。

42

早期飞行开拓者越是谨慎,越是选择付给别人报酬或试图说服他们来试飞自己的作品。据说1853年George Cayley先生的马车夫在完成了一份简报并驾驶Cayler的一架滑翔机自由地飞过约克郡河谷后提出辞职,理由是:“尊敬的先生,我不是雇来飞行的”。当时事故、受伤和死亡事故很频繁,因为工程师们都在努力掌握飞行的基本知识,而很少关心安全问题。

相比之下,到20世界末飞行已经成为最安全的旅行方式之一。波音客机的数据显示,到1996年底世界范围内已由12343架商业喷气飞机组成了一支庞大的机群,飞行总数达到1630万次。1996年仅发生了30起有乘客或机组人员死亡的事故,造成1300人死亡,达到一百万次飞行中死亡80人的比率。每次事故之后都会组织大规模的调查寻到事故原因,判断是否需要修改飞机设计,增强机组人员的训练或流程来防止类似事故再次发生。这些调查报告广泛的传播以让整个业界受益。

Unit 20-2

第二部分:人为错误的教训

1988年苏联福波斯I号卫星失踪在飞向火星的途中。什么原因?根据《科学》杂志的说法,是因为发射后不久地面控制中心在发往飞船的一系列数字指令中略去了一个字母。由于运气不好,这个字母的缺少使代码被误译,从而触发了测试序列(测试序列存储在ROM中,只是准备飞船在地面上时用于熟悉性能的)。福波斯折戟沉沙,就此无法恢复。

多么奇怪的报告:只是“运气太坏”吗?为什么是运气坏而不是坏的设计?难道不是命令语言设计的问题使这样一起异常事件导致了如此严重的后果?

电噪声对于信号的检测、识别和可靠性的影响是众所周知的。设计者会使用误码检测和纠错编码来解决这一问题。让我们假定是某些已知来源的干扰破坏了传送到福波斯的信号,这样我们就不会去责备地面控制者了。我们会说系统的设计者没有遵从标准的工程惯例,会重新考虑系统的设计,以防止今后再出现这种问题。

人们错了。因为这就是生活的现实。人不是精确设计的机器。实际上人类是一种完全不同的“装置”。我们的强项是创造性、适应性、灵活性。持续不断的警戒、行动或记忆的精确性则是我们的弱点。我们容忍错误的能力是惊人的,甚至在有物理损伤也如此。我们非常灵活、健壮、富有创造能力,具有极强的能力从不完整的和受干扰的证据中寻求解释和理解含义。而导致健壮性和创造性的同样秉性却也产生错误。解释不完整信息的本能虽然是我们的基本优势,却可以使一名操作者以这样一种貌似有理的方式误解系统的行为,从而使这种误解难以被发觉。

我们对人类行为,以及它是如何用于与系统之间交互的了解已经相当多了。人类所犯的好几类错误已经得到确认和研究,可以事先确定,在什么情况下发生错误的可能性会增加。可以设计通信系统使之具有容忍误码、检测误码、纠正误码的能力。类似地,我们可以发明一种容错、检错或使人机交互降至最小的科学。

在我们对信息处理系统硬件和软件的理解方面已经取得了许多进步,但是还有一个缺口,这就是将操作者包括到系统分析之中。一个信息处理系统的行为并不只是设计指标的产物,而是人和系统交互作用的产物。设计者必须将系统中包括人在内的所有组成部分,以及他们之间的相互作用考

43

虑进去。这一领域的各种技术出版物表明了对软件和硬件的关注,可是缺乏对人类功能和能力的强调。许多信息系统的失败要归咎于人为错误而不是设计问题。我们还将遭遇失败直到学会改变我们的方法。

需要做的第一件事就是改变态度。我们称之为人为错误的行为和系统噪声一样地可预测,也许更甚。因此,不要责怪那些恰好与此有关的人,最好还是试图找出导致事故的系统特性,然后修改设计以消除相应危险,或者至少将它对未来事件的影响减至最小。一个主要步骤是将“人为错误”这个名词从我们的词汇表里去掉,重新评价是否应责怪具体人员。第二个主要步骤是制定设计指标,将人的作用考虑在内,并赋予它和系统其他部分相同的重视程度。

根据美国《科学》杂志关于苏联探测火星事件的报道,好像是控制人员的无能造成了事故。《科学》采访了苏联飞船制造厂经理罗尔德·克莱姆涅夫。这份杂志对这次采访的报道是这样的:“发生错误的控制人员受到了什么处分?克莱姆涅夫以阴沉的语气告诉《科学》杂志,他没有被送进监狱或发配西伯利亚。实际上正是他最终找到了程序中的错误。不过克莱姆涅夫说,这位控制人员未能再参加以后福波斯的工作。”采访者提出的问题和克莱姆涅夫的回答预先都已经有了责备的观念。尽管操作者查出了错误所在,他还是受到了惩罚(不过至少没有被流放)。可是编程语言的设计者和所用的软件或方法又怎样呢?没有提到。用这种态度进行处理所产生的问题是,它使我们不能从事故中学到什么,使错误潜伏的情况依旧。

由于“人为错误”而导致计算机系统失败的事件在每个行业都很容易找到,例如核电、航空、商务、股市,当然还有计算机工业本身。在Communications of the ACM(美国计算机协会通信)1989年8月出版的一期中,下列论述出现在新闻追踪栏目中:埃克森石油公司休斯顿总部一名计算机操作员被解雇,该操作员漫不经心地销毁了数以千计文件的电脑拷贝,这些文件中包含与阿拉斯加石油溢出有关的重要信息。然而这位前雇员说他只是替罪羊,在他删除的磁带中没有任何一盘标有“不得销毁”的文字。关于这一事故提供的信息太少,不能得出结论。但如果系统设计中将人的因素考虑了进去,那么磁带的保留就不会仅仅依赖于一条 “不得销毁”的(人为)标签了。这样就既不会发生事故,也不会提供貌似有理的借口了。也许现在是ACM在这一方面带头在计算机系统设计方面采取措施的时候了。ACM的成员中有足够的专长,这些成员包括计算机和公共政策委员会,以及一个专门关注相关问题的研究组:人机交互专门研究组(SIGCHI)。

还有一个方便的起点可以启动这方面的工作。在计算机网络上,Peter Neumann主持着一个很有意义的论坛,即关于计算机和相关系统中公众所面临风险的论坛,作为ACM计算机和公众政策委员会的一项活动。这一“风险”论坛收集、报告、评论各种包括人为错误和设计问题的事故,但这些对于该领域的专业性发展并不具备足够的准确性和权威性。信息来源通常是传媒的报告,而这些报告是不完整的,通常是在全部有关信息收集齐全之前写就的,并受到其他不准确的和有偏向的消息来源的影响。(以上本人引述的《科学》杂志和CACM新闻反映了所有这些不可靠的来源。)通过对设计失败的仔细分析可以得到许多潜在的好处,其他学科领域学会了通过仔细检讨和分析而受益。在回顾“风险”论坛中所讨论的案例中,为什么不将它们用作更好设计的指南呢?

其他行业中正在使用着的好几种系统可以提供一个范例。航空界一个有价值的主要咨询信息源是称为航空安全报告系统(ASRS)的事故汇集(信息库),这是由美国宇航局Ames研究中心(NASA-Ames)运作的,带有Battelle公司管理的计算机可读取的数据库。这里,见证或发生错误或其他有关问题的航空界人员将对事故的描述,以及他们对事故的解释写下来,寄给ASRS。ASRS

44

的调查人员可以召回他们以核对材料的准确性或取得更多的信息。但是一旦信息被确认和澄清,表格中包含提供信息人员身份的有关部分就被返回本人。ASRS还将可确认身份的信息删除,使得人们不可能确定谁是提供消息者和事故的有关人员。这种匿名制度是保证数据库准确性和完整性的关键。因为美国宇航局不具备统制权,而且有保护消息来源机密的良好记录,这一数据库得到了航空界的信任。现在人们如果相信他们的报告将有助于改进航空安全,就会愿意叙述他们自己的行为。驾驶员坐舱和飞机其它部分设计的许多改进都是经过设计者研究了数据库中能找到的错误情况后做出的。

ASRS系统的一个关键因素就是,其中的报告不能被信息提供者的上司看到。其他行业的类似尝试均告失败,因为他们的报告是通过一系列的权威机关提交的,其中包括有关人员的上司或工厂管理层,他们是有偏向的,或者对报告进行处理以减轻责任,或者做出对报告的否定判断。这样一来,关于核工业事故的报告系统对于实际的运作实践就不是一种无偏见的指南。连同确认和澄清体系一起,匿名制度和自我报告制度起到了它的作用,如美国宇航局的ASRS团队(主要由退休的航空专业人士组成)所做的那样。

类似地,美国国家交通安全局(NTSB)也对交通事故进行详细分析,包括航空、高速公路、海运、铁路、输油管。这些报告非常有价值,是相关行业提高安全性的重要因素。(根据法令,NTSB报告不得用于确定事故责任的司法程序。这种保护性措施在当前这种动不动就诉诸法律的社会中,对于调查能进行下去而不用担心其结果会被错误解释或滥用是具有关键作用的。)

ACM是否应当提出类似的动议呢?笔者不知道,因为这个问题和其它行业面临的问题有所不同。但笔者提请ACM对改进本专业的这一方面开展调查。ACM可以采取某种积极的,建设性的行动,提升计算机系统中对人的作用的重视,使之与硬件和软件所引起关注和重视具有等同的水平。

45

本文来源:https://www.bwwdw.com/article/l0g5.html

Top