人机交互技术的哲学讨论

更新时间:2024-05-18 09:43:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

学校代码:10255

学 号:2101386

硕 士 学 位 论 文

DONGHUA UNIVERSITY MASTER DISSERTATION

论文题目:人机交互技术的哲学讨论

A PHILOSOPHY DISCUSSION OF THE HUMAN-COMPUTER

INTERACTION

硕士生 姓名: 王晓雯 学 科 专 业: 科学技术哲学 指 导 教 师: 张怡 教授 答 辩 日 期: 2012年12 月31日

东华大学硕士学位论文

附件一:

东华大学学位论文原创性声明

本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已明确注明和引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律结果由本人承担。

学位论文作者签名: 日期: 年 月 日

I

东华大学硕士学位论文

附件二:

东华大学学位论文版权使用授权书

学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。

保密 □,在 年解密后适用本版权书。 本学位论文属于

不保密 □。

学位论文作者签名: 指导教师签名:

日期: 年 月 日 日期: 年 月 日

II

东华大学硕士学位论文

人机交互技术的哲学讨论

摘 要

计算机技术经过半个多世纪的发展,其在计算能力、软硬件设计方面已经取得了辉煌的成绩,制造成本也大幅下降。如何让高性能的计算机更好的为人服务将是未来计算机技术发展的主要方向。人机交互技术直接关注计算机的使用者,是计算机的终端技术,其理论及理念的发展最终将计算机技术未来的走向。近几年普适计算、虚拟现实、智慧城市等技术潮流中,传统的人机交互理论在很多方面出现危机。

本文认为,传统人机交互理论危机的根源在于,旧的理论范式与新的人机交互的设计理念存在根本的冲突。因而,解决这一危机的首要步骤就是抽取出旧范式和新理论背后最核心的理论预设。

本文梳理了人机交互技术的发展路径以及作为其理论基础的认知科学的基本假设理论,挖掘研究了经典人机交互理论背后的理论假设。通过借鉴塞尔行动哲学的理论,探讨了传统交互理论所遇到的困难与困难背后的本质。通过借鉴胡塞尔和伊德的现象学理论,本文力图从一个全新的视角定义人与智能设备在互动时的关系,以期为新的人机交互设计理念建立适合的理论基础。

第一部分,主要从人交互的技术发展史角度切入,梳理了从人们用穿孔纸带与计算机交流到今天虚拟现实和普适计算技术下的可穿戴交互设备与基于手势的人机交互方式。本文提出,未来一段时间,人机交互技术将主要沿着虚拟现实和普适计算两大技术理念的轨迹发展。这两种技术理念对人机交互技术提出的最大问题就是,如何使

1

东华大学硕士学位论文

人们更自然的与计算机互动,使界面消隐在我们的行动中。

第二部分,主要从认知科学和行动哲学的角度分析了传统人机交互理论的理论预设。并且提出传统人机交互理论之所以不适应新的设计理念,其根源在于其背后隐藏的笛卡尔主客二分的认识论模式。在这一认识论背景下,我们与智能设备互为主客,我们都是彼此的认识对象。

第三部分以胡塞尔和伊德的现象学为依托,重新审视了交互理论背后的行动理论,并且提出从人、计算机、行动对像三者的关系角度理解人机交互的本质。文章末尾提出,在未来普适计算的技术背景下,智能技术将不再是我们的行动对象,而是或者成为我们认识的延伸,或者成为我们认识对象的延伸

关键词:人机交互技术 行动哲学 现象学

2

东华大学硕士学位论文

A PHILOSOPHY DISCUSSION OF THE HUMAN-COMPUTER

INTERACTION

Abstract

After a half century development, both software and hardware of computer has been made amazing achievements. On the other hand, the cost has been declined substantially. Now, the main direction of the computer technology is to make the computer serve the user well. Human-Computer Interaction technique is a terminal technology, which is interested in the users of the computer. For this reason, the direction of the Human-Computer Interaction technology will influence the future of computer technology both in theory and engineering practice. But in recent years, the traditional theory of human-computer interaction faced a lot of challenges, such as, Ubiquitous Computing, Virtual Reality, Smart City Technology etc..

This paper argues that, the root of the crisis of the traditional theory of human-computer interaction is that, there is a fundamental conflict between the old theoretical paradigm and the new design philosophy. Thus, the first step to solve this crisis is to explore the hypothesis behind the old paradigm and the new philosophy.

In this paper, we reviewed the history of the human-computer interaction technology as well as the basic theory of cognitive science, which is the basis of the human-computer interaction theory. We taked the J. R. Sale’s philosophical of action as instrument and explored the crisis and difficulties encountered by traditional interactive theory. Learn from the phenomenology theory of Husserl and Idhe, we tried to establish a new viewpoint for the human-computer interaction design philosophy, what is more, we tried to establish a new basis for human-computer interaction design interactions from a whole new perspective on the definition of people with smart device.

In the first part, mainly from the point of view of the history of the interaction ways form which is from punched tape to virtual reality and ubiquitous computing technology. We argued that, nowadays, the direction of the human-computer interaction technology will be closely connection with the virtual reality and ubiquitous computing technology. And the main problem is how to make the interaction more human nature and how to hide the interface.

In the second part, we discussed the hypothesis of the human-computer interection theory with the perspective of cognitive

3

东华大学硕士学位论文

science and the philosophy of the action. We argued that, the reason of the crisis is that, Cartesian subject-object dichotomy epistemological mode is behind the traditional human-computer interaction theory. With this mode, what we interact with is the computer but not the task.

In the third part, we rely on the phenomenology of Husserl and Idhe, and re-examine the interaction theory behind the action theory. We argue that, we should examine the nature of human-computer interaction with the respect of the relationship of human, computer and the object of the action. We believe that, in the future, the intelligent computer will be an extension of our cognitive system or an extension of the object of our cognition, but not the object itself.

Xiaowen Wang ( Philosophy of Science and Technology)

Supervised by Zhangyi

KEYWORDS: human-computer interaction the philosophy of action phenomenology

4

东华大学硕士学位论文

目录

1 人机交互技术的历史和现状 ........................................... 7 1.1 从图灵机到图形用户界面 ............................................ 7 1.2 交互技术发展方向 .................................................. 8 1.21 虚拟现实技术................................................... 8 1.22 普适计算...................................................... 9 1.23 新技术背景下的人机交互....................................... 10 2 认知范式下的人机交互理论 ......................................... 11 2.1 心智的计算理论 .................................................. 12 2.2 关于行动的哲学讨论 .............................................. 12 2.3 行动的意向性视角 ................................................ 14 2.31 行为与行动................................................... 14 2.32 行动与意向................................................... 15 2.4 认知范式下的人机交互理论 ........................................ 16 2.5 PLAN MODAL ........................................................ 18 2.51 认知范式下的行动观和plan 模型 ............................... 18 2.52 从计划模型到互动模型......................................... 19 2.6 传统交互模型的困难 .............................................. 20 2.61 Situated Action 问题......................................... 20 2.62 语境困难..................................................... 20 2.63 非任务导向的交互............................................. 21 2.64 积极外在主义................................................. 21 2.65 心理内容..................................................... 23 2.66 积极外在主义引起的问题....................................... 23 3 现象学视角下人交互理论的再审视 ................................... 24

5

东华大学硕士学位论文

3.1 人与计算机的关系 ................................................ 25 3.2 再论行动与意向性 ................................................ 25 3.21 行动与行动的对象............................................. 26 3.22 内时间意识与计划的意识....................................... 27 3.23 行动与动感................................................... 29 3.3 伊德的技术哲学 .................................................. 29 3.4 人与智能设备的关系 .............................................. 31 3.41 认识功能(Epistemic Functions).............................. 32 3.42 本体(Ontic)功能.............................................. 33 3.5 从现象学视角看人机关系 .......................................... 33 3.51 强的替代关系................................................. 34 3.52 加强关系、弱的替代关系、补充关系............................. 34 3.52 人的延伸的技术............................................... 36 3.54 本体功能与物的延伸........................................... 37 参考文献 ............................................................ 38

6

东华大学硕士学位论文

1 人机交互技术的历史和现状

1.1 从图灵机到图形用户界面

人机交互(Human-Computer Interavtion),顾名思义,指的是人与计算机的互动关系。因此,无论人机交互技术,还是人机交互理论,都是与基于通用图灵机模型的通用计算机技术同时产生的。

通用图灵机的有三个核心部分:一条带子,一个读写头,一个控制装置。带子分成许多小格,每小格存一位数,读写头受制于控制装置,以一小格为移动量相对于带子左右移动或读小格内的数,或写符号于其上,可以把程序和数据都以数码的形式存贮在带子上。与之前为解决特定问题而设计的专用计算机不同,通用计算机是建立在通用图灵机的数学模型上的。在图灵机模型上的通用计算机包含了硬件设备和软件程序两部分,一台硬件设备就可以对意义世界进行普适化的计算。

50年代,世界相继制造出了多台真实的通用计算机,比如位于费城的“EDVAC”(Ecker and Mauchley)、位于曼彻斯特外号“Baby”的“Small—Scale Experimental Machine”等。通用计算机的出现直接带来了人与计算机的交流问题:如果一台通用计算机能够完成多种不同的任务,那么如何让它知道此刻该做什么呢?在当时,这个问题仅仅是一个技术问题,在理论上没有困难。按照图灵机的设想,我们只需将用二进制数字表示的计算程序打印在纸带上,通过更换不同的程序纸带就可以命令计算机完成特定的任务。第一代交互技术就是建立在计算机语言之上的手工作业输入,人机交互主要通过穿孔纸带进行。

虽然在理论上,我们可以通过程序纸带完全地控制计算机,但这种方式的交互效率和直观性都非常低,并且基本上是以用户的输入为主,并非是人机间真正的互动。复杂的机器语言大大降低了人们使用计算机的效率,为了提高计算机的使用效率,人们改用“符号”(symbol)这一更易于人类理解的方式与计算机交流,在此基础上出现了汇编语言。在汇编语言中,每一个特定符号都代表计算机一组特定动作,编程人员用符号代替了二进制代码进行编程。

人机交互下一次重大变革是文本(textual)交互方式的出现,以及键盘和CRT显示器广泛应用。由之,带来了两方面的变革:首先,在交互语言上,朝着人类日常的语言方式更进一步;更重要的,它们的出现实现了人与计算机间真正意义

7

东华大学硕士学位论文

上的互动。在文本交互方式下,我们不仅仅向计算机输入信息,并且能够即时得到计算机的反馈细腻。美国人机交互技术专家保罗多罗希(Paul. Dourish)认为,文本方式是交互技术的真正开端,因为在这一模式下,人与计算机间形成了一个完整的信息环,这样一个信息环使得人机间的命令与反馈可以持续的进行下去。

随后,由于图形用户界面(GUI)和鼠标的出现,使得人机交互变得更加的直观,交互效率进一步提高。用户图形界面以其所见即所得的特性大大减少了用户记忆信息和输入信息的负担。另外,视窗式的交互界面不仅将人与计算机交互的区域从一维提高到二维,大幅增加了界面的信息容量,而且使得计算机的信息输出方式由串行改为并行,更加贴近了人类自然的信息处理方式。

1.2 交互技术发展方向

人机交互技术的发展,往往是由新的计算机设计理念驱动的。例如,一般认为,“文本交互界面和图形化用户界面的出现,其技术动机是为了适应多通道批处理系统和实时操作系统的要求”1。因此,我们展望未来的人机交互技术,也必须从新的计算机设计理念处着手。

1.21 虚拟现实技术

1965年,麻省理工大学(MIT)的伊万·萨瑟兰(I. Sutherland)在其研究生了论文中提出了虚拟现实的技术思想。他指出:“可以把电脑现实屏作为通往虚拟世界的一个窗口,通过窗口,人们可以看到一个虚拟世界,具有挑战性的工作是让那个虚拟世界看起来真实,在其行动中真实,感觉的向真实一样。”2上世纪八十年代末,随着三维显像技术的提高和一系列感官输出技术的出现,虚拟现实的思想在技术领域展开了大量的实践研究。与虚拟实在相联系的另一个概念是“赛博空间”。首先提出这一概念的学者威廉·吉布森(William Gibson)认为,赛博空间是一个人和设备可以在其中交互的虚拟空间。所谓赛博空间,张怡教授认为“远程显现虽然实现了虚拟实在的虚拟出场,它能够让主体执行远程操作。但是虚拟出场要能够实现,还需要特定的空间。在虚拟技术中,人们通常把虚拟实在出现的空间成为赛博空间。”3 。

虚拟现实技术也称为虚拟环境(Virtual Enviroment)、合成环境(Synthetic Enviroment)或远程显现(Tele-presence),它在技术上基于计算机强大的计算功能,配合数字头盔、数据手套等三维跟踪装置。一方面,人的行动以数据的形式输入计算机;另一方面,计算机则输出视觉、触觉等感觉信号,为人模拟出一个

1

计算机的心智—操作系统之哲学原理p21

陈敬全:《虚拟现实技术与人类认识能力的提高》,《科学》2003年第一期,第XX页。

2

3 张怡:《虚拟实在论》,《现代科技与哲学思考》第141页,上海人民出版社2004年出版,。

8

东华大学硕士学位论文

具有感官真实性的虚拟世界。美国学者迈克尔·海姆(Michael Heim) 认为,虚拟现实技术具有三个重要特征:第一,沉浸感(Immersive),它必须使人真正感觉到身临其境;第二,互动性(Activity),计算机必须及时的处理人通过行为、情感等方式输入的信息,并及时输出反馈,人机界面之间需要有强烈的互动关系;第三,实现远程显现的信息强度(Information intensity)。1

虚拟现实是一种认识主体在感觉意义上的现实世界,它的实现依赖于人在其中能否有真实的感觉,进行真实的操作。交互界面在虚拟现实中扮演了一个关键性的角色。虚拟哲学家迈克尔海姆指出:“界面指的是一个接触点,软件在此把人这个使用者和信息处理器连起来。这可是个神秘的、非物质的点,电子信号在此成了信息。正是我们与软件的交互作用,才创造出界面。”2

1.22 普适计算

如果说虚拟现实技术力图将人带入一个虚拟的计算世界,那么普适计算技术则力图将计算广泛的嵌入(Embed)我们的现实世界。1988年施乐(Xeroc)公司的帕洛阿尔托研究中心(Palo Alto Research Center, PARC)首先开始进行普适计算(Ubiquitous Computing)的研究。PARC的领导者马克·威瑟(Mark Weiser)认为,普适计算最核心的特征是深度的嵌入式计算。未来,智能设备将广泛嵌入我们的生活,并成为我们生活环境的一部分。所谓深度的嵌入,包括两层涵义:其一,是智能设备的广泛性。威瑟认为,随着计算机硬件成本的降低和计算性能的提高,未来的计算机将可能与我们生活所及的一起事物相结合,并且通过网络彼此相连;其二,是不可见性。真正好的工具是那种处在我们意识之外的工具,当我们使用这种工具时,我们的注意力将集中在任务而非工具上。

在威瑟眼里,文字技术和电技术就完美的结合了“广泛性”和“不可见性”这两个特点。今天,从书刊、报纸到广告路牌再到互联网,文字已经无处不在,但这些文字却并不会强求我们的注意,而是在我们的一瞥之间传递信息。电也是一样,我们生活中几乎所有设备都是需要点,我们的房间里、汽车里、电脑里布满了电线,但电只是默默的驱动着这些设备而很少引起我们的注意。威瑟认为,未来的智能设备将像电和文字一样成为一种无处不在的安静技术(Calm Technology)。

近几年,计算机技术沿着普适计算的方向出现了一大批新技术和新概念,例如蓝牙、无线网络、移动数字终端、云计算、数字城市等等。特别是,近两年移动互联网技术的快速普及和苹果公司的成功,使得人们越来越关注九十年代威瑟的工作。甚至有人指出,乔布斯对苹果公司的发展规划就是照搬了威瑟对普适计

1 迈克尔·海姆:《从界面到网络空间》,上海科技教育出版社,2000年出版,第79页。

2

迈克尔·海姆:《从界面到网络空间》,上海科技教育出版社,2000年出版,第79页。

9

东华大学硕士学位论文

算技术的预言。1

笔者认为,随着移动互联网的发展,在今天网络和智能设备在数量和存在的广泛性上几乎已经是无处不在了,但这种普适性却并不是嵌入式的,还没有变为我们生活中不可见的一部分。用户使用智能设备时,虽然不再用学习那些难懂的计算机语言,但是还要进行复杂的交互操作。

1.23 新技术背景下的人机交互

界面不是任务,它本身并不是我们行动的对象,而是隔在我们和任务间的一道墙。它的存在,本身就是一种不幸。在我们行动的现实情境中,迫于某种压力或约束,我们必须要把自己的一部分心智和精力,放到各种复杂的界面与操作过程之中,因而占用了人们许多的注意力,偏离了人的本位需求,降低了互动效率。虚拟现实和普适计算虽然看似两种完全相反的设计理念,但对未来人机交互的要求却是相同的。他们都力求使交互界面消隐在我们的行动中。

在消隐界面的要求下,大量新的交互理念被提出来,同时也产生了许多新兴的或正在处于试验阶段的新技术。可穿戴的交互技术和基于手势识别技术是这些新技术中较为典型的代表。

可穿戴交互方式通过将输入输出设备与人日常穿戴的服装、饰品相结合,使用户在日常行动中随时随地与智能设备互动。与今天常见的基于视窗的交互系统不同,可穿戴计算式一种自适应的人机交互方式,它通过一定的算法自动获取用户行动模型,主动与用户行为相适应。它能够动态适应当前用户和当前任务,为用户提供与手边任务和用户背景知识相关的信息,减少信息过载,辅助用户快速达到目标。谷歌公司于2012年4月发布的一款“拓展现实”眼镜—Google Project Glass(如图1)是这一技术的典型代表。

谷歌眼镜包括了一条可横置于鼻梁上方的平行框架、一个位于镜框右侧的宽条状电脑,以及一个透明显示屏。这款高科技眼镜拥有智能手机的所有功能,镜片上装有一个微型显示屏,用户无需动手便可上网冲浪或者处理文字信息和电子邮件,同时,戴上这款“拓展现实”眼镜,用户可以用自己的声音控制拍照、视频通话和辨明方向。

基于手势识别的人机交互是一种符合人类行为习惯的交互技术。计算机通过传感器识别人的手势,实现人机互动。近年来,这

1

图1: Google Project Glass

关于乔布斯思想渊源与威瑟普适计算概念的关系,请参见博文《乔布斯与普适计算》,

http://www.ifanr.com/34483。

10

东华大学硕士学位论文

一方式在技术和理论两方面都得到了广泛的发展。今天已经成型的手势识别技术大体有三种方式:

1. 基于手套的识别 :这种技术奖传感器置于数据手套内部,通过其扫描分析用户的手势动作。用户通过挥动手指,就可以选择屏幕上的物体。G-Speak技术是基于手套的识别典型代表。

2. 基于表面的识别 : 这种技术的传感器位于智能设备的屏幕下端,用户通过触摸屏幕输入信息。今天的智能手机触摸屏就是这种方式的典型代表。 3. 基于摄像头的识别: 基于摄像头的识别,智能设备通过摄像头扫面用户手势动作,经过一定的算法分析,将用户的手势图像转化成特定的输入信息。这一技术今天在游戏机领域已经获得了广泛的发展。

除此以外,还有很多新的交互理念,如Tangible User Interface,The Workaday World,Attentive environments1等等,这些理念的核心价值都与在于走向自然化的互动。在新的理念指导下,计算机越来越走出用户的视野,界面将消失在我们的行动中。新的理念需要新的理论指导,本文的动机正是要讨论传统人机交互理论是否适应新的交互理念。

2

认知范式下的人机交互理论

在商业计算机的早期阶段,硬件设备价格昂贵且速度很慢,计算机时间(Computer Time)相比于用户时间要宝贵得多。因此传统的人机交互手段,机器始终是人机交互的中心,目的是更有效率的利用计算机。用户不得不迁就和适应机器的输入、输出方式。这样,用户就必须花费大量时间去学习如何操作机器。但在计算机高度普及,硬件设备性价比快速提升的今天,这种方式显然已不再经济。在新的条件下,迫切需要机器回归工具的客体地位,而让人占据人机关系的中心点。关于人机间交互关系的理论和技术研究就是在这个大背景下发展起来的。

人机交互的研究范式形成于上世纪八十年代。专门从事人机交互技术和理论研究的美国学者保罗·多罗希(Paul Dourish)认为,传统人机交互理论有两条理论线索:其一,是计算机科学、认知科学背后的心智计算理论(Computational Theory of Mind);其二,是社会学、人类学及哲学领域关于人的行动的理论。2

1

在维基百科收录了许多最新的交互理念,请参见维基百科“交互范式”词条,http://zh.wikipedia.org/wiki/

交互范式。

2

Paul Dourish(2004). Where the Action is – The Foundations of Embodied Interaction . The MIT Press: 59.

11

东华大学硕士学位论文

在本章中,我们首先简要介绍下认知科学背后的心智计算理论和西方心灵哲学关于行动的讨论,并据此带出基于人的行动的计划模型(Plan Modal)的传统人机交互理论。

2.1 心智的计算理论

心智的计算理论(Computational Theory of Mind)是认知科学、人工智能、认知心理学(包括认知主义和联结主义)背后的共同假设。这一理论框架的成型与发展与许多科学和哲学理论有关,比如图灵测试、功能主义、物理符号系统思想。

1950年图灵发表的《计算机器与智能》一文中,给出了的关于如何判定计算机是否有智能的方法。其基本思想是,在与被试一问一答的互动中,如果计算机能够表现得像真人一样,成功欺骗被试者,那么就可以判定该计算机具有了人类的智能。尽管很多科学家和哲学家并不认为人的思维等价于计算,甚至图灵本人也从未表达过这一观点,但图灵测试的设想却已经它打破了智能与人类大脑的稳固联系。

美国哈佛大学教授希拉里·普特南 (Hilary Putnam) 率先提出了心灵的计算理论。在1960年出版的《心灵与机器》一书中,普特南探讨了心灵与图灵机类比的问题。在文中普特南指出,普适图灵机是一种抽象机器,他在物理上几乎有无数种可实现方式。在1967年的论文《心理状态的本质》中,普特南认为,人的心理状态并不等同于大脑的物理化学状态,而是一种功能状态,这种状态可以在多种物理装置上实现。我们看到,既然通用图灵机和心理状态都是多重可实现的,并且心理状态只是大脑实现的一种功能,那么我们就有理由假设通用图灵机能够实现人的心理状态。

认知科学家哈尼什在《心智、大脑与计算机》一书中将心智的计算理论归纳为两个论题1:

1. 认知状态是具有内容的计算心理表征的计算关系。

2. 认知过程(认知状态的改变)是具有内容的计算心理表征的计算操作。 这一论题的核心假设是,将思维理解为心智中的表征结构以及在这些结构上的计算操作,而这种表征既可以是一定的数据结构(心智的数字计算理论),也可以是神经元特定结构(心智的联结计算理论)。

2.2 关于行动的哲学讨论

关于行动的研究,在西方心灵哲学领域内已经形成了一个专门的分支,即行动哲学。这一领域关心的问题之一就是究竟什么是行动?我们虽然可以将行动简

1

R.M.哈尼什:《心智、大脑与计算机》,浙江大学出版社2010年出版,第8页。

12

东华大学硕士学位论文

单理解为一个人有目的的行为,但这样的回答显然太过粗略。这一领域哲学的研究者们按照一个行为中行为主体所投入的意识、目的、计划的程度,将广义的行动分为四个层次:

1. 无意识行为(involuntary Behavior)

2. 有一定目的导向的活动(Goal Directed Activity) 3. 意向行为 (Intentional Action) 4. 自主的行动(Autonomous Acts)

他们认为,一个有目的的行动的一个必要条件是行为主体对他的行为必须有直接的控制(Direct Control of Behavior)。所谓直接的控制行为,斯坦福哲学百科给出了一个较为简单的理解,稍作整理可以表述为:

“如果某个行为A,组成了一个行动Fing,并且A由一个目的to be Fing引起,并且在整个过程中始终且时时都由这个意向引导,那么我们说行为A是一个被直接控制的行为。”1

例如,我抬起手去拿杯子,那么“我抬起手”的动作就是由“拿(to be catching)杯子”引起,并且在整个活动中都有这个目的所引导。那么“我抬起手”这个动作就是一个被直接控制的行为。

很多哲学家认为,这样的理解虽然符合直觉,但却太弱了。考虑如下一个情况:如果一个人用他活动的左手引导着他麻木的右手移动,那么我们一般说是左手的动作真正的行动,而右手不是。右手的运动只是左手引导的结果,这好比一个人开灯的行动导致灯光亮起来是一样的。行动主体直接控制的是左手的运动而不是右手的运动。但是在这一情况中,右手的运动也是满足上述关于行动的条件的。

阿尔弗雷德·梅里(Alfred Mele,1992)在文章《The Springs of Action》中对这一问题进行了讨论,并修正了这一定义。他认为,我们可以规定引导行动的意向必须近距离的(Proximally)引起和维持行为A。也就是说,它规定了引导行为A的意向to be Fing,不能通过另一个同时的行为A*间接地作用于A。这种限制虽然可以成功的排除掉许多反例,但似乎又太强了,比如我们四肢的运动都是间接通过肌肉的伸缩导致的,而肌肉的伸缩又是神经系统作用的结果。根据这样一个定义,我们的大多数身体行为都很难认为是我们意向的直接结果。

霍恩斯比(Hornsby)认为,真正的行动不是行动主体身体的移动(Movements of an Agent’s Body),而是行动主体移动了他的身体(Moving of His Body)。身体的移动只是主体移动他的身体的结果。这样,对于我们的身体行为,可以认为我的意向导致了我移动我的身体(Moving of My Body),而不是导致了我身体的移

1

本段文字翻译自斯坦福哲学百科词条“Action”. 原文请参见网址:

http://plato.stanford.edu/entries/action/

13

东华大学硕士学位论文

动(Movement of My Body)。也就是说,我外在表现出来的身体的移动—对应alfred定义中的行为A—虽然并不是我意向的直接结果,但我可以说这个意向产生了某种内在的效果—行为A*—正是这个内在的行为A*,而不是A才是我的行动。

除此之外,“直接的”这一要求还会引起另外一个问题,如果某一个行为A是由A*因果引起的,那么它们就不可能同时都是我的行动。有些哲学家(例如塞尔)认为,意向具有因果传递性,他说“根据意向因果性的传递性,我们可以说,在先意向既因为了行动中的意向,又引起了这项行动。“1另外一些哲学家(例如霍恩斯比)则认为,我们移动腿的行动是由我们试图去移动腿这个意向引起和维持的,并且,这种“试图”本身也是一个行动。为了解决这一矛盾,戴维森提出:

“If a person Fs by Ging, then her act of Fing = her act of Ging.”2

这一命题不太好翻译,在这里只能稍作解释,根据戴维森的解释,F和G都是动词,表示主体的某个行为,如果一个人通过某个行动G(Ging)来达到某个目的F (Fs) ,并且这个目的不是某种状态而是我的某种行动,那么我的这个行动F (Fing) 就等价G (Ging) 这个行动。我们可以引用戴维森本人给出的例子加以说明。戴维森让我们设想如下情景:假设有一个人通过照亮屋子来恐吓一个窃贼(alerts a burglar by illuminating a room),为了照亮屋子他打开灯(turning on a light),为了他开灯他按动了开关(flipping the switch)。在整个的情境中,他的恐吓窃贼的行动,等于他打开灯的行动,等于他按动开关的行动。

2.3 行动的意向性视角

2.31 行为与行动

关于行动的哲学讨论的一个基本问题是区分行为(behavior)和行动(action)。对于二者的差别。对于什么是行为,虽然从生物学到心理学再到社会学不同学科因为关注的重点不同,所以对行为的定义略有差别,但并不存在太大的争论。根据行为主义的定义,行为是可以被描述和解释而不涉及任何心理事件或任何内部的心理学过程。3虽然当代心理学表明主体的很多行为都有一定的心理过程参与但我们将这些心理过程抽象掉,只保留主体表现出来的纯客观的动作和变化。

1

塞尔,意向性-论心灵哲学,p96

本段文字节选自斯坦福哲学百科词条“Action”. 原文请参见网址:

2

http://plato.stanford.edu/entries/action/

3

本段文字翻译自斯坦福哲学百科词条“Behaviorism”. 原文请参见网址:

http://plato.stanford.edu/entries/behaviorism/

14

东华大学硕士学位论文

在另一方面,关于什么是行动则存在太多的争论。我们清楚的是,“行动”这个词指称的一定是行为和那种引发并维持和影响着行为的心理过程组成的整体。正如维特根斯坦所问“如果从我举起我的手臂这一事情中抽掉我的手臂往上去了这一事实,那留下的是什么。“从前面的文献综述中我们看到,西方行动哲学研究者们定义一直希望给行动一个准确而又不失常识的定义,但却一直没有取得成功,其最重要的困难就在于很难准确把握这一心理过程。

一个出自常识的观点是行动是有目的的行为。欧内斯特·内格尔(Ernest Nagel)在《科学的结构》中说:“在许多研究部门中,尤其是虽然不完全是,在生物学和人类事物的研究中,说明采取这样的形式:或者指明一个单元在维持或实现它所属的系统的某些特征方面所履行的一个或多个功能,或者阐明一个行动在导致某个目标中所起的工具作用。我们往往吧这种说明称为—功能说明或目的说明。”

1

虽然内格尔认为,那些被目的说明所解释的事物和活动不全是有意识参与的,

但它们是否是行动仍是存在争论的。哈利·法兰克福(Harry Frankfurt) 认为,动物很多行为都是有目的的,这样的行为在一个很低的层次上可以认为是一种主动的行动。例如,当一个蜘蛛爬过桌子,蜘蛛控制着它的腿的动作,腿的动作有将它从一个地点移动到另一个地点,这样的移动行为对于蜘蛛来说显然具有一个目的。我们很难用如此简单的一个条件判其是否是行动。

笔者认为,引起这样争论的一个原因是,目的这个词所涵盖的意义太广。它既可以指称某种无意识参与的目的论(Teleology)意义上的目的,也可以指称人的意图,这种目的则是一种有意识参与的目的。行动哲学的研究者一般用“Intention”来表示行动背后的心理状态。罗伯特·索克拉夫斯基认为,“Intention”这个词有两层含义,它的日常意义是“意图”或“目的”,例如“他买了一些木材的意图是要建一栋小木屋”,而在现象学语境下的意义则是“意向”2。在塞尔的著作《Intentionality:An Essay in the Philosophy of Mind》一书的中译本中(上海世纪出版社出版),刘叶涛将Intention一词翻译为意向。笔者认为这样的表达是否准确虽然有待证明,但在本文中确实一定的便利性。这是因为,首先,本文关心的重点是人的有意识的行动,“意向”一词表达的是意识的指向性,因而一般的说,任何意向状态都是一种有意识的状态;其次,用“意向”来描述行动,更便于我们将行动放到意向性理论中进行考察。

2.32 行动与意向

塞尔认为在行动具有两个成分,其一是意向性的心理状态,其二是作为这种心理状态意向对象的事件,或者说人的行为。行动中的心理状态又可以分为两种,其一是行动的在先意向(prior intention),其二是行动中的意向

1

欧内斯特·内格尔:《科学的结构》,上海译文出版社2005年出版,第231页。 罗伯特索克拉夫斯基:《现象学导论》,武汉大学出版社2009年出版,第8页。

15

2

东华大学硕士学位论文

(intention-in-action)。我们一般用“我要做A”或“我打算做A”来描述在先意向,用“我正在做A”来描述行动中意向。聊在先意向、行动中意向和动作是一个最完整行动中的三个组成部分,一个行动可以缺少在先意向,但不能缺少行动中意向。例如,我再投入的思考问题是不自觉的起身散步的情况中,我的散步是我的一个意向行动,但这个行动中我们不必要对它形成一个在先意向,我只是如此行动而已。

一个行动不仅需要这三个组成部分,并且他们之间必须就有恰当的因果关系,它们的关系是“在先意向引起行动中意向,行动中意向引起动作。根据意向因果性的传递性,我们可以说,在先意向既引起了行动中的意向,又引起了动作”。1

仅仅对行动做如此说明,我们仍会面对前文综述中提到的种种问题。例如在我的右手拖着我麻木的左手移动的情况中,我既有在先意向“我希望我的左手移动”,也有行动中的意向,即左手移动的动觉,并且他们是以恰当的因果顺序发生的,只不过因果链的末端是右手作用于左手,而不是左手的肌肉作用与左手。这里我们需要借助塞尔的“行动的描述层面”和“因果自指称”的概念。塞尔认为,一个意向行动是一个行动意向的满足条件。行动意向对其满足条件的要求是,它必须是因果自指称的,也就是说我的行动必须是因为我的意向而做出。塞尔认为从因果性的角度考虑,一个事件序列可以引起无数的因果效应,我们可以对某个行动事件做不同层面的描述,其中有的是意向行动、有的是无意向行动还有与我无关的物理效应。“设想我的狗正绕着花园追逐一个球,它正在做着追球的意向行动以及撕扯半边草坪的无意向行动。”在这个情境中,狗的行动是追逐一个球,而他的行为却因果的引起了撕扯草坪的效果,甚至无数的其他物理效果,比如改变了它在地球上的地理位置,甚至是引起了美国西海岸的一场热带风暴。但是,在这一系列的因果链中,只有追逐球是狗的行动,因为其他的因果效应并不满足意向行动的因果自指称要求。

在抬起左手臂的例子中,我的确有一个抬起左手臂的在先意向,但我的在先意向引起的行动中的意向却是,我的右手臂拖着抬起我的左手臂。换句话说,我的身体做出的全部行为是,我的右手臂拖着抬起我的左手臂,而我的这个行为必然全部被我行动中的意向表达,也就是说我必然具有关于这整个事件的身体体验, 因此,我行动中的意向必然是,我的右手拖着抬起我的左手,而不是我抬起我的左手臂。因此在这个场景中我确实做出了一个行动,但却不是抬起左手臂的行动,而是右手拖着抬起左手臂的行动。

2.4 认知范式下的人机交互理论

1

塞尔:《意向性—论心灵哲学》,上海人民出版社2007年版,第96页。

16

东华大学硕士学位论文

埃格里(Agre)认为:技术领域的研究往往是围绕一些隐喻展开的,这些隐喻为技术提供有价值的问题并给出解决问题的方向??在经过了认知主义的革命后,人机交互领域普遍采纳了认知科学的隐喻,将人机交互的过程看做人和计算机间信息的交换。1图灵的思想不仅影响了人工智能和认知科学的发展,在今天也是人机交互技术的核心隐喻。从某种意义上说,图灵测试的问答模式可以说是第一个人机交互的抽象模型。虽然今天的技术实践并不是要设计出像GPS(通用问题求解系统)这样的智能系统,而是要设计出更加智能的CA(计算机辅助)系统,但是人工智能背后的认知主义的理论假设作为一种隐喻却被延续了下来。

从一个不太严格的角度看,人机交互领域的大多数技术专家持一种强人工智能(Strong Artificial Intelligence)或计算功能主义(Computational Functionalism)的观点2,他们认为优秀的人机交互系统(至少在某些方面)在心智结构与人是等价的。例如,在一本关于如何设计优秀的人机交互系统的权威的指导书中这样写道:

“工程师开发软件的方式通常是给定的,并且常常受制于技术和业务上的限制。有关软件实际上如何工作的模型成为实现模型。用户与软件交互的心智模型是用户理解他们所需要进行的工作,以及程序如何帮助他们完成工作的过程。这种模型给予他们如何完成任务,以及计算机如何工作的想法。设计师选择如何将软件工作机制表现给用户的方式称为表现模型。表现模型和其他两个模型不同,它是设计师能够极强地对软件进行控制的体现。设计师的一个很重要的目标是使表现模型和用户心智模型尽可能互相匹配,因此设计师能否详细的理解目标用户所想到的软件使用方式,非常关键。”3

这段引文以不太严格的方式,表达了作者一种强人工智能主义的乐观态度,并且从设计的角度引入了计算功能主义的核心观点,比如对于描述层次(levels of description)的区分、多重可实现性(multiple realization)。根据塞尔4,多重可实现性是计算功能主义的关键概念,此想法的要点是,比较高的描述层次上的特征

1

Agre, P. E(1997).Computation and Human Experience. Cambridge University Press. 转引自Steve Harrison, Phoebe Sengers, Deborah Tatar(2001). Making Epistemological Trouble: Third-Paradigm HCI as Successor Science. Interacting with Computers: 2.

2

这里将强人工智能与计算功能主义同时提出是沿用塞尔的观点。这里借用这一观点,主要为了指出技术专家们提出的交互理论兼具这两方面特点。请参见:塞尔,《意向性—论心灵哲学》,上海人民出版社2007年版,第57页。

3

艾伦?库伯,罗伯特?瑞宁,大伟?克洛林:《软件观念革命-交互设计精髓》,电子工业出版社2012年出版,第26页。

4

塞尔:《心灵导论》,上海人民出版社2008年出版,第62页。

17

东华大学硕士学位论文

可以基于不同的底层结构中实现。正如同样的程序可以通过不同的硬件上实现,人类的心智也可以在数字计算机上实现。引文中对实现模型、表现模型、心智模型的区分恰恰体现了这一观点。

2.5 Plan Modal

传统的人机交互既延续了认知科学心理计算表征的假设,也认同关于行动的意向性理论。既然认知科学的中心假设是将思维视为心智中的表征结构以及在这些结构上进行操作的心智程序,那么在这一研究范式下,人机交互理论研究的一个核心问题就是如何用认知科学的模型来表征人意向性的行动。

2.51 认知范式下的行动观和plan 模型

既然行动是主体的有意向行为,并且在认知科学的语境下,行动理论的重要问题是如何表征主体的行动,以及能否在计算机上模拟这种行动。表征行动最终要的问题是如何表征伴随着生理活动进行的意向性。

一些认知科学家认为,行动的计划就是行动中的意向。人工智能哲学家玛格丽特?博登(1973)说“除非我们将意向(intention)理解为行动计划(action-plan),我们就无法理解意向在现实生活中的功能。所谓行动计划,就是我们根据现有的背景知识规划出来的,并用于指导行为的东西。”1(p27-p28)

认知科学普遍接受了这种以计划为核心的行动观,并逐渐发展成型了精致的计划模型(Plan Model)。这一模型认为,主体的行动过程就是构建和执行行动计划的过程。主体在世界中的真实行动由行动计划控制,计划是主体行动的必要条件。在Miller、Galanter、Pribram等人合写的一篇较早的文章里,详细的描述了什么是计划与行动的关系

“任何对行为的完整描述都应该能够作为一组指令(instructions)的形式出现,这种指令类似于行动的计划,能够指导被描述的行动。当我们谈到“计划”,这个词指的是一个指令的层级系统(a hierarchy of instructions)??一个计划是一种具有层级的过程,生物体可以通过控制这种过程执行一系列操作。

计划之于生物,在本质上就如同程序之于电脑。我们可以将模仿生物特定行为的电脑程序发展为某种生物控制其自身行为的计划理论。

甚至,我们可以用“计划”来粗略的描述一些行动??并且对每一个具体的操作的进行具体说明??我们认为,所谓生物执行一个特定的计划,实际上等同于计划在执行着它正在执行的一系列操作。”2

1

Boden, M. (1973). The structure of intentions. Journal of Theory of Social Behavior 3: p23- p46.

2

Miller, G., Galanter, E., and Pribram, K. (1960). Plans and the structure of behavior. New York: Holt,

18

Rinehard and Winston. p17.

东华大学硕士学位论文

2.52 从计划模型到互动模型

从行动的计划模型,我们很自然的就会过渡到一个互动的计划模型。既然我们要设计的是辅助人们行动的机器,那么它首先要做的就是识别出用户的行动计划。Suchman认为:“人机交互技术的核心问题就是如何能够识别出潜藏在另一个主体行动背后的计划,并给予对方合适的回应。“1

在这种互动模型中,我们将人的心智理和智能设备都理解成一台图灵机,用一个有层级的计划系统对其说明,在这一系统的最底端是直接控制操作(operation)的指令(instructions)。而人机交互就是双方执行自己的计划,同时根据对方的输出评估调整计划的过程。在这一过程中,人与计算机形成了一个有限的I/O循环。它的基本形式如图所示。

这里我们用一个有限集K={ K1, K2,??,Kn,Kn+1,Kn+2,?? }表示机器的状态,用集合S表示人的心理状态。假设机器目前的状态是Ki,并且收到一个传感信号Inputj,那么,机器状态将根据收到的信号变更为Ki+n,并且输出输出相应信息。相对的,我们则根据收到的感知觉信息更改我们的心理状态,同时输出一定的行为。请注意,人和计算机的状态并不是沿着集合的顺序依次改变的,而是根据对输入信号的评估依据一定的规则进行改变,而改变之后的状态则是已经定制好的。

Input 感知觉 心理状态有限集S Output 行为

Output 信息 …… Sn Sn+1 读写头 Sn+2 …… 读写头 …… Kn Kn+1 状态有限集K Kn+2 …… Input 传感信号 图2:交互模型

例如,在弈棋游戏中,双方的目标都是将死对方。在游戏初期阶段,双方首先各自制定自己的战术计划完成布局,并且根据对方的走法判断对方的行动计划。随着游戏的进行,棋手必须不断根据棋面的形势和自己猜出的对方的计划调整自己的战术。

在这种模型下,人机交互的技术难题就是如何将人的行为恰当的表征,也就是传感问题,以及如何分析处理这些信息,也就是模式识别问题。

1

Lucy Suchman(1988). Represent practice in cognitive science. Human Studies 11: 305-325.

19

东华大学硕士学位论文

2.6 传统交互模型的困难

2.61 Situated Action 问题

将计划理解为我们行为的脚本,确实为认知科学提供了一个理解人类行动的简便方式。但是,这种模型可能只适用于我们最简单的行动。如果我们考虑一个较为复杂的真实情景,就会发现我们很少甚至几乎不会按照计划来行动。

设想一个情景,你驾驶一条皮划艇在水上漂流,假设你的船开始不断下沉,这时你会怎么做。较合理的假设是,如果情况不是万分紧急,你可能快速的判断当前形势,并马上设想一个解决方案,比如:我会尽可能的向左划,设法让船避开湍急的水流,然后尽力让船能卡住前面倒下的树杈。你可能还会在大脑中快速的评估和模拟这个方案,尽力考虑到所有的细节。但可以设想,无论时间多么充裕你也无法将方案细化到每一个具体的行为,而是依靠经验和身体技巧来操控你的船。并且,在实际的操作中,一旦你绝不会严格按照事先的模拟计划行动,而是靠我们具身的技巧来掌控独木舟,并对时时出现的意外做出反应。

Suchman 认为,在境遇化实践中,我们是时时刻刻在于周围的环境进行着互动。计划与其说控制着我们的行动,不如说是在启发着我们的行动。我们生活中的大多数行动,比起经过深思熟虑的弈棋,更多的是类似以上情境中的因势而动的行动。虽然我们都会在行动前尽量周密的计划,并尽可能穷尽所有会出现的情况,但在实际的情境中,这些计划最重要的作用不是控制行动,而是帮助我们避免一些严重的错误。

2.62 语境困难

在普适计算的智能环境中,计算设备将广泛的嵌入我们的日常生活。可以想见,未来我们与智能设备的交互的环境将不会像现在一样局限在我们的办公室,而会是一种无处不在的交互。因此如何准确表征我们的环境信息,就成为了一个关键问题。

按照行动的计划模型,主体间的交互行动首先要根据对方的行动读出对方的目的。但是,我们的行动和行动目的之间不是一一对应的关系,行动还部分的取决于环境和当前局势。在不同的环境中,同一个行动可能有不同的目的。例如Gumperz给出的对话的例子(Gumperz, 1982:326,suchman文章317):

A:这段时间你不出去吧? B:恩,你出去吧,不用着急回来? A:我只出去一小会,有事叫我。 B:好的,放心吧

在这段对话中,A对B提出的问题实际上是一个请求,即:我需要出去一会,这段时间你能替我一会么?显然,B能做出正确的判断是因为他还掌握大量的语

20

东华大学硕士学位论文

境信息。

在认知科学的范式下,语境问题的实质是我们如何在表征和编码周围的环境。例如,Ryan(1997)1将语境定义为“地点,身份,环境,时间“组成的四元组。那么我们能否根据这些已有的互动情景找出语境所包含的要素,并制定出形式化的规则帮助我们确定主体的行动目的呢?Gumperz认为,这种做法没有任何意义。虽然在这个场景中我们确实可以设计出一些行事规则,例如:如果你的同事在休息时间问你,在休息期间你的时间安排,那么可能他是想休息一下。但Gumperz认为,这样的规则既不够一般化,因而无法将其推广,同时也不够明确,因而我们无法根据它准确的判断对方的行动目的。(1982:326)

2.63 非任务导向的交互

在行动的计划模型中,有一个基本假设,用户的行动有一个目标,在一个计划中这一目标被分解为不同层级的子目标(即任务)。因此智能设备的设计目的就是识别并帮助用户完成其各个任务,最终达到用户行动目标。

但是在实际的技术实践中,特别是在沉浸式的交互系统中,我们有许多非任务导向的(non-task-oriented)技术动机。比如在一个模拟飞行训练的交互系统中,系统的设计目的是为用户提供一个逼真的虚拟环境。在这种系统中,用户虽然也有明确的行动目的,但是其行动的总目标和各个具体活动的子目标却可能不再具有逻辑关系。比如,用户的总目标是熟练掌握飞行技巧,但在实际操作中,用户的向左拉动摇杆的目的是躲避某个障碍物。

2.64 积极外在主义

1998年,Andy Clark 和 David J. Chalmers合写的“The Extended Mind”2一文中,延展认知论题TEC(the thesis of extended cognition)和延展心灵论题TEM(the thesis of extended mind)。前一个论题可以简述为,认知并不局限在我们的大脑中,认知的过程是由人类和外部物理和社会环境构成的耦合系统共同完成的。后一个论题可以简述为,我们的认知过程受外部环境影响,当外部环境以恰当的方式对我们的认知起作用时,我们的某些心灵状态会延伸到外部世界中。

对于TEC论题,克拉克和查尔莫斯借助一个思想实验对其进行论证: 1) 假设电脑屏幕上展示了一些二维图形。一个人坐在电脑前,他需要回答这些图形是否能插入一些特殊的插孔中。根据心理学的研究成果,为了进行判断,我们必须对这些图形进行心里旋转,来考察他们是否能够合适配对。

2) 这次主人公在电脑前,面对同样的问题。但他可以选择通过一个按钮在屏幕上对图形进行旋转,或者仍然选择对其进行心理旋转。我们可以合理假设,

12

Paul Dourish(2004). What we talk about when we talk about context. Pers Ubiquit Comput 8: 21 后文中该文章的相关引述,均翻译自:Andy Clark, David J. Chalmers(1998). The Extended Mind.

Analysis 58: 7-19.

21

东华大学硕士学位论文

主人公为了提高速度而选择了前者。

3) 考虑在未来赛博朋克的年代,这种按钮已经通过神经移植技术被嵌入了他的神经系统。在此情境中,主人公为了回答同样的问题,必须考虑调动那些认知资源(使用嵌入的计算机还是传统的心理资源)来完成旋转操作。

作者认为,在情景3中,我们认为无论主人公调动哪类认知资源进行心理旋转,他都是在进行认知。而在3中,如果主人公调动心理资源进行认知操作,那么就与情景1中相同。而如果主人公调动电子资源进行心理旋转,那么它与因此情景2的区别仅在于芯片位于大脑外还是大脑内,这种差别显然是不重要的。因此克拉克和查尔莫斯认为,无论是情景1中的心理操作,还是情景2中的大脑外部的物理操作,对于都是一种认知操作。因此作者认为,“认知过程不局限在头脑中”,而是可以延伸到相关的环境中,我们可以通过进行一些物理行动来替代我们的一些认知任务。对于这些帮助我们认识的物理行动,克拉克和查尔莫斯沿用了Kirsh 和 Maglio的命名,称之为认识行动(epistemic action。)

对于TEM论题,克拉克和查尔莫斯认为信念(believe)是我们最重要的心理状态,因此他们通过另一个思想实验论证,信念并不局限在大脑之内:

1) 首先考虑一个正常的信念的情况。Inga听朋友说在现代艺术博物馆有一个展览,并决定去看。她回忆了一会,想起博物馆在第53大街,于是她便步行到了第53大街并抵达了博物馆。很明显,无论在Inga回忆之前还是之后,我们认为Inga都相信博物馆在第53大街。因为我们一般认为,信念并不会因为回忆儿突然冒出来,而是一直都潜藏在记忆里。

2) 在另一个情景中,Otto是一名奥兹海默患者,他会将所有需要记忆的信息都记录在一个笔记本上。假设Otto也想去现代艺术博物馆。他查看笔记本,上面写着博物馆位于第53大街,于是他抵达了博物馆。

3) 第三个情景发生在普特南的孪生地球上,假设存在一个孪生Otto,他的全部物理特征都与Otto相同,除了一点,他错误的将博物馆的地点记作第51大街。于是他按照笔记本的地址做出了错误的行动。

克拉克和查尔莫斯认为,存在于Inga头脑中的记忆和存在于Otto笔记本中的信息在本质上是一样的,它们对主体当下的行为都会产生相同的影响。对于Otto和孪生Otto,由于他们本子上的信息不同,导致了他们随后做出了不同的行为。因此,作者认为,信念存在的位置在本质上不影响它对认知的作用方式。如果承认了外部信息对主体行动的因果效力,也就承认了信念不局限在头脑中,进而心灵也就可以延展到外部世界。

这里笔者并不想介入关于积极外在主义论题本身的讨论。但TEC和TEM论题却带出了一个人机关系的问题。根据普适计算的设想,未来的智能设备低成本、低功耗、嵌入式的方向发展,最终它们将广泛的嵌入并消隐在我们生活的中。今天的很多已经成熟和已经普及的技术,比如可穿戴计算机、智能手机、平板电脑、

22

东华大学硕士学位论文

电子身份证等等已经具有了普适计算的雏形。因此,可以设想克拉克和查尔莫斯的思想实验将很快成为我们真实面对的问题。那么在不久赛博格时代,当我的身体内被嵌入了大量的智能设备,我所有的心理内容都由这些设备进行存储,那么此时的我们和这些设备的交互关系又是什么呢?

2.65 心理内容1

一般认为,意向性的意识包含两个基本的元素,其一是我们的心理状态(mental state或psychological type),或者语言哲学所谓的命题态度(proposition attitude)。其二是我的心理内容(mental content),或语言哲学所谓的命题(proposition)。一个意向状态一般具有以下形式:“xAp”,其中“x”代表人;“A”代表一种心理状态,如相信、意愿;“p”代表命题内容。一个人的意向性的意识可以用如下形式表示:表示心理状态的词项+表示心理内容的词项或句子。如,相信天正在下雨;爱‘萨利’等。

塞尔认为不同的意向状态间有一个很重要的不同,即适应指向(direction of fit)的差别。对于一个信念中,我们认为它有责任去匹配这个世界,因此如果一个信念是错的,那么我们只能通过改变信念来纠正,因此它具有“心灵向世界”(mind-to-world)的适应方向。相反的,对于愿望,我们则认为它具有“世界向心灵”(world-to-mind)的适应方向,它们并不被认为需要与世界相匹配,而是被认为会为世界带来变化。

塞尔将意向状态与实在世界相适应的条件记为“满足条件”,他认为,我们的意向状态表征了它们的满足条件,准确的说,一个意向状态的满足条件是由其意向内容决定的。我们说对于某个意向状态““xAp”中,它的与世界相适应,当且仅当我们的心理内容“p”与世界相匹配。例如,“我的陈述是真的,当且仅当被表达的信念是正确的,我的命令将被服从,当且仅当被表达的希望或愿望得到满足”。

许多哲学家认为,信念和愿望是最基本的意向状态,任何复合的意向状态都可以分解为信念和愿望的组合。在行动的计划模型中,位于计划系统最底层的是具体的任务,一个任务可以分解为一个信念和愿望的合取。例如,我有一个把屋里灯打开的子计划,其中必然会包含希望“屋子亮起来的”愿望,和“如果按开关,灯就会亮起来”的信念、“我将会按动开关”的信念等等。无论一个完整的计划系统有多少任务组成,整个计划就是一个由多个简单意向状态组成的复合的意向状态。

2.66 积极外在主义引起的问题

在认知主义的计划模型中,行动就是我执行了某个计划或任务,进而也就是

1

前文的行动模型中,使用“心理状态”一词只是沿用了相关技术文献的表述,这是一种广义的用法,

在本章中它等同于这里所说的“心理内容”。

23

东华大学硕士学位论文

说一组由信念和愿望组成的意向状态得到了满足,再进一步也就是说这些意向状态所表征的命题内容与世界相适应了,无论这种适应的方向是什么。

在查尔莫斯和克拉克的论证中,延展到外部世界的正是心理内容。Otto笔记本中记录的是他的信念内容,而不是信念的态度。我们心灵与外在世界区别最重要的标志就是,我们的心灵具有意向状态,也就是说它总是由处于一种心理模式当中的心理内容组成。福多(J. Fodor)曾质疑,如果Otto的部分心灵传递到了物理设备中,那么他自身的心灵究竟何在?而笔者在这里要问的则是,如果我们认可心灵和认知有我们的大脑和外部设备共同承担,那么在这一前提下,我们和这些设备究竟有什么关系呢?

积极外在主义对交互提出的诘难正在于,传统的交互理论无法应用于我们与嵌入式和具身的交互设备间的互动关系。传统交互理论假设我们与设备的互动是面对面进行的,如同人与人之间的交流,设备根据我们的行为表征我们的行动计划,找到我们行动目的并帮助我们完成它,同时我们也尽量的适应设备的设计模型,双方协作完成任务。但在赛博格时代,智能设备嵌入了我们的身体,同时我们的行动计划也嵌入了智能设备,人机间的互动不再是正面。显然我们需要新的行动和互动理论来适应这样的技术实践。

笔者认为,前文所述的Situated Action 问题、语境困难、非任务导向的交互和TEC和TEM论题所揭示的问题其根源都在与传统人机交互理论和经典认知科学背后隐藏的笛卡尔主客二分的认识论模式。在这一认识论背景下,我们与智能设备互为主客,我们都是彼此的认识对象。智能设备作为认识主体,通过各种传感设备扫描我身体表现出的各种特征,根据一定的规则,主要是统计的规则,表征我的心灵;我作为认识主体则观察—主要依靠视觉—设备传递出的各种信息,评估局势以保证与设备步调一致。例如在讨论Situated Action问题我举的沉船的例子,如果我们要设计一款智能船桨按照传统人机交互理论,我们要做的就是尽可能的增加传感设备,通过扫描我们的各种生理指标并根据统计数据尽快估算出的我的行动计划,并帮助我们实现。

但是,正如在前文所论,我们在真实的情况中并没有一个明确计划,因此该设备所表征的任何计划都是错的。船桨对我来说不仅是一个划船的工具,也是我们的认识工具,它帮助我们判断水面的环境,比如水流速度、水深,除此之外还有很多无法用语言清楚表达的信息,我们的身体根据这些信息和我们的经验自然而然的做出反馈。在情景化的行动中,一条智能船桨绝不会是我们意识关注的对象,我们关注的只有环境中的局势,我们与智能设备的关系也绝不会是位于意识之上的交互关系。

3

现象学视角下人交互理论的再审视

24

东华大学硕士学位论文

3.1 人与计算机的关系

笔者曾撰文1提出,我们可以从一个整体的视角看待人机的交互关系。所谓整体视角是指,在分析这种交互关系时,我们不仅应该看到人和智能设备,还应该注意到隐藏在智能设备背后我们行动的真正对象的存在。我们应该注意到,在真实的人机交互中在用户意识里,真正与之互动的不是智能设备,而另有对象,机器只是我们面对该对象的一个中介。比如,当我们在通过QQ聊天时,虽然我们的直接交互对象是计算机,但本质上我们是通过计算机中介与网友进行互动;当我们进行网络游戏时,我们的互动对象则是网络游戏中的虚拟人物;当我们用word软件编辑文档时,我们关注的也不是软件,而是我们的文章。

传统人机交互理论站一种第三人称的客观视角上分析人与智能设备的交互关系,从这种视角出发,人与智能设备的关系智能是互为主客的认识关系。当我们分析人的交互行动时,我们看到的是用户根据自己的行动和设备的反馈猜测设备的技术模型。当我们分析设备时,我们看到的是设备根据人的各种外在指标判断人的心理模型。以这种视角,必然会造成两个问题,其一是前文所述的在复杂情境下的人机交互问题;其二是当我们的视域中心对焦与计算机时,必然会造成我们与生活的世界的疏离。

在威瑟所预言的普适计算的世界中,智能设备不再占据我们意识的中心,而消失在我们的生活中。笔者认为,在这样的人际关系下,传统的交互理论将不再适用。在本章中,我们从现象学的视角出发,以人行动时的意向对象为核心,借助胡塞尔、唐伊德、飞利浦·博瑞(Philip Brey)2的相关理论,详细分析普适计算预言下的人机的互动关系。

3.2 再论行动与意向性

上文中,我们从心灵哲学的角度,分析了行动中的意向问题,特别是分析了塞尔关于行动的一些看法。另一个与意向性问题关系紧密的学科是现象学,特别是胡塞尔。虽然胡塞尔并没有专门讨论过行动问题,更不可能涉及人机交互问题。(虽然胡塞尔对主体间性的问题进行过广泛的讨论,但笔者认为,本文所说的交互是指人和作为工具的智能设备的互动关系,而不是人与作为与人对等的人工智

12

王晓雯:《智慧城市和人机交互技术的现象学初探》, 青年与社会2012年第5期,第235页

Philip Brey(2005). The Epistemology and Ontology of Humna-Computer Interaction. Minds and

25

Machines 15: 383-398.

东华大学硕士学位论文

能体之间的互动关系问题,所以与本文关系不大。)但是,胡塞尔胡塞尔关于知觉问题、动感和内时间意识的讨论对我们论题有很大的启示。

现象学认为,意向性在本质上是关于某对象的意识,我们的每一个经验和有意识的行动都是意向性的。胡塞尔称我们意向性的意识活动为意向活动(Noesis),称意识涉及对象为意向相关项(Noema)。

从意向活动的角度说,我的知觉都充实的意向和空虚的意向组成的混合物。从意向相关项的角度说,一个被给予我的意向对象是以混合了在场与缺席的被给予方式把自身展现给我的,这些被给予方式被胡塞尔成为“映射”。这些映射中的一部分以直观方式将自身显示给我,而其他的映射则以共同当下(Mitgegenwartig)的方式被我意识到。

3.21 行动与行动的对象

这里笔者注意到胡塞尔和塞尔关于意向性的一点区别:塞尔认为我们的意向涉及的不仅是对象,也有事态,并且他更关心的是意向的心理状态对事态的表征,至少在《意向性》一书中,塞尔说“本书当中大部分分析都是关于那些具有完整命题内容的状态”1。例如我的有一个关于天在下雨的信念,“天在下雨”就是我这个信念的意向对象。而在胡塞尔的现象学中,特别是他关于知觉问题的分析中,更多地强调我们的意识是指向某个对象的。胡塞尔说“在对象的显现方式中,被感知之物本身在感知的每一个瞬间都是一个指明系统,它具有一个显现的核心”这个核心不是当下被给予我的视角面,而是在意识中非实项(Reell)含有的对象。而事态则是以共同当下的形式被给予我们的,实在意向相关项的外视域中给予我们的。这个差别就好比一张焦点明确和一张没有焦点的照片的差别。

请注意,笔者在这里并没有断言从胡塞尔现象学出发我们从不关注事态,相反的,在关于语言的现象学分析中,我们分析的对象更多的会是命题,而不是个别的名词,在知觉现象中,我们关注的也可以是对象在一定情境中构成的事态。笔者认为,这里最重要的差别在于,是将我们的意向对象当作一个点状的对立面还是一个杂多的现象系统。认知范式下行动模型采取的就是第一种态度,在计划模型中,我们的目标和每一步的行动都被表征为一个事态,这个事态是封闭的和自足的,只有我们严格按照被表征的事态做出了行动,我们才说这一意向被满足了。而在现象学的视角下,无论我的意向对象是一个具体物,还是一个事态,它都是在一个指明的光束系统(Strahlenssystem)中作为意向相关项的核被给予的,“在它周围还有一种意向的空乏视域(Leerhorizont)围绕着它们并和他们混杂在一起,只是因为他们周围有一圈与现象有关的晕(Hof)”2,在这个系统中除了我们关注的物或事态外,它还预示着一个丰富的杂多现象系统,如空间和时间

1

塞尔:《意向性—论心灵哲学》,上海人民出版社2007年版,第7页。 胡塞尔:《生活世界现象学》,上海译文出版社2005年出版,第49页。

26

2

东华大学硕士学位论文

的多样性。将意向对象当作一个封闭的点状的对立面,也就意味着,一旦我们以此方式表征了对象,例如将我们所关注的事物都被表征为特定的数据结构,也就切断了它们与世界通过其他方式相联系的可能性。例如在前文所述的语境困难中,雷恩(Ryan)1将语境表征为“地点,身份,环境,时间”四个变量组成的四元组的同时,也就语境成为了客观的环境,而失去了语境与行动间的互动关系。

造成这个差别的原因,笔者认为正是经常为现象学家提及的自然态度和现象学态度的区别。从自然态度的视角看,行动确实只能以一个事态的形式出现,因为它必然包含一个行动的主体和行动的内容有时还有一个行动的对象,例如,“张三打了李四”,或者“张三在跑”。因为这种封闭性,在认知范式下,行动必须被表征为一个事态。但是经过现象学还原我们会看到,大多时候我的行动对我是显透的(Transparency),我关注的是我行动的对象,而非行动本身。这点可以类比于海德格尔所谓工具之于我的“上手状态”。我们可以说,在行动中,我的行动和行动的计划对我都是上手的。

3.22 内时间意识与计划的意识

这里还要再澄清一点,当我们将计划表征为一种数据结构并应用于人工智能领域,比如用来驱动机器人行动时,显然的机器人的意识对象(假设它们有意识的话)也不是这个数据结构,而也是行动对象。但是,人工智能专家对计划的实证分析却是对象化的,这种自然态度的分析可能会漏掉一些关于行动与计划与我们其他意识之间的联系。用黑尔德的话说“对于非课题的进行的过程,只有彻底内向的现象学反思使它得以明显”2

如果说在真实的行动中, 行动本身对我是显透的,那么行动和我以及行动对象的关系又是什么呢?笔者认为,以现象学的态度看待行动,在一点上与行动的计划模型是一致的,即行动一般都以行动序列的形式出现,或者可以说真实的行动都是有计划的行动。(请注意,这里所说的有计划的行动,与计划模型中的计划有很大的差别,这里主要强调的是真实的行动具有一种序列的性质)因此,我们认为必须借助胡塞尔关于内时间意识的分析来考虑这个问题。

在我们的任何行动中,确实都有一种计划的意识出现,但不是前文所述的计划模型。这种意识是序列化的,前后相继的,它与行动的关系不是单方面的严格决定关系,它影响着我的行动,同时也受我行动的影响,萨奇曼(Suchman)认为,计划与其说控制着我们的行动,不如说是在启发着我们的行动。因为计划意识是一种序列化的意识,所以它必然是由我的内时间意识衍生出来的,或者用户塞尔的话说,计划意识奠基于时间意识。

12

Paul Dourish (2004). What we talk about when we talk about context. Pers Ubiquit Comput 8: 21. 胡塞尔:《生活世界现象学》,上海译文出版社2005年出版,第16页。

27

东华大学硕士学位论文

首先考察一下我们的时间意识。我们对于时间的意识,并不是将是将当做一种对象来研究的意识。胡塞尔认为,时间的意识是一种前对象的意识,在奠基的顺序的意义上第一个被意识到的东西。也就是说我们对任何事物的意识体验都奠基于时间的意识体验。在时间的体验中,“此刻”是直接给予我们的“原印象”,“滞留”和“前摄”是与之共同当下的,由原印象和其滞留与前摄共同组成的晕构成了时间意识的本原形态。时间是一条连续的河流,每一个此刻都在不断的成为新的滞留,而之前的每一个滞留则移动到更远的过去。如图3所示,OE从客观的角度看是时间的前进方向,从主观的角度看,从O到E的每一个点都是一个现在。EE’则是此刻的现在连同此刻的过去视域。OE’和PP’每一个已经过去的现在的下坠方向,沿着这个方向投影到我此刻的过去视域中,并在其找到自己的

O P E P’ E’

图3:时间意识

位置,即点E’和点P’。

正如前文所说,在行动中我们的行动和计划对我们是显透的,我们的意识是关于行动对象的意识,但是这并不是说我们在行动中没有计划的意识,而是说计划以一种非对象的方式被我们意识到,是我们关于行动对象意识的奠基。因此这种分析具有一种步骤的意识,这种意识奠基于我们的时间意识中,而我们行动中的意识有奠基于这种计划意识中。笔者认为,计划的意识的本原结构中,除了具有时间意识的“当下、滞留、前摄”的晕结构外,主体的行动目标和塞尔所谓行动中的意向对我来说也是共同当下的。随着时间的流逝,我的每一个当下的行动都变成了过去的行动,并保留在我的每一个滞留中,行动与每一个当下一起在我内时间意识的序列里定位,并形成了一个行动的序列。

这里补充一点,关于行动序列的观点在我们的实际生活证是可以得到证明的。在工作中,我们常常被要求写一些具体工作的操作流程,比如财务上的报税流程,设计流程、恢复一盘围棋等。当我们回忆我们的工作流程时,很难直接定位到某一步的操作是什么,而是从前往后或从后往前一步步的回忆。每当回忆道某一步时,其前一步和后一步都变得更加清晰起来。

从现象学的视角看,我的行动目标并不被我明确的表征为一个事态,我的行动的计划也并不严格决定我的行为。在前文所举的沉船的例子中,我希望得救,但并不在意得救的方式。最终我可能以抓住一棵树杈的方式得救,也可能以将船搁浅的方式得救,等等。我的自救行动也会随着形势的改变随机应变。我们如何

28

东华大学硕士学位论文

分析这个情况呢?笔者认为,在实际的行动中,本原的被给予给我的是我当下的情况,与之共同当下的是有前摄,滞留、我的目标、行动中的意向。也就是说,我对未来的前摄,受到我过去的行动序列,直观的当下以及当下的行动的影响。例如在操作电脑的情境中,我刚刚打开了“word”软件,点击了“开始”菜单,并准备点击了“字体”选项,那么我对未来的期待理所当然的是一些与字体相关的选项框,而不会是与插图相关的选项框。我的期待被过去的操作,计算机给我的操作反馈和我即将进行的操作决定。当然,这种决定绝不是严格的数学意义上的映射式的决定,而是一种模糊的前摄。不仅我的过去行动形成了一个行动序列,在行动的另一端,我的前摄也会形成一个序列,这个序列就是我的计划意识,它的终点就是我的目标。我最初定下的目标引导者我的每一步行动,相反的,它也会随着我前摄的改变而做出调整。

3.23 行动与动感

从意向相关项的角度说,任何被给予我的意向对象是以混合了在场与缺席的被给予方式把自身展现给我的。比如我们看一个正方体,每一时刻我们看到的只能是正方体的一个侧面,正方体从不会一次性地完完全全地给予我。“每一个感知都伪称说,它切身的给予了对象”1,那么就产生一个问题,我们如何能够从被给予的杂多中把握住一个统一的对象呢。正如胡塞尔所问“但思维所意指的、所感知的、所回忆的事物只能作为体验,而不是实项地作为一个部分,作为真实地在其中存在着的东西在思维自身之中被发现。因而问题在于:体验如何能够超越自身”。

胡塞尔认为,这个问题是传统的感觉主义认识论造成的。在感觉主义看来,我们的感觉是一种被动的遭受,正如感觉(impress)这个词表达出来的意思,它是强行被印在我们心中的。而在胡塞尔看来,我们的感觉一开始就包含着主动性。为了看到对象所有的侧面,我主动地运动我的眼睛、手、脑袋。我们的感觉是以动感的方式进行的,他与我们身体的运动不可分。

胡塞尔说“我们的身体的特征在于它是感知的身体。我们把它纯粹看作是一个主观运动的,并且是在感知行为中主观运动着的身体。”从这段话中,我们看到我们的身体和行动都承载着认识的功能。

3.3 伊德的技术哲学

对于人机关系的分析我们首先要借鉴的是当代技术哲学家唐伊德(Don· Ihde)对“I-Technology-World”四种关系的分析。

在《技术与实践》一书中,伊德提出四种“人—机器—世界”的关系。其一

1

胡塞尔:《生活世界现象学》,上海译文出版社2005年出版,第55页。

29

东华大学硕士学位论文

是,“具身关系”(Embodiment Relations),伊德将其表示为“(人—技术)—世界”,“(Human-Technology)- environment”。在此关系下,技术乃是作为人经验世界的中介,具身是我们参与环境或世界的方式。例如在视觉现象中,当我透过眼镜看世界时,眼镜作为技术被纳入人体当中,我们把这副眼镜变成了我们的组成部分,它从我们的感知中消退;在触觉上,盲人用导盲棒的末端来感觉脚下的道路。具身关系是行动主体和行动对象之间的关系,这种关系中包含了我们的技术人工物,但这些人工物却不是我们的行动对象,而是被我们融入到了我们的身体经验中。

同时,伊德认为这一关系有一个“放大/简化结构”(Magnification/Reduction Structure),由于技术的介入,我们经验到的世界被其进行了一定程度的改造。比如我们透过望远镜观察月亮,月球的细节被技术放大了。同样的,当我们通过qq进行聊天时,我们对对方的经验被简化为单一的文本形式。

第二种关系,伊德称之为诠释的关系(Hermeneutic Relations),伊德将其表示为“人—(技术—世界)”,“Human-(Technology- Word)”。伊德认为,在很多情况下人与技术的关系形成一个连续统(Continuum),很多技术更多的应用了我们的语言的、以意义为指向的能力。在这一类关系下,我们对技术的关注被指向了其他事物。比如,当我们关注设备的仪表盘时,“我们关注的是仪表盘所指示的设备的状态,我们“阅读”的是人工物而读到的东西确实身体和知觉意义上的。”1这时,技术和世界的关系类似于语言与指称的关系。

伊德的第三种关系,他称之为它异关系(Alterity Relations),表示为“人—技术—(世界)”。伊德认为,我们与技术的关系并不都是指向性的,技术人工物本身也可以作为一种准对象(Quasi-Objects)与我们产生关系。例如,在伊德所举的玩具的例子中,“玩具既可以是看起来像活物的对象,也可以是玩耍的对象。”

2

当我们以这种方式与技术打交道的时候,技术走向了前台,相对的世界成为一

个我们面对技术的环境。这时,技术本身仿佛成了与我们日常世界不同的其他世界。

注意,我认为在应用这种替代性关系分析交互技术时,不必在本体论层面承诺这样一个世界的存在,我们完全可以站在一种现象学视角上的意向这样一个世界。

第四种关系是“背景关系”(Background Relationship),“人—(技术)—世界”。在背景关系下,我们并不会注意到技术的存在,技术构成了我们生存的背景。只有当这些技术出现问题时,我们才会注意它们的存在。比如写字楼中的中央空调,当它正常运转时我们不曾注意到它们,一旦其停止工作,我们马上关注

1

伊德:《让“事物”说话:后现象学与技术科学》,北京大学出版社2008年出版,第57页。 伊德:《让“事物”说话:后现象学与技术科学》,北京大学出版社2008年出版,第57页。

30

2

东华大学硕士学位论文

到它们的存在。

除了人与世界的关系外,在这里应该注意的是,伊德引入了一个“显透”(Transparency)的概念。我们看到,在具身、诠释、背景这三种关系中,技术的对我们都是显透的,我们都是透过技术来经验世界。在第一种关系和第三种关系中,我们是以一种知觉(Perception)的方式穿透技术,我们直接知觉的就是世界中的对象。而在第二中关系中我们则是以诠释(Hermeneutic)的方式穿透技术,我们看到的虽然是技术本身,但我们意向的却是技术的指称对象。

3.4 人与智能设备的关系

伊德对人与技术的四种关系的分析,主要针对的是传统的技术。笔者认为,我们完全可以将这种分析移植到人与智能设备的关系中,当然这种移植要伴随着对伊德的一些修改。但是由于计算机的通用性和复杂性,我们很难简单的套用这些关系。正如计算机的另一个名字,通用机器(Universal Machine),它告诉我们计算机的功能可能延伸到无限多的领域。当然我们可以概括的说,计算机在本质上是用来完成各种计算的,或处理信息的自动设备。但这样的说法对于我们的分析没有任何意义,因为伊德的分析是站在用户的第一人称视角展开的,是一种现象学的悬置分析。对于计算机来说,本身具有一种“实现层面—表现层面”的二元属性。1就一个具体的软件来说,实现模型就是它的算法和代码,表现模型就是用户看到功能和界面。站在用户的视角看,实现模型对用户是完全隐蔽的,用户只会与表现层面的计算机或软件产生关系。

请注意,这里的隐蔽并不是伊德所谓的显透的,对于显透的技术来说,用户虽然并不直面技术,但是技术仍作为一种环境与我们的意向对象共同当下,但我所谓的隐蔽的则是完全消失在用户的视域中。因此,当我们说计算机时一种计算的设备时,它描述的并不是用户视域中的计算机的功能,因而对我们的分析是完全没意义的。当然,如果我们分析的是研发人员和计算机的关系,这种说法就是有意义的,但是当我们说“人机交互”时,人与计算机的关系就是用户和工具的关系,即使是一个开发者,当他利用计算机来开发软件的时候,比如他使用C语言的时候,他也是作为用户与计算机产生关系。

综上,为了将伊德的人与技术的关系套用在人机关系上,我们首先要厘清现实中计算机能够实现和已经实现了哪些功能,以及这些功能和用户的关系是什么。

飞利浦·布雷(Philip Brey)在文章《The Epistemology and Ontology of Human-Computer Interaction》中总结了现实生活中计算机的所有功能,并将其概括为两大类,认识功能(Epistemic Functions)和本体功能(Ontic Function)。所谓认识功能主要强调的是计算机的计算功能,它作为一种认知设备扩展或加强了

1

Paul Durish(2004). Where the action is- The foundations of embodied interaction. MIT Press: 140.

31

东华大学硕士学位论文

人的认知能力。另一方面,我们的个人电脑中的绝大多数多应用的设计初衷并不辅助我们的工作,例如虚拟现实、电脑游戏、娱乐软件等。Brey将计算机承载的这些功能成为本体功能,这些功能的目的为用户创造一种体验,继而扩展了我们与世界的关系。

3.41 认识功能(Epistemic Functions)

Brey认为,由于当代通用计算机的功能强大,仅仅说计算机具有一类认知的功能是远远不够的。在此基础上,作者考察了主要作为认识功能的计算机与使用者的三类关系。

替代(replace)关系

所谓替代关系是指,人工物完全替代了人体器官的相关功能。例如,当我们开汽车时,我们的腿就不再承担提供我们移动动力的功能。从计算机科学领域看,早期人工智能研究中,科学家试图通过计算机技术完全模拟人的智能,他们的目标就是制造一个像人一样的认知主体,或找到一种人脑的替代物。虽然这一研究最终并未成功,但其一些阶段性的研究成果在特定的领域确实已经替代了人的大脑,如深蓝计算机在国际象棋领域与人的关系就是一种替代关系。

补充(Supplement)关系

所谓补充关系是指,人工物的功能与机体实现完全相同的功能,机体通过人工物加强了本身已有的能力。比如衣服的功能和皮肤一样,只是加强了。从计算机领域看,计算机辅助智能的观点在过去取得了很大的成绩,并且至今仍在不断发展。以辅助智能角色出现的计算机,帮助人类完成一些复杂、单调、易错的计算任务。比如在工程计算中,用户设计好算法后,具体的数值计算则有计算机完成。

加强(Enhance)关系

加强关系与辅助关系的区别在于,加强关系是人工物通过与机体合作来加强机体的功能,而辅助关系中,我们的机体和人工物的功能则是完全一样的,二者没有任何功能上的互动。比如显微镜和眼睛,缺少任何一个我们都不可能看到微生物,因此这一种加强关系,而皮肤和衣服则是辅助关系,因为即使我们没有皮肤,衣服仍然担当着保暖的功能。在计算机领域,个人电脑的兴起带动了这一模式的发展,这一模式下,计算机不再是一个自动的认知单元,而是辅助人的认知。人的认知系统和计算机耦合在一起,即是交换信息,共同完成认知任务。PC机上大多数的软件与我们的关系都是这种加强关系,我们对计算机的操作等价于克拉克和查尔莫斯所谓的认知操作。比如在Word中,我们调整字体大小,计算机经过计算后就会把新的文档板式反馈给我;再比如,计算机辅助(CAD)设计中,我们通过滚动鼠标中键来翻转我们设计的模型,在这种操作中,我们对鼠标的操作和计算机对虚拟设计模型的操作是耦合在一起的,等等。对于这种耦合系统,布雷称为杂交系统(Hybrid System),笔者认为所谓杂交系统在本质上与查

32

东华大学硕士学位论文

尔莫斯所谓的混合系统(Coupled System)是等价的。

从上文的分析中我们看到,计算机被广泛用来作为辅助或替代用户进行认知的工具。但从中我们也注意到,我们分析的对象几乎全是那些专业的软件与专业用户间的关系,而忽略计算机的另一大类功能。这种功能体现在普通用户所使用的个人电脑,智能手机,平板电脑中,体现在这些设备提供的娱乐、生活、游戏等功能中。

个人计算机和多媒体普及的今天,计算机对今天的普通用户来说已经不再是一个辅助我们工作的工具,而更像是一个多媒体的娱乐中心,特别是在今天的移动计算设备中,智能设备的辅助认知功能已经被大大弱化甚至去掉了。当然,从客观的角度看或者对于计算机开发人员来说,计算机的所有功能在本质上都是对信息的处理,因而所有的功能也都是一种认知功能。但当我们应用windows或mac系统时,当我们在计算机上听音乐或刷微博时,虽然从算法的角度看,计算机仍然在处理一些抽象的符号信息,但但站在普通用户的视角上,我们面对的不是数据,而是桌面、音乐、社会关系等。

3.42 本体(Ontic)功能

布雷认为相对于那些大型的专业计算机而言,今天的个人电脑的主要功能并不是帮助我们处理信息,而是给我们提供更多的体验。我们更多的是用他们是模拟世界上已经存在的一些对象或创造一些并不存在的对象,不是一台认知设备(Cognitive device),而是一台模拟设备(Simulation Device),并且他将这种功能成为计算机的本体(Ontic)功能。在这种功能中,计算机借助多媒体技术手段模拟现实中的物理实在对象和社会实在对象,这种功能最集中的体现在虚拟现实技术中。在虚拟现实技术中,作为认识主体的人置身于以计算机模拟和显像为基础的虚拟环境中,与虚拟对象进行互动。在这种环境中,计算机所实现的功能就是一种本体功能,在某种意义上,计算机所模拟的对象也具有本体论地位。例如张怡在《虚拟实在论》一文中就认为,虚拟现实技术的模拟物也具有实在意义,是一种感觉性实在,“在虚拟现实技术中,实在的主客体性界限模糊了,实在不再仅仅意谓着是物理性的,也是主体感觉性的。”1

3.5 从现象学视角看人机关系

当我们站在认知主义的角度上,将人机交互理解成人与智能设备的二元关系时,自然就会忽略环境与行动主体的关系。虽然这种视角操作起来十分方便,但是它却强迫我们接受一个观点,即在人机交互中我们的行动对象是计算机。那么我们是否有其他的视角来探讨人、智能设备、环境三者的关系呢?

1

张怡:《虚拟实在论》,《哲学研究》2010年第6期。

33

东华大学硕士学位论文

前文中我们介绍了布雷关于人与计算机关系的分类,讨论了胡塞尔和伊德哲学中的相关内容。本节我们将站在伊德和胡塞尔现象学立场上,从三个问题切入分析人与计算机的各种关系关系。第一是,人在人机交互中行动的意向对象是什么。第二,智能设备在这种行动中是如何出现在人的视域中的。第三,人,智能设备,世界的关系是什么。并且笔者提出一个观点,在未来普适计算的环境中,智能设备将以两种方式嵌入我们的生活,它或者作为人的认识的延伸被嵌入我们的行动中,或者以物的延伸的行动被嵌入到我们的行动对象中。

3.51 强的替代关系

替代关系中,我们首先应该区分强的替代和弱的替代。在弱的替代中,设备仅仅替代了我们部分的认知功能,比如在一个问题求解的过程中,我们将搜集信息的工作交给设备,决策则有自己做出,这一关系我将在后文中予以分析。

在强的替代中,智能设备完全代替了人的功能,这是他与用户的交互就是两个完全对等的主题的交流。例如图灵测试、深蓝计算机与卡斯帕罗夫的对局都是这个类型的交互。在这种互动中,人与智能设备的关系对应着伊德所说的是一种它异关系。在这种关系中,我是以一种主体间性的方式去经验智能设备的,即“我把它经验为对这个世界来说的主体,他人同样能经验到这个世界“1在这种关系中我的意向对象可能是智能体也可能是其他对象,在前一种情况中,我直接的经验智能体,我把它经验位于我们自己想想的心灵和自我的体现。后一种情况中,我们并不观察我们自己与他人之间的直接关系,而是“观察我们和他们与此二者共同拥有的世界以及世界的关系。”2例如在与计算机棋手下棋时,此时的我虽然直接关注的是棋局,但是棋局作为对象却是以主体间性的方式给予我,我意识到与我互动的智能设备也在以某种方式关注着它。

在强替代性关系中,用户和智能设备的互动正像是人与人之间的互动。唯一不同的是,我们不一定会一直将对方经验为与我相同的心灵,正如伊德所说,在它异关系中,技术人工物是准对象的。例如在图灵测试中,被试者一旦看到与他交流的只是一台计算机,他就会立刻转换交流的意向性,可能转而关注设备的设计方式、原理等,例如他可能会试图问一些设备可能答不上来的问题。 3.52 加强关系、弱的替代关系、补充关系

1

胡塞尔:《生活世界现象学》,上海译文出版社2005年出版,第55页。 现象学导论,索克拉夫斯基,现象学导论,p150

34

2

东华大学硕士学位论文

但我们使用个人电脑机型辅助设计、辅助办公室我们与计算机的关系是典型的加强关系。例如,当我用3DMAX进行设计时,在设计之初我只有一些模糊的概念,比如我觉得设计的手机将是弧面的,上面有一些数字键,屏幕大概占手机一般的面积等等。当我利用软件提供的工具慢慢的表现这些造型时,计算机将造型各个局部之间的关系计算并呈现给我,例如,当我想得到一个由两圆柱体组合成的图形时,我很难意识到在图形相接的地方有一条鞍形曲线,但当我真正的用CAD软件进行布尔运算后,计算机就自动计算机会将两型的切线展现给我(如下图)。

图4

图5

注a:图4和图5中,在我们的意识中的图形类似图1,我只以一种不太精确的方式意识到它。而当我们用计算机将这个图形表现出来是,它的细节就展现出来了,例如黄线所标示的鞍形曲线。

在这种情况中,我与计算机的关系就是伊德所说的具身关系。在我的行动中,我并不关注我使用的软件,而将注意力放在我的设计的产品、我编辑的文档、我绘制的图画上。而计算机对我则是完全显透的,和我的身体融为一体的。计算机之于我的认知,如锤子之于我的手。当我拖动鼠标时,我所做的是翻转这个图形,而不是在操作这个软件,计算机则及时的将我的操作结果反馈给我。

那么,在这种关系中,我们是如何意识到技术的呢?这里我们要借助胡塞尔的权能性和内视域的概念进行分析。前文对胡塞尔的分析中,我们已经提到了本真被感知之物和共同当下之物的区别,即前者是那些被我们直观到的现象上的规定性,后者是在空乏中被先示的规定性。这里我们还应该注意到,即使在现实显现之物中,也包含着向前摄取(Vorgreifen)的意向,即内视域。正如胡塞尔所说“即使已经被现实的看到的一个面而言,它也发出这样一种召唤:走近些,再走近些,然后改变你的位置再看我,改变你看的方式,目不转睛地注视我,如此等等,你会在我身上发现许多新的东西,发现更多的局部色等等。”1在内视域中被显示到的这些部分,是作为某种可能性处在我的权能范围之内的东西被我拥有

1

胡塞尔:《生活世界现象学》,上海译文出版社2005年出版,第21页。

35

东华大学硕士学位论文

的,胡塞尔称之为权能性。这种权能性对我来说是非课题的,我的感知经验通过这种方式不断向前迈进,我通过把我非课题的权能性来了解作为课题的对象的其他进一步的规定性。

当我们用3DMAX进行设计前,我可能明确知道我的设计的轮廓,我可能还有一个手绘的草图,这个草图即将设计的主要的特点呈现给我。但是还有更多的细节则只是在空乏的先示的意义上被我经验到,我可能不知道如此绘制的曲线最终是否连续,这样的倒角是否平滑。但是,因为3DMAX就在我的手边,我可以随时的放大、缩小、翻转整个图形,软件即刻就将图形的细节呈现给我。因此笔者认为,作为补充关系的智能系统丰富了我的权能性,并且在我对对象的操作中以权能性的方式把我到。

对于补充关系和弱的替代关系,笔者认为在本质上就是为具身性更强或更弱的加强关系。在布雷看来,加强关系和补充关系的差别在于,前者,我们以组合的方式与技术互动,在后这种我们则以叠加的方式与技术互动。但是我们很难想象到真正与我们成补充关系的认识技术。在一项认知任务中,只有智能设备与大脑进行相同的认知操作时,人机关系才是这种补充关系,而在实际的合作中,我们总会调动一些与设备不同的认知资源。比如在克拉克和查尔莫斯的心理旋转的思想实验,是最接近与补充关系的情况。在这种情境中,数字旋转的能力已经嵌入了主人公心智,但是在进行心理旋转时,主人公和数字芯片的操作并不相同,前者的任务是选择索要调动的心理资源,后者的任务是旋转图形,因此严格的来说他们的关系也不是补充的。

这里我要补充一点,在实际的操作计算机时,任何时候计算机与用户都不会呈现出如此单纯的某种关系。在我进行工程计算时,我还必然会用到键盘、鼠标,还要面对软件呈现出的交互界面,我们这里只是抽象出了这些关系中的最重要方面进行分析。但是笔者认为,当我们将所有的抽象关系都分析完毕后,我们实际中的人际关系只是这些抽象关系的组合。

3.52 人的延伸的技术

技术是人的延伸,这一论题我们已经很熟悉了。从技术哲学的伊始,技术哲学家卡普就提出技术的器官投射说,认为机械技术是人类器官的延伸。例如,由于显微镜和望远镜扩展了我们的视觉,使我们看到了肉眼看不到的东西。汽车扩展了我们移动的能力,使我们能走的更快更轻松。锤子、螺丝刀则扩展了我们收的能力。那么急于数字技术的计算机能是否也是人的延伸呢,它眼神的是人的什么能力呢。最早提出数字技术是人认识延伸的当数加拿大学者麦克卢汉(McLuhan)。在《理解媒介》一书中,麦克卢汉提出数字媒体扩展的不只是我们的知觉能力和运动能力,更扩展了的使我们中枢神经系统的能力。

在前文的分析中我们看到,对于我与设备的加强关系、补充关系、弱的替代关系中,我们是以一种非课题的方式把握我的设备的,它们作为我的全能性的一

36

东华大学硕士学位论文

部分被我把握住的。我放大缩小屏幕上的图片,正如同我放大缩小我的瞳孔。设备在这种关系中正是成为了我认识能力的延伸。

在强的替代关系中,比如对于一个机器人,我们说他是我们认识的延伸是否有些牵强呢?笔者认为不是的。因为当我们站在主体间性的角度考虑问题,那么设备提供给我们的就不仅是一个与我们交流信息的对象,也是看待其他事物存在方式的一个视点。正如在下棋时,我们不仅站在我的角度考虑棋局,也要站在对手的角度考虑。很多对于社会、文化的现象学分析正是站在这个视角上展开的。 3.54 本体功能与物的延伸

对于智能设备的本体论功能,会与我们呈现出一种伊德所谓的诠释关系。在这种关系下,我们通过智能设备间接的意向我们的行动对象,对象也是间接的呈现给我们。由于这种间接性,对象的呈现方式会由智能设备的影响而丰富或缩减。例如我们在虚拟现实的环境中使用一把锤子,如果程序设计人员仅仅用代码表征了锤子的锤的功能,而没有表征其在现实中更多的可能性,那么这个虚拟的锤子就仅仅能以锤钉子的方式给予我,虽然我仍然可以以一种空乏的方式意向到它其它的可能性,但却无法发挥权能性将这些可能带到视域的中心。

在另一方面,智能设备更多的是丰富了对象的被给予方式。我们从社会实在的现象中特别容易看到这点。一个典型的例子是虚拟社区。今天的互联网发展了很多的与真实社区混合的虚拟社区应用,例如人人网,这样的虚拟社区建立在真实社区的基础上,丰富着真实社区存在的方式。传统上我们的班级通过通过同学一起上课、班级出游、班级活动等方式实现自身,或者说展现给其中的每个同学。在有了班级的虚拟空间后,我们又可以通过在空间上分享文字、图片实现这一社会实在。对于物理实在,智能设备也可以通过与之结合来延伸他们。比如我们常用的笔,传统上它们是通过我们的写字呈现给我们的,但对于一支智能的笔,比如书写同时进行扫描的笔,它们不仅在书写,同时也在我们将扫描文字上传给电脑的时候呈现给我。

37

本文来源:https://www.bwwdw.com/article/hd47.html

Top