社会感知视角下的若干人文地理学基本问题再思考 - 刘瑜 - 图文

更新时间:2023-09-13 23:03:01 阅读量: 教学研究 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第71卷第4期2016年4月

地理学报

ACTAGEOGRAPHICASINICA

Vol.71,No.4April,2016

社会感知视角下的若干人文地理学基本问题再思考

刘瑜(北京大学遥感与地理信息系统研究所,北京100871)

摘要:近年来,不同类型大数据在地理研究中得到了越来越多的重视,许多学者基于手机、社

交媒体、出租车等数据开展了大量实证研究。社会感知概念刻画了地理空间大数据基于大量人的行为时空模式获取地理环境特征的的技术手段,该手段有助于重新审视地理学研究中的一些基本问题,因而本文选择了空间分布和空间交互这两个基本地理概念以及定性方法和定量方法这两个人文地理基本研究方法展开讨论。大数据从微观个体和宏观群体两个层面同时感知空间分布和空间交互,可以定量分析其中的距离以及尺度效应。进而,由于小样本访谈人群和场所是定性研究的基础,而大数据可以通过定量方法识别特定人群和场所并进行刻画,因此,社会感知手段为集成定性和定量研究方法,构建混合地理学奠定了基础。关键词:大数据;社会感知;空间分布;空间交互;定性方法;定量方法DOI:10.11821/dlxb201604003

1大数据与社会感知

随着大数据时代的到来,学者们认识到了大数据对于地理学以及相关学科(如城市规划、环境保护、交通等)研究的机遇和挑战[1-4]。目前,关于大数据并没有一个标准的定义[1]。考虑到大数据这一概念的出现与传感网、移动互联网等信息技术的发展密切相关,通常把如下途径获取的数据归于大数据的范畴:直接的(如监控设备采集的视频影像)、自动的(如手机、公交卡获取的数据)、志愿的(如社交媒体数据)[3]。其中第二、三类数据近年来在地理研究中受到了广泛关注,其共同特点是每条记录具有时空标记并且可以关联到个体,而一个数据集中包含了大量个体的行为信息。在本文中,地理空间大数据特指这两类数据。目前研究较多的地理空间大数据有手机数据、公交卡数据、出租车轨迹、社交媒体数据等。

对于一个个体而言,其空间行为具有随机性而难以提取有价值的规律特征。然而,当样本变大,一个群体的行为的规律性就较为明显,这种规律性与地理环境,尤其是地理环境中的社会经济特征有关。因此,地理空间大数据为人们进一步定量理解社会经济环境提供了一种新的观测手段。最近,Liu等提出了“社会感知(socialsensing)”概念及研究框架,指出社会感知是指借助于各类海量时空数据研究人类时空间行为特征,进而揭示社会经济现象的时空分布、联系及过程的理论和方法[5]。社会感知数据可从三个方面提取人的时空间行为特征:①对地理环境的情感和认知(如基于社交媒体数据中可以

收稿日期:2015-08-24;修订日期:2015-12-24

基金项目:国家自然科学基金项目(41271386,41428102);资源与环境信息系统国家重点实验室开放基金[Foundation:

NationalNaturalScienceFoundationofChina,No.41271386,No.41428102;StateKeyLaboratoryofResourcesandEnvironmentalInformationSystem]

作者简介:刘瑜(1971-),男,山东诸城人,教授,博士生导师,中国地理学会会员(S110007302M),主要研究方向为地理

信息科学。E-mail:liuyu@urban.pku.edu.cn

564-575页

4期刘瑜:社会感知视角下的若干人文地理学基本问题再思考565

获取人们对于一个场所的感受);②在地理空间中的活动和移动(如基于出租车、签到

等数据可以获取海量移动轨迹);③个体之间的社交关系(如基于手机数据可以获取用户之间的通话联系信息)。社会感知研究框架包括人、地、时三个基本要素。首先,在“人”的方面,社会感知数据可以获取人的活动与移动、社交关系、情感与认知等行为模式;其次,在“地”的方面,可以基于群体的行为特征揭示空间要素的分布格局、空间单元之间的交互以及场所情感与语义;最后,从“时”的视角,可以发现地理过程(尤其是人文地理过程,如城市空间结构演化)的规律和特征。与社会感知手段相比,传统的遥感技术利用光谱特征等获取地物信息,但无法有效感知社会经济环境特征,而大数据包含丰富的人群时空间行为信息,形成了对传统遥感数据的有力补充。

在传统的人文地理学研究中,由于样本量通常较少,难以直接根据人的行为特征去推断地理环境。而根据社会感知框架,相关研究主要有如下几个方向:①基于活动时间变化特征分析用地功能[6-8];②基于空间交互发现城市或区域的空间结构[9-10];③基于社交媒体语义数据提取特定地理事件与地理环境特征[11-14]。正如这些研究所展示的,大数据使基于人的时空行为感知并理解地理环境成为可能[5]。回顾人文地理学发展的几次转向,计量革命因为缺少对人的关注而受到批评,而后期行为主义则受限于样本太小、缺乏定量模型。大数据的出现以及相关的社会感知手段研究,在一定程度上弥补了上述两个方面的不足,对于地理学尤其是人文地理学研究具有重要意义。对于地理信息系统与科学而言,大数据的意义体现在两个方面。首先,大数据管理和分析需要研究实现新的数据模型和空间分析方法;其次,大数据也为实现以人为本的地理信息系统提供了支持[15]。

地理空间大数据及其提供的社会感知手段,带来了全新的研究范式,促进了人文地理学的研究[16],也有助于重新审视地理学研究的一些基本问题。由于空间分布和空间交

,互是地理学研究的两个重要传统[17-18],它们共同表征了空间异质性(spatialheterogeneity)

而定性方法与定量方法是人文地理学研究的两条重要途径,因此,本文围绕空间分布和空间交互以及定性方法和定量方法这两组问题,归纳最新研究进展,并探讨社会感知支持下的空间分布和空间交互研究,以及如何从“人”和“地”这两个视角去集成地理学中的定性与定量方法。

2空间分布和空间交互

空间异质性是地理学的基础概念,它表现为观测变量的一阶分布(distribution)以及场所间二阶交互(interaction)的时空变化特征。空间分布和空间交互在现代地理学研究中受到广泛重视,Ullman、Hartshorne、Castells等著名学者均对此问题进行了探讨[19-21]。Tobler地理学第一定律正是阐述了分布的空间依赖(spatialdependence)及交互所受到的距离影响,从而在理论上支持相关的空间建模与分析[22-25]。2.1感知空间分布和空间交互

大数据同时提供了对于空间分布和空间交互的感知手段。首先,人类活动密度的空间差异及时间变化表达了相应地理现象的分布特征,如图1a所示,利用超过50万用户一年内的社交媒体签到位置,展现了中国城市化程度较高的区域以及主要交通干线的空间分布特征。

除了签到数据,手机的通话记录以及出租车的上下车点都可以用于量化人群活动的时空分布规律[26-27]。在城市尺度上,由于相同功能地块具有相近的人群活动密度以及日变

566地理学报71卷

注:其中暖色调表示高值,冷色调表示低值。

图1利用社交媒体签到数据得到的中国签到点分布及城市间交互模式

Fig.1Spatialdistributionofcheck-inpointsandspatialinteractionsbetween370citiesinChina(Bothmapsarecreatedusingasocialmediacheck-indataset,wherethewarmandcoolcolors

denotehighvaluesandlowvalues,respectively.)

化特征,例如,城市商业中心区的人群活动量呈现出“昼高夜低”的模式,而在居民区,其活动变化模式正好相反。因此,可以基于不同地块的活动时间变化曲线对研究区域进行土地利用分类[6,8]。此外,还可以从带有时空标记的社交媒体数据获取个体的认知和情绪信息,从而在群体层面构建与不同地点相关联的语义与情感,并刻画地理空间异质性,如Dodds利用用Twitter数据研究了区域的“幸福感(happiness)”分布特征[28]。不论是活动随时间变化的特征,还是语义与情感特征,都可以用于表征地理单元间的空间差异性和依赖性,以及在此基础上展示的空间分布模式。

地理学有很久的空间交互研究传统,其中空间交互的解释模型受到了学者的广泛关注[29]。利用大数据所反映的个体移动和联系,可以在聚集层面量化地理单元间的空间交互。例如,基于同样社交媒体签到数据获取的个体城市间移动轨迹,可以进行汇总并表达城市间的空间交互模式(图1b)[30]。近年来,随着大数据的广泛应用,许多学者基于空间交互构建嵌入空间的网络(spatiallyembeddednetwork),即网络的每个节点对应一个地理单元,并引入网络科学分析方法,如中心性度量和社区分割(communitydetection),从而定量评价地理单元的重要性并发现研究区的结构特征。区域划分是处理地理空间异质性的一条重要途径。在大数据的支持下,目前主要有两类分区方法:第一种方法考虑地理单元所关联的活动时变特征相似性,或语义情感的相似性,利用聚类方法,如K均值聚类,将相似性高的区域进行合并;第二种则利用地理单元之间的联系强度,利用网络社区发现算法,将联系较为紧密的地理单元划分到同一区域[9-10]。这两种方法分别基于空间分布的依赖性和空间交互的强度,其区划结果的地理含义存在差异。前者将会得到特定属性(如土地利用)较为均质的区域,而后者得到的分区则往往拥有更为丰富的内部结构,并且可以归因于分区内地理单元功能的差异性和互补性(图2)。2.2空间分布和空间交互中的距离和尺度问题

2.2.1距离衰减效应正如Tobler第一定律所陈述的,空间邻近的区域往往具有相似的属性以及更强的交互。在空间分析中,前者可以通过空间自相关指数(如Moran'sI等)加以度量,而后者则可通过重力模型等途径定量表征距离衰减。大数据提供了基于人的空间行为特征量化现象分布和交互中的距离影响的支持。

地理分布中的距离衰减效应意味着空间距离近的区域具有相似的观测值,即表现为正的空间自相关。地理空间的这种分布特性,对于空间分析至关重要,因为它是空间插

4期刘瑜:社会感知视角下的若干人文地理学基本问题再思考567

注:其中不同颜色表示不同区块,采用数据为出租车轨迹数据。

图2北京五环以内的城区基于相似性以及交互强度的空间划分方法

Fig.2Tworegionalizationschematabasedonsimilarityandspatialinteraction

(Differentzonesaredepictedusingdifferentcolors.ThestudyareaistheurbanareainsidetheFifthRingRoadofBeijing.Botharecomputedusingataxitrajectorydataset.Thesubfigureaiscreatedbyclassifyingthediurnalvariationsofpick-ups

anddrop-offsinparcels,indicatingthatparcelsinthesamecategoryhavesimilarlandusecharacteristics.

Thesubfigurebiscomputedbasedonspatialinteractionstrengthsbetweenparcels,

indicatingthatparcelsinthesamezonehaverelativelystrongconnections.)

值的理论基础[25]。例如在地统计学分析中,即利用方差随距离变化表示相似度的距离衰

减,进而构建插值函数。对于自然地理现象,相似度的距离衰减容易被观测和理解,如Zhao对于中国气候以及植被相似度的空间衰减进行了定量研究[31]。而对于人文地理现象,尤其是与人的行为有关的现象,其相似度距离衰减及空间自相关程度尚需进一步研究。由于地理障碍及人群异质性的影响,导致人文地理现象空间自相关不显著甚至呈现负的空间自相关,典型的如城市的居住隔离(residentialsegregation)现象。在图3所示的北京市昌平区遥感影像中,仅仅一路(京藏高速公路)之隔,分别是别墅区和年轻中低收入者租住的城中村,无疑,其居民收入水准以及空间行为模式会有明显的差异。Liu等通过扩展Moran'sI系数,利用城市出租车数据,初步印证了以上论断[32]。人文现象的这一分布特点,使得研究中基于观测样本的插值操作[33]需要谨慎。

Couclelis认为,所有经典的人文地理模型在表征空间时都将活动视为距离的函数[34]。

图3人文地理现象更为强烈的变化梯度

(a.北京市昌平区北四村以及碧水庄园别墅区的遥感影像;b.北四村为著名的“蚁族村”,约有9万

年轻人租住于图示范围内;c.环境优美的碧水庄园别墅区,与北四村最近距离不到1km)

Fig.3Rapidspatialchangeofhumangeographyphenomena

(a.TheremotelysensedimageofBeisicunandBishunzhuangyuanvilladistrict;b.Subfigurebshows

thestreetviewofBeisicun,whichisawell-knownanttribevillageinBeijing;c.Incontrast,

Bishunzhuangyuan,onlyonekilometeraway,hasabeautifulview.)

568地理学报71卷

随着信息通讯技术的发展,距离的空间阻隔作用被大大削弱[35],因此许多学者提出了“距离的消亡(deathofdistance)”[36]。大数据提供了检视这一论断的支持,除了基于个体的空间移动度量场所之间的联系强度,还可以通过用户间利用信息通讯手段(如手机通话、微博互粉)等建立的联系感知空间交互。对于前者,人或物在空间中的移动由于成本原因会出现距离衰减;而对于后者,即基于信息通讯手段建立的联系中距离影响的程度,目前的研究表明该影响依然存在。例如Kang等利用手机数据,通过重力模型拟合,得到幂律(power-law)形式的距离衰减函数,其指数为0.5[37]。这说明在基于信息通讯技术建立的联系中,距离衰减效应尽管较弱,但并非已经“消亡”。这可以归因于人们在网络空间的联系可以认为是真实世界中联系的映射,即两个区域间的社会经济关联越强,通常其间居民的联系也越多,即两者存在正相关关系。由于前者存在距离衰减效应,使得在群体层面的联系依然受到空间约束,而不是与距离无关。2.2.2尺度效应空间分布和空间交互在传统地理学研究中,多在区域聚集层面进行分析。由于地理学缺乏天然的分析单元[38],研究结果依赖于空间单元形状,即产生了可变面状单元问题(modifiablearealunitproblem,MAUP)[39]。Armhein指出该问题的产生包括两种情形:从小面积单元到大面积单元的不同尺度的聚合方式,以及研究区的不同划分方案[40]。由于大数据的基本粒度是个体,使得研究者可以同时从个体和群体两个层面观察空间分布和交互模式(图4)。很明显,在个体层面的分布和交互模式中,并不存在分析尺度的影响。只有当试图依据不同空间分析单元概括群体层面的模式时,才需要处理MAUP

注:图c中三角符号和方形符号别表示轨迹起点和终点。问题。因此,可以基于大数据感知到

图4个体和群体两个层面的空间分布与空间交互的行为模式在不同聚合方案中的变

Fig.4Spatialdistributionandinteractionatboththeindividualand化,考察地理现象的尺度效应。

aggregatelevels(a.Individuallevelpointdistribution.b.Aggregate

与空间分析中的尺度效应相类

leveldistributionbasedonarealunits.c.Individuallevelinteraction.

似,基于大数据研究人的空间行为模d.Aggregatelevelinteractionbetweenarealunits.)式需要注意生态学谬误(ecological

fallacy)问题。由于大数据具有海量的个体样本,使得研究者可以很容易观察整个样本的空间行为模式并建立解释模型。然而,由于人群异质性(populationheterogeneity)的存在,基于整个人群得到模式和模型未必适用于每个个体[30]。例如,对于一个人群中所有具有联系的个体之间的距离分布,尽管基于手机数据已经观察到距离衰减效应[37],然而具体到每个人,其联系对象的空间分布未必随距离增加而变得稀疏。不论是地理空间的MAUP问题还是人群的生态学谬误问题,都需要在大数据研究中,建立微观个体到宏观群体两个层面模式的关联。

本文来源:https://www.bwwdw.com/article/nedh.html

Top