六度空间的应用——找出两个陌生人之间的关系

更新时间:2024-06-16 09:57:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

社交网络

1.2.1 六度空间理论

当今最流行的Facebook、Twitter、新浪微博、人人网等社交网络站点的理论基 础正是“六度空间理论”。人们通过社交网络服务提供的人际关系网,在找到老同 学、老同事的同时,也可以继续结识新朋友,扩展自己的人脉网络。

六度空间理论(Six Degrees of Separation)是一个数学领域的猜想,又称为六度 分割理论,也叫做小世界理论。该理论指出:任何两个陌生人之间所间隔的人数量 不会超过六个。用一个简单的说法,最多通过六个人间隔,你就能够认识地球上任 何一个陌生人。

20世纪20年代,匈牙利作家弗里奇斯·卡林思在他的一篇短篇小说中首次提到: 尽管世界很庞大,社会很复杂,但是世界上的所有人,都可以通过至多五个中间人 串连起来。

20世纪60年代,美国哈佛大学的心理学教授斯坦利·米尔格兰姆(Stanley

Milgram,1933—1984)设计了一次连锁信件实验。他把信随机发送给住在美国各大 城市的一部分居民,信中写有一个波士顿股票经纪人的名字,并要求每名收信人把 这封信寄给自己认为是比较接近这名股票经纪人的朋友。这位朋友收到信后,再把 信寄给他认为更接近这名股票经纪人的朋友。最终,大部分信件都寄到了这名股票 经纪人手中,每封信平均经手6.2次到达。米尔格兰姆基于这个连锁信实验提出了六 度分割猜想,尝试证明平均只需六个人就可以联系任何两个互不相识的美国人。 2001年秋天,美国哥伦比亚大学的社会学教授瓦茨(Duncan Watts)组建了一

个研究小组,利用电子邮件开始进行六度空间理论的实验。在一年多时间里,总共 有166个国家和地区的6万多名志愿者参与实验。实验结果证明,一封电子邮件平均 被转发6次,即可回到原始发件人那里。

一个经典的关于六度空间理论的故事是:数年前一家德国报纸接受了一项挑战, 要帮法兰克福的一位土耳其烤肉店老板,找到他和他最喜欢的影星马龙?白兰度的潜 在关联。结果经过了几个月后,报社员工发现,这两个人只需要经过不超过六个人

的私交,就可以建立起人脉关系。原来烤肉店老板是位伊拉克移民,他有个朋友住社交网络中陌生个体间人际关系形态研究 第 4 页

在美国加利福尼亚州,而刚好这个朋友的同事,就是电影《这个男人有点色》制作 人的女儿在女生联谊会的结拜姐妹的男朋友,而马龙?白兰度又主演了这部影片。 这种现象的发生,并不是说任何人与其他人之间都必须通过六个间隔才会产生 联系,而是表达了这样一种重要的概念:任何两个原本素不相识的人,通过一定的 方式,总能够产生必然的联系或关系。六度分隔也阐释了社会网络中一个重要的现 象,即小世界理论,其含义是在一个成员众多的社会网络中,可以按照某种方式来 建立成员之间的关系链,平均最短关系链的链长远小于人群的人数。

六度空间理论提出以来,引起了人们的极大关注,同时也激发了人们无穷的想

象力。1990年,戏剧《六度分隔》上演。1993年,基于这部戏剧的同名电影《六度 分隔》上映。影片主角的台词包括“不管是美国总统还是威尼斯的船夫,只要找到 正确的5个人,我们就能联系起来”等等。

1998年,康奈尔大学的博士生Watts及其导师Strogatz在《自然》杂志中发表题 为《“小世界”网络的群体动力行为》的论文,提出了Kleinberg小世界模型,把这 种关系变成了一种可以评估的数学模型。大量的研究证明,大多数的社会网络都满 足小世界理论的要求。在参加聚会或其他活动场合,我们经常说的一句话是:“这

世界真小”,因为人们一聊天交流,才发现彼此会有共同认识的好友。 1.2.2 社交网络的起源和类型

1978年诞生的电子布告栏(Bulletin Board System,简称BBS)系统不仅仅是电 子布告栏而已,它包括信件讨论区、文件交流区、信息布告区和交互讨论区这几部 分。在之后二十多年的时间里,BBS迅速成为全世界计算机用户交流信息和沟通的 园地,社交网络正是从Web 1.0时代的BBS层面逐渐演进而来。

互联网聊天室(Internet Relay Chat,简称IRC)在1988年出现以来,一直广受欢 迎。它的特点是速度非常快,聊天时几乎没有延迟的现象,并且只占用很小的带宽 资源。所有用户可以在一个被称为Channel(频道)的地方就某一话题进行公开聊天 或私下密谈。每个IRC的使用者都有一个可更改的Nickname(昵称)。

出现于上世纪90年代的WWW浏览器带来了互联网的迅速发展,成为了当时的“杀手级应用”。越来越多的人们开始方便的接触网络,使用Yahoo Groups 和 E-mail、邮件列表、新闻组来彼此进行点对面的多方交流。

人类历史上,大凡重要的技术革命都伴随着媒介革命,人类任何活动本质上都 是信息活动,信息流的传递介质和管理方式的不同将决定你接受信息的不同,所有 有关信息流媒介的变革一定是底层的变革—社交网络也是如此。

社交网络一直在降低人们社交的时间和物质成本,或者说是降低管理和传递信 息的成本。与此同时,社交网络一直在努力通过不断丰富的手段和工具,来替代传 统社交方式来满足人类这种社会性动物的交流需求,并且正在按照从“增量性的娱 乐”到“常量性的生活”这条轨迹不断接近人类的基本需求。

新的社交网络提供的便捷服务使得用户更具自主性、互动性,用户不再是被动 接受信息的媒体受众,而是积极地参与到网络中,成为信息的制作者、发布者、传 播者和分享者。

在 Web2.0 时代,用户已经可以在相当大的自主空间内将个人信息发布而不再 受传统封闭式门户的约束,信息生产与信息传播的主动权在一定程度上回归大众, 信息传播的内容多样性、互动便捷性与个性化订制能力大大增强,以个人为中心的 Web2.0应用已经摆脱少数商业精英力量的控制,自媒体促成了草根阶层的迅速崛 起,推动着互联网朝着亲和开放的方向发展,产生出一种全新的传播生态。

2002年,面向商业客户的 LinkedIn 网站成立。LinkedIn 努力帮助人们增进相互 了解,相互结识,使人们更有机会在事业当中相互协助。具体说来是这样的:假如

A 和 B 都是个人 C 社交网络的联系人,A 可以通过 C 寻求与 B 结识,如果 B 同意, 那么 A 就获得了一个新的联系人。通过这种方式,人们可以结交到更多的朋友,也 可以找到更多的合作伙伴。

2003年,运用丰富的多媒体个性化空间吸引注意力的Myspace网站成立,提供 人际互动、使用者自设定的朋友网络、个人档案页面、博客、群组、照片、音乐和 视频影片的分享与存放。

2004年马克·扎克伯格(Mark Zuckerberg)在哈佛大学创建的Facebook网站改

变了世界,也宣告了社交网络时代的全面到来。2012年10月4日,该社交网站活跃用社交网络中陌生个体间人际关系形态研究 第 7 页

化应用网站,吸引了大批高校大学生用户。近年来,随着移动互联网的兴起和智能 手机的普及,无处不在,无时不在的手机微博、微信也在高校大学生群体内广为流 行。2012年11月尼尔森最新发布的一份报告显示,目前全球近一半社交网络用户通 过手机等移动设备来访问社交网络,这一趋势在亚太地区尤为明显。

根据中国互联网络信息中心(CNNIC)发布的《第 27 次中国互联网络发展状

况统计报告》调查显示:截至 2010 年12月,中国社交网站的用户规模达2.35亿人, 年增用户人数5918万人,年增长率 33.7%。社交网站在网民中的使用率达51.4%, 比2009 年增加5.6个百分点。调查显示,活跃用户占比 63.9%,用户规模约为 1.5 亿 人;非活跃用户占比 36.1%,用户规模约为36.1%。

互联网的社交化趋势和手机上网需求的快速增长,使手机社交化应用迎来更大 的发展,手机社交网站的使用快速普及,手机社交功能服务不断丰富。同时,社交 网站也通过提供手机客户端产品的下载,与手机厂商通过合作在手机终端内置客户 端等方式,积极推广手机SNS产品和服务。

尼尔森旗下NM Incite董事总经理亚瑟·尤素福(Yasir Yousuff)表示:“社交媒

体是有史以来增长最快的媒体,目前全球3/5的互联网用户使用社交媒体。亚太地区 用户使用社交媒体比全球其他任何地区都更频繁。随着越来越多用户拥有可上网的 移动设备,我们认为,跨平台活动和移动社交媒体的使用将出现大幅增长。” 尼尔森2012年12月发布的《2012年社交趋势报告》显示: 不仅美国,全球的用

户使用智能手机、平板、游戏机、智能TV的时间一直在增加,2012年访问时间总体 上升了21%,每个月上升到520分钟,不过其中17%的时间花在了Facebook上。截止 到2012年7月,8550万的用户通过智能机和平板应用访问社交网络;而2011年7月这 个数字只有4480万;不过有趣的是,Facebook的PC用户减少4%的时候,Twitter增长 了13%,Google+增长了80%,Pinterest增长了1047%。18岁至34岁的用户中,有1/4 的用户边看电视边在社交媒体上评论电视内容。不过做这种举动全球各有差异,47% 的亚洲用户会这么做,63%的中东和非洲用户会这么做。对于各品牌和广告商发布 在社交媒体上的广告,1/3的用户选择忽视,超过1/4的用户喜欢看朋友分享的广告 信息。

社交网络的蓬勃发展,已经改变了人们传统的学习和工作,交友的生活方式。第 6 页 户已突破10亿大关(其中6亿来自于移动平台),成为全球最大的社交网站。扎克伯 格在Facebook网站上称,Facebook用户的平均年龄正趋于年轻化,2007年的用户平 均年龄是26岁,2010年活跃用户数量达到5亿时,平均年龄降为23岁,如今已降至22 岁。

2006年创建的Twitter是全球最火热的SNS服务之一,也是微博客这一概念的先

行者。2009年8月新浪微博的推出,拉开了中国微信息社交网络时代的大幕。140字 的及时表达,及根据用户价值取向及兴趣所向等多维度划分用户群体,用户通过推 介及自行搜索等方式构建自己的朋友圈。随着智能手机的普及,这种产品迅速聚合 了海量的用户群,当然也吸引了众多业者(如腾讯、网易、盛大)的追随。2012年 新浪Q4财报显示,新浪微博的注册账户已突破5亿,2012年12月日均活跃用户数在 4620万,同比增82%,75%的活跃用户通过移动终端登录微博。

2013年1月腾讯公布,微信注册账户已超过3亿,相对于传统SNS,微信更能迎 接互联网移动化、碎片化、分散化和在线化的潮流,提供了更加便捷、便宜的服务。 如果按照用户数来说,腾讯实际上已经是中国的第二大运营商,严重冲击了中国移 动、中国联通、中国电信的传统用户市场。

国内的开心网(2008年推出)和校内网(2006年推出)也迅速复制了Facebook 的成功模式,为用户提供了开放的互动平台,让用户与朋友、同学、同事、家人保 持更加紧密的联系,及时了解传递他们的动态,在线分享照片、日记、心情。 社交网络的实质,是由人际关系网络,以及在这个关系网络上流动的信息所构 成一个开放系统。和朋友,以及朋友的朋友分享自己的人脉圈,在这种一环套一环

的社交网络的推动下,用户的人脉交际圈网络会像滚雪球一样越滚越大。而拥有这 样一个庞大的人脉网络资源,无疑是一笔巨大的财富,能够让参与其中的人们彼此 都拥有更强的人脉能量。 1.2.3 国内外发展趋势

本世纪初起步的Facebook、Twitter、Linkedin等社交网络服务网站带动互联网走

进了Web 2.0时代,国内也随后产生了新浪微博、腾讯微博、人人网、开心网等本土社交网络中陌生个体间人际关系形态研究 第 8 页

在国内,随着门户网站、搜索引擎和电子商务巨头先后加入社会化媒体阵营,跨界 和开放成为这两年来的最新趋势。一方面团购的崛起,模糊了社交网站和电子商务 的界限;另一方面各大网站纷纷推出第三方开放应用平台,鼓励基于社会化媒体的 商业创新。

第二章 社交网络人际关系获取 第一节 人人网 2.1.1 人人网的背景

人人网(renren.com)的前身校内网(xiaonei.com) 成立于2005年,由清华大 学毕业生王兴创立,首先在清华大学推出,是中国最早的校园SNS社区。校内网最 开始采取措施进行控制,仅允许来自大学网络地址段或者拥有大学电子邮箱(edu.cn) 的用户注册,这样的规则就保证了其初期注册用户绝大多数都是在校的大学生群体。 用户注册完成之后可以上传自己的照片,撰写个人日志,互相留言等。人人网站鼓 励大学生用户使用实名进行注册,上传真实照片,从而让大学生群体在网络上享受 到现实生活的乐趣。

基于人与人之间关系的应用,从“熟人的熟人”网络社交拓展逐步演变成基于

兴趣爱好、学习经历、居住地点、IP地址等判断用户潜在朋友关系,通过朋友之间 彼此邀请吸引用户登录注册,使人人网的推广获得良好的用户基础。

2009年8月4日,校内网正式更名为人人网。但仍然保留了以实名制为基础,为 用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用 户对社交、资讯、娱乐、交易等多方面的需求。

2008年人人网推出了开放平台战略,提供了丰富的API调用接口给开发人员。 大量的第三方网络公司和独立编程人员为其开发了丰富的网页版Web应用程序和网 页版游戏。各种各样的社会化网络游戏为密切社交网络用户之间的互动和联系也提 供多元化的选择,从而在一定程度上推动了中国互联网往平台化方向发展。

2012年初,人人网提出与电信运营商、操作系统提供商、终端设备厂商及开发社交网络中陌生个体间人际关系形态研究 第 10 页

关系,不会出现类似新浪微博上超过千万粉丝的一些明星帐号。人人网官方2011年 底公布平均每个用户有大约190个好友,并且八成用户在人人网留下了真实资料。微 博营销团队以及大量的刷粉军团、虚假微博红人的出现,使得微博用户数量众多, 但是良莠不齐,过多的人为操纵因素使得国内微博难以体现真实的人际关系。 三.目前高校大学生最频繁访问的SNS网站就是人人网。大学生群体普遍拥有 较高的知识文化水平,受教育程度较高,走在时代的前端,容易接受新事物和新观 念,有被关注的需求,希望通过发表观点来引起他人的注意,渴望通过开放的社会 交往方式来实现自己的人际交往和人际关系维护的需求。

大学生有比较强烈的情感需求,而在现实生活中,他们的情感需求并不总是得

到满足;大学生由于受到各种不良刺激,容易出现迷茫、烦恼和焦虑等负面情绪, 这些问题在现实中由于大学生生活阅历不足,本身解决问题的能力有限,再加以不 愿意咨询老师和心理医生寻求帮助,因而得不到较好的解决。社交网络服务具有自 由、虚拟、隐秘的特点,因而大学生往往选择通过网络来宣泄情绪。

根据对上海交通大学校园网一周对外网站访问的不完全统计,全校14%~18%

的网站访问请求量都指向了人人网相关网站。大量的真实用户基数和其产生的复杂 人际关系为后期的研究提供了基础。

四.以往只能依靠有限的小范围调研或模拟才能进行的社会网络调查分析,在 计算机程序辅助获取批量数据和新的统计分析技术的支持下,具备了大规模开展和 实施的条件。并且这些分析减少了人为主观因素,可以更加客观的进行,并且能够 进行重复实验加以验证。

第二节 社交网络用户信息获取 2.2.1 大学生数据获取

如何大量获取真实的社会网络数据是一个很有挑战性的任务。作为社交网站会 尽力保护这些数据不被批量获取,但同时也不得不开放这些数据来帮助人们发现和 拓展好友群体。对人人网社交网络用户的数据搜集和初步分析,我使用了Python语

言编程来实现,具体实现是模拟真实用户去访问网站,然后保存返回网页内容并按第 9 页 者联手,为每一家合作伙伴打造社交解决方案,让社交网络贯穿所有服务。2012年3 月31日,人人公司副总裁、人人无线总经理吴疆表示,目前人人网用户数已超过两 亿,其中每日通过移动设备访问网站用户数占总体用户数一半以上。作为国内首度 涉猎移动定位服务(LBS)的社交网站,“人人报到”率先在移动客户端中引入位置 服务的概念。数据显示,用户在人人网每天更新带地址信息的内容超过100万条,人 人已经成为国内移动互联领域最大的LBS平台。 2.1.2 选取人人网的原因

对大学生群体进行社交网络分析研究需要一个切入点,本次论文选取人人网做 为初始研究的社交网络平台对象,主要出于以下几点考虑:

一.人人网的前身校内网是集中定位于大学生群体的SNS网站,为广大大学生 提供了一个互动交流平台,2009年更名人人网后主要活跃群体依然以在校大学生和 部分中学生为主。《2010 年中国网民社交网站应用研究报告》显示,社交网站用户 主体是年龄 30 岁以下的年轻群体,20-29 岁的用户占比最高,达 37.4%;其次是 年龄在 20 岁以下的用户,占比 31.6%。与互联网网民总体相比,社交网站用户的 年龄结构更加年轻,年轻群体所占比例非常高,如下图1所示。 图 1:社交网站用户的年龄分布

二.人人网在实名制注册和认证确认控制方面做的较好,其用户身份的真实性 相对微博更为可靠,并且其用户的人际关系也比较纯净,大多是双向之间的强好友社交网络

《2010 年中国网民社交网站应用研究报告》显示,有83.8%的用户表示,在社 交网站上的好友是现实中的朋友。同时,网络交际人群比例也较高,54.6%的社交 网站用户好友是来自线上交往。

在社交网站用户间的各种关系中,业缘关系占主体,用户的好友中78.9%来自 现在或过去的校友,59.4%的用户好友来自同事或同行业的从业者。其次是基于地 缘的好友关系, 59.7%的用户好友来自同一城市、社区居住的人或同乡,地域 SNS

的市场空间较大;基于亲缘关系的占 57.6%,如下图6所示。

图6:社交网站用户好友构成

现实生活中较亲密群体在社交网站中的交往活动,对用户的活跃度产生了积极 的影响。活跃用户与非活跃用户相比,在社交网站上基于亲缘、业缘、地缘等亲密 关系建立起来的关系网络较多。由于这些关系的线下基础较为牢固,且关系的互动 性和互惠性较强,因此对用户行为的互动性和参与性起到了推动作用。 3.1.2 大学生群体平均好友数量

本次做的研究统计显示,有 52,594 名人人网用户明确的把自己的身份信息设定 为上海交通大学并通过了网站认证核实。由于受用户隐私设置限制,本次研究只获 得了其中 12,721 名上海交通大学用户的完整好友列表。下表 4 是对在不同的好友数 量区间内,符合条件的用户数量以及所占百分比统计得出的数据。 好友数量范围 符合的用户数 百分比% 0-100 1175 9.24 100-200 1920 15.09 200-300 2275 17.88 300-400 2078 16.34 400-500 1640 12.89 500-600 1150 9.04 600-700 770 6.05 700-800 548 4.31 800-900 419 3.29

900-1000 310 2.44社交网络中陌生个

体间人际关系形态研究 第 22 页

1000-1100 221 1.74 1100-1200 89 0.70 1200-1300 41 0.32 1300-1400 31 0.24 1400-1500 14 0.11 1500-1600 14 0.11 1600-1700 7 0.06 1700-1800 9 0.07 1800-1900 3 0.02 1900-2000 2 0.02 >2000 5 0.04

表4:上海交通大学用户好友数量统计

下图 7 是分析了表 4 的上海交通大学用户好友数量之后得出的统计图。 图 7:上海交通大学用户好友数量分布

图中横坐标是好友列表(以间隔100人为一个统计区间)数量,纵坐标是符合条 件的区间用户数。统计数据显示,9.2% 的用户好友少于100个,90.8% 的用户好友 数量在100以上;80% 的用户好友数量在600以下,好友数量在200~400区间段的最 多,占34%;所有用户的平均好友数量是 401 名。这个数值远远高于之前提到的人 人网以及Facebook的平均水平,同时也远大于150这个顿巴数。这直接反映出大学生 群体交际非常活跃,人际关系网更为庞大和复杂。社交网络中陌生个体间人际关系形态研究 第 23 页

根据此前抓取到的其他高校部分用户的好友信息,我做了不同高校大学生的平

均好友对比,如表5所示。由于除了上海交通大学的样本用户数超过1万,其他学校 用户选取的样本相对较小,故这个对比仅具有参考价值,但至少有一点是毫无疑问 的,就是各高校大学生的平均好友数量同样都远大于150这个顿巴数。 学校 样本用户数量 平均好友数量 上海交通大学 12,721 401

复旦大学 169 593 同济大学 83 524 华东师大 73 461 清华大学 62 756 上海财经 54 523 北京大学 52 583

表 5: 不同高校平均好友数量对比

大学生正处于成长的黄金时代,他们渴望建立良好的人际关系,从中得到激励, 自信和归属认同感。社交网站的好友大部分存在于现实生活当中,也就是说网络人 际交往从某种意义上是现实人际交往的延伸。社交网络人际关系既依托于现实人际 关系,同时又对现实人际关系产生反作用。互联网上人际交往的满足降低了现实生 活中人际关系的需要,因此大学生理想的人际关系状态应该是现实和网络的优势互 补。

社交网络给现实生活中不善交往的同学也提供了很好的辅助途径。人们在虚拟 世界可以忽视身份、外貌等客观不利条件,自由自在的与其他同学平等对话,表达 自己的观点;在互联网上,没人知道你是一条狗(On the Internet, nobody knows you're a dog);通过社交网络平台,现实人际交往过程中产生的冲突和矛盾也可能得到化 解和改善。

中国人重友情,在家靠父母,出门靠朋友。很难想象一个没有什么朋友的人, 能够独立生活在这个世界上,并且可以过得快乐和幸福。随着时代的变迁,交友方 式也发生了变化。在人人网上,用户可以用较低的成本,维护和扩展受到时间和空 间两个维度限制的人际交往关系,过滤掉现实生活中可能影响人际交往的不利因素,实现用户需要人际交往的基本诉求。人人网对人际关系的积极作用主要体现在维护 原有人际关系和扩展新型人际关系上。 社会学家费孝通先生说过:“现代化在人与人关系上表现最深刻的就是距离缩 短了,接触加多了,范围扩大了,相互往来频繁了。” 社交网站改变了大学生人际 交往的频率并增加了效率, 使得网络人际交往更加方便、 快捷, 为大学生创造了 更为高效的人际交际平台。大学生群体对社交网络的充分利用也直接反映在其拥有 的明显高于社会平均水平的好友数量上,本研究也证实了这一点。 第二节 社交网络陌生个体联系路径 3.2.1 用户最短联系路径研究

2011年12月5日,Facebook和意大利米兰大学Web算法实验室共同宣布了他们关 于六度分离理论的新研究成果:经过对七亿多Facebook用户(相当于全球10%以上 人口)的研究,他们确定任何两个独立用户之间平均所间隔的人数为4.74。 此次合作研究采用了米兰大学Web算法实验室开发的state-of-the-art算法对

Facebook遍布全球的用户好友关系进行分析。研究表明,用六度来描述社交网络中 两个人之间联系的间隔稍微显得有点大,实际在Facebook上,任意两个用户之间只 有五度间隔的概率是99.6%,任意两个用户之间只有四度间隔的概率是92%。2008 年全球用户之间的平均距离为5.28跳,现在只有4.74跳。当把观察范围缩小到美国一 个国家的时候,大部分用户之间的间隔只有三度(4跳),如下图8所示。

在Facebook的研究中,84%的关系对居住

在同一个国家,并且往往两个人在居

住地附近会有共同的好友,年龄相仿。研究显示即使在一个跨国界和跨年龄的社交 网络上,人们也趋向于与不同国籍的同龄人交朋友,如同在同一个国家的人,如下 图9所示。图中横坐标为好友年龄,纵坐标为百分比。 图9:用户年龄和好友年龄分布的关系

2006年7月,微软研究人员Eric Horvitz和Jure Leskovec分析了匿名化处理的全球

范围内MSN用户消息。此次处理的数据集包含2.4亿使用者的300亿次对话,据估计, 这大约覆盖了那段时间全球一半左右的即时通讯消息。会话的具体内容并没有被记 录,仅仅是从统计角度收集必要信息,这也是科学研究中通行的匿名化处理原则。 利用这个数据集,他们构建了一个拥有1.8亿个节点和13亿无向图的当时最大的社交 网络模型并进行分析。

他们的研究表明,MSN用户通过“六度空间理论”彼此相互交流,两个任意用

户在2006年7月间的平均间隔路径长度是6.6。他们的研究还发现,当人们在相互沟 通时,如果有相似的年龄,相同的语言,相近的地理位置,或者异性间的会话都更

加频繁,持续时间也会相对较长。社交网

络中陌生个体间人际关系形态研究 第 26 页

3.2.2 大学生群体间最小好友间隔

本次研究利用之前开发的信息抓取系统得到的数据集,从中抽取出上海交通大 学的人人网用户信息和彼此关系,精确计算出其中任何两个独立大学生用户之间的 最小间隔数以及最短路径联系。数据抽取的原则为:

1. 抽取的对象为上海交通大学的大学生群体,并且抽取的用户要明确知道其全 部好友列表和直接好友数量;

2. 抽取的人人网用户直接好友也要有部分存在这些用户当中,不能全部存在这 一群体之外;

抽取的目的是为了控制研究的目标群体不能无限制的扩大。经过详细计算和筛

选,符合这些条件的上海交通大学人人网用户为12,717个,他们的平均好友数量为 401个。这些一万多人组成的大学生群体成为了这次最小好友间隔研究的对象,最终 研究结果表明:其中任何两个独立用户之间平均所间隔的人数为1.82。

具体分析研究过程中涉及到很多计算机算法方面的内容,本质上可以转化为计 算机图论里求图上任意两点之间的最短路径问题。为此专门编写了多个程序,使用 自己编写的算法进行各种运算,并且使用了高性能的计算能力和大容量存储来支持

进行相关研究。但由于这些基础性工作和研究过程都不是本文的讨论重点,这里不 详加描述,只是把最终社交网络数据分析得到的结果在下面给出。

这12,717个用户通过彼此之间的好友关系互相连接,形成了一张非常复杂的人

际关系网,最终产生了所有可能的161,709,372(约1.6亿)个两两用户对。在人人网 上两个普通个人用户之间,好友关系具有双向性而不是单向性,也就是说如果A成 为了B的好友,那么B也一定会是A的好友,他们之间是强好友联系而不是单向关注 的弱联系。达成好友关系需要双方的共同意愿和许可,而不会单方面达成。但是对 于公共主页用户,则会存在允许单向关注的现象,因此公共主页用户已经被排除在 了此次研究的对象之外。

如果将这些用户任意抽出两个,他们之间可能是直接好友(中间间隔为0个,1 跳到达),也可能拥有一个共同的好友(中间间隔为1个,2跳到达),或者通过几 个人的中间联系再建立起间接联系,这些都是我们早已知道的社交网络的基本规律。社交网络中陌生个体间人际关系形态研究 第 27 页

任意两两用户之间有无数条可能的联系路径。研究表明:在两度的情况下,这一万 多用户之间的所有可能联系路径就已经达到了28,160,908,945(281亿条),下面的 研究仅计算其中最短的一条路径长度。

经过对任意两个用户所有可能最小间隔人数的计算,结果如下表6所示。 最小间隔人数 存在实际数量 所占百分比% 零

1,038,752 0.642357327 一

41,444,632 25.62908475 二

104,618,538 64.69540801 三

14,326,972 8.859704186 四

278,384 0.172150814 五

2,092 0.001293679 六

2 0.00000123679 七 0 0

表6:大学生群体任意两用户之间的最小间隔人数

大学生群体任意两用户平均间隔人数与所占比例如下图10所示,横坐标为平均

间隔人数,纵坐标为对应所占百分比,可见间隔数为2(也就是两度)的占65%,占 据明显优势。研究数据显示,任意两个用户之间六度间隔的概率是100%,已经完全 覆盖了所有用户群。这次研究的内容再一次成功验证了六度空间理论。即使再增加 一度提高到七度,完全没有任何必要。任意两个用户之间只有四度间隔的概率是 99.999%,只有三度间隔的概率是99.827%,只有两度间隔的概率是90.967%,只有

一度间隔的概率是26.271%。社交网络中

陌生个体间人际关系形态研究 第 29 页

曾经有人质疑六度空间不能证明,并提出以下三点疑问:

1. 每个人的关系圈扩展之后都是无穷的,有时候甚至是不为己知的。(比如小 时候曾插班读书的某同学也许已经成了重要人物的副手) 2. 挖掘这些不为所知的关系是需要耗费极大成本的。(与我们越熟悉的关系, 我们越容易发掘,而非要找出某种不为已知的关系,就必须深度挖掘,这需 要耗费大量的成本)

3. 我们真正出彩的关系,不是已知的关系,而是未知的关系,而未知的关系又 是无法穷尽的。所以,六度这种猜测之所以成立,正是因为其无法穷尽性。 本文的研究过程回答了前面这几点疑问。

1. 通过获取目标群体用户的所有好友信息,把用户的无论强关系还是弱关系都 进行了重新梳理。关系圈进行了扩展之后可以得到所有可能的不为用户已知 的关系。

2. 现代高性能计算和大容量存储技术的发展,使得社交网络关系挖掘成为可 能。相应的成本和门槛随着技术的持续进步正在逐渐下降。

3. 零度关系是确定已知的,一度,二度,三度再上去虽然其未知关系数量巨大, 但也是可计算的, 虽然需要花费大量代价, 但并未是无穷无尽。本次研究

得出的平均1.8度正说明了这一点。社交网络中陌生个体间人际关系形态研究 第 30 页

第四章 社交网络人际传播关系分析研究 第一节 社交网络人际传播模型 4.1.1 人际传播模型

六度空间理论虽然肯定了人与人之间存在普遍联系,但没有对这种联系作定量 的分析。我们一生可能会认识成百上千的人,他们有的对我们极其重要,而更多的 对我们无足轻重,只是匆匆路过,再无交集。建立这些联系的原因和方法也千差万 别。有父母亲属这类生而固有的血缘联系,也有因为地理位置接近发展出来的邻里 关系。还有因共同学习工作而建立起来的同学、同事关系。六度空间理论中把这些 统统简单归结于联系,而没有强弱的区分。人与人的关系在网状结构里需要加权处 理。

人与人之间的关系,从沟通互动的频率来看,可以简单划分为强连接和弱连接。 强弱关系实际上并不仅仅由人与人之间的关系决定,还会受六度空间的度数影响。 显而易见的是:一度关系肯定要比两度关系强。在社交网络中,强弱关系还可能会 根据建立关系的分类依据来决定,比如同喜好、同群组、同应用??等。这类关系 相对较弱,但同一类关系交集如果越多,关系则会越强。

强连接最有可能的是你目前工作同事,事业伙伴,合作客户,因为工作和生活

上互动的机会可能很多。弱连接范围更加广泛,同学、朋友、亲友等等皆有可能, 由于沟通和互动的机会较少,更多的是由于个人的时间、经历和沟通机会造成的。 根据统计,可以简单的概括1个人大概有150个联系人,其中强连接约30个,弱连接 约120个。

弱连接理论由美国社会学家马克?格拉诺维特(Mark Granovetter)在1974年提 出。格拉诺维特指出:在传统社会里,每个人接触最频繁的是自己的亲人、同学、 朋友、同事,这是一种十分稳定的然而传播范围却受限的社会认知,是一种“强连 接”现象;与此同时,还存在另外一类相对于前一种社会关系更为广泛然而却是肤 浅的社会认知。例如一个无意中被提到或打开收音机偶然听到的人??格拉诺维特社交网络中陌生个体间人际关系形态研究 第 28 页

图10:大学生群体任意两用户平均间隔人数与所占比例

对这1.6亿个两两关系统计下来,任何两个独立用户之间平均所间隔的最小人数 为 1.82294 。研究表明,用六度来描述社交网络中大学生群体之间联系的间隔显得 有点过大,实际对本次研究对象的一万多大学生用户群体来说,其之间的关系为 1.8 度。在本次研究的大学生群体里,人与人之间的关系是出于意料的如此之近。 通过研究,不仅可以得到最短间隔人数,还可以明确知道最短间隔存在多少种 可能性,并且这些人际联系路径应该如何走,最终通过这些可能路径和另一个陌生 人建立起间接联系。

在实际生活中,最短路径不一定是最佳路径。人际关系也是如此,现实生活中, 人与人之间的关系是多种多样的,相互建立联系的原因和方法也是千差万别,而且 这些关系也有权重值的不同。存在有大量的路径可以选择,这时可以选择若干条可 能的同等长度路径甚至是次短路径来和另一个用户个体之间建立联系。 在社会学中,你认识但不经常联系的人被称为“微弱联系”(Weak ties),这

些联系往往可能是职务空缺这类小道消息的最佳来源。因为和关系密切的朋友比较, 这些人穿行在不同的社交世界中,因此可以看到你和你最熟悉的朋友们所无法看到 的各种机会。如果人们能够首先看到这些关系,知晓这些路径,无疑会在工作和生 活中抢占先机。社交网络中陌生个体间人际关系形态研究 第 31 页

把后者称为“弱连接”。他通过研究发现:其实与一个人的工作和事业关系最密切 的社会关系并不总是“强连接”,而常常是“弱连接”。“弱连接”虽然不如“强 连接”那样稳定和牢固,却有着极快的、可能具有低成本和高效能的传播能力。 格拉诺维特认为在探究一些特定网络现象时,使用弱连接的概念比使用强连接

的概念来得更加重要。他和一位数学家林登?佛里曼深入地研究社会网络和社会资本 的课题后得出的一个主要论点是:有大量数学论证和社会学实验表明,“强连接” 往往形成一个个小圈子,而“弱连接”却会组织出一张大网络。

由于前文已经提到,若每个人平均认识150人,其经过六度传递之后就可以到达 11万亿的规模。但实际上好友的好友是有重叠的,并且不同好友也存在有差异。有 的人虽然直接好友个数不多,但是这些直接好友产生的间接好友数量众多;有的人 虽然直接好友个数很多,但是这些直接好友产生的间接好友数量却并不多。 信息会伴随着人际关系进行传播。研究人际关系实际上也在某个层面上研究信 息在社交网络中的传播扩散过程。真实世界的信息传递与人际关系既有一定联系但 是又有明显差异。

第二节 大学生群体间人际传播分析

4.2.1 大学生群体间人际传播数据分析

利用之前开发的信息抓取系统得到的数据集,从中抽取出12,717个上海交通大 学的人人网用户信息,可以精确计算出从其中任何一个用户开始,顺着真实好友关 系前进的人际传播模型。

下表7 随机抽取了20个大学生用户,观察以其为起点,顺着其好友关系,扩展 最大六度之后的人际关圈影响用户数。为了避免影响范围的无休止扩大,把最大影 响范围也设定在这12,717这个群体。出于隐私保护考虑,这里的用户ID用*隐去了最 后一位。

序号 用户 ID 零度 一度 二度 三度 四度 五度 1 1473* 2 36 1924 12124 12709 12717

2 48826271* 2 1374 8820 12633 12717社交网络中陌生个体间人际关系形态研究 第 33 页

图11:不同度数下达到最大群体影响范围的用户数

如果我们以单个用户为起点,观察其N度之后的平均影响用户数以及其在研究 群体中所占的比例,计算了全部12,717个用户,可以得出下表8的数据。 \\ 平均影响到的用户 百分比% 零度 82.68216 0.65017 一度 3341.677 26.27724 二度 11568.34 90.96756 三度 12694.94 99.82657 四度 12716.84 99.99871 五度

12716.9998 99.999999 六度 12717 100

表8:不同度数下平均影响到的用户

根据表8的数据得到不同度数下平均影响到的用户趋势图,如图12所示。我们可 以看到前期增长速度非常快,一度的时候只能覆盖到26%的用户,但是在二度的时 候已经迅速增长到91%,在三度的时候更增长到99.8%。此后由于已经接近了100%, 增长的空间非常小,六度的时候终于达到了100%。这项研究也在大学生群体这一微 观群体层面上部分验证了六度空间理论的正确性。虽然大部分群体二度即可达到, 但是覆盖全体仍然需要六度。社交网络中陌生个体间人际关系形态研究

第 34 页

图12:不同度数下平均影响到的用户趋势图

研究中发现,只有两个用户之间需要经过六度才能产生联系。虽然这种情况相 对于1.6亿关系对的比例只有亿分之一,但是分析这种情况的出现原因也有实际意 义,这两个用户信息见表9所示,数字显示了其N度之后的影响范围。 序号 用户 ID 零度 一度 二度 三度 四度 五度 六度 1 24285165* 2 7 180 5788 12612 127161 2717

2 48778897* 2 17 365 6920 12479 127161 2717

表9: 两个需要六度才能产生联系的用户

我们可以看出这两个用户的直接好友(零度)都比较少,只有两个。这样从统 计角度上来看,间接导致了其一度好友和二度好友的数量增长速度相对较慢,也就 是从他们出发的人际关系扩展较慢。并且无论是从他们开始出发,还是找到他们的 中间路径都会相对较长。即使这样,但是当增长到四度的时候,以他们为起点出发 的好友仍然可覆盖98%以上的用户。 4.2.2 大学生群体人际传播关系研究

80/20法则(The 80/20 Rule,又称为帕累托法则、帕累托定律、最省力法则或不 平衡原则、犹太法则)认为:原因和结果、投入和产出、努力和报酬之间本来就存 在着无法解释的不平衡。社交网络中陌生个体间人际关系形态研究 第 32 页

3 26144764* 2 421 7473 12638 12716 12717 4 25913226* 20 2048 11905 12710 12717 5 1958* 27 460 8339 12662 12717 6 24256300* 132 5529 12514 12717

7 40021538* 132 4898 12129 12715 12717 8 22119824* 134 4487 12465 12717

9 22878206* 274 5881 12565 12715 12717 10 17895466* 292 8633 12675 12717 11 22369968* 357 9064 12684 12717 12 4504725* 380 9002 12687 12717

13 32734373* 392 8319 12648 12716 12717 14 10075201* 399 9255 12679 12717 15 22919177* 475 9717 12695 12717 16 22079398* 500 10044 12696 12717

17 26137646* 509 8459 12629 12716 12717 18 23251215* 701 10241 12695 12717 19 23258872* 1281 10937 12701 12717 20 26752273* 1556 11036 12705 12717

表7:随机抽取的20个独立用户的N度之后的影响用户数

从上表中我们可以观察到。前两个用户虽然直接好友都同为2个,但是一度的时 候影响到的用户数差异就非常明显,相差38倍;二度的时候影响到的用户数差异虽 然还很大,但已经下降到了4.6倍;但是等到了三度之后,影响用户数差异就并不明 显,几乎相同;等到了四度,五度,基本上就已经影响到了其群体全部用户。不论

起始用户的直接好友是几个,在三度后其影响用户范围已区别不大。即使有的用户 直接好友很少,其二度后影响范围也并不比拥有上千直接好友的用户少多少。 通过计算全部12,717个用户的N度影响范围,我们可以得到下图11。图中横坐标 为度数,纵坐标为满足该度数下可以覆盖全部群体的用户个数。可以看出,13.8% 的用户在三度的时候其影响范围就扩展到了全部群体,82.9%的用户在四度的时候 其影响范围也扩展到了全部群体,只有3.3%的用户在五度的时候其影响范围才扩展 到了全部群体,仅有2个用户需要六度才能把其影响范围扩展到全部群体。社交网络中陌生个体间人际关系形态研究 第 35 页

一般情形下,产出或报酬是由少数的原因、投入和努力所产生的。原因与结果、

投入与产出、努力与报酬之间的关系往往是不平衡的。80/20法则表明在投入与产出、 原因与结果以及努力与报酬之间存在着天然的不平衡性。在日常生活中,80/20 思 想能帮助人们转变行为方式,并把注意力集中到最重要的事情上,其收获就是使用 最小代价得到尽量大的收益。

本次用户影响范围研究也适用于80/20分析法,虽然六度可以满足覆盖100%的 目标影响范围,但是要花费高昂的代价;而二度的时候就已经可以满足覆盖91%的 目标影响范围的需要,所需要的代价会小得多。

在社交网站上面发布的一条消息,可能会透过作者的朋友,以及朋友的朋友不

断扩散开来。这种透过熟人口碑传播的信息传递扩散成本低,而且速度快,效果好。 假设我们要向一个上万规模的特定群体传递信息,比如发一个通知或消息。一 种做法是每个人都一一通知到,这种方式成本很高,效率也很低。另一种做法是选 择其中的若干个独立个体进行单独通知,然后让这些信息通过这些个体的关系链, 口口相传的模式进行传播,最终扩大到整个整体。

美国2011年5月1日宣布本?拉登死亡消息后,此新闻在Twitter上呈现爆炸式的传 播,受众普遍认为社交网站上不仅可以获得第一手消息,并且可以得到更多客观的 评论。关于本拉登的死讯,美国前国防部长拉姆斯菲尔德的办公室主管基斯?伍巴恩 在5月1日10时25分发布微博称:一个老法师告诉我,他们把本?拉登干掉了。这是第 一条在微博上向大众公开本?拉登死亡的消息。基斯?伍巴恩的这条消息在一分钟内, 就被转发80多次,其中包括纽约时报的记者Brian Stelter(他的Twitter有五万个关注 者)。而另一些有影响力的用户也为这个消息传播增加了动力,使它在两分钟内获得

了300多个评论和转发。同日10时30分及以后时间段,奥巴马宣布本?拉登已死,ABC、 CBS、NBC插播口播新闻,众多网站也纷纷报道、讨论,其他国家媒体和网站纷纷 跟进。基斯?伍巴恩在那周成了最具影响力的新闻制造者。发布时间的选择、恰当的 社交网络受众,加上公众对微博发布者的信赖程度,所有这些要素相加引发了Twitter 新闻传播的大爆炸。

好事不出门,坏事行千里,伴随着互联网和手机等现代化通讯手段,口口相传速传播。这时候可靠的消息往往不多,社会上充斥着谣言和猜测。媒体、公众及政

府都密切注视事态的进一步发展和从自己的立场采取应对。对于当事个人或企业在 处理危机方面的做法和立场,舆论赞成与否往往都会立刻见诸于传媒报道。因此个 人或企业必须当机立断,快速反应,果断行动,与媒体和公众进行沟通。从而迅速 控制事态,否则会扩大突发危机的范围,甚至可能失去对全局的控制。危机发生后, 能否及时控制住事态,使其不扩大、不升级、不蔓延,是处理危机的关键。 “意见领袖”(舆论领袖)是拉扎斯菲尔德在两级传播理论中提出的一个传播

学经典概念。媒体只能告知和说服一些关键个人,也就是后来被称为“舆论领袖”

的那些个人,它们转而通过与其追随者的人际传播联系,即以一种两级传播流通的 模式将这种效果加以扩大。在开放性和交互性强的社交网络中,每个人既是信息的 接收者,同时也是信息的传播者,意见领袖逐渐平民化,每一个人都可能成为影响 舆论的人。

为了以最小代价达到最大传播范围的目的,如何选择最少的但是最有价值的独 立个体作为起始点?如何识别哪些用户是意见领袖?信息中间传播几次就可以差不 多结束?直觉告诉我们选择他们中直接好友最多的人开始。零度上看是这样没错, 但是一度,二度之后,情况就发生了变化。本文的研究对这些问题给出了答案,并 且通过研究,可以明确给出每个人的 N 度具体影响范围,从而为选取合适的起始传 播个体给出了方向。

下图13为研究中某个用户的零度好友(47个)分布,可以明确的看出其与直接

好友的联系。但是一旦从零度扩展到了

一度好友,就会发现这个用户的间接好友迅速膨胀到

3793人,如下图14所示,这种量级的人际关系就已经复杂到无法直接通过人的头脑 来简单维护了,而只能依赖社交网络数据分析来帮我们梳理其中的关联性。 Facebook,人人网都有一个好友推荐功能,新浪微博也有帮你找到可能感兴趣

的人,都是通过好友的好友来帮你发现潜在的感兴趣的人,拓展人际交往范围。这 就实际上涉及到寻找共同的一度好友问题。本次研究正可以快速的找出任意两个用

户之间的共同一度好友。

生个体间人际关系形态研究 第 40 页

第五章 社交网络人际交往圈子分析研究

社交网络中陌

第一节 社交网络的交际圈和团体 5.1.1 腾讯的QQ圈子

2012年3月,腾讯推出QQ圈子,根据用户的好友以及好友的好友,系统可以按 照真实生活中的关系自动分圈,智能梳理用户QQ上的社交关系,帮助用户找回失去 联络的老友,好友关系链的延伸使得社交关系变得更加宽广,因此受到了用户的广 泛关注。

圈子是基于QQ好友关系、分组名等信息智能生成的,并且通过聚合分类数学算 法进行人脉推荐,圈子中好友关系比较密集的一群人会聚成一个圈子分组,目前分 组名称有:同学、同事、圈子、朋友以及未分圈好友。用户可以向同一交际圈,但 仍属于陌生人的用户发起对话,拓展人脉关系。

我们随着成长,从一个地方迁移到另一个地方,从一个圈子迁移到另一个圈子。 对于大多数人而言,我们在一个地方出生和长大,去一个新的地方求学,认识新的 朋友。毕业后,我们再去一个新的地方工作,认识新的同事??在每一个阶段,我 们都会有好友,也会有密友。但是随着迁移,旧的好友慢慢地被淡忘。罗宾·顿巴 等人指出,每年我们会遗忘大约15%的好友,而旧时的密友也会从我们社交圈的中 心,慢慢地退到圈子的边缘,甚至最终消失。

QQ圈子帮助我们完成了“结识新朋友,不忘老朋友”的工作。在圈子的后台, 有强大的数据分析和挖掘能力在支撑这项业务。QQ把服务器里的已有好友关系、群 成员关系、不同用户的共同喜好行为等关系链资源整合在一起,从而能够完整的勾 勒出用户的社交关系网,借助多年的历史数据积累分析,帮助用户找到更多的潜在 社交好友关系,从而加入其可能期望的社交网络圈。在个别用户已处的圈子内,QQ 也可以自动为其推荐一些目前尚不是好友的用户,这些人可以认为属于用户当前社 交圈的外延,也就是其朋友的朋友,这种推荐更加易为其接受。在圈子中,用户可 以点击这些推荐的人并发起对话、加为好友。借助这一功能,用户的交际圈子会越 来越广,更加有效的拓展其人脉。社交网络中陌生个体间人际关系形态研究 第 38 页

图14:单个用户的一度好友分布

米尔格拉姆在他1967年发表的那篇著名论文中提到: 在最初的实验中,其中的 一封信在不到四天的时间内就被传达到了目的地。但是我们无法忽略一个重要的事 实就是,实际上只有不到5%的信件被最终送达到了收件人手中。随后进行的两次连 锁信实验,因完成连锁的比例太低导致实验结果并未被公开发表。在实验过程中, 研究者发现有很多微妙的因素会对连锁信实验的结果产生极大的影响。研究者尝试 针对不同种族和不同收入的人群中来重复进行实验,他们发现其中存在巨大的差异。 事实上,在米尔格拉姆合著的另一篇论文中提到:虽然实验者开始的时候并不知道 收信人的种族,但如果信件的接收者为黑人,实验送达率为13%,但如果接收者是 白人,则实验送达率上升到33%。这几次社会学实验无不充满了各种不确定因素并 且无法重复。

米尔格拉姆还发现了漏斗效应:大部分的传递都是由极少数的明星人物来完成

的。在一个5%的飞行员实验中,他发现2/3成功的传递都是由同一些明星来完成的。 尽管如此,在这个社会学实验仍然存在有一个挑战性的假设:它假设传递链条中所社交网络中陌生个体间人际关系形态研究 第 41 页

QQ圈子加强了人际间的互动:解除传统社交圈子150人的顿巴数魔咒,将好友 关系扩充到上千人;人们通常保持紧密关系的只有30~50人,使用圈子可以有效扩

充相对紧密的好友圈;虽然现实生活中地点改变造成线下好友流失,但借助虚拟的 圈子功能还是可以继续保持线上好友接触。

和QQ圈子类似,淘宝圈子功能与淘宝后台的好友动态、个人动态等等分享内容 相互贯通,可以从淘宝站内导入更多的买家信息,并按照每一个人不同的习惯,每 个买家都可以加入到自己的圈子。每个用户圈子首页的右上角都显示了用户所在的 圈子名称,用户可以通过圈子发帖分享自己的物品、照片、微博等任意内容。圈子 网站布局类似Pinterest,但产品本身更类似轻博客。基于兴趣爱好,用户可以创建圈 子、搜索圈子。

5.1.2 新浪微博的微群

微群是微博群的简称。聚合有相同爱好或者相同标签的朋友们形成圈子,将所 有与之相对应的话题全部聚拢在微群里面。让志趣相投的朋友们以微博的形式更加 方便的进行参与和交流。用户可以创建自己的微群,或选择自己感兴趣的微群,并 且为未加入微群的用户随机推荐热门微群。与此同时,用户可以选择在群内的发言 不被同步到个人微博,因此能在群内畅所欲言而不用担心被不相关的人发现。 微群的作用主要体现在以下几方面: 1. 认识身边的好友或者同行业的同事; 2. 看看身边都发生了哪些新鲜事;

3. 会有更多的专业人士进行讨论和交流; 4. 能获得更多关心和关注,提升影响力; 5. 通过私密微群进行内部交流和分享;

和新浪微群类似,腾讯微博和搜狐微博也都推出了自己的微群产品。腾讯微博

提供了丰富的微群分类和搜索推荐;搜狐微群与ChinaRen校友录以及焦点网全国业

主论坛打通,与搜狐其他产品紧密结合、纵深发展。社交网络中陌生个体间人际关系形态研究

第 39 页

有的参与实验人员都有能力发掘链条终端的两个人传递的有效性,而这在实际生活 中是很难存在的。

真实的人际关系是相对固定的,一旦形成就不会轻易消失。陌生个体之间虽然 也可能有一见钟情之说,但是大多数人际关系的形成都需要一定过程,并且朋友的 关系一经形成,就不会随便就能终止,所谓的“绝交”现象现实中不是那么轻易就 发生的。而社交网络中人际关系的形成则带有很大的随意性,随机成份比较大。第 一次在网上见面聊天就从此成为彼此好友的现象很多。网络上的好友关系一经形成, 要终止也是非常容易的事情。由于网络用户身份的高度不确定性,可以更换网名、 头像、性别乃至姓名等个人识别信息,或者使用隐身登录,拉入黑名单,甚至可以 “自杀”来摆脱原有人际关系,从网络上消失一个旧身份并重新开始一个新的角色 进行生活和交际。在网络上如果有人和你意见不合,你尽可以离开他,或者避而远 之,而去与自己喜欢的人来交流。而在实际生活中回避我们不喜欢的人远没有这么 简单,因为有可能低头不见抬头见,由于各种关系而无法逃脱。

如上所述,网络中的人际关系可能更具有随意性和不确定性。本次研究中的人 际关系分析研究是在假设这些关系稳定的前提下进行的,因此最终结果可能和真实 情况有所偏差。

本章研究过程中采用了确定的人人网人际关系数据集并进行分析,各种可能的 传播途径都确定且完全可知,所有参与传播节点都完全清楚上一个节点和下一个节 点的位置和数量,并且实验结果可以反复进行验证。通过这项研究,我们可以得到

一条传播范围可控和起点可选的人际传播路径。社交网络中陌生个体间人际关系形态研究 第 42 页

第二节 大学生群体的交际圈和团体 5.2.1 大学生群体圈子数据分析

具有相似特征并紧密关联的网络用户个体的聚集现象被统称为网络团体。团体 是社交网络上由于某种关系结合在一起的一组相互个体,是社交网络中最常见的结 构之一。针对社交网络上团体的定义并没有统一的标准,根据不同的网络物理结构、 连接特征、标注方法,人们对期望团体的要求和具体的发现方法也不尽相同。 研究社交网络的团体结构对信息的有效利用具有重要的实际价值。在内容安全 与网络舆情分析方面,对网络中话题涌现性的判定以及特定话题传播轨迹分析都是 重要任务,而发现团体结构,以及对其特征进行分析,对内容传播的分析具有重要 理论价值。网络团体的分析可以进一步挖掘出个体之间的交往关系,提高网络搜索 的性能和精确性,提升网络信息挖掘能力。在商业情报智能分析领域,有效的团体 关系分析对隐藏在大规模非结构化数据中的人物关系、群体关系以及数据关联关系 的挖掘具有重要价值。

团体分析是大规模复杂信息网络研究中的一个基础性问题。一方面,团体结构

反映了网络中个体节点行为的区域性特征以及群体之间重要的关联关系;另一方面, 如果将整个信息网络抽象为层次化的团体以及团体关系,可以降低整个信息网络研 究的复杂度,有利于信息网络的科学问题分析与基本规律的发现。

对于一个小规模大学生用户群体,可以从之前的研究中计算抽取出其中的彼此

好友关系。如下表10所示,是以作者为中心,扩展到的56个直接好友组成的群体内 部之间人际关系示例(鉴于篇幅限制,仅显示其中4组)。 用户ID 群体内部的好友ID

30764339* 24584109* 24697751* 25132998* 25144272* 25221826* 25598689* 25989913* 27220992* 27967677* 28595361*

28655869* 30240922* 31102499* 31900303* 34991786*社交网络中陌生个体间人际关系形态研究 第 43 页

20003759* 22945226* 22977096* 23753901* 26605787* 28036490* 23258872* 22977096* 22994224* 24279730* 24584109* 26435212* 26532368* 272209*

28792510* 25132998* 25989913* 27967677*

表10: 以作者为中心的直接好友构成的用户群体

这些数字是枯燥乏味的,所以研究中使用了可视化方式来把这些数字关系转化

为易读的图形表达方式。如下图15是一张小规模的人人好友关系无向图(56个用户 节点)。利用之前的数据集,把人际关系转换为DOT脚本文件,并使用Graphviz(Graph Visualization Software)提供的工具选择算法进行布局,最终生成可视化的用户关系。 Graphviz 是一个由美国贝尔实验室(AT&T)启动的高效而简洁的开源绘图工

具包,用于绘制 DOT 语言(一种图形描述语言)脚本描述的图形,它同时也提供 了可供其它可视化软件使用的库。Graphviz 的强项在于自动布局,当图中的节点和 边的数目变得很多的时候,正如这次要绘制的复杂人际关系图,就能很好体会这一 特性的好处。

图中的中心节点为本文作者,图上每个圆圈代表一个用户,每条线代表两个人 之间存在好友关系。图中每个用户都是作者的直接好友,并且他们之间存在着彼此

之间的好友联系。可以看出这些好友之间存在非常明显的规模不等的团体聚集关系, 并且被自动划分成三块不同大小的区域。图中上半部分用户数量最多的一个团体是 由于作者之前工作关系产生的一个群体,故人数较多,这些人之间关系也非常密切。 图上右半部分是一个学院的部分学生组成的群体,由于教学关系,作者平时和他们

接触较为密切。图上左下角为作者的一些联系较频繁的大学同班同学组成的团体。

第 45 页

从图 15 中我们清晰的看出本文作者所从属的三个朋友圈子。本次研究找到了一 种方法,仅仅通过若干好友关系,就可以将研究范围内用户的直接好友自动化的分 类进若干个朋友圈子,把线下的真实人际关系映射到了线上的人群圈子关系,并且 从实际效果来看较为准确。

5.2.2 大学生群体的交际圈和团体研究

使用这种人际关系分析技术,对于一个固定的用户群体,只要了解其成员之间 的彼此人际交往关系,就可以把这个用户群体划分为若干个联系圈子。这些圈子可 能是由于工作关系、学校关系、社团活动等各类关系建立并维系起来的一个虚拟人 际交往圈。每个用户可以同时从属于多个圈子当中,具有多重身份和属性。 一个人的主要人际圈子之外或者边缘的小圈子往往对其学习、工作具有更高的 价值。大圈子内部,大家生活模式、知识结构、社会关系等相似度较高。当个人遇 到困难需要帮助时,同一圈子内的人往往也会遇到相似的瓶颈。如果同一圈子内有 人能解决该问题,同时也会有其他一批熟人可以解决该问题。但边缘圈子则不同, 往往可以解决我们的特殊问题,并且具备不可替代性。

通过这种研究方式,可以进行针对性的好友聚类推荐,帮助用户找到潜在好友 关系,扩大用户的人脉。社交网站背后对应的庞大用户群体构成了一个贴近真实世 界的社会网络。如果已知用户处于某个固定的圈子当中,那么这个圈子当中的所有 成员都可能是其感兴趣的对象,当社交网络服务向用户推荐这些成员时,用户将这 些熟悉的陌生人加为好友的概率就会大大增加。

信息的分类和过滤是社交网络服务的一项基本特征,例如人人网对好友关系有 一套自己的分类方式,用户可以自行对好友进行分组,从而对信息的收发做分组的 管理。通过分析社交网络的关系结构,提取出其中的人际圈子,能够让我们更好地 理解这个网络的组成方式,从而更好的认识自己,梳理自己的关系人脉。也可以更 深入的认识自己的朋友,了解以他为中心的所有人际交往圈子,将其打上不同的角 色标签,从另一个角度获知他的人际交往关系和个人背景成为可能,其中有些信息社交网络中陌生个体间人际关系形态研究甚至是你无法直接获取,并且你的朋友也不愿意透露的。一个小圈子,通常代表一

种经历。以用户为中心的多个圈子内的好友联系,往往反映其不同时间段以及不同 身份角色的人生经历,甚至是隐私经历。

信息的分类和过滤是社交网络服务的一项基本特征,例如人人网对好友关系有 一套自己的分类方式,用户可以自行对好友进行分组,从而对信息的收发做分组的 管理。通过分析社交网络的关系结构,提取出其中的人际圈子,能够让我们更好地 理解这个网络的组成方式,从而更好的认识自己,梳理自己的关系人脉。也可以更 深入的认识自己的朋友,了解以他为中心的所有人际交往圈子,将其打上不同的角 色标签,从另一个角度获知他的人际交往关系和个人背景成为可能,其中有些信息社交网络中陌生个体间人际关系形态研究甚至是你无法直接获取,并且你的朋友也不愿意透露的。一个小圈子,通常代表一

种经历。以用户为中心的多个圈子内的好友联系,往往反映其不同时间段以及不同 身份角色的人生经历,甚至是隐私经历。

本文来源:https://www.bwwdw.com/article/l3z3.html

Top