基于词典与机器学习的中文微博情感分析

更新时间:2023-11-05 22:32:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

龙源期刊网 http://www.qikan.com.cn

基于词典与机器学习的中文微博情感分析

作者:刘开元

来源:《电子技术与软件工程》2016年第22期

摘 要

目前,社会正处于一个微博崛起的时代,一切有关于微博的问题都被社会广泛关注,并得到了工业界和学术界的高度重视。微博从出现以来,取得了良好的发展,并拥有大众的普遍关注和应用。微博的超大信息量和高速度的更新等,都是值得研究的话题。同时,微博处理自然语言已经成为当前最新型和热门的研究课题,而其中最值的探讨的热点课题就是中文微博情感分析。

【关键词】词典 机器学习 中文微博 情感分析

在当前众多社交网络平台中,微博以新型的信息发布手段具有重要的社会影响力。根据我国相关数据统计可以发现,我国微博用户使用量已经高达3.5亿,并处于逐年上升的趋势,占全国网络居民中的百分之五十。微博情感分析是按照主观倾向性将微博文本分为三类:第一是正向;第二是负向;第三是中性。 1 情感的分析方法

目前,主要通过两种技术来对情感进行分析。第一类是根据情感词典来进行,微博文本中所包含的正向情感词和负向情感词都通过情感词典来进行统计分析,而文本的情感极性则依靠所取得的差值来决定。第二类是机器学习的使用方法,对测试预料和训练词进行相关的标注,再使用分类器对情感进行分析,其中分类器包括有: (1)KNN; (2)最大熵; (3)支持向量机等。

另外,Wang与相关研究人员对Twitter情感分析系统进行了构建,其能对相关评论信息的情感倾向性进行较为实时的分析。Agarwal与相关人员通过对极性词语的特征研究,对微博文本通过树内核模进行了情感分类研究,其也获得了一定的成绩。Jiang及其成员对微博文本的情感分析使用了主题无关和主题相关的方式进行了分类,一种是正向情感,一种是负向情感。 与英文微博相比,中文微博具有很大差异,其中主题较为发散是中文微博的主要特点,且内容十分繁杂丰富,并与英文微博的行文习惯也有很大区别。因此,部分研究人员通过多种计算方法对微博的情感分析进行了全方位的分析,其中所包括的算法有:

本文来源:https://www.bwwdw.com/article/9ir2.html

Top