面向网络舆情的关联度分析

更新时间:2023-12-15 14:13:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

面向网络舆情的关联度分析

摘要

随着互联网的迅速发展,网络舆情对政治秩序秩序与社会稳定有着非比寻常 的作用,因此挖掘网络用户信息与网络舆情信息的关联度的过程意义重大。编制java 语言,在关键词词频统计的基础上,给予用户信息中的关键词赋予比重不同的权重,实现在网络舆情资料库中对 web 信息提取与关键词提取的功能。将用户信息中的关键词转化为向量 A,向量的分量为对应的关键词的权重,同时使用二值法将网络舆情信息库中的网页转为向量 B,向量的分量为对应关键词的出现与否,将向量 B中的各分量分别乘于相应的权重值,得向量 C。求向量 A 与向量 C 的余弦值并由此构建关键词加权评分系统,完成对相关网页的评分高低排序并归档。

关键词:java,关键词赋权,余弦值

目录

面向网络舆情的关联度分析................................................................................ 1 摘要:.................................................................................................................... 1 1. 挖掘目标........................................................................................................... 3 2. 分析方法与过程............................................................................................... 4

2.1. 总体流程................................................................................................ 4 2.2. 具体步骤................................................................................................ 4 2.3. 结果分析................................................................................................ 8 3. 结论................................................................................................................. 15 4. 参考文献......................................................................................................... 18

1. 挖掘目标

本次建模目标是利用网络爬虫工具采集的大量网络舆情信息,采用数据挖掘技术,给予用户信息中的关键词赋权,分析用户信息中不同权重大小的关键词与网络舆情信息间的关系,挖掘用户与网络舆情信息的关联规则,使用关键词加权评分系统构建反映与用户最相关的网络舆情信息。从而可以发挥网络对社会监督的巨大作用,以及及时有效的处理网络舆情突发事件。

2. 分析方法与过程

2.1. 总体流程

步骤一: 编写 java 语言,在网络舆情信息资料库中进行 web 信息提取与关键词提取,对十项关键词(去除二个样本无差别变量:国别,照片),进行“or”逻辑规则搜索,得到相应关键词的网页地址。

步骤二: 在关键词词频统计的基础上,设置用户信息中十项关键词的权重。 步骤三: 基于二值法优化构建关键词加权评分系统(详细流程见图 2),将净化出关键词的网页进行评分。

步骤四:对网页的评分高低排序并归档,完成关联度分析。

2.2. 具体步骤

步骤一:web信息提取与关键词提取样本预处理在用户信息的十二项关键词

本文来源:https://www.bwwdw.com/article/4aj5.html

Top