网络舆情监测设计方案

更新时间:2023-10-07 18:38:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第一章 项目的背景及必要性 1.1 项目背景

近年来,网络舆情对政治生活秩序和社会稳定的影响与日俱增,一些重大的网络舆情事件使人们开始认识到网络对社会监督起到巨大作用。如“5.12”汶川特大地震中传统媒体与新媒体的充分联动,又如“7.23”甬温线特别重大铁路交通事故中微博发挥的重要作用,再到2012年此起彼伏的社会群体事件。

公共危机事件爆发时,犹如以石击水,相关信息在短时间内迅速传播,引起群众的广泛关注。

一些非理性议论、小道消息或负面报道常常在一定程度上激发人们普遍的危机感,甚至影响到群众对党和政府的信任,影响到消费者对某一企业品牌的认同。如不及时采取正确的措施分析和应对,会造成难以估计的后果。

随着互联网技术和应用的发展,网络舆情在数据体量、复杂性和产生速度等方面发生巨大变化。网络舆情分析方法已超出了现有常用的分析框架,必须在大数据分析的思维下有所创新。

本项目主要利用网络爬虫技术和大数据技术的融合应用,建立基于贵州交通行业网络舆情监测平台。通过网络爬虫技术对各大新闻门户网站、微博、知名论坛、贴吧、博客、搜索引擎等舆情信息采集,充分使用大数

1

据技术对采集到的网络舆情信息进行挖掘与分析。实现重大负面舆情信息、突发事件实时预警,并根据舆情分布、影响力、发展趋势等进行分析和来源追踪。

1.2 项目的必要性

当前,网络舆情可以说是网络舆情管理的基础和晴雨表。以大数据观念变革传统网络舆情管理思维,准确把握网络舆情的内在特征及其在演化过程中的潜在规律,对于新形势下做好网络舆情管理工作具有重要的理论意义和实践价值。

因此,贵州交通行业应采取各种有效措施做好网络舆情的应对工作。增加信息透明度,准确、及时地发布权威信息,使谣言破灭,从而有效引导舆论。建立权威专业的组织体系、加强互联网人才队伍建设、采取适当的舆情引导与控制手段,是建立科学有效的舆情应对机制的必需。加强网络舆情分析与研判工作,区分不同性质的涉及本行业负面舆情,可以正确的为相关部门提供决策参考。善与媒体沟通,借助媒体传达贵州交通行业的声音,掌握舆论引导主动权。

第二章 设计原则

2.1全面性

对网络信息的获取要尽量做到全面,不漏掉有价值的舆情信息。需要监控的站点主要分布于门户网站、知名论坛、搜索引擎、博客、贴吧,微

2

博等网络载体中。

2.2准确性

已经获取到的网络信息形形色色、要对信息做进一步筛选,将最焦点的、最常用的、最需要的、最关注的舆情信息做相应的分类展示,方便下一步工作。

2.3时效性

舆情信息的第一时间获取、第一时间分析、第一时间展示、第一时间预警。网络信息的一大特点就是传播快,出现重大事件后,相关部门必须第一时间了解到相关情况,否则就会在整个事件的处理上处于被动局面。

2.4易维护性

整套解决方案的数据维护简单,容易操作,完全通过WEB方式完成,采用云技术,降低维护的技术难度,也减少了人为隐患的发生。

2.5安全、稳定、准确、及时

采用先进的算法,多个模块组成一个安全、稳定、准确、及时的网络舆情监测平台。方案在总体设计上遵循稳定、开放、可扩展、经济、安全的原则,从而使整个方案组成合理,技术先进,易于扩展,既能满足当前的业务数据处理要求,又能符合长期发展的需要。

3

第三章 总体架构

3.1总体概述

网络舆情监测平台采用J2EE技术体系,前端采用Ajax开发技术,操作简单、易用、高效、稳定。平台所有功能均采用纯B/S结构设计,零客户端维护。

实时采集网络舆情信息,如门户网站、知名论坛、搜索引擎、博客、贴吧,微博等,7*24小时为用户提供信息采集、信息处理、信息编辑功能,实时掌握所关注的网络舆情信息,为贵州交通行业相关部门提供决策参考依据。

3.2业务流程

网络舆情监测平台是针对互联网这一新兴媒体,通过对海量网络舆情信息进行实时的自动采集、分析、汇总、监视、并识别其中的关键信息,

4

及时通知到相关人员,从而第一时间应急响应,为正确舆论导向及收集民众意见提供直接支持的一套信息化平台。

第四章 本项目涉及的关键技术

4.1网络爬虫概念

网络爬虫又被称为网页蜘蛛、网络机器人,在FOAF社区中间,更经常的称为网页追逐者,是一种按照一定的规则,自动地抓取互联网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

4.1.1网络爬虫工作原理

Web 网络爬虫系统一般会选择一些比较重要的、出度(网页中链出链接

5

? 时间过滤

根据选择的时间显示舆情信息。时间可选项:最近一天、最近三天、最近一周、最近一个月、自定义。自定义时间:由用户设置起止时间,默认为所有舆情信息。

? 来源过滤

根据选择的来源网站类型显示舆情信息。来源选项包括:新闻、微博、论坛、博客、贴吧、搜索引擎,默认为全部。

? 排重过滤

按照文章排重显示舆情信息。可选项:文章排重、文章不排重。默认选项为:文章不排重。

? 热度过滤

热度高的舆情信息优先显示,热度根据点击量和回复量来评定。 点击量选项:全部,点击量>1000、点击量>2000、点击量>10000,默认全部;

回复量选项:全部,回复量>1000、回复量>2000、回复量>10000,默认全部;

? 显示过滤

显示/隐藏舆情信息的来源、摘要、高频词;显示选项:隐藏来源、隐藏摘要、隐藏高频词。默认显示来源、摘要和高频词。当选择隐藏时,相应的选项变更为显示。

16

? 舆情排序

可根据网站、访问量、回复量、转载量、发布时间、相关文章、相似文章来排序。

5.8舆情操作

舆情操作包含了八个子模块:设置文章属性、添加到舆情简报、添加到指定专题、添加到指定类别、添加到收藏夹、添加到导控任务、添加到指定账户、上报舆情。

? 设置文章属性

可将舆情文章属性设置为:正面、负面、重大负面、突发事件等。 ? 添加到舆情简报

将舆情文章加入舆情简报中。 ? 添加到指定专题

将舆情文章添加到指定的专题下。 ? 添加到指定类别

将舆情文章添加指定的分类中。 ? 添加到收藏夹

将舆情文章加入到个人收藏夹中。 ? 添加到导控任务

将舆情文章加入到指定的导控任务下。

17

? 添加到指定账户

对账户作分析,将舆情文章纳入指定的账户类别下,账户类别分为疑似账户、关注账户、屏蔽账户。

? 上报舆情

对负面、重大负面、突发事件舆情文章做上报处理。 5.9舆情报表

舆情报表包含了六个子模块:舆情日报、舆情周报、舆情月报、舆情年报、舆情简报、简报格式。

? 舆情日报

主要是给用户一个当日详细的信息采集来源站点及具体数目,让用户清楚的了解采集到舆情信息都来自哪些网站、各自有多少数量。

? 舆情周报

根据用户选择的周报显示舆情信息。 ? 舆情月报

根据用户选择的月报显示舆情信息。 ? 舆情年报

根据用户选择的年报显示舆情信息。 ? 舆情简报

结合用户定义好的舆情模板格式自动生成html浏览,而且用户也可以将这些指定的舆情文件自动生成word文件并下载后编辑、打印。

18

? 简报格式

用户可以根据本单位的工作习惯设置简报标题,字体、颜色、大小、单位名称、批示空行等各种属性。

5.10舆情报警

舆情报警包含五个子模块:首页报警、敏感报警、本地敏感报警、报警设置、报警任务。

? 首页报警

针对舆情信息在首页位置出现的特殊意义和影响,网络舆情监测平台专门针对各大新闻网站(比如:新浪、搜狐、网易、腾讯、人民网等和本地有名的地方性门户)、知名论坛、微博等首页信息进行高效率监控,以非常迅速的方法扫描这些网站的首页,如果首页中出现了要监控的关键字,则会以醒目的方式进行报警。

? 敏感报警

在首页扫描完成后,平台会按照指定的采集任务在采集目标中采集舆情信息,采集到指定关键词的舆情后自动对其中文件的内容进行中文分词并自动比照,如果发现文章中内容涉及到敏感词,则以醒目的方式在“敏

19

感报警“栏目中显示。

? 本地敏感报警

用户在使用过程中,往往处于指导意义会采集上级单位的舆情,同时出于借鉴意义会采集同类兄弟单位的舆情,这样舆情的总数就会比较多。通过用户设置的“地域、人名和机构”关键词分析,对上述这些舆情进行了再次细分,把只与本地下属单位有关的舆情归纳到“本地敏感”栏目中。

? 报警设置

可以定义多个邮件、多个手机,可以定义任务启动时间、间隔和报警方式。

? 报警任务

用户可以根据自己的工作习惯和工作需要,定制报警任务。这些舆情的报警在指定的时间以邮件或者短信的方式推送到用户的终端。

5.11用户设置

用户设置包含四个子模块:方案设置、导出模板设置、修改密码、用户权限。

? 方案设置

将用户常用搜索设置保存为搜索模板。模板内容包括:方案名称、关键字、排除关键词等。

? 导出模板设置

设置文章导出时的格式、内容等规范。

20

? 修改密码

用户修改个人登录密码,退出系统重新登录时将使用新的密码验证登录。

? 用户权限

提供用户组管理的概念,系统管理员可以通过设置组织的权限和对组成员的管理来批量管理用户的权限。

5.12舆情关键词维护

舆情关键词维护包含三个子模块:采集搜索关键词维护、舆情预警关键词维护、排除关键词维护。

? 采集搜索关键词维护

设置舆情过滤、权重和用户关键词,对舆情信息搜索采集时的关键词。 ? 舆情预警关键词维护

用户可根据负面、重大负面、突发事件相应关键词进行设置。 ? 排除关键词维护

非舆情信息的判定关键词设置。 5.13模块维护

该平台具有非常好的开放性和灵活性,通过“模块维护”可以非常方面的打造一个个性化的舆情监测管理平台。用户可按专题、类别、收藏夹、领导人名等进行设置和维护。

21

第六章 建设目标及效益

6.1建设目标

我国正处于社会发展的转型期,各种社会矛盾不断涌现。鉴于交通行业职责特殊性,在与社会各阶层的长期接触中极易被置于矛盾的风口浪尖上。任何涉及交通方面的负面信息,如果得不到及时有效的处理,在网络环境下都有可能成为舆情风暴,导致交通行业相关部门及工作人员形象受损严重。关注热点,抓住难点,为领导决策参考服务,如何快速的实现网络舆情搜集处理工作,成为当前舆情工作的当务之急。针对这些问题,建立网络舆情监测平台成功地实现了:

? 针对互联网海量舆情自动实时的监测、自动敏感内容分析和自动实时报警的功能。

? 有效地解决了传统的以人工方式对舆情监测的实施难题。 ? 加快了网络舆论的监管效率,有利于组织力量展开信息整理、分析、引导和应对工作,提高了贵州交通相关部门对网络突发舆情的公共事件应对能力。

? 有利于全面掌握民意,提高执政水平。

? 及时了解和掌握社情民意,提高宣传思想工作的预见性、针对性、实效性。 6.2经济和社会效益 6.2.1有效的部署工作人员

在实际工作中,网络舆情监测平台的运用,可以有效的进行工作人员

22

部署,运用网络爬虫和大数据技术替代人工浏览的方式,将会节省大量人力,并将负责分析互联网信息的人员从枯燥的重复性的查看互联网信息的工作中解放出来,把更有效的人力投入到对舆情信息结果的处理和防范等重点上。

6.2.2降低人工对比分析误差

在本项目运用中,通过该平台以大数据挖掘技术为基础,通过信息关联分析与共享、人工经验知识分享与机器自动学习相结合的方式,实现对网络舆情信息的研判与事件综合分析预测,改变以人工操作带来的不便,提高了业务水平和工作效率。

6.2.3提高管理效能

在该平台中针对互联网信息的虚拟性、隐蔽性、发散性、渗透性和随意性等特点,网络舆情基于自然语言理解的文本挖掘技术,提高了交通相关部门对于网络舆情的应对能力和快速反应能力,加强了对社会面信息的全面动态控制能力。

建立网络舆情监测平台,实现了在一定范围内网站信息发布进行全面掌控,能够对各大新闻网站、论坛、博客、微博、贴吧、搜索引擎等实时监测、采集、内容提取及排重;并且对获取的信息进行全面检索、主题检测、专题聚焦、相关信息推荐;按照业务需求定制信息分类规则;为用户辅助编辑提供信息服务。如重大负面舆情,突发事件预警自动形成网络信息报告、追踪已发现的信息来源,及时发送到指定的监管人员手机或邮件

23

中。这对于随时随地掌握舆情信息;获得舆情信息热点、焦点和趋势分析;合理部署工作人员,提高人员的工作效能;实时通报最新舆情信息;更充分了解社情民意都起到一定的推动作用。

6.2.4为领导提供决策依据

网络舆情监测平台对采集到的舆情信息进行趋势分析,舆情分布、影响力查询等快速掌握舆情发展动向,为领导提供决策作用。

第七章网络舆情项目报价

7.1项目总报价

本项目报价包含软件开发、软硬件采购、服务器管理和运维服务等费用。

总报价为各个子系统的总和,各系统报价由工时组成。 项目名称 总报价 预计完成年限 网络舆情项目 ¥3263150 1年 项目总价 人民币:叁佰贰拾陆万叁仟壹佰伍拾元整 24

7.2报价明细

产品名称 产品型号 数量 金额 (万元) 软件开发 硬件采购 软件采购 网络舆情监测系统 服务器和办公电脑 Oracle 12c企业版 1套 1批 1套 105.6 79.25 80 61.465 服务器管理和运维服务费 服务器管理和运维服务费按年计算 合计:326.315万元 软件开发工时明细

本项目软件开发共132(人/月)工时,即(105.6)万元

功能模块开发 可行性分析 1. 前期调研 方案设计 需求分析 2. 产品设计 产品原型及UI设计 概要设计 3. 架构设计 详细设计 物理模块划分 4 1 2 0.5 2 2.5 (人/月) 1 25

本文来源:https://www.bwwdw.com/article/5x3d.html

Top