地税局大数据云平台整体解决方案 地税大数据平台

更新时间:2024-06-16 15:58:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

地税局大数据云平台整体解决方案

地税局大数据云平台

建 设 方 案

1

地税局大数据云平台整体解决方案

目 录

第一章 现状与需求分析 ...................................................................................... 16

1.1 总体现状分析 ........................................................................................................ 16

1.1.1 信息化现状.................................................................................................... 16

1.1.1.1 基础设施建设 ...................................................................................................... 16 1.1.1.2 应用系统建设 ...................................................................................................... 19 1.1.1.3 数据资源建设 ...................................................................................................... 22 1.1.1.4 安全体系建设 ...................................................................................................... 23

1.1.2 关键问题分析 ................................................................................................ 24

1.2 业务需求理解 ........................................................................................................ 26

1.2.1 开放的地税局云数据平台 .............................................................................. 26 1.2.2 数据采集与拓展 ............................................................................................ 27 1.2.3 创新应用开发 ................................................................................................ 28

1.3 基础平台建设需求 ................................................................................................. 29

第二章 总体架构设计 ................................................................................................... 32

2.1 总体架构 ................................................................................................................ 32 2.2 数据架构视图 ........................................................................................................ 33 2.3 创新的业务模式 ..................................................................................................... 33

第三章 基础资源平台设计 ............................................................................................ 34

3.1 网络设计 ................................................................................................................ 34

3.1.1 系统现状 ....................................................................................................... 34

2

地税局大数据云平台整体解决方案

3.1.1.1 网络结构现状 ...................................................................................................... 34 3.1.1.2 系统资源现状 ...................................................................................................... 35 3.1.1.3 网络带宽现状 ...................................................................................................... 36 3.1.1.4 路由协议现状 ...................................................................................................... 36

3.1.2 需求分析 ....................................................................................................... 37

3.1.2.1 网络结构需求 ...................................................................................................... 37 3.1.2.2 网络分区需求 ...................................................................................................... 38 3.1.2.3 网络带宽需求 ...................................................................................................... 38 3.1.2.4 网络高性能需求 .................................................................................................. 40 3.1.2.5 网络负载均衡需求 ............................................................................................... 41

3.1.3 数据中心网络系统设计 ................................................................................. 41

3.1.3.1 系统设计原则 ...................................................................................................... 41 3.1.3.2 网络结构规划 ...................................................................................................... 43 3.1.3.2.1 网络层次规划 ............................................................................................. 43 3.1.3.2.2 网络分区规划 ............................................................................................. 45 3.1.3.3 网络总体结构设计 ............................................................................................... 47 3.1.3.4 数据中心核心层设计 ........................................................................................... 49 3.1.3.5 数据中心接入层设计 ........................................................................................... 54 3.1.3.6 lP地址规划 .......................................................................................................... 57 3.1.3.7 数据中心路由设计 ............................................................................................... 60 3.1.3.7.1 路由协议选择 ............................................................................................. 60 3.1.3.7.2 数据中心内部路由设计 ............................................................................... 61

3

地税局大数据云平台整体解决方案

3.1.3.7.3 数据中心与外部网络路由设计 .................................................................... 61 3.1.3.8 负载均衡系统设计 ............................................................................................... 62 3.1.3.8.1 全局负载均衡系统设计 ............................................................................... 62 3.1.3.8.2 应用负载均衡系统设计 ............................................................................... 64 3.1.3.9 可靠性设计 ......................................................................................................... 65 3.1.3.9.1 网络总体结构可靠性设计 ........................................................................... 65 3.1.3.9.2 数据中心设备冗余设计 ............................................................................... 66 3.1.3.9.3 链路冗余设计 ............................................................................................. 67 3.1.3.10 带外管理网络设计 ............................................................................................. 69 3.1.3.10.1 带外管理简介 ........................................................................................... 69 3.1.3.10.2 带外管理的必要性 .................................................................................... 70 3.1.3.10.3 数据中心带外管理网络设计 ...................................................................... 70 3.1.3.11 NTP(网络时间同步)系统设计 ........................................................................ 70 3.1.3.11.1 NTP概述 .................................................................................................. 70 3.1.3.11.2 NTP的工作原理 ........................................................................................ 71 3.1.3.11.3 NTP系统设计 ........................................................................................... 72

3.1.4 同城DWDM系统设计 .................................................................................. 73

3.1.4.1 传输网的需求 ...................................................................................................... 73 3.1.4.2 传输技术的选择 .................................................................................................. 73 3.1.4.3 同城数据中心DWDM传输网络设计 ................................................................... 75 3.1.4.4 可靠性设计 ......................................................................................................... 76

3.2 地税局云大数据平台基础设施建设需求分析 ......................................................... 77

4

地税局大数据云平台整体解决方案

3.2.1 建设需求分析 ................................................................................................ 77

3.2.1.1 系统现状 ............................................................................................................. 77 3.2.1.1.1 关键业务系统 ............................................................................................. 77 3.2.1.1.2 数据系统 .................................................................................................... 77 3.2.1.1.3 备份系统 .................................................................................................... 77 3.2.1.2 容灾建设考虑因素 ............................................................................................... 79

3.2.2 地税局云大数据平台基础设施建设技术方案建议 ............................................ 1

3.2.2.1 总体架构平台概述 ................................................................................................. 1 3.2.2.2 地税局云计算平台设计 .......................................................................................... 2 3.2.2.2.1 地税局云平台基础架构 ................................................................................. 2 3.2.2.2.2 地税局云计算管理平台 ................................................................................. 3 3.2.2.2.3 地税局云计算安全 ........................................................................................ 8 3.2.2.3 计算资源池建设方案建议 ...................................................................................... 9 3.2.2.3.1 主机资源池建设 ............................................................................................ 9 3.2.2.3.2 虚拟化资源池建设 ...................................................................................... 11 3.2.2.3.3 数据库平台建设 .......................................................................................... 13 3.2.2.3.4 资源管理平台 ............................................................................................. 13 3.2.2.4 存储资源池建设方案建议 .................................................................................... 14 3.2.2.4.1 存储资源池建设原则 ................................................................................... 14 3.2.2.4.2 存储数据类型 ............................................................................................. 15 3.2.2.4.3 数据存储模式 ............................................................................................. 17 3.2.2.4.4 存储资源池建设方案 ................................................................................... 18

5

地税局大数据云平台整体解决方案

3.2.2.5 备份系统建设方案建议 ........................................................................................ 20 3.2.2.5.1 数据备份系统建设方案 ............................................................................... 20 3.2.2.6 系统资源管理平台建设方案建议 ......................................................................... 24

3.2.3 地税局云大数据平台基础设施平台两地三中心建设方案建议 ......................... 0

3.2.3.1 两地三中心建设依据 ............................................................................................. 0 3.2.3.2 两地三中心建设目标 ............................................................................................. 1 3.2.3.3 容灾技术的选择 .................................................................................................... 2 3.2.3.4 两地三中心总体架构设计建议 ............................................................................... 3 3.2.3.4.1 总体架构描述 ............................................................................................... 4 3.2.3.4.2 资源池功能描述 ............................................................................................ 5 3.2.3.4.3 总体架构设计 ............................................................................................... 5

第四章 大数据支撑平台设计 ......................................................................................... 11

4.1 设计思路 ................................................................................................................ 11

4.1.1 轻量服务化架构 ............................................................................................ 11 4.1.2 弹性可扩展.................................................................................................... 12 4.1.3 开放共享 ....................................................................................................... 12 4.1.4 安全可靠 ....................................................................................................... 12 4.1.5 自主可控 ....................................................................................................... 12

4.2 设计内容 ................................................................................................................ 13

4.2.1 数据存储 ....................................................................................................... 15

4.2.1.1 分布式文件系统 .................................................................................................. 15 4.2.1.2 分布式数据库 ...................................................................................................... 18

6

地税局大数据云平台整体解决方案

4.2.1.2.1 基于MySQL的关系数据库集群 ................................................................. 18 4.2.1.2.2 基于HBase的NoSQL数据库集群 ............................................................ 19 4.2.1.3 分布式缓存 ......................................................................................................... 22 4.2.1.3.1 基于Memcached的缓存 ............................................................................ 22 4.2.1.3.2 基于Redis的缓存 ...................................................................................... 24 4.2.1.3.3 缓存分片路由控制器 ................................................................................... 24

4.2.2 计算能力 ....................................................................................................... 25

4.2.2.1 离线计算Map/Reduce ........................................................................................ 27 4.2.2.2 离线计算Hive ..................................................................................................... 28 4.2.2.3 流式计算Storm ................................................................................................... 28 4.2.2.4 内存计算Impala ................................................................................................. 29 4.2.2.5 图计算 ................................................................................................................. 29

4.2.3 高速服务框架 ................................................................................................ 29

4.2.3.1 服务注册中心 ...................................................................................................... 30 4.2.3.2 服务监控中心 ...................................................................................................... 31 4.2.3.3 服务引擎 ............................................................................................................. 31

4.2.4 垂直搜索引擎 ................................................................................................ 32 4.2.5 开放服务 ....................................................................................................... 34

4.2.5.1 云服务器 ............................................................................................................. 34 4.2.5.2 云存储 ................................................................................................................. 34 4.2.5.3 关系数据库 ......................................................................................................... 34 4.2.5.4 海量结构化存储 .................................................................................................. 35

7

地税局大数据云平台整体解决方案

4.2.5.5 云搜索 ................................................................................................................. 35 4.2.5.6 消息推送 ............................................................................................................. 35 4.2.5.7 负载均衡 ............................................................................................................. 35 4.2.5.8 云监控 ................................................................................................................. 36

4.2.6 分布式应用服务器 ......................................................................................... 36

第五章 大数据创新平台设计 ......................................................................................... 37

5.1 采集整合服务 ........................................................................................................ 37

5.1.1 现状分析 ....................................................................................................... 37 5.1.2 设计思路 ....................................................................................................... 37

5.1.2.1 爬取方式 ............................................................................................................. 38 5.1.2.2 购买方式 ............................................................................................................. 38 5.1.2.3 合作方式 ............................................................................................................. 38 5.1.2.4 数据整合 ............................................................................................................. 39

5.1.3 设计内容 ....................................................................................................... 39

5.1.3.1 互联网原始数据采集 ........................................................................................... 39 5.1.3.2 互联网合作伙伴数据采集 .................................................................................... 41 5.1.3.3 其他部门数据采集 ............................................................................................... 41 5.1.3.4 社会机构和商业组织数据采集 ............................................................................. 41 5.1.3.5 数据整合 ............................................................................................................. 42

5.1.4 分步建设 ....................................................................................................... 42

5.1.4.1 互联网原始数据 .................................................................................................. 42 5.1.4.2 互联网合作伙伴数据 ........................................................................................... 42

8

地税局大数据云平台整体解决方案

5.1.4.3 国家其他部门数据 ............................................................................................... 43 5.1.4.4 社会机构和商业组织数据 .................................................................................... 43

5.1.5 运营方式 ....................................................................................................... 43

5.2 质控治理服务(云平台) ...................................................................................... 44

5.2.1 质量规则 ....................................................................................................... 46 5.2.2 自动化监控数据流转 ..................................................................................... 46 5.2.3 数据比对 ....................................................................................................... 47 5.2.4 数据检测 ....................................................................................................... 48 5.2.5 数据质量评分 ................................................................................................ 48

5.3 数据资源服务(云平台和智慧城市) .................................................................... 49

5.3.1 架构设计 ....................................................................................................... 49 5.3.2 服务总线 ....................................................................................................... 50

5.3.2.1 服务总线架构 ...................................................................................................... 50 5.3.2.2 服务生命周期管理 ............................................................................................... 51 5.3.2.3 服务目录 ............................................................................................................. 52 5.3.2.4 服务授权 ............................................................................................................. 52 5.3.2.5 服务网关 ............................................................................................................. 52 5.3.2.6 服务监控 ............................................................................................................. 53 5.3.2.7 服务SDK ............................................................................................................ 54

5.3.3 数据超市 ....................................................................................................... 54

5.3.3.1 数据多维展示 ...................................................................................................... 54 5.3.3.2 数据检索 ............................................................................................................. 55

9

地税局大数据云平台整体解决方案

5.3.3.3 数据订阅 ............................................................................................................. 55 5.3.3.4 数据评分、评论 .................................................................................................. 55 5.3.3.5 数据可视化 ......................................................................................................... 55 5.3.3.6 数据地税局 ......................................................................................................... 55 5.3.3.7 数据反馈 ............................................................................................................. 56

5.4 数据资源服务 ........................................................................................................ 56

5.4.1 数据目录创建 ................................................................................................ 56

5.4.1.1 数据目录申请 ...................................................................................................... 56 5.4.1.2 数据集目录完善 .................................................................................................. 57 5.4.1.3 数据目录初始化 .................................................................................................. 57

5.4.2 标签生成 ....................................................................................................... 58 5.4.3 目录审批管理 ................................................................................................ 58

5.5 数据洞察服务(云平台) ...................................................................................... 58

5.5.1 数据挖掘 ....................................................................................................... 58 5.5.2 数据可视化.................................................................................................... 62

5.5.2.1 地图 .................................................................................................................... 63 5.5.2.2 图表 .................................................................................................................... 64

5.6 数据开放服务 ........................................................................................................ 73

5.6.1 数据开放目录管理 ......................................................................................... 73

5.6.1.1 目录设计 ............................................................................................................. 73 5.6.1.2 数据开放目录的梳理 ........................................................................................... 74

5.6.2 数据开放加工机制 ......................................................................................... 74

10

地税局大数据云平台整体解决方案

5.6.2.1 数据再整理 ......................................................................................................... 75 5.6.2.2 数据失真 ............................................................................................................. 75

5.6.3 数据开放方式管理 ......................................................................................... 77 5.6.4 数据开放生命周期管理 ................................................................................. 77

5.6.4.1 数据规划设计 ...................................................................................................... 77 5.6.4.2 数据运行维护 ...................................................................................................... 78 5.6.4.2.1 待发布数据集 ............................................................................................. 78 5.6.4.2.2 数据集目录查询 .......................................................................................... 78 5.6.4.2.3 数据集更新 ................................................................................................. 78 5.6.4.2.4 数据集目录修改 .......................................................................................... 78 5.6.4.2.5 数据集目录下线 .......................................................................................... 79 5.6.4.2.6 数据集目录删除 .......................................................................................... 79 5.6.4.3 数据绩效评价 ...................................................................................................... 79

5.6.5 数据开放授权管理 ......................................................................................... 80 5.6.6 开放服务管理机制 ......................................................................................... 80

5.6.6.1 数据目录申请流程 ............................................................................................... 80 5.6.6.2 数据集目录完善 .................................................................................................. 81

第六章 信息安全中心设计 ............................................................................................ 82

6.1 地税局云安全风险分析 .......................................................................................... 82

6.1.1 地税局云环境面临的传统安全威胁 ............................................................... 82 6.1.2 地税局云环境面临的新型安全威胁 ............................................................... 83

6.1.2.1 IaaS 安全威胁 ..................................................................................................... 83

11

地税局大数据云平台整体解决方案

6.1.2.2 PaaS安全威胁 .................................................................................................. 103 6.1.2.3 DaaS安全威胁 .................................................................................................. 113 6.1.2.4 SaaS安全威胁 .................................................................................................. 119 6.1.2.5 运维服务安全威胁 ............................................................................................. 125

6.2 地税局云安全建设方案 ........................................................................................ 129

6.2.1 IaaS层安全建设方案 ................................................................................... 129

6.2.1.1 规划安全域 ....................................................................................................... 130 6.2.1.2 安全池建设 ....................................................................................................... 132

6.2.2 PaaS平台安全 ............................................................................................ 136

6.2.2.1 方案总体设计 .................................................................................................... 136 6.2.2.2 软件健康上线 .................................................................................................... 137 6.2.2.3 服务中间件安全 ................................................................................................ 140 6.2.2.4 PaaS平台高可用性 ........................................................................................... 141 6.2.2.5 PaaS平台运维集中管控 .................................................................................... 144

6.2.3 DaaS层安全建设方案 ................................................................................. 145

6.2.3.1 云数据防泄漏系统 ............................................................................................. 146 6.2.3.2 数据服务安全使用体系 ...................................................................................... 148

6.2.4 SaaS层安全建设方案 ................................................................................. 149

6.2.4.1 云应用访问控制 ................................................................................................ 150 6.2.4.2 应用攻击防护 .................................................................................................... 154

6.2.5 安全服务中心建设方案 ............................................................................... 155

6.2.5.1 日志池 ............................................................................................................... 160

12

地税局大数据云平台整体解决方案

6.2.5.2 日志审计倒查系统 ............................................................................................. 163

第七章 运维监控中心设计 .......................................................................................... 167

7.1 云计算中心运维服务方案 .................................................................................... 167

7.1.1 运维服务体系建设说明 ............................................................................... 167

7.1.1.1 运维服务体系建设需求 ...................................................................................... 167 7.1.1.2 运维服务体系建设目标 ...................................................................................... 168 7.1.1.3 运维服务体系建设意义 ...................................................................................... 169

7.1.2 运维服务体系架构 ....................................................................................... 170

7.1.2.1 服务宗旨 ........................................................................................................... 170 7.1.2.2 地税局云中心服务体系架构 .............................................................................. 170 7.1.2.2.1 组织管理模式层 ........................................................................................ 170 7.1.2.2.2 制度规范层 ............................................................................................... 171 7.1.2.2.3 技术支撑层 ............................................................................................... 171 7.1.2.3 体系建设内容 .................................................................................................... 171 7.1.2.3.1 组织模式 .................................................................................................. 172 7.1.2.3.2 管理制度 .................................................................................................. 173 7.1.2.3.3 管理流程 .................................................................................................. 173 7.1.2.3.4 绩效考核 .................................................................................................. 174 7.1.2.3.5 运维费用 .................................................................................................. 174 7.1.2.3.6 技术支撑 .................................................................................................. 174

7.1.3 云计算中心运维服务内容 ............................................................................ 175

7.1.3.1 驻场服务支持 .................................................................................................... 175

13

地税局大数据云平台整体解决方案

7.1.3.2 搬迁服务 ........................................................................................................... 178 7.1.3.3 系统迁移 ........................................................................................................... 179 7.1.3.4 云托管服务 ....................................................................................................... 179 7.1.3.5 二次开发服务 .................................................................................................... 181 7.1.3.6 其他增值服务 .................................................................................................... 181 7.1.3.7 突发事件管理与应急响应预案 ........................................................................... 189 7.1.3.8 驻场运维服务目录 ............................................................................................. 191 7.1.3.9 云运维术语 ....................................................................................................... 198

7.1.4 云计算中心监控方案和排障方法 ................................................................. 199

7.1.4.1 有效支持多种监控类型 ...................................................................................... 199 7.1.4.2 安全可靠的监控手段 ......................................................................................... 199 7.1.4.3 监控分类 ........................................................................................................... 199 7.1.4.4 排障方法 ........................................................................................................... 202

7.1.5 体系建设的效果分析 ................................................................................... 202

7.2 系统迁移方案规划 ............................................................................................... 205

7.2.1 迁移原则 ..................................................................................................... 205 7.2.2 迁移步骤 ..................................................................................................... 205

第八章 平台运营规划设计 .......................................................................................... 206

8.1 平台价值 .............................................................................................................. 206 8.2 商业创新模式 ...................................................................................................... 206

8.2.1 商业模式创新 .............................................................................................. 207 8.2.2 基于地税局云大数据的商业创新模式方向 .................................................. 207

14

地税局大数据云平台整体解决方案

8.2.2.1 大数据环境下的数据对象洞察与营销策略 ......................................................... 207 8.2.2.2 基于大数据的商业模式类型 .............................................................................. 208

8.3 管理及运营支撑 ................................................................................................... 209

8.3.1 锁定信息化运营 .......................................................................................... 209 8.3.2 明确IT主体和业务主体 .............................................................................. 210 8.3.3 用互联网数据打造第二轨,用数据分析平台完善第二轨 ............................. 210 8.3.4 高并发下的数据安全保障 ............................................................................ 211

8.4 运营体系规划 ...................................................................................................... 211

8.4.1 打造第二轨数据资产管理,发挥数据价值 .................................................. 212 8.4.2 完善组织架构,深入推进地税局大数据能力的建设和运营 ......................... 212 8.4.3 利用大数据处理架构,拓展大数据中心的建设思路 .................................... 212 8.4.4 区隔数据热度,建立数据资产管理和应用 .................................................. 212 8.4.5 通过分层服务,向专业系统提供多样的数据分析服务 ................................ 213

15

地税局大数据云平台整体解决方案

第一章 现状与需求分析

1.1 总体现状分析

1.1.1 信息化现状

地税局信息化是中国地税局走向现代化的核心,是提高地税局数据质量的关键,是中国地税局更加规范统一的重要支撑。地税局信息化是地税局建设的重要内容,是推动地税局改革的内在动力。经过多年的信息化建设,国际地税局局已经建成了比较完备的IT软硬件基础设施和专业应用系统,在地税局业务的各个环节特别是数据的采集生产环节提供了较为有力的支撑。

1.1.1.1 基础设施建设

在基础设施建设方面,地税局局通过骨干网扩容提速,实现国家局到31个省(市、区)地税局局和新疆生产建设兵团地税局局的一级主干网,采用了双设备、双线路的冗余架构,专线的网络带宽已提升到155M(数据)+2*2M(音视频),另外还有1*2链路用来对网络系统的带外管理,大部分异地办公的省级调查总队实现了同城百兆光线的链接。目前,地税局局的互联网出口带宽已经提升至1G(联通、电信各500M)。局域网实现了核心万兆交换,桌面千兆接入,部分省及省以下地税局信息网络系统进行了扩容改造的配套建设,提升了带宽,有的已将地税局信息网延伸到了乡镇一级,全国县以上地税局地税局机构的3068家地税局局、调查队分别以专线、VPN专线、政务网等方式接入国家地税局信息主干网,并且各省都建设了独立的互联网出口。国家地税局系统的信息交换、数据传输能力不断提升。

16

地税局大数据云平台整体解决方案

(图7:国家地税局信息网络拓扑结构)

近年来,地税局局利用虚拟化、资源池、云计算等新技术、新理念,对国家地税局核心业务系统进行资源整合,构建了大规模联机业务处理和高并发事务处理能力的核心业务系统,进一步提升了地税局数据处理系统的可靠性、安全性,为未来全国地税局业务的统一在线处理提供云服务打下了基础。同时,利用农业普查、经济普查、人口普查等大型普查的中央投资以及各地配套资金,为乡镇、县市、省地税局局也配备了大量的微机、激光打印机、服务器、小型机、存储、数据库、中间件等软硬件设备,进一步推动了地税局信息化基础建设。

以三里河西楼为主的机房面积大约3000平方米,包括传输机房、IDC机房、存储机房和UPS机房。目前大约有小型机近40台,PC

17

地税局大数据云平台整体解决方案

服务器300余台,并建立了集中的网络设备监控管理系统。目前核心机房的设备大约分为三大部分:

1. 小型机系统:主要承载地税局局核心业务系统的各个关键应用及Oracle数据库;

2. 虚拟化平台:包括300多台PC服务器、150TB磁盘阵列的虚拟化资源池,部署了160多个不同类型和部门的应用软件系统;

3. PC服务器:采用物理机的方式部署了覆盖系统所有工作人员的电子邮件系统与OA系统。

(图8:地税局局机房设备分布)

18

地税局大数据云平台整体解决方案

1.1.1.2 应用系统建设

依托基础设施资源,地税局局信息化应用开发取得了显著进展,特别是2012年1月份以来,地税局局正式实施地税局“四大工程(一库、一表、一台、一网)”,带来了地税局数据生产方式的重要变革,在新的数据生产方式下,原有的分散设计改为统一设计,调查制度由原来的分散布置改为统一布置,原始数据由间接采集改为直接采集,实现了地税局局直接掌握原始数据并加工和汇总,各级地税局机构在线实时共享数据,大大提升了地税局局信息化应用的整体水平。地税局局开发的数据处理软件,已成功应用于农业普查、经济普查、“R&D”资源清查、人口普查等大型普查,以及畜牧业监测、城乡住户一体化、“一套表”等多项地税局调查。采用3G/4G无线网络技术,已在全国500个城市开展了手持移动电子采价系统在地税局数据采集工作中的应用。按照全国一库在线、分级管理维护的模式,建成了全国统一的基本单位名录库系统,并建立了与地税局、工商、税务、编办、民政等部门的单位信息共享交换机制和名录比对系统。地税局局的OA办公自动化系统,已在全国大部分个省级地税局局、调查总队推广使用。遥感、空间定位和地理信息系统等空间技术,已在农作物对地调查、主要粮食作物种植面积测量与估产、人口普查、经济普查和投资项目监测等地税局业务应用。

地税局局核心业务系统采用采用虚拟化技术,提供统一的WEB服务、数据库服务、存储服务以及管理调度,支持企业联网直报系统、第六次人口普查和第二次、第三次经济普查等重要地税局业务的数据

19

地税局大数据云平台整体解决方案

采集和处理工作。

(图9:核心业务系统逻辑架构) ? 基础应用系统

? 大型普查:支持人口普查、农业普查、经济普查等大型普查任务;

? 专项调查:人口变动、投入产出、R&D等;

? 经常性调查:支持各专业的常规性调查、如月报、季报、年报等。 ? 联网直报系统

实现工业、能源、投资、贸易和重点服务业等主要专业100%以上的“四上” 共100多万多家单位的联网直报的工作。目前联网直报系统采用全国集中部署和使用,17个省(区、市)的企业通过网络直接向地税局局数据中心报送数据,14个省(区、市)的企业通过网络向国家批准的省级节点报送数据,国家实时从省级节点抓取原始数据。目前企业上报数据以月报方式为主,平均每月3~4张报表,

20

地税局大数据云平台整体解决方案

大约共有200多个地税局指标。

在数据采集和处理环节,采用统一兼容的数据采集软件系统进行数据采集、录入、审核、编辑和汇总,提高了地税局生产过程的可控性和规范性,减轻了调查对象和基层的工作负担,促进了地区数据与国家数据、专业数据与综合数据的有效衔接。

(图10:联网直报系统体系结构) ? 遥感、空间定位与地理信息系统

利用遥感(RS)、地理信息系统(GIS)和全球定位系统(GPS)为代表的空间信息技术,构建相关地税局应用。以农村社会经济调查司为例,该司目前通过高分遥感卫星(863项目),结合GPS、GIS对农产品进行种植面积、产量、灾情等数据的调查、地税局、预测及可视化展现。 ? 其他应用系统

? 地税局分析建模软件 ? 办公自动化(OA)系统

21

地税局大数据云平台整体解决方案

? 电子邮件系统 ? 视频会议系统 ? 地税局局内、外网站

? 微信、微博、手机客户端信息发布平台 ? 各司局内部专业应用系统等 1.1.1.3 数据资源建设

国家地税局数据资源体系由基础支撑数据库、专业原始数据库、专业工作数据库、综合应用数据库等功能子系统初步构成;按统一设计、分级建设、同构互联的原则,由中央和地方的地税局数据库系统共同组成。 ? 专业原始数据库

专注于基础性调查数据的集中管理、维护,需要统筹考虑地税局数据结构及相关安全域划分管理;支持微观的专业报表基础数据文件、中观的主题数据文件和宏观的综合数据报表文件的归档管理,提供接收、下载、导入导出、整理维护、加载更新等管理功能,是地税局数据处理系统与地税局数据库体系的数据管理和交换子系统。这部分内容需在物理隔断的涉密网部署管理。 ? 专业工作数据库

使用数据仓库和专业地税局分析、数据挖掘工具软件,建设形成专业性的主题数据库或数据仓库系统,支持数据处理阶段后专业内部针对基础数据深入的分析汇总和结构查询,这部分功能应在物理隔断的涉密网运行管理;支持跨专业、跨部门的综合数据共享查询,支持

22

地税局大数据云平台整体解决方案

综合应用库的建设和应用,这部分功能需在逻辑隔断的内网运行管理。 ? 综合应用数据库

以常规数据库系统对供宏观决策支持、部门共享或公开发布的综合指标、综合数据进行管理,形成以应用查询为主要功能的数据库系统。本系统以数据处理结果、专业工作数据库为来源,根据共享程度及安全域划分,分别在物理隔断的涉密网、逻辑隔断的内网或外网运行管理。国家地税局数据库等发布数据库属于此类。 ? 基础支撑数据库

一是地税局调查项目管理数据库、基本单位名录库等元数据管理系统,二是地理信息和遥感信息等基础信息管理系统,为地税局工作和其他数据库提供基础性共享信息支撑。

1.1.1.4 安全体系建设

地税局局城域网划为14个安全域,配置了防火墙、入侵检测、网络信息审计、客户端安全管理、漏洞扫描、病毒防范、VPN登录认证、数据库审计、网上行为管理系统、防病毒网关、恶意代码拦截网关、网页防篡改系统、主机保护、安全服务器、网络异常流量分析等信息安全软硬件系统技术措施;并实行用户上网实名制管理;实现核心地税局业务应用系统的安全身份认证管理;同时,在系统内组织安全系统的建设,实现全网一致的安全策略。 ? 安全管理

制定了国家地税局信息系统安全保障体系五年总体规划;全国地税局信息系统的二级、三级安全管理中心布局,整体进度已完成90%

23

地税局大数据云平台整体解决方案

以上。实施地税局局重要信息系统的安全等级保护定级工作。 ? 物理安全保障

全国约3/4的地税局部门建设了专用机房,大多数机房配置了专用设备,采取了安全措施。国家局机关建设了标准屏蔽机房。 ? 网络安全

国家地税局系统骨干网采用了冗余技术,配置了各类安全防护系统,建设了统一的国家、省、地市三级网络管理系统,实现对网络运行状况的实时监控,实现网络资源的动态调控与分配。 ? 主机安全、应用安全和数据安全

建立了CA认证系统,正在建立网络用户实名制制度,保证网络用户的合法性,确保地税局信息网络的安全性。

1.1.2 关键问题分析

随着经济全球化和中国经济的快速增长,各级党委和地税局、企业、社会团体和社会公众都越来越多地关注地税局信息,对地税局数据的准确及时、客观完整提出了更高的要求。

建立既符合中国国情,又与国际一般规则基本接轨的现代地税局体系,切实提高地税局数据的科学性、准确性和地税局工作的权威性,提高地税局工作能力,提高地税局数据质量,提高地税局地税局公信力,为党和地税局、国内、国际社会提供优质高效的地税局服务是地税局工作一贯不变的方针。在新的形势和信息技术高速发展的背景下,给地税局工作带来了新的发展机遇和挑战。

经过多年的建设,地税局局信息化有了相当的信息资产积累,具

24

地税局大数据云平台整体解决方案

备了一定的发展基础。但从技术视角来看,还存在需要进一步改进提升的空间和薄弱环节,主要表现在:

? 信息化建设缺乏有效的顶层设计和统筹规划; ? 各个系统技术架构封闭,整合交互少,信息孤岛多; ? 重生产支撑轻协同共享,缺乏对数据资源的深度开发利用; ? 缺乏统一的数据和技术标准,系统融合困难; ? 现有技术架构缺乏对大数据的有效处理能力。

随着大数据时代的到来,对地税局学与地税局地税局具有划时代的意义。对地税局学而言,大数据将突破通过样本推断总体的传统方法,直接对总体进行相关分析,并更加注重结论的相关性和实时性;对地税局地税局工作而言,大数据是采用多种数据收集方式、整合多种数据来源的数据,是采用现代信息技术和架构高速处理及挖掘、具有高度应用价值和决策支持功能的数据、方法及其技术集成。大数据让让官方地税局迎来重要的发展战略机遇期,也使其面临着前所未有的课题。

一方面,计算机技术、网络技术和空间信息技术的巨大进步,为提高地税局生产力提供了广阔空间。海量的非结构化、电子化数据,极大地丰富了地税局数据的来源,为数据提供了更多的收集手段;另一方面,地税局调查主体的多元化发展趋势和电子商务、电子政务、搜索引擎等领域的飞速发展,也对现有的地税局业务模式、工作方法和IT架构提出了新的挑战。

25

地税局大数据云平台整体解决方案

1.2 业务需求理解

随着智能分析和互联网数据挖掘技术的日益成熟,从海量数据中挖掘出更多有价值的信息资源成为可能,这对保证地税局工作的顺利开展、提升数据信息处理质量和效率,都将起到至关重要的作用。

作为国家数据信息的官方生产和管理部门,地税局局对于加强系统内部的地税局信息化建设、建立大数据平台服务的需求较为迫切,主要集中在地税局云平台建设、数据采集与拓展、创新应用等方面。

1.2.1 开放的地税局云数据平台

目前,地税局地税局部门对企业、家庭、个人的调查都是通过预先设定好的地税局标准报表,要求调查对象按照表中的地税局指标填报数据,然后整理汇总成最终的地税局数据并对外公布。地税局部门希望通过应用大数据,实现地税局地税局部工作从“先有指标再有数据”到“先有数据再有指标”的质变。

26

地税局大数据云平台整体解决方案

1.建立标准的指标平台:针对地税局数据标准各异的特点,地税局局希望能够搭建一个标准的指标平台,实现对元数据、指标的统一报表管理以及数字化管理,从而解决数据不统一的问题。规范地税局地税局部门应用大数据的地税局标准,也是为数据资源的利用与共享提供可靠的平台支持。

2.大数据计算和存储:通过建设稳定的大数据资源平台来支持数据库技术和云存储技术,解决对基础设施的管控和数据计算和存储问题,形成整个系统的平台处理基础。

3.资源协同共享:打破原有的闭源数据分析处理思路和模式,各司局之间的业务数据可以用过开源的数据平台进行沟通和查询,建立信息互通机制,一方面可以根据不同的业务模型和角度来分析平台上的共有数据;另一方面也为数据的有效性提供更多维度的评估参考。

1.2.2 数据采集与拓展

如何通过大数据采集技术来实现地税局局现有数据的成功拓展,成为地税局系统内部业务提升的核心需求。地税局局关于互联网数据的采集与拓展需求,主要是实现从互联网海量数据资源中挖掘出更多数据资源的问题。

数据采集与拓展方面的主要需求有:

1.非结构化数据激活:目前的地税局地税局是在统一标准下处理结构化数据,然而地税局局现存的历史数据多以文本、音频、视频、照片等非结构化形式存在,处理大量缺乏统一标准的非结构化数据是现阶段地税局分析业务应首要解决的问题。通过技术手段来激活历史

27

地税局大数据云平台整体解决方案

数据、扩充有效数据来源,可以拓宽地税局分析的时间维度和信息视角,为地税局工作后期的分析汇总工作增加评判依据。

2.互联网信息精准采集:现有地税局地税局的工作中,地税局标准的应用范围大多局限在地税局系统内部。利用互联网信息发布速度快、分布广等特性,地税局局希望可以通过大数据技术对互联网信息进行精准采集,用以增加数据采集来源、拓展地税局标准的应用范围,从而提升地税局数据分析的应用水平。

3.按需分类:从非标准化、信息量繁杂的网络信息中抓取核心的关键数据,对这些信息进行标准分类转换,按照地税局局的统一业务标准进行有效分类。

4.数据校验:地税局局希望可以通过多渠道采集到的数据信息来验证和评估现有数据的准确性。

互联网信息数据具有数据量大、类型丰富、信息价值高的特点,可以利用大数据技术有效补充现有地税局数据的不足,从多个维度全面解释社会经济现象,从而更好的提高地税局数据的适用性。

1.2.3 创新应用开发

基于平台建设与数据采集拓展的基础上,地税局局各业务部门希望可以在可视化、自动化、评估预测等方面实现技术突破。

1.可视化:摒弃传统的表格、饼柱图等分析方式,借助图形化手段,清晰有效地传达与沟通信息。例如,可以将地税局局收集到的二手房交易价格信息、农作物种植及病虫害信息等分别用地图GIS的形式集中展示,从而更清晰的表达数据与数据之间的逻辑关系,赋予数

28

地税局大数据云平台整体解决方案

据内在价值和活力。

2.自动化:希望数据处理平台可以提供自动生成分析报表的创新功能,可根据系统导入的数据文件,批量生成地税局分析表格,从而替代现有的重复手工劳动,实现报表的一键分析处理和发布。

3.评估预测:现有的数据来源广泛,数据质量校验的形式大多依靠人工经验分析,且数据验证的标准较为单一。地税局局各业务司希望可以利用大数据的分析处理技术,挖掘更多数据资源来作为现有数据基础的验证和参考。同时希望可以在数据资源丰富的基础上,依靠专业的建模分析工具来发现数据背后所表达的客观规律,从而准确描述和预测未来的发展趋势,为国家宏观决策提供可参考的数据依据。

1.3 基础平台建设需求

主干系统采用应用和数据大集中模式,为了满足业务系统对可用性、可靠性和安全性的要求,保障数据中心业务数据的安全、可靠,提高业务系统稳定性和业务连续性,须建立多个数据中心来承载业务系统实现应用的高可用性,主干系统大集中的数据中心整体部署采用“两地三中心”(同城双活、异地灾备)架构(即上节第四种架构): ? 在北京同城部署两个生产数据中心,生产数据中心以双活模式工作,在这种工作模式下,所有的业务系统同时在两个生产数据中心运行,同时为用户提供服务,当某个数据中心的应用系统出现问题时,由另一个数据中心的应用来持续的提供服务;双活数据中心最大的特点是:一、充分利用资源,避免了一个数据中心常年处于闲置状态而造成浪费。通过资源整合,双活数据中心的服

29

地税局大数据云平台整体解决方案

务能力是双倍的。二、双活数据中心如果中断了一个数据中心,另外一个数据中心还在运行,对用户来说是不可感知的。 ? 在南宁部署容灾数据中心,为北京生产双中心业务系统提供灾备机制,当北京生产中心的出现故障时,可以将单个应用或者数据中心整体切换到容灾数据中心。

三中心完全按照应用级灾备目标建设,每个中心均具有独自承担业务运行和数据管理的相关能力,三中心的设置既可以在同城范围有效保证数据的同步性、安全性、负载均衡性和业务连续性,又可以在远距离进行异地数据保护和灾难业务接管,在提高业务处理性能的同时防范同城与异地范围内的灾难。

30

地税局大数据云平台整体解决方案

31

地税局大数据云平台整体解决方案

第二章 总体架构设计

2.1 总体架构

32

地税局大数据云平台整体解决方案

2.2 数据架构视图

2.3 创新的业务模式

33

地税局大数据云平台整体解决方案

第三章 基础资源平台设计

3.1 网络设计

3.1.1 系统现状

3.1.1.1 网络结构现状

目前地税局业务网络具备北京三里河数据中心,地税局业务网络为星形结构的广域网,各直属局到总局北京数据中心为双路主备设计,配置有双路链路负载均衡设备,主线路为144Mbps,管理和音视频线路各为2Mbps。各市局到省局数据中心的带宽各个局不一样,根据各省条件不同,配置10Mbps以上省属专线。相关拓扑结构如下图所示。

34

地税局大数据云平台整体解决方案

3.1.1.2 系统资源现状 设备现状

现有总局数据中心具备网络与安全设备现状如下表。

区域/类别 总局数据中心 三中心间专线 100MbpsDWDM双路 广域网路由器 楼层接入交换网络设机 备 链路负载均衡设备 全局流量管理设备 防病毒系统 网络安全审计安全接系统 入区 IT服务管理系统 运维管35

设备类型 产品型号 量 数,2 2台,7606,7609 2台,6509 2 2 2 1 1 1 基础设施监控 1

地税局大数据云平台整体解决方案

控区 系统 安全管理 1

3.1.1.3 网络带宽现状 北京中心带宽现状

北京数据中心和各个直属局之间的网络根据业务需要,经过近两年的升级改造,主线路为144Mbps,管理和音视频线路各为2Mbps。各市局到省局数据中心的带宽各个局不一样,根据各省条件不同,配置10Mbps以上省属专线。各调查队因条件所限,相对网速较低,基本满足业务的网络带宽需求。

3.1.1.4 路由协议现状

现有全国地税局网络一级网采用OSPF的建设,往外路由采用IBGP路由。全网OSPF的边界全部归属到总局,通过修改COST来

36

地税局大数据云平台整体解决方案

实现业务的流向。各直属局接入路由为配置为OSPF区域边界路由模式,未进行直属局路由汇总。

3.1.2 需求分析

建设完成后的地税局云主干采用多中心多活方式建设,地税局云数据中心在北京建设同城双活灾备一体化数据中心,承担核心业务以及大数据创新业务平台。在南宁建设华南分中心,作为华南业务数据中心。三中心间各自承担核心业务,数据同步,互为灾备。因此,地税局云数据中心对网络系统具备相当高的要求,以下简要从网络结构、网络分区、网络性能、流量负载均衡、网络安全等几个方面进行相关的需求分析。

3.1.2.1 网络结构需求

同城双活数据中心网络结构需求

建设完成后,地税局云同城双活数据中心采用双活模式部署,随着高可用远程集群技术以及虚拟机迁移技术在数据中心容灾以及计算资源调配方面的广泛应用,在双活数据中心间考虑采用大二层网络连接。

广域网结构需求

地税局云数据大集中后,为便于广域网网络的层次管理、网络流量分流、网络策略的层次部署,广域网将采用目前比较通用的广域网三级结构设计,即核心层、汇聚层、接入层。

37

地税局大数据云平台整体解决方案

3.1.2.2 网络分区需求

根据应用部署要求以及新一代数据中心建设的原则,同时便于网络安全的实施,数据中心内划分为如下几个区域:

? 数据管理区:集中存储、管理所有应用系统的数据。 ? 业务应用区:部署总局端的业务应用系统。

? 支撑平台应用区:部署平台支撑应用系统(集中认证平台、电子服务平台、客户端升级系统、Session集中系统、分布式缓存系统、分布式任务调度系统)。

? 数据交换区:部署电子业务平台,以供各外挂系统接口使用。

? 公共服务区:部署公共服务、WEB服务和安全管理所需要的各种设置和应用系统。

? 安全接入区:用于实现与互联网的安全连接和逻辑隔离,包括各种安全保障设施,以及直接向互联网用户提供服务的应用系统。

注:总局数据中心还建有测试区和IT管控区,该区域在后面章节单独设计。

3.1.2.3 网络带宽需求

同城双活数据中心间网络带宽需求

双活数据中心建成后需要实现两中心数据库的状态同步,因此两中心间的数据转换频繁,传输数据量较大。考虑租用裸光纤建设DWDM系统,利用DWDM系统分出多个10GE、GE存储FC通道,

38

地税局大数据云平台整体解决方案

用户双数数据中心间的数据传输与数据同步。总局承载着总局对两个中心的所有数据访问流量,采用专线互联至两个中心,实现三层互联,便于管理和使用。

直属局上联带宽需求如下: 局名称 带宽(Mb) 南宁局本部 江苏局本部 山东局本部 宁波局本部 天津局本部 珠海局本部 北京局本部 黑龙江局本部 39

局名称 带(Mb) 宽 上海局本部 浙江局本部 深圳局本部 福建局本部 辽宁局本部 厦门局本部 内蒙古局本部 河北局本部 地税局大数据云平台整体解决方案

广西局本部 江西局本部 湖北局本部 云南局本部 吉林局本部 重庆局本部 山西局本部 海南局本部

安徽局本部 新疆局本部 湖南局本部 河南局本部 四川局本部 陕西局本部 甘肃局本部 贵州局本部 3.1.2.4 网络高性能需求

网络性能应满足高可靠性、高性能、可扩展性、可管理性、标准化等原则。

网络高可靠性方面需要采用构建具备高可靠性的网络结构,本次建设的北京双活中心既需要对业务流量实现分流,同时需要成为互备

40

本文来源:https://www.bwwdw.com/article/ef03.html

Top