ESM企业IT系统集中管理平台 - 图文

更新时间:2024-04-10 06:15:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

万联企业IT系统集中管理服务平台 Enterprise System Manage

万联ESM(Enterprise System Manage)系统突破传统IT 网管概念,高效集成了传统的网络管理、系统管理、软件应用管理、职能和业务监控。这里的集成不是传统意义的多个模块的后期组合,而是将网络、主机系统、应用等,统一作为系统管理对象。ESM 统一提供覆盖各种网络设备、主机服务器、数据库、中间件、通用软件、专有设备及专有业务系统的各种监测器。监测器的种类和覆盖范围还在不断增长和升级。用户可以为每一个网元同时创建上述各个层面的多个监测器和采集器,并能够在不同的监控之间、从不同管理角度建立任意的相关性和依赖关系。这一点在传统IT 管理方案中是不可想象的。ESM 通过引入SLA规则和业务视图定义,将不同类型的监测器和采集器获得的管理数据进行多角度多层面的综合分析,汇总出企业关心的整体运行状况;众多单体监测器监控到的各种微观管理信息将被汇总,映射为对服务和业务造成的影响和损失;主动制定各种监控和管理的规则和指标,并最终落实到不同的监测器和采集器规则上。ESM 为用户提供了连接关键IT 部件和业务目标的动态方法,是面向业务的解决方案,能使您全面了解和预测自己的IT 环境;了解IT 技术如何影响业务;业务如何影响IT 基础架构;帮助客户围绕SLA 建立工作标准和优化效率。

1、产品定位和特点

? ESM 是定位于“IT 架构集成管理”的“运行维护管理”的管理产品,注重分析运维的特点,注重

分析使用者的特点,是一套“事前”管理系统,基于网络平台,面向应用。

? 如同所有的网络管理产品,设备本身的管理是ESM 的重要组成部分,但 ESM 除关注设备本身状况

外,更关注的是流经设备的数据流,关注的是应用对设备造成的压力,关注的是网络应用的压力分布、变化情况,ESM 将设备视为网络这张大“蛛网”上的诸多Agent,通过这些关键节点上的Agent 在为整个应用系统“诊脉”。

? 在设备数据的表现上ESM 有所取舍,关心用户为什么要看,想看些什么,根据运行维护的需要进行

数据裁减,加工,注重主动告诉用户些什么,而非被动地等待用户刚好查到某数据。

?

ESM 网络节点拓扑结构图集中体现了运行维护管理特色。

2、系统特点

全面深广、无所不能的监测

ESM 监控手段主要基于SNMP 协议,同时提供SSH、Agent、SQL、JMX、SNMP Trap及Syslog 等

1

多种监控方式。

强大的拓扑展示

提供自动和手动拓扑两种方式,可根据用户的真实网络环境生成个性化拓扑图,能展现网络中各个资源的运行状态和流量分布状况,一旦发生故障,物理拓扑上便能即时产生告警提示,使您迅速查看问题所在。

独具特色的业务视图

ESM 为用户提供了连接关键IT 部件和业务目标的动态方法,根据业务划分的角度进行IT 资源管理的视图,即以业务为主线,实现面向业务的监测和管理。

智能高效的事件处理

告警控制台提供映射规则、过滤规则、事件相关性规则、合并压缩规则,一旦发生告警事件,及时通知管理员,快速定位故障源。

丰富灵活的性能报告统计

能根据用户需求生成各种报表和图形化的性能统计和分析报告,帮助IT 部门分析网络的运行趋势,找到隐藏的性能瓶颈。

高度的可扩展性,完全满足用户需求

面向对象的监测模式,插件式的监测器,灵活的定制化开发,更好更方便的满足用户个性化需求。

标准的第三方集成接口

符合行业标准协议,支持标准XML 数据接口、SNMP Trap 接口、数据库接口、标准API 等,非常方便的能与第三方管理工具无缝集成。

独创的软硬一体化

国内首创的软硬一体化网管设备,无需安装任何软件,即插即用,快速完成实施部署,无须专业培训,维护升级简便易行。

2

软硬一体化架构,方便部署

3、ESM的部署步骤

3

4、ESM监测范围

5、ESM操作流程

4

6、ESM体系架构

7、软件展示

独特的业务管理视图

5

简单直观的展现方式

6

主机详细的节点信息

主机监控(AGENT)

交换机(Cisco)监测情况

7

Oracle数据库监测情况

丰富的数据性能报表

8

8、特点分析

9

竞争分析-费用

9、ESM系统基础平台监控参数

CPU监测器 IO状态监测器 NT服务监测器 Win Registry监测器 Windows窗口监测器 磁盘空间监测器 内存使用监测器 平均负载监测器 日志文件监测器 文件监测器 文件目录监测器 系统进程监测器 虚拟内存监测器 Swapspace 监测器 远程PING监测器 脚本监测监测器 监测 服务器CPU 监测 服务器IO状态 监测 NT Service 监测 Windows Registry 监测 Windows窗口是否存在 监测 服务器磁盘空间 监测 服务器内存使用 监测 服务器平均负载 监测 服务器日志文件 监测 服务器文件 监测 服务器文件目录 监测 服务器系统进程 监测 服务器虚拟内存 监测 服务器交换空间 监测 服务器远程PING 监测 服务器脚本监测

10

可选的监测器

可选功能模块 ESM-NETFLOW ESM-SMS 可选监测器 (数据库) MON-ORACLE MON-DB2 MON-MSSQL MON-SYBASE MON-INFORMIX MON-MYSQL 可选监测器 (应用) MON-WEBSPHERE MON-WEBLOGIC MON-IBM-CICS MON-TUXEDO MON-MT MON-MQ MON-LOTUS-NOTES MON-MSEXCHANGE MON-LDAP MON-MS-IIS MON-TOMCAT MON-APACHE MON-IBM-HACMP MON-IBM-GMD MON-JBOSS MON-RESIN ORACLE 监测器 DB2 监测器 MS-SQL 监测器 SYBASE 监测器 INFORMIX 监测器 MYSQL 监测器 NetFlow流量信息采集和分析 短信告警模块 WEBSPHERE 服务 监测器 监测 WEBSPHERE 服务的性能参数和事件 WEBLOGIC服务监测器 CICS服务监测器 TUXEDO服务监测器 MT服务监测器 MQ服务监测器 监测 WEBLOGIC 服务的性能参数和事件 监测 IBM CICS 服务的性能参数和事件 监测 TUXEDO 服务的性能参数和事件 监测 MT 服务的性能参数和事件 监测 MQ 服务的性能参数和事件 NetFlow流量信息采集和分析 短信告警发送 LOTUS NOTES服务监测器 监测 LOTUS NOTES 服务的性能参数和事件 MS EXCHANGE 监测器 LDAP 监测器 MS-IIS 监测器 TOMCAT监测器 APACHE 监测器 HACMP服务监测器 GMD服务监测器 JBOSS服务监测器 RESIN服务监测器 监测 MS-EXCHANGE的性能参数和事件 监测 LDAP 可用性和响应时间 监测 MS-IIS 的性能参数和事件 监测TOMCAT的性能参数和事件 监测 APACHE服务可用性和性能参数 监测 IBM HACMP 服务的性能参数和事件 监测 IBM GMD 服务的性能参数和事件 监测 JBOSS 服务的性能参数和事件 监测 RESIN 服务的性能参数和事件

11

10、设备监测指标:

1). 主机系统

监控范围:Windows(2K\\XP\\2003\\Vista)

LINUX(Red Hat\\SUSE \\红旗 \\Ubuntu Linux\\FreeBSD\\Turbo) UNIX(Solaris 8、9、10)\\AIX (4.X、5.1、5.2、5.3)\\HP-UX (11i) AS400

监控方式:SNMP\\AGENT

监控说明:SNMP方式监控,被管机器上仅需要启动SNMP服务,采集的指标为一些通用指标,AGENT方式监控,需要在被管机器上安装AGENT程序,采集的指标丰富,而且可以根据具体需要进行定制,AGENT监测方式支持对主机的简要操作。

注:AGENT程序是经过严格测试,对目标机器的资源占用很少,也可限定对内存的占用大小,不会影响目标机器的正常运行。

ESM系统支持对物理磁盘监测(主机磁盘做了冗余后,往往单个物理磁盘故障后,不影响系统运行,如不及时更换,再有磁盘损坏将会导致数据丢失甚至系统宕机。通过ESM物理磁盘监测功能可实时了解物理磁盘运行状态,当有异常发生时实时消息通知,及时处理避免不必要损失。

指标分析: UNIX\\LINUX 监控项 CPU 指标名 CPUCpuUtil 描述 显示的是CPU使用率 报警范围 一般报警:90% ~ 95% 严重报警:95% ~ 100% CPULoad 在采样间隔内,内核中运行队列中排队的进程的平均值 CPUUserTime CPUSysTime 用户模式下的命令使用的CPU的时间 系统模式下的系统命令使用的CPU的时间 文件系统 FSCapacity 反映了文件系统使用空间的百分比 需要了解系统的实际情况后而定 一般报警:90% ~ 95% 严重报警:95% ~ 100% 一般报警:96% --- 98% 严重报警:98% ~ 100% FSMountState 文件系统挂载状态 一般告警:1(unmounted) 严重告警:2(unknown) 内存 MEMFreeMem 反映了操作系统中空闲的内存 一般报警:100 ---200K 严重报警:0 ---100K

12

需要了解系统的实际情况后而定 MEMRCache 缓冲区逻辑读的百分比 一般报警:1-10% 严重报警:10-20% 进程 PROCTopProcs PROCExec 显示最占用系统资源的前10个进程 每秒钟系统调用次数 反映的是系统中所有的交换区的使用的空间的数量 在系统登陆的用户数 用户session数量 文本输出 图形显示 一般报警:90% ~ 95% 严重报警:95% ~ 100% 图形显示 图形显示 交换区 SWPTotSwapUsedPercent 用户 USRNoUser UsrNoSession

WINDOWS 监控项 磁盘 指标名 描述 报警范围 一般报警:5% ~ 10% 严重报警:0 ~ 5% 在采样间隔内,系统使用CPU的时间 一般报警:90% ~ 95% 严重报警:95% ~ 100% 内存 Memory Available Memory Faults PageFile 进程 安全 ProcTopProcs SECsvrErrorsLogon SECsvrErrorsLogonDelta 服务 ServiceStatus 监控自动启动的服务启动情况

2). 网络设备

监控范围:交换机\\路由器\\防火墙\\(思科、北电、华为、锐捷、JUNIPER、港湾) 监控方式:SNMP\\SNMP trap

监控说明:SNMP方式监控为ESM系统定期主动轮训方式 ,SNMPtrap是被管设备主动发送消息到ESM系统,在赋予SNMP读写权限后,可以对设备进行简单操作,如端口的关闭。 指标分析:

13

Logical Disk 显示逻辑硬盘剩余空间的百分比 Space CPU CPU 显示内存的可用空间 一般报警:4MB ~10M 严重报警:<4MB 一般报警:10~20 严重报警:<10 Page File Page 显示每分钟Memory Page Faults的次数 Page File Page文件使用的百分比 一般报警:80% ~90% 严重报警:90% ~ 100% 消耗资源最大的Top10的进程 检查从系统启动开始的所有失败的登陆次数 上一轮询周期内的登陆失败次数 文本显示 图形显示 图形显示 严重报警:not running 监控项 CPU 指标名 CPUCpuUtil 描述 显示的是CPU使用率 报警范围 一般报警:50% ~ 80% 严重报警:80% ~ 100% 内存 Memory Available 显示内存的可用空间 一般报警:4MB ~10M 严重报警:<4MB 端口 端口流出速率 端口流入速率 端口流出带宽利用率 一般告警:80%~90% 严重告警:90%~100% 端口流出量 端口流入带宽利用率 一般告警:80%~90% 严重告警:90%~100% 端口流入量 端口丢包数 端口丢包率 一般告警:1%~5% 一般告警:5%~10% 端口误码数 端口误码率 一般告警:1%~5% 一般告警:5%~100% 等等

14

本文来源:https://www.bwwdw.com/article/u43r.html

Top