运维2.0理论体系之三大重点

更新时间:2023-11-13 15:57:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

运维2.0之三大重点

一、 业务驱动运维

IT的使命是向业务交付价值,为了高效地服务于业务,运维2.0强调以一种新的途径来管理运维,即业务驱动运维。业务驱动运维的本质强调无论服务源自何处,IT运维总能主动规避、发现或解决问题,向业务提供统一标准地端到端交付,并以确保持续改进的最佳服务级别的目标加以管理。业务驱动运维可以从如下两个层面来解读。 (一) 自上而下 —— 业务战略指导IT运维规划

运维规划从企业的业务战略入手,逐步将业务战略转化为运维管理系统与工具的功能目标和系统架构,通过分析业务战略识别运维目标、运维的交付过程和数据,对数据进行分析,自上而下地指导运维规划,并形成一体化运维平台。支撑企业业务战略的实现,满足企业管理层次的要求,引领企业业务创新。业务战略与愿景给IT运维体系和一体化运维平台提供总体架构与演进方向,同时也明确运维体系与相应落地工具组成与开发的先后顺序。

(二) 自下而上 —— 智能运维提升业务的敏捷性

业务的发展瞬息万变,移动化、虚拟化和云计算等技术使IT运维环境错综复杂,IT运维要想跨越分散独立的异构IT领域,深入分析业务服务并实现模块化。就需要将业务服

务级别提高到一个全新的智能级别。利用历史数据优化资源的使用情况,并规划未来业务发展。服务智能化旨在将各种IT数据转化为切实可行的知识,引领规划和指导实践。运维2.0工具体系提供能够提前预见IT问题和预判未来业务需求的分析引擎,支持IT部门更智能化地为业务交付价值。自下而上地将存储、监控、分析、展示、管理和规划全面整合在一起,提供全新的一站式和一体化服务,保证业务的敏捷性以及频繁变动时业务决策的科学化和智能化,减少耗时粗犷的手动操作。

运维2.0所提倡的业务驱动运维使得IT运维主动和业务建立强相关,运维愿景与规划来源于业务战略,运维活动反作用于业务创新与规划,IT的任何问题或故障都能量化成业务影响,业务不必了解复杂的IT技术仅需要了解和自身相关的服务。通过规范SLA评估服务质量,从而达到IT运维和部门之间相互依存、互利共赢的目的。

图示:业务驱动运维

二、 架构驱动运维

所谓架构驱动运维是指利用架构的优化达到运维管理效率的提升,在应用发生变化或故障发生时,可以触发架构本身可伸缩和可调度能力,做到自我修复,节省对运维成本与能力的依赖。运维2.0的架构规划原则包括: (一) 分层多级且单元化服务——拆分迭代灵活

大系统拆分成多层多级,如应用架构上分服务提供层、接入调度层、中间计算层、数据存储层。层级模块内高内聚,层级模块间低耦合。每一层级划分若干模块,低耦合系统易于扩展,足够小的模块易于复用。在保持功能模型完整的基础上,要保持高性能与高负载,需要不同功能特点的模块再拆分,比如静态与动态部分分离。此外,考虑到服务的性能和成本,核心服务的主服务提供体系可以考虑架构单元化,

即服务虽然分层划分,但每个单元自成一体,单元中的上层节点会访问指定的下层节点。这样不仅保证了更高性能更低成本的目标,在资源隔离,系统灰度发布,对高峰扩容的应对方式上也提供了权宜之策。

图示:服务单元化

(二) 服务模块化,兼顾分区容忍性——纵向可伸缩

根据目标客户群、增长模型、访问量模型、峰值分析等来推导和设计服务的架构、规模、资源,每个服务由多模块组成,如接入层主服务器集群、中间层备服务器集群。根据功能模型和用户规模推导出模块数量,每个模块支撑的容量,每个模块的服务器数量,每个服务器支撑的容量以及模块在多IDC、多ISP间的分布。当出现故障时,通过故障梯度服务柔性将故障对服务提供的影响消化掉,借助可伸缩的服务设计不影响服务调用者的体验。根据功能模型的需要,一部

分类似一致性的商务需要可以通过其他手段完成。

图示:服务模块化

(三) 多ISP、多IDC分布——横向可调度

为防范网络、硬件的故障,规避硬件层、系统层、通过全局负载均衡解析服务的访问,引导服务到最优的ISP、IDC、模块、服务器。当出现故障时,可以通过全局负载均衡将故障对应的ISP、IDC的服务器IP地址从全局负载均衡中摘除,服务访问被解析到其他正常的模块、服务器,从而使故障不影响自服务的提供。架构上多ISP、多IDC的分布和调度策略是重点。

(四) 分布式云化部署——海量运维可支持

运维最大的挑战是基础架构环境规模越来越大,服务支持趋于海量,海量导致技术选型取向趋于分布式架构和产品。如分布式文件系统、分布式缓存、分布式存储和分布式数据

库、IDC分布式部署。每套服务独占物理环境,交付慢且调整难度大导致运维日益云化,底层架构实现虚拟化资源池、上层架构实现运维流程服务调用,以达到有效提高资源利用率,全面提升系统运维管理能力的目的。 三、 数据驱动运维

在云计算和大数据时代,集群规模和数据爆发式海量增长,给运维带来了巨大的挑战。运维2.0理论提出用数据说话、用数据预见运维活动、借助全量的数据提及评价运维过程,简言之,就是数据驱动运维。运维2.0的数据驱动运维关注两个重点。

(一) 构建全量的数据体系

构建全量的数据体系包括构建数据全生命周期管理和数据架构体系,做好数据分类、数据标准、数据质量和数据安全的把控,作为数据驱动体系的基础数据采集与规范平台,发挥数据价值,为运维决策和运维服务的衡量提供科学依据。

数据全生命周期管理包括数据创建、存储、清洗、迁移、归档及销毁数据从产生到灭亡的六个阶段的标准、规范和流程。

数据架构体系则从流程、人员和技术三个层面,对所采集的面向资源的、面向技术指标的、面向服务的、面向用户的以及面向产品的结构化数据和非结构化日志或文件,在数据管控、数据归属、数据架构、数据质量和数据安全方面提

出要求。具体落地方式可通过如下方式在实现。 1. 建立主数据系统,对主数据进行一致性管理和调用; 2. 建立数据质量规范与策略、数据清理标准、数据合规性标准,并将上述规则嵌入到应用系统与工具中;

3. 将数据分类,落实不同类型数据的归属者与责任人,并建立相应的逻辑数据模型和物理数据模型;

4. 建立《数据质量考核办法和实施细则》,定期对数据进行合规和安全性的审计,确保数据质量的持久可控; 5. 完善操作及分析数据的工具与技术,如数据提取、加载与转换工具、数据同步与整合工具、数据清洗工具、数据建模与分析工具等。

图示:全量数据体系

(二) 构建价值驱动体系

在建立全量数据体系,保证数据的准确性和完整性基础上,为体现数据价值,运维2.0提出价值驱动的四个方面。 1. 建立与业务战略相结合的数据战略,为数据化能力建立明确方向和目标。运维2.0提出将数据领域的管理与应用提升至企业战略层面,建立与业务战略相结合的数据战略,为数据化能力明确方向和目标。数据战略应充分消化业务战略中的数据需求,明确企业所应具备支撑业务的数据使用和处理的高阶能力要求,完整的数据体系应包含数据治理、数据管理和数据应用与服务三个高阶能力。数据战略用以强化企业基于数据的精细化管理和决策的意识。 2. 建立数据管理组织,坚持数据运维的文化,用数据认责法激活数据治理机制。在运维规划和运维活动中坚持用数据说话,坚持以定量的方法描述运维过程、定位运维故障、预见运维事件。数据驱动的运维理念反映到KPI中,确保团队成员对运维数据足够重视。建立企业数据管理组织,通过数据认责管理机制将数据资产分配到相关责任人,在数据生命周期中承担数据管理责任,与管理流程和制度结合,逐步建立数据资产人人有责的数据文化。

3. 关注不同角色的数据需求。数据的反馈需要及时准确,但并非所有人员都需要实时数据,过多实时的数据一则成本

高,其则干扰大。此时,需区分不同角色的数据需求“投其所好”,一线监控人员更多的是看服务状态,因此需要实时告警的信息;上层的运维管理人员希望看到的是服务周期性的状态、趋势和对比;工具研发人员需要看到数据的关联;产品人员关注的是产品的趋势和用户体验等。 4. 沉淀业务元数据。将业务元数据存储在配置管理数据库,建立底层数据关联。使用公共基准的元数据规则,更好的整合数据。

5. “以用带治”,建立持续滚动反馈的数据体系。让数据和运维目标相关联,通过目标驱动,自上而下的重视衡量运维服务的价值、评估目标的达成度和影响度。进而完善数据源及数据分析和展现的方法,提升运维活动的精细化管理,有效评估与衡量运维服务的质量,量化运维活动的价值。

本文来源:https://www.bwwdw.com/article/ewev.html

Top