XXX云计算项目技术方案(详细版)

更新时间:2023-11-06 18:41:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

XXX云计算平台项目

技术方案V1.0

2013年4月11日

- 1 -

目 录

第1章 建设云计算平台的重要意义 ........................................................................................ - 3 - 1.1 传统IT面临的困境 ......................................................................................................... - 3 - 1.2 云计算概述 ....................................................................................................................... - 5 - 1.2.1 什么是云计算 ............................................................................................................ - 5 - 1.2.2 云计算的价值 ............................................................................................................ - 7 - 1.3 H3CLOUD云计算解决方案特色 ....................................................................................... - 8 - 1.3.1 H3Cloud云计算解决方案组件 ................................................................................. - 9 - 1.3.2 H3Cloud云计算解决方案亮点 ............................................................................... - 13 - 第2章 需求分析...................................................................................................................... - 18 - 2.1 项目背景 ......................................................................................................................... - 18 - 2.2 需求分析 ......................................................................................................................... - 18 - 2.3 建设目标 ......................................................................................................................... - 19 - 2.4 建设要求 ......................................................................................................................... - 19 - 第3章 总体设计...................................................................................................................... - 21 - 3.1 建设目标 ......................................................................................................................... - 21 - 3.2 建设内容 ......................................................................................................................... - 22 - 3.3 建设原则 ......................................................................................................................... - 22 - 3.4 建设思路 ......................................................................................................................... - 24 - 第4章 建设方案...................................................................................................................... - 27 - 4.1 系统总体架构 ................................................................................................................. - 27 - 4.2 计算资源池 ..................................................................................................................... - 30 - 4.3 存储资源池 ..................................................................................................................... - 48 - 4.4 网络资源池 ..................................................................................................................... - 56 - 4.4.1 网络设计要点 .......................................................................................................... - 56 - 4.4.2 网络资源池设计 ...................................................................................................... - 59 - 4.4.3 虚拟机交换网络 ...................................................................................................... - 63 - 4.4.4 安全设计 .................................................................................................................. - 67 - 4.5 云层设计 ......................................................................................................................... - 73 - 4.5.1 自助式云业务工作流 .............................................................................................. - 74 - 4.5.2 详尽的用户分级管理 .............................................................................................. - 76 - 4.5.3 数据的集中保护与审核 .......................................................................................... - 77 - 4.6 虚拟桌面部署 ................................................................................................................. - 78 - 4.7 应用系统迁移 ................................................................................................................. - 80 - 4.7.1 应用系统迁移规划 .................................................................................................. - 80 - 4.7.2 物理机虚拟化迁移(P2V) ................................................................................... - 82 -

- 2 -

第1章 建设云计算平台的重要意义

1.1 传统IT面临的困境

自从上世纪90年代开始,IT行业在全球范围内得到了迅猛的发展,IT平台的规模和复杂程度出现了大幅度的提升,与此同时,很多企业的IT机构却因为这种提升而面临着一种新的困境:高昂的硬件成本和管理运营成本、缓慢的业务部署速度以及缺乏统一管理的基础架构。

高昂的成本支出

随着IT规模的不断膨胀,数据中心内的服务器数量、网络复杂程度以及存储容量急剧增长,随之带来的是高昂的硬件成本支出以及运营成本支出(电力、制冷、占地空间、管理人员等)。

基础结构成本:托管、冷却、连接服务器以及为服务器提供电源都会随着服务器数量的增长而导致成本大量增加。仅服务器电力需求一项就占总成本一大块,估计数据中心的 1000 台服务器的电力成本每年都在 45,000 美元以上。

硬件成本:每年服务器在容量和计算能力上都呈增长趋势。随着服务器变得越来越强大,最大化的利用这些超强资源也变得愈加困难。IT 组织和应用服务用户习惯为每个应用服务部署一台独立服务器以确保完全控制该应用服务。几

- 3 -

乎在所有情况下,部署这些功能强大的服务器将会使服务器过剩50-500%。

软件成本:通常服务器需要从操作系统或应用软件厂商那里获取许可证与支持。

管理成本:迄今为止,管理成本是服务器成本中最大的一个部分,分析专家估计管理成本占服务器总拥有成本的50-70%。IT技术 人员不得不对软硬件进行升级、打补丁、备份以及修复,部署新的服务器及应用,维护用户账户并执行许多其他任务。随着服务器数量的增长,IT 部门发现他们面临着满足相关服务器管理需求的挑战。

缓慢的业务部署速度

新的服务器、存储设备和网络设备的部署周期较长,整个过程包括硬件选型、采购、上架安装、操作系统安装、应用软件安装、网络配置等。一般情况下,这个过程需要的工作量在20~40小时,交付周期为4~6周。

分散的管理策略

数据中心内的IT基础设施处于分散的管理状态,具体表现为:

机房管理员遵循“根据最坏情况下的工作负载来确定所有服务器的配置”这一策略导致服务器的配置普遍过高。

容易出现大量“只安装一个应用程序”而未得到充分利用的x86服务器。 提交变更请求与进行运营变更之间存在较长的延迟。

缺少统一的集中化IT构建策略,无法对数据中心内的基础设施进行监控、管理、报告和远程访问。

- 4 -

1.2 云计算概述

1.2.1 什么是云计算

云计算是一种基于网络的计算服务供给方式,它以跨越异构、动态流转的资源池为基础提供给客户可自治的服务,实现资源的按需分配、按量计费。云计算导致资源规模化、集中化,促进IT产业的进一步分工,让IT系统的建设和运维统一集中到云计算运营商处,普通用户都更加关注于自己的业务,从而提高了信

息化建设的效率和弹性,促进社会和国家生产生活的集约化水平。 云计算主要包含两个层次的含义:一是从被服务的客户端看:在云计算环境下,用户无需自建基础系统,可以更加专注于自己的业务。用户可按需获取网络上的资源,并按使用量付费。如同打开电灯用电,打开水龙头用水一样,而无需考虑是电从哪里来,水是哪家水厂的。二是从云计算后台看:云计算实现资源的集中化、规模化。能够实现对各类异构软硬件基础资源的兼容,如电网支持水电厂、火电厂、风电厂、核电厂等异构电厂并网;还能够实现资源的动态流转,如西电东送,西气东输、南水北调等。支持异构资源和实现资源的动态流转,可以更好的利用资源,降低基础资源供应商的成本。

云计算的特征

- 5 -

服务器虚拟化、存储虚拟化和网络虚拟化只是构成云计算基础设施的硬件资源池,在云计算环境中,最重要的一点是实现资源池的自动化,避免人力对于基础设施的过多干预。H3Cloud通过自动化的管理平台和手段,帮助用户实现对云硬件资源和业务流程的快速部署与自动化维护和管理。

H3Cloud云管理平台由Cloud Virtualization Kernel(CVK)、Cloud Virtualization Manager(CVM)和Cloud Intelligence Center(CIC)三个组件完成:

Cloud Virtualization Kernel(CVK):虚拟化内核与管理代理

运行在基础设施层和上层操作系统之间的“元”操作系统,用于协调上层操作系统对底层硬件资源的访问,减轻软件对硬件设备以及驱动的依赖性,同时对虚拟化运行环境中的硬件兼容性、高可靠性、高可用性、可扩展性、性能优化等问题进行加固处理。

Cloud Virtualization Manager(CVM):虚拟化管理软件包

主要实现对数据中心内的计算、网络和存储等硬件资源的软件虚拟化,形成虚拟资源池,对上层应用提供自动化服务。其业务范围包括:虚拟计算、虚拟网络、虚拟存储、高可靠性(HA)、动态资源调度(DRS)、虚拟机容灾与备份、虚拟机模板管理、集群文件系统、虚拟交换机策略等。

Cloud Intelligence Center(CIC):云业务运营软件包

由一系列云基础业务模块组成,通过将基础架构资源(包括计算、存储和网络)及其相关策略整合成虚拟数据中心资源池,并允许用户按需消费这些资源,从而构建安全的多租户混合云。其业务范围包括:组织(虚拟数据中心)、多租户数据和业务安全、云业务工作流、自助式服务门户、兼容OpenStack的REST API接口等。

- 11 -

从逻辑架构上,H3Cloud云管理平台包括虚拟化层、自动化服务层、管理层、业务编排层、API层:

虚拟化层

利用Cloud Virtualization Kernel(CVK)提供的底层虚拟化能力和上层Cloud Virtualization Manager(CVM)提供的管理能力,屏蔽底层物理硬件基础设施的异构性和复杂度,对外以虚拟资源池的形式呈现。

自动化服务层

强调业务运行的高可用性和可扩展性,并未业务提供自动的容灾备份与资源调度能力。

管理层

对虚拟化资源及云运营要素进行管理,如虚拟机生命周期的管理、虚拟机镜

- 12 -

像文件和配置文件的管理、多租户的安全隔离、网络策略配置的管理等。

业务编排层

对云计算资源进行可运营性管理,包括对虚拟资源池的编排、最终用户的自助服务门户、业务的申请、审批与开通、用户帐务的管理与报表输出等。

API层

为第三方云运营管理平台提供RESTful的API接口。

1.3.2 H3Cloud云计算解决方案亮点

1.3.2.1 直观的配置与管理

完全基于B/S架构的管理控制台,不仅让您轻松组织和快速部署整个IT环境,而且还能对包括CPU、内存、磁盘I/O、网络I/O等重要资源在内的关键元件进行全面的性能监测,为管理员实施合理的资源规划提供详尽的数据资料。

- 13 -

1.3.2.2 智能化的资源自动优化配置

H3Cloud云计算软件为虚拟机中运行的应用程序提供简单易用、成本效益高的高可用性功能。硬件故障导致的服务器或虚拟机宕机再也不会造成灾难性的后果,H3Cloud提供的资源智能调度能力会为这些服务器或虚拟机自动选择最佳的重新运行位置。

1.3.2.3 支持IEEE 802.1Qbg标准草案

支持IEEE 802.1Qbg(VEPA)协议标准草案,与H3C 5820V2交换机及iMC VCM网管组件配合,能够实现对虚拟机流量的全面监控。

1.3.2.4 快速业务部署能力

支持虚拟机的快速克隆功能,所有链接到主镜像文件的虚拟桌面都可以通过更新主镜像文件来修补或更新,而不会影响用户的设置、数据或应用程序,大幅简化了桌面的管理,同时极大地减少存储空间的浪费和缩短了部署虚拟桌面的时间。

支持虚拟机系统的增量备份功能,仅备份上一次完全/增量备份后发生变化的文件,极大地减少了每次备份文件的数量和备份的时间,提高了备份效率。

1.3.2.5 自助式云业务电子流

自助式服务管理为用户提供了一个安全的、多租户的、可自助服务的IaaS,是一种全新的基础架构交付和使用模式。通过H3Cloud云计算软件提供的虚拟化资源池功能,使IT部门能够将计算、存储和网络等物理资源抽象成按需提供的弹性虚拟资源池,以消费单元(即组织或虚拟数据中心)的形式对外提供服务,IT部门能够通过完全自动化的自助服务访问,为用户提供这些消费单元以及其它包括虚拟机和操作系统镜像等在内的基础架构和应用服务模板。这种自助式的服务真正实现了云计算的敏捷性、可控性和高效性,并极大程度地提高了业务的

- 14 -

响应能力。

云资源系统管理员云服务组织管理员云用户最终用户2云资源申请5云服务申请1物理资源整合与资源池化4组织策略配置与虚拟机模板管理7使用虚拟资源最终用户计算资源最终用户6云服务申请审核通过虚拟资源分配3存储资源云资源申请审核通过组织创建与云资源分配最终用户最终用户网络资源

1.3.2.6 多租户业务安全

通过用户数据安全隔离与网络安全策略模板,确保虚拟化、多租户环境下的用户隐私信息及数据的安全。

虚拟化资源位置信息的唯一标识,避免了虚拟化技术引起的物理边界模糊可能导致的司法取证问题。

通过用户权限的精细化控制、管理帐号的分级管理以及详细的操作访问日志,避免权限滥用问题。

- 15 -

最终用户系统管理员云服务用户自助服务门户虚拟机模板虚拟网络系统管理用户组管理组织 #1组织 #2权限管理多租户安全隔离日志管理云资源物理资源虚拟资源系统配置管理计算资源存储资源网络资源虚拟机虚拟机模板License管理

1.3.2.7 为高性能、高效率和轻松访问而构建的云计算服务器

符合能源之星标准的H3C FlexServer服务器配置充分体现了H3C一贯的帮助客户节市能源、降低成本的宗旨。

借助通用免工具的新型滑轨,可以快速安装H3C FlexServer,快速释放杆可实现快速服务器访问。非常灵巧的电缆管理支架选项,可实现灵活布线和出色的布线管理,让您可以快速访问该服务器。

率先推出的3D阵列温度传感器可精确控制服务器风扇直接散热,从而避免了不必要的风扇功耗。

1.3.2.8 存储组件确保出色的应用可用性和灾难恢复能力

H3Cloud云计算解决方案中的存储组件可跨存储节点集群分割和保护多份数据副本,并消除SAN中的单点故障。 应用程序在发生电源、网络、磁盘、

- 16 -

控制器、存储节点或站点故障的情况下,具有连续的数据可用性。

H3Cloud云计算解决方案中的存储组件高可用性架构的优点是,一个单一的存储集群可托管不同网络RAID级别的卷,每个卷的可用性和/或性能水平依应用的需求而异。

H3Cloud云计算解决方案中的存储组件具备集成复制功能,通过自动化和透明的故障转移与故障恢复简化管理。 如果有一个存储节点脱机,它就会从脱机时间开始跟踪数据变化;当节点重新联机时,变更的数据块就会恢复到当前水平。

1.3.2.9 经济实惠的企业级存储功能和全面的特性集

横向扩展存储集群允许将多个存储节点整合到共享存储池中。 汇聚所有可用的容量和性能,用于集群中的每个卷。 随着存储需求的增长,存储组件可在线横向扩展性能和容量。

网络RAID可跨存储节点集群分割和保护多份数据副本,从而消除存储组件中的任何单点故障。 应用程序在发生电源、网络、磁盘、控制器、存储节点或站点故障的情况下,具有连续的数据可用性。

多站点SAN可用性使存储组件能够将集群中的存储节点分配到不同的地点(机架、机房、建筑和城市),并提供无缝的应用高可用性,跨不同地点自动实现故障转移/故障恢复。

无须预留快照,实现精简配置,只分配写入数据所需的空间,无需预分配存储容量,从而提高存储组件的整体利用率和效率。

- 17 -

第2章 需求分析

2.1 项目背景

为推动XXX信息化的发展,XXX致力于私有云服务平台的建设。

本项目将依据“加速成长、优势互补、资源汇聚、持续发展、创新增值”的原则,有效地整合和配置企业的公共服务资源,提供IT基础架构及应用的完整支撑和公共服务解决方案。本项目建成后不但将支撑企业在信息建设工作中的普遍需求,提供共性的技术和服务,而且会针对不同行业对于信息应用的特殊需求,提供面向特定行业领域的技术和服务。

依据“资源共享、业务合作、优势互补、可持续发展”原则,有效地整合和配置企业的公共服务资源,提供软件研发及应用的完整支撑和公共服务解决方案。在充分依托现有资源的基础上,重点建设数据中心及云计算公共服务中心等服务模块。

2.2 需求分析

对于数据中心的建设,云计算是多种概念和技术并行发展,融合过程中逐渐形成的一个多层次,多模式,多维度的复合概念,不同的企业应用可以选择使用不同的云计算技术来构建。云计算不仅有助于提高资源利用率,节约成本,还能大幅度提高应用程序从设计开发到业务部署的速度,并有助于加快创新步伐,创造更大的业务成效。

针对本次项目的需求,通过分析,认为此次项目的方案架构也应该从面向云服务和云计算的角度出发,搭建具有先进性的方案架构。

云服务具有5个特征: (1)面向服务的

(2)具有可扩展性,是一个弹性的框架 (3)是共享的平台 (4)按需计量的

- 18 -

(5)云服务是基于互联网技术的

“云计算”平台为企业提供共享计算、共享存储、开发环境平台搭建、支撑服务软件等内容的公共技术服务。建设内容包括:中心机房、服务器设备、存储设备、网络设备、安全设备、支撑软件、业务软件等模块。

2.3 建设目标

数据中心及云计算服务中心依托先进技术,能统一管理标准,确保平台的保密性、安全性、稳定性和可扩展性。统一标准的平台降低了IT维护成本,提高了对需求的响应速度,从而达到以下目标:充分利用现有的硬件、软件资源;支持计算、存储资源共享能力;为企业提供业务支撑服务。

平台不管从系统安全、可靠性、大容量,还是可扩充性等诸多方面,都应给予非常全面的考虑:

1. 经济性

2. 可靠性,避免单点故障 3. 大容量,可扩展性 4. 安全性,实现安全域划分 5. 分级网管

2.4 建设要求

在本次项目的设计和建设中,需严格遵循以下原则: (1)稳定性

应采取各种必要技术措施,保证公共服务平台具备有优秀的稳定性,在保证性能的前提下,为主要业务提供7x24小时持续的支撑服务。

(2)安全性

平台系统应能充分考虑用户数据的安全,避免用户受到异常攻击或敏感数据窃取。应能主动评估业务系统的安全状况及提供弥补措施,并提供各种操作行为的可回溯能力。同时,应能提供独立的机房、专用的门禁及专享的运营管理团队,确保机房及公共服务平台运行的安全。

(3)可扩展性

- 19 -

各平台应具备良好的扩展能力,满足数据中心长期发展的要求。根据业务的发展预测,平台系统定期按照适度预留的原则进行建设,能在规定时间内快速响应新的用户,新的业务的新增要求。

(4)灵活的 IT 基础架构

满足资源的随时随地按需分配,需要建立一个灵活的硬件基础架构。硬件基础架构通常由虚拟的服务器池、共享的存储系统、网络和硬件管理软件组成。

(5)自动化资源部署

云计算运行管理平台的核心功能是自动为用户提供服务器、存储以及相关的系统软件和应用软件。用户、管理员和其他人员能通过 Web 界面使用该功能。要实现资源的自动部署,必须做到:

首先,建立一个中心数据库来管理数据中心的硬件资源;其次,要规范化资源的使用,包括标准化操作系统、数据库软件、中间件软件的种类和版本。

自动化的部署流程不仅能做到“随需应变”,适应用户的需求,而且能够带来以下好处:引入技术和创新的时间缩短,设计、采购和构建硬件和软件平台的人力成本降低,以及通过提高现有资源的利用率和复用率节省成本。

(6)完善的资源监控及故障处理手段

云计算服务管理平台提供资源和服务的各种运维能力,可以监控资源的使用情况,对于平台故障提供及时地预警报警,保证云计算平台的稳定运行。

(7)有助于建立IT管理规则

为了实现数据中心的规范管理,需要以云计算运行管理平台为基础,有助于为数据中心制定一套完整的管理规则。

(8)开放性

要求各类系统设计、产品及网络构建都要满足相关的国际标准和国家标准,提供标准结构及接口,有效地兼容各种品牌、厂商、电子运营商的系统和网络,实现多系统、多平台的互联互通。

- 20 -

第3章 总体设计

3.1 建设目标

目前IT信息技术已经延伸到企业的各个层面,从企业角度看,云计算有利于整合信息资源,实现信息共享,促进企业信息化的发展。从用户角度看,利用云计算可以独立实现或享受某一项具体的业务和服务。因此云计算将在企业的IT政策和战略中正扮演越来越重要的角色。企业云计算中心的建设,未来的核心业务涵盖如下范围:

以“统规、统建、统维”思想为指导,以丰富的云基础设施,云存储,云安全和各类云服务构件共同构建XXX云服务平台,服务于:

1. 为XXX企业提供计算环境,降低企业的IT硬件投资

2. 为XXX内部应用提供基于云计算平台办公应用、生产经营运行监控。 3. 为XXX企业提供通用企业管理软件,为企业建立低成本的管理系统 4. 为XXX企业提供基于云计算平台的开发测试环境

5. 为XXX企业提供IaaS/PaaS/ SaaS平台,为企业向云计算转型服务 6. 优化投资环境,节省企业IT软硬件投入和开发环境的投入,吸引企业加

快企业自身信息化发展。

本方案将云数据中心“IT基础设施”的“按需使用”以及”自动化管理和调度”作为云计算的实践,形成可落地实施的、可持续发展的云计算平台,即IaaS云计算平台。

作为XXX的云计算实践,云计算数据中心的建设建议达到以下目标: 统一管理

通过最新的云计算核心技术之一虚拟化技术,整合现有所有应用,整合内容

- 21 -

包括WEB、MAIL、FTP、域控管理、OA系统、后台数据库等应用,将整个业务系统作统一的规划和部署,统一数据备份,从而形成自上向下的有效IT管理架构。

强调整体方案的可扩展性、高可用性、易用性和易管理性

采用最新的2路双核服务器,保证整个硬件系统的可靠性和可用性,为用户的应用提供可靠的硬件保障;建设云计算平台,发挥云计算平台的优越性,为用户提供HA高可用,保证用户业务系统的连续性和高可用性,让用户的业务实现零宕机风险;专业的管理软件,保证硬件系统和软件系统的可管理性,为用户节市管理投资成本。

3.2 建设内容

云计算平台建设主要包括以下建设内容: 1、资源池化系统(服务器、存储、网络资源池) 2、云平台管理及运营系统 3、云计算安全支撑系统

3.3 建设原则

本项目建设遵循以下建设原则: ? 先进性

基础设施平台建设采用的产品和技术具有云平台的特征及技术的先进性,保障平台的资源使用周期最大化。但采用先进的技术也有一定的风险,即可能存在技术不成熟问题。我们采用充分论证及测试的方式,在选择先进技术时,把技术风险降低。并通过平台的小规模运营实践,逐步淘汰不成熟、不可行的技术,将整个平台建设成技术领先的基础设施系统。

? 高可靠性

- 22 -

云计算平台作为承载未来企业应用的重要IT基础设施,承担着稳定运行和业务创新的重任。伴随着数据与业务的集中,云计算平台的建设及运维给信息部门带来了巨大的压力,因此平台的建设从基础资源池(计算、存储、网络)、虚拟化平台、云平台等多个层面充分考虑业务的高可用,基础单元出现故障后业务应用能够迅速进行切换与迁移,用户无感知,保证业务的连续性。 ? 可扩展性

可实现通过简单的硬件扩容达到系统动态扩容的目的,可动态伸缩,满足应用和用户规模增长的需要。 ? 易管理

云计算的最终目标是要实现系统的按需运营,多种服务的开通,而这依赖于对计算、存储、网络资源的调度和分配,同时提供用户管理、组织管理、工作流管理、自助Portal界面等。从用户资源的申请、审批到分配部署的智能化。管理系统不仅要实现对传统的物理资源和新的虚拟资源进行管理,还要从全局而非割裂地管理资源,因此统一管理与自动化将成为必然趋势。 ? 开放性

当前阶段云计算整个产业化还不够成熟,相关标准还不完善。为保证多厂商的良好兼容性,避免厂商技术锁定,方案的设计充分保证与第三方厂商设备保持良好的对接。此外,为保证方案的前瞻性,设备的选型应充分考虑对已有的云计算相关标准(如EVB/802.1Qbg等)的扩展支持能力,保证良好的先进性,以适应未来的技术发展。

传统的管理系统与上层系统对接,注重故障的上报和信息的查询。而云计算的管理系统更关注如何实现自动化的部署,在接口方面更关注资源调度和分配,这就需要管理系统在业务调度方面实现开放。为保证服务器、存储、网络等资源能够被云计算运营平台良好的调度与管理,要求系统提供开放的API接口,云计算运营管理平台能够通过API接口、命令行脚本实现对设备的配置与策略下发联动。同时云平台也提供开放的API接口,未来可以基础这些接口进行二次定制开

- 23 -

放,将云管理平台与企业应用相融合,实现面向云计算的企业应用管理平台。

3.4 建设思路

随着XXX信息化的深入,数据大集中以及信息交换的要求很高的计算能力。传统企业数据中心建设和运维的成本(包括电力成本、空间成本、维护成本等)在不断上升。简单的通过设备叠加和设备性能增强已经难以适应上述的要求。因此,当XXX数据中心建设的核心需求为在IT建设模式上进行转变。改变传统的“竖井式”IT建设模式而引入云计算建设模式来整合优化当前信息中心内的硬件资源,提升数据中心的资源弹性、运行效率、交付能力以及扩展能力,并从根本上降低数据中心的建设成本,如下图所示。

云计算架构下的IT建设模式并没有完全颠覆传统IT的建设方式,在硬件资源大集中的前提下,先完成计算、存储、网络的资源集中化,同时增加虚拟化层与云层解决硬件统一整合以及资源按需分配的问题。

- 24 -

有别于传统建设模式单机单用的情况,虚拟化层通过在裸金属服务器上加装虚拟化内核Hypervisor这一层从而实现单个物理计算节点能够虚拟出多个逻辑隔离的计算节点即虚拟机的方式来承载多个应用,通过虚拟化层的集中管理能够为企业带来如下好处:

? 提高现有资源的利用率,传统单机单用的业务部署模式对硬件资源独占

无法共享,而大部分时间硬件资源利用率都较低部分业务甚至不足3%,虚拟化层可通过一虚多的方式,充分利用每一个计算服务器的资源,提高现有资源的利用率;

? 降低数据中心成本,传统建设模式业务部署或扩容更多的都是硬件设备

的追加,通过虚拟化层可以利用现有的服务器进行业务整合,未来新建部署的业务系统也可以通过虚拟机承载的方式快速部署,建设硬件成本的追加,同时硬件设备数量的减少也可以带来数据中心空间成本的节省以及数据中心耗电的节省;

? 提高 业务连续性,基于虚拟化迁移、集群、负载均衡等技术,任何虚

拟机或者承载于虚拟机上的业务系统并不依托于某一个硬件节点存在,

- 25 -

4.2.1.1 资源池分类设计

在搭建服务器资源池之前,首先应该确定资源池的数量和种类,并对服务器进行归类。归类的标准通常是根据服务器的CPU类型、型号、配置、物理位置来决定。对云计算平台而言,属于同一个资源池的服务器,通常就会将其视为一组可互相替代的资源。所以,一般都是将相同处理器、相近型号系列并且配置与物理位置接近的服务器——比如相近型号、物理距离不远的机架式服务器或者刀片服务器。在做资源池规划的时候,也需要考虑其规模和功用。如果单个资源池的规模越大,可以给云计算平台提供更大的灵活性和容错性:更多的应用可以部署在上面,并且单个物理服务器的宕机对整个资源池的影响会更小些。但是同时,太大的规模也会给出口网络吞吐带来更大的压力,各个不同应用之间的干扰也会更大。如果有条件的话,通常推荐先审视一下企业自身的业务应用。可以考虑将应用分级,将某些级别高的应用尽可能地放在某些独立而规模较小的资源池内,辅以较高级别的存储设备,并配备高级别的运维值守。而那些级别比较低的应用,则可以被放在那些规模较大的公用资源池(群)中。

初期的资源池规划应该涵盖所有可能被纳管到云计算平台的所有服务器资源,包括那些为搭建云计算平台新购置的服务器、企业内部那些目前闲置着的服务器以及那些现有的并正在运行着业务应用的服务器。在云计算平台搭建的初期,那些目前正在为业务系统服务的服务器并不会直接被纳入云计算平台的管辖。但是随着云计算平台的上线和业务系统的逐渐迁移,这些服务器也将逐渐地被并入云计算平台的资源池中。

对于x86系列的服务器,除了用于生产系统的资源池以外,还需要专门搭建一个测试用资源池,以便云计算平台项目实施过程以及平台上线以后运维过程中使用。

在云计算平台搭建完毕以后,企业的服务器资源池可以如下图所示:

- 31 -

在云计算平台上线以后,原有非云计算平台上的应用会逐步向云计算平台迁移,空出的服务器资源池也会逐渐并入云计算平台的资源池中。其状态可以用下图所示:

H3Cloud CVM虚拟化管理平台体系将IT数据中心的物理服务器资源以树形结构进行组织管理,统一称之为云资源。

云资源是H3Cloud云计算软件分层管理模型的核心节点之一,用来统一管理数据中心内所有的、复杂的硬件基础设施,不仅包括基本的IT基础设施(如硬件服务器系统),还包括其它与之配套的设备(如网络和存储系统)。默认情况下,H3Cloud云计算管理平台出厂配置中已经添加了一个名为“云资源”的根节点,准备使用H3Cloud云计算软件进行管理的所有物理资源都需要手工逐一添加到该节点下进行统一的管理。

云资源中的被管理对象之间的关系可以用下图描述:

4.2.1.2 主机池设计

在H3Cloud云计算软件体系架构中,主机池是一系列主机和集群的集合体,

- 32 -

主机有可能已加入到集群中,也可能没有。没有加入集群的主机全部在主机池中进行管理。

在H3Cloud云计算管理平台主界面导航菜单窗口中点击“云资源”,在快捷工具栏中选择<增加主机池>按钮。

或者右键单击“云资源”,在弹出的上下文菜单中选择<增加主机池>子菜单。

在弹出的增加主机池对话框中,输入主机池名称后,单击<确定>按钮完成主机池的添加。

4.2.1.3 HA集群设计

传统数据中心内的服务器高可靠性保障通常会选择依赖于集群技术的部署。而云计算平台将计算资源虚拟化以后,可以利用虚拟服务器自身虚拟化的特点实现传统物理服务器上无法实现的高可靠性。

为了提升云业务系统的可靠性,在云计算平台的计算资源池建设时,可以将多个物理主机合并为一个具有共享资源池的集群。CVM HA功能会监控该集群下所有的主机和物理主机内运行的虚拟主机。当物理主机发生故障,出现宕机时,HA功能组件会立即响应并在集群内另一台主机上重启该物理主机内运行的虚拟机。当某一虚拟服务器发生故障时,HA功能也会自动的将该虚拟机重新启动来恢复中断的业务。具体操作如下图所示:

- 33 -

除了对集群中的物理服务器节点进行持续检测之外,H3C CAS HA软件模块还对运行于物理服务器节点之上的虚拟机进行持续检测。

在每台服务器节点上都运行了一个LRMd(Local Resource Manager daemon,本地资源管理器守护进程),它是HA软件模块中直接操作所管理的各种资源的一个子模块,负责对本地的虚拟化资源进行状态检测,并通过shell脚本调用方式实现对资源的各种操作。

当LRMd守护进程检测到本机的某台虚拟机出现通信故障时,首先将事件通知给DC,由DC统一将该虚拟机状态告知集群内所有的物理服务器节点,并按照一定的策略算法,为该故障的虚拟机选择一个空闲的服务器节点,在该节点上重启该虚拟机。

- 34 -

共享存储池SAN/iSCSI/NFS在集群内自动为虚拟机选择空闲的服务器节点,实现动态迁移和业务的高可靠性服务器集群VMVMVMLRMdCVKVMVMVMDCCVKVMVMVMLRMd持续检测本机虚拟机运行状态,由DC为故障的VM自动选择迁移后的服务器节点。CVKIP network使用H3C CAS云计算软件HA特性进行虚拟机故障切换

H3C CAS HA技术有效的解决了目前其它高可用性解决方案面临的问题:

当物理服务器发生硬件故障时,所有运行于该服务器的虚拟机可以自动切

换到其它的可用服务器上,相对传统的双机容错方案,H3C CAS HA可以最大程度减少因硬件故障造成的服务器故障和服务中断时间。 不同于其它HA的双机热备方式,所有参与HA的物理服务器都在运行生产

系统,充分利用现有硬件资源。同时,对众多的操作系统和应用程序,H3C CAS提供统一的HA解决方案,避免了针对不同操作系统或者应用,采用不同的HA方案带来的额外开销和复杂性。

通过H3C CAS HA,IT部门可以:

为没有容错功能的应用提供冗余保护

传统意义上HA实现很复杂并且价格昂贵,多用于关键性的服务或应用,而H3C CAS HA为所有的应用程序提供了高性价比的HA解决方案。

为整个IT环境提供“第一条安全防线”

- 35 -

后,会自动回收CPU和内存等资源,为了保证虚拟机数据安全其所占用的存储资源不会自动回收。

4.2.1.6 DRS动态资源调度

CVM提供的动态资源调整功能可以持续不断地监控计算资源池的各物理主机的利用率,并能够根据用户业务的实际需要,智能地在计算资源池各物理主机间给虚拟机分配所需的计算资源。通过自动的动态分配和平衡计算资源,动态资源调整特性能够:

整合服务器,降低IT成本,增强灵活性; 减少停机时间,保持业务的持续性和稳定性; 减少需要运行服务器的数量,提高能源的利用率。

随着业务量的增长,虚拟机对计算资源需求会相应的迅速增加。此时其所在物理主机的可用资源可能就不能再满足其上承载的虚拟机的计算需要。CVM动态资源调整功能组件可以自动并持续地平衡计算资源池中的容量,可以动态的将虚拟机迁移到有更多可用计算资源的主机上,以满足虚拟机对计算资源的需求。即便大量运行SQL Server的虚拟机,只要开启了动态资源调整功能,就不必再对CPU和内存的瓶颈进行一一监测。全自动化的资源分配和负载平衡功能,也可以显著地提升数据中心内计算资源的利用效率,降低数据中心的成本与运营费用。

VMVMVMVMVMVMVMVMVMVMVMVM物理服务器物理服务器物理服务器集群

如上图所示,动态资源调整功能通过心跳机制,定时监测集群内主机的CPU利用率,并根据用户自定义的规则来判断是否需要为该主机在集群内寻找有更多可用资源的主机,以将该主机上的虚拟机迁移到另外一台具有更多合适资源的服务器上。具体操作如下图所示:

- 41 -

除了定时检测和动态迁移之外,H3C CAS还充分考虑了虚拟机对物理服务器主机的亲和性因素,即衡量虚拟机对当前物理主机的依赖程度。例如,用户可能希望某些虚拟应用系统只允许在固定的物理主机上运行,而不允许其动态迁移。此时,只需要在H3C CAS云计

算管理平台上,去勾选虚拟机的自动迁移属性即可(虚拟机自动迁移属性配置)。

动态资源调整技术特色总结

根据业务需求自动调整资源

- 42 -

H3C CAS动态资源调度功能将物理服务器主机资源聚合到集群中,通过监控CPU和内存等关键计算资源的利用率持续优化虚拟机跨物理主机的分发,将这些资源动态自动分发到各虚拟机中。

自动平衡计算容量

H3C CAS动态资源调度功能会不间断地平衡资源池内的计算容量,提高服务级别并确保每个虚拟机能随时访问相应资源,满足虚拟应用程序的高可用性。

4.2.1.7 虚拟机资源限额

默认情况下,H3C CAS给每台物理服务器主机上的虚拟机分配数量相同的CPU、内存以及磁盘I/O资源。但是,并不是所有虚拟机工作负载天生相同,例如,SQL服务器和Web服务器的访问需求就不尽相同,因此,手动调整分配给每个虚拟机的资源就显得非常重要。

CPUCPU优先级VM #1VM #2VM #3高中低磁盘I/O优先级中高低高服务器集群VMVMVMVMVMVMVM #1VM #2VM #3中低I/O中低IP network

H3C CAS通过资源限额方式来为虚拟机指定资源调度的优先级。有三种预设的限额分配方式:高、中、低,调度优先级权重分别为4:2:1,反映到份额上的数值如下表所示:

优先级权重

4 高 2 中 1 - 43 -

低 100%高100%

CPU调度优先级数值 CPU调度优先级百分比 磁盘I/O调度优先级数值 2048 57.1% 800 1024 28.6% 500 31.2% 512 14.3% 300 18.8% 磁盘I/O调度优先级百分比 50.0% 比如,一台物理服务器主机上分配了5个虚拟机,CPU调度优先级分别为高、中、中、低、低,那么,高优先级的虚拟机至少可以获得4/(4+2+2+1+1)=40%的CPU资源,中优先级的虚拟机至少可以获得20%的CPU资源,而低优先级的虚拟机至少可以获得10%的CPU资源。

需要强调的是,虚拟机资源限额机制的真正目的是为了确保每个虚拟机对资源的调度下限,如果物理服务器上没有发生虚拟机的资源抢占行为,那么,即使是低优先级的虚拟机也有可能独享该物理服务器上绝大部分的资源。

高SQL服务器VM #1中Web服务器VM #2低Mail服务器VM #3高SQL服务器VM #1中Web服务器VM #2低Mail服务器VM #3VM #1VM #1VM #2资源发生抢占的情况下,CPU资源调度优先级严格按照4:2:1的权重确保所有的虚拟机都能抢占到一定的资源,保证业务的可用性。VM #2VM #3假如高优先级的虚拟机处于负载低潮时,中优先级和低优先级的虚拟机可以抢占本属于高优先级虚拟机的资源,以提高应用程序的效率和物理资源的利用率。VM #3

当所有的虚拟机都处于满负载运行的情况下,CPU资源严格按照4:2:1的权重比例进行调度,以确保所有的虚拟机都能抢占到一定数量的资源,保证业务的可用性。一旦某个虚拟机的负载回落到权重比例之下,那么,其它的虚拟机可以抢占本属于该虚拟机的资源,以最大限度地利用物理资源的利用率,保证应用程序的运行效率。

4.2.1.8 虚拟机备份

随着云平台对IT信息化系统的依赖加深,业务系统备份是必不可少的组件。相应的,在云计算平台中,针对计算资源池中虚拟机备份也至关重要。

- 44 -

H3Cloud Virtualization Manager实现了透明的定时备份和即时备份功能,会在暂停虚拟机中的应用程序之后,为正在运行的虚拟机创建快照,从而对备份工作进行集中处理,以确保文件系统的一致性。如下图所示:

H3Cloud Virtualization Manager的备份特性是一种高效而低成本的灾难恢复特性,它将给用户带来如下价值:

? 基于磁盘的备份功能,为虚拟机提供快速、简单的数据保护 ? 无需额外代理的备份,简化了部署复杂度

? 支持全自动的定时备份和手工干预的即时备份,满足不同的应用要求

4.2.1.9 完善的性能状态监控

? 基于物理服务器的性能监控

提供物理服务器CPU和内存等计算资源的图形化报表及其运行于其上的虚拟机利用率TOP 5报表,为管理员实施合理的资源规划提供详尽的数据资料。

- 45 -

本文来源:https://www.bwwdw.com/article/xeg2.html

Top