华三(私有云方案)云计算项目技术方案(详细版)

更新时间:2024-01-22 17:56:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

XXX云计算平台项目

技术方案V1.0

2013年4月11日

- 1 -

目 录

第1章 建设云计算平台的重要意义 ........................................................................................ - 3 - 1.1 传统IT面临的困境 ......................................................................................................... - 3 - 1.2 云计算概述 ....................................................................................................................... - 5 - 1.2.1 什么是云计算 ............................................................................................................ - 5 - 1.2.2 云计算的价值 ............................................................................................................ - 7 - 1.3 H3CLOUD云计算解决方案特色 ....................................................................................... - 8 - 1.3.1 H3Cloud云计算解决方案组件 ................................................................................. - 9 - 1.3.2 H3Cloud云计算解决方案亮点 ............................................................................... - 13 - 第2章 需求分析...................................................................................................................... - 18 - 2.1 项目背景 ......................................................................................................................... - 18 - 2.2 需求分析 ......................................................................................................................... - 18 - 2.3 建设目标 ......................................................................................................................... - 19 - 2.4 建设要求 ......................................................................................................................... - 19 - 第3章 总体设计...................................................................................................................... - 21 - 3.1 建设目标 ......................................................................................................................... - 21 - 3.2 建设内容 ......................................................................................................................... - 22 - 3.3 建设原则 ......................................................................................................................... - 22 - 3.4 建设思路 ......................................................................................................................... - 24 - 第4章 建设方案...................................................................................................................... - 27 - 4.1 系统总体架构 ................................................................................................................. - 27 - 4.2 计算资源池 ..................................................................................................................... - 30 - 4.3 存储资源池 ..................................................................................................................... - 48 - 4.4 网络资源池 ..................................................................................................................... - 56 - 4.4.1 网络设计要点 .......................................................................................................... - 56 - 4.4.2 网络资源池设计 ...................................................................................................... - 59 - 4.4.3 虚拟机交换网络 ...................................................................................................... - 63 - 4.4.4 安全设计 .................................................................................................................. - 67 - 4.5 云层设计 ......................................................................................................................... - 73 - 4.5.1 自助式云业务工作流 .............................................................................................. - 74 - 4.5.2 详尽的用户分级管理 .............................................................................................. - 76 - 4.5.3 数据的集中保护与审核 .......................................................................................... - 77 - 4.6 虚拟桌面部署 ................................................................................................................. - 78 - 4.7 应用系统迁移 ................................................................................................................. - 80 - 4.7.1 应用系统迁移规划 .................................................................................................. - 80 - 4.7.2 物理机虚拟化迁移(P2V) ................................................................................... - 82 -

- 2 -

第1章 建设云计算平台的重要意义

1.1 传统IT面临的困境

自从上世纪90年代开始,IT行业在全球范围内得到了迅猛的发展,IT平台的规模和复杂程度出现了大幅度的提升,与此同时,很多企业的IT机构却因为这种提升而面临着一种新的困境:高昂的硬件成本和管理运营成本、缓慢的业务部署速度以及缺乏统一管理的基础架构。

高昂的成本支出

随着IT规模的不断膨胀,数据中心内的服务器数量、网络复杂程度以及存储容量急剧增长,随之带来的是高昂的硬件成本支出以及运营成本支出(电力、制冷、占地空间、管理人员等)。

基础结构成本:托管、冷却、连接服务器以及为服务器提供电源都会随着服务器数量的增长而导致成本大量增加。仅服务器电力需求一项就占总成本一大块,估计数据中心的 1000 台服务器的电力成本每年都在 45,000 美元以上。

硬件成本:每年服务器在容量和计算能力上都呈增长趋势。随着服务器变得越来越强大,最大化的利用这些超强资源也变得愈加困难。IT 组织和应用服务用户习惯为每个应用服务部署一台独立服务器以确保完全控制该应用服务。几

- 3 -

乎在所有情况下,部署这些功能强大的服务器将会使服务器过剩50-500%。

软件成本:通常服务器需要从操作系统或应用软件厂商那里获取许可证与支持。

管理成本:迄今为止,管理成本是服务器成本中最大的一个部分,分析专家估计管理成本占服务器总拥有成本的50-70%。IT技术 人员不得不对软硬件进行升级、打补丁、备份以及修复,部署新的服务器及应用,维护用户账户并执行许多其他任务。随着服务器数量的增长,IT 部门发现他们面临着满足相关服务器管理需求的挑战。

缓慢的业务部署速度

新的服务器、存储设备和网络设备的部署周期较长,整个过程包括硬件选型、采购、上架安装、操作系统安装、应用软件安装、网络配置等。一般情况下,这个过程需要的工作量在20~40小时,交付周期为4~6周。

分散的管理策略

数据中心内的IT基础设施处于分散的管理状态,具体表现为:

机房管理员遵循“根据最坏情况下的工作负载来确定所有服务器的配置”这一策略导致服务器的配置普遍过高。

容易出现大量“只安装一个应用程序”而未得到充分利用的x86服务器。 提交变更请求与进行运营变更之间存在较长的延迟。

缺少统一的集中化IT构建策略,无法对数据中心内的基础设施进行监控、管理、报告和远程访问。

- 4 -

1.2 云计算概述

1.2.1 什么是云计算

云计算是一种基于网络的计算服务供给方式,它以跨越异构、动态流转的资源池为基础提供给客户可自治的服务,实现资源的按需分配、按量计费。云计算导致资源规模化、集中化,促进IT产业的进一步分工,让IT系统的建设和运维统一集中到云计算运营商处,普通用户都更加关注于自己的业务,从而提高了信

息化建设的效率和弹性,促进社会和国家生产生活的集约化水平。 云计算主要包含两个层次的含义:一是从被服务的客户端看:在云计算环境下,用户无需自建基础系统,可以更加专注于自己的业务。用户可按需获取网络上的资源,并按使用量付费。如同打开电灯用电,打开水龙头用水一样,而无需考虑是电从哪里来,水是哪家水厂的。二是从云计算后台看:云计算实现资源的集中化、规模化。能够实现对各类异构软硬件基础资源的兼容,如电网支持水电厂、火电厂、风电厂、核电厂等异构电厂并网;还能够实现资源的动态流转,如西电东送,西气东输、南水北调等。支持异构资源和实现资源的动态流转,可以更好的利用资源,降低基础资源供应商的成本。

云计算的特征

- 5 -

基于网络

云计算是从互联网演变而来,云计算本质通过网络将计算力进行集中,并且通过网络进行服务,如果没有网络,计算力集中规模、服务的种类和可获得性就会受到极大的限制,如集群计算虽然也是基于网络的计算模式,但是不能提供基于网络的服务,还不能称之为云计算。

支持异构基础资源

云计算可以构建在不同的基础平台之上,即可以有效兼容各种不同种类的硬件和软件基础资源。硬件基础资源,主要包括网络环境下的三大类设备,即:计算(服务器)、存储(存储设备)和网络(交换机、路由器等设备);软件基础资源,则包括单机操作系统、中间件、数据库等。从横向维度考虑,支持异构资源,意味着在同一时期内,可以采购不同厂商的软硬件。对云计算平台的构建者而言,这种形式更为灵活;而从纵向维度考虑,意味着云计算平台既可以兼容当下采购的新设备,也可以兼容以前的老设备,既可以兼容当前的新软件系统,也可以兼容以前遗留的老软件系统。支持异构的基础资源这一特性,在有效利用老资源的同时,也保证了新老资源的平滑过渡。

支持资源动态扩展

支持资源动态伸缩,实现基础资源的网络冗余,意味着添加、删除、修改云计算环境的任一资源节点,亦或任一资源节点异常宕机,都不会导致云环境中的各类业务的中断,也不会导致用户数据的丢失。这里的资源节点可以是计算节点、存储节点和网络节点。而资源动态流转,则意味着在云计算平台下实现资源调度机制,资源可以流转到需要的地方。如在系统业务整体升高情况下,可以启动闲置资源,纳入系统中,提高整个云平台的承载能力。而在整个系统业务负载低的情况下,则可以将业务集中起来,而将其他闲置的资源转入节能模式,从而在提高部分资源利用率的情况下,达到其他资源绿色、低碳的应用效果。

支持异构多业务体系

- 6 -

在云计算平台上,可以同时运行多个不同类型的业务。异构,表示该业务不是同一的,不是已有的或事先定义好的,而应该是用户可以自己创建并定义的服务。这也是云计算与网格计算的一个重要差异。

支持海量信息处理

云计算,在底层,需要面对各类众多的基础软硬件资源;在上层,需要能够同时支持各类众多的异构的业务;而具体到某一业务,往往也需要面对大量的用户。由此,云计算必然需要面对海量信息交互,需要有高效、稳定的海量数据通信/存储系统作支撑。

按需分配,按量计费

按需分配,是云计算平台支持资源动态流转的外部特征表现。云计算平台通过虚拟分拆技术,可以实现计算资源的同构化和可度量化,可以提供小到一台计算机,多到千台计算机的计算能力。按量计费起源于效用计算,在云计算平台实现按需分配后,按量计费也成为云计算平台向外提供服务时的有效收费形式。

1.2.2 云计算的价值

云计算是能够提供动态资源池、虚拟化和高可用性的下一代计算模式。如果把一个计算的资源,比如一台服务器,看成一个小水滴,当很多资源汇聚在一起的时候,它就形成了计算的云,正如我们不关心水滴是怎么产生的,用户也不需要关心计算资源位于哪台物理的服务器上。用户关心的是需要什么样的计算能力,需要什么时刻拥有这些计算能力。云计算管理平台可以为用户提供“按需计算”服务。

从资源共享方面

在整合XXX信息中心现有软硬件资源基础上建设云计算平台。充分发挥云计算平台虚拟化计算、按需使用、动态扩展的特性,为XXX各个部门提供计算、存储和信息资源服务,实现软硬件集中部署、统建共用、信息共享,避免重复投资。

- 7 -

基于云计算技术建设公共的云服务平台来运行企业正常运行所需要的业务,可以将企业运维中共性的业务部分进行提炼和归纳,并实现,可以保证共性业务实现的规范性、安全性、全面性和稳定性,也避免了公共功能模块的多次开发实现所造成的冗余浪费乃至系统不兼容错误。更重要的是公共的云服务平台可以提供一系列支撑服务,业务应用子系统在这些支撑服务的基础之上进行开发,大大降低了开发难度和成本,使各部门可以更加专注于其本身综合的、深层次的、相关联的业务需求,而不是基础设施的建设,把精力用在企业高效运行和企业创新的关键点业务需求上,比传统的建设模式更好的把握业务需求,将会大大提高企业信息化的建设效益。

从管理工作方面

企业工作的本质就是服务。如果各部门的业务应用子系统都是按照“企业云计算”的统一标准进行开发实施、注册部署,可以方便的对机关各类业务工作进行标准化管理,从统一管理的的角度对系统进行规范管理,而不是各扫门前雪,在大大降低管理成本的同时,也大量的节约系统的运行成本。

从技术实现方面

基于云计算的企业公共服务平台可以按照SOA的松耦合方式来建设,模块间通过标准协议实现相互调用和消息传递,这种技术架构较为成熟,具有较好的扩展性,可以确保信息系统技术层面可持续发展,更有助于企业不同服务业务之间的信息共享,提高企业各部门业务之间的协同。

从标准化实现方面

基于云计算的企业公共服务平台可以提供一种标准化的建设模式,可以统一制定共性办公业务标准、管理工作实现标准、技术安全标准、保密安全标准、软硬件技术实现标准等,这对企业标准的实施和推广具有重要意义。

1.3 H3Cloud云计算解决方案特色

H3C公司依托强大的研发实力、广泛的市场应用和技术理解,以客户需求

- 8 -

为导向,为企业新一代云计算数据中心基础架构提供一体化的云计算平台解决方案,帮助用户实现快速、可靠的虚拟化数据中心和云业务应用部署。H3Cloud云计算解决方案包含统一的计算资源池、统一的网络资源池、统一的存储资源池,并提供了一体化的监控和部署工具进行统一的虚拟化与云业务管理,通过简洁的管理界面,轻松地统一管理数据中心内所有的物理资源和虚拟资源,不仅能提高管理员的管控能力、简化日常例行工作,更可降低IT环境的复杂度和管理成本。

1.3.1 H3Cloud云计算解决方案组件

H3Cloud云计算解决方案面向于私有云IaaS(基础设施即服务),主要包含以下几个部分:

云计算平台

现有的企业计算环境通常是x86平台,H3Cloud可以通过服务器的虚拟化进行计算资源的整合与灵活利用,进行服务器计算资源的整合、动态调整、迁移。

H3C FlexServer服务器系列定义了下一代2U双插槽机架式服务器的标准。借助可维护性方面的改进、无与伦比的性能、强大的配置灵活性和受用户启发的设计模式,H3C FlexServer所提供的完美解决方案能满足当今不断扩展的数据中心所需的动态计算机要求。H3C FlexServer服务器支持iLO管理引擎,这是一套全面的嵌入式管理特性,可支持服务器的完整生命周期(从初始部署到运行管理、再到服务警报和远程支持)。

云存储平台

实现IaaS的一个重要组成部分是云存储,一个云计算的基础设施要服务于很多个不同的业务系统或者应用,每个业务系统或应用都会有不同的存储需求,H3Cloud可以通过存储虚拟化管理,进行存储需求的整合,灵活的容量控制。

- 9 -

H3Cloud云计算解决方案中的存储组件提供了经济实惠的企业功能,并具有全面的功能集,简化了对所有位置的集中管理,是具有各种虚拟服务器、客户端虚拟化、数据库、电子邮件和业务应用程序的环境的理想选择。

存储组件中集成了各种出色的应用程序可用性和灾难恢复功能,在任何情况下都可进行自动故障转移/故障恢复, 并针对虚拟化环境进行了优化,并为用户和应用程序提供了即时满足需求的连续数据可用性。

虚拟化网络基础平台

随着云计算环境下虚拟化技术的大规模部署,传统的网络架构将面临着很多新的挑战,包括规格与性能、虚拟机接入与控制、大二层网络部署、流量突发与拥塞等等,如下图所示:

H3C虚拟网络方案通过数据中心级设备、网络虚拟化及虚拟机网络接入新标准(EVB)等产品与技术的创新,可以实现网络基础平台对云计算虚拟化环境的良好支撑,同时大大简化网络的运维管理。

云管理平台

- 10 -

服务器虚拟化、存储虚拟化和网络虚拟化只是构成云计算基础设施的硬件资源池,在云计算环境中,最重要的一点是实现资源池的自动化,避免人力对于基础设施的过多干预。H3Cloud通过自动化的管理平台和手段,帮助用户实现对云硬件资源和业务流程的快速部署与自动化维护和管理。

H3Cloud云管理平台由Cloud Virtualization Kernel(CVK)、Cloud Virtualization Manager(CVM)和Cloud Intelligence Center(CIC)三个组件完成:

Cloud Virtualization Kernel(CVK):虚拟化内核与管理代理

运行在基础设施层和上层操作系统之间的“元”操作系统,用于协调上层操作系统对底层硬件资源的访问,减轻软件对硬件设备以及驱动的依赖性,同时对虚拟化运行环境中的硬件兼容性、高可靠性、高可用性、可扩展性、性能优化等问题进行加固处理。

Cloud Virtualization Manager(CVM):虚拟化管理软件包

主要实现对数据中心内的计算、网络和存储等硬件资源的软件虚拟化,形成虚拟资源池,对上层应用提供自动化服务。其业务范围包括:虚拟计算、虚拟网络、虚拟存储、高可靠性(HA)、动态资源调度(DRS)、虚拟机容灾与备份、虚拟机模板管理、集群文件系统、虚拟交换机策略等。

Cloud Intelligence Center(CIC):云业务运营软件包

由一系列云基础业务模块组成,通过将基础架构资源(包括计算、存储和网络)及其相关策略整合成虚拟数据中心资源池,并允许用户按需消费这些资源,从而构建安全的多租户混合云。其业务范围包括:组织(虚拟数据中心)、多租户数据和业务安全、云业务工作流、自助式服务门户、兼容OpenStack的REST API接口等。

- 11 -

从逻辑架构上,H3Cloud云管理平台包括虚拟化层、自动化服务层、管理层、业务编排层、API层:

虚拟化层

利用Cloud Virtualization Kernel(CVK)提供的底层虚拟化能力和上层Cloud Virtualization Manager(CVM)提供的管理能力,屏蔽底层物理硬件基础设施的异构性和复杂度,对外以虚拟资源池的形式呈现。

自动化服务层

强调业务运行的高可用性和可扩展性,并未业务提供自动的容灾备份与资源调度能力。

管理层

对虚拟化资源及云运营要素进行管理,如虚拟机生命周期的管理、虚拟机镜

- 12 -

像文件和配置文件的管理、多租户的安全隔离、网络策略配置的管理等。

业务编排层

对云计算资源进行可运营性管理,包括对虚拟资源池的编排、最终用户的自助服务门户、业务的申请、审批与开通、用户帐务的管理与报表输出等。

API层

为第三方云运营管理平台提供RESTful的API接口。

1.3.2 H3Cloud云计算解决方案亮点

1.3.2.1 直观的配置与管理

完全基于B/S架构的管理控制台,不仅让您轻松组织和快速部署整个IT环境,而且还能对包括CPU、内存、磁盘I/O、网络I/O等重要资源在内的关键元件进行全面的性能监测,为管理员实施合理的资源规划提供详尽的数据资料。

- 13 -

1.3.2.2 智能化的资源自动优化配置

H3Cloud云计算软件为虚拟机中运行的应用程序提供简单易用、成本效益高的高可用性功能。硬件故障导致的服务器或虚拟机宕机再也不会造成灾难性的后果,H3Cloud提供的资源智能调度能力会为这些服务器或虚拟机自动选择最佳的重新运行位置。

1.3.2.3 支持IEEE 802.1Qbg标准草案

支持IEEE 802.1Qbg(VEPA)协议标准草案,与H3C 5820V2交换机及iMC VCM网管组件配合,能够实现对虚拟机流量的全面监控。

1.3.2.4 快速业务部署能力

支持虚拟机的快速克隆功能,所有链接到主镜像文件的虚拟桌面都可以通过更新主镜像文件来修补或更新,而不会影响用户的设置、数据或应用程序,大幅简化了桌面的管理,同时极大地减少存储空间的浪费和缩短了部署虚拟桌面的时间。

支持虚拟机系统的增量备份功能,仅备份上一次完全/增量备份后发生变化的文件,极大地减少了每次备份文件的数量和备份的时间,提高了备份效率。

1.3.2.5 自助式云业务电子流

自助式服务管理为用户提供了一个安全的、多租户的、可自助服务的IaaS,是一种全新的基础架构交付和使用模式。通过H3Cloud云计算软件提供的虚拟化资源池功能,使IT部门能够将计算、存储和网络等物理资源抽象成按需提供的弹性虚拟资源池,以消费单元(即组织或虚拟数据中心)的形式对外提供服务,IT部门能够通过完全自动化的自助服务访问,为用户提供这些消费单元以及其它包括虚拟机和操作系统镜像等在内的基础架构和应用服务模板。这种自助式的服务真正实现了云计算的敏捷性、可控性和高效性,并极大程度地提高了业务的

- 14 -

响应能力。

云资源系统管理员云服务组织管理员云用户最终用户2云资源申请5云服务申请1物理资源整合与资源池化4组织策略配置与虚拟机模板管理7使用虚拟资源最终用户计算资源最终用户6云服务申请审核通过虚拟资源分配3存储资源云资源申请审核通过组织创建与云资源分配最终用户最终用户网络资源

1.3.2.6 多租户业务安全

通过用户数据安全隔离与网络安全策略模板,确保虚拟化、多租户环境下的用户隐私信息及数据的安全。

虚拟化资源位置信息的唯一标识,避免了虚拟化技术引起的物理边界模糊可能导致的司法取证问题。

通过用户权限的精细化控制、管理帐号的分级管理以及详细的操作访问日志,避免权限滥用问题。

- 15 -

第3章 总体设计

3.1 建设目标

目前IT信息技术已经延伸到企业的各个层面,从企业角度看,云计算有利于整合信息资源,实现信息共享,促进企业信息化的发展。从用户角度看,利用云计算可以独立实现或享受某一项具体的业务和服务。因此云计算将在企业的IT政策和战略中正扮演越来越重要的角色。企业云计算中心的建设,未来的核心业务涵盖如下范围:

以“统规、统建、统维”思想为指导,以丰富的云基础设施,云存储,云安全和各类云服务构件共同构建XXX云服务平台,服务于:

1. 为XXX企业提供计算环境,降低企业的IT硬件投资

2. 为XXX内部应用提供基于云计算平台办公应用、生产经营运行监控。 3. 为XXX企业提供通用企业管理软件,为企业建立低成本的管理系统 4. 为XXX企业提供基于云计算平台的开发测试环境

5. 为XXX企业提供IaaS/PaaS/ SaaS平台,为企业向云计算转型服务 6. 优化投资环境,节省企业IT软硬件投入和开发环境的投入,吸引企业加

快企业自身信息化发展。

本方案将云数据中心“IT基础设施”的“按需使用”以及”自动化管理和调度”作为云计算的实践,形成可落地实施的、可持续发展的云计算平台,即IaaS云计算平台。

作为XXX的云计算实践,云计算数据中心的建设建议达到以下目标: 统一管理

通过最新的云计算核心技术之一虚拟化技术,整合现有所有应用,整合内容

- 21 -

包括WEB、MAIL、FTP、域控管理、OA系统、后台数据库等应用,将整个业务系统作统一的规划和部署,统一数据备份,从而形成自上向下的有效IT管理架构。

强调整体方案的可扩展性、高可用性、易用性和易管理性

采用最新的2路双核服务器,保证整个硬件系统的可靠性和可用性,为用户的应用提供可靠的硬件保障;建设云计算平台,发挥云计算平台的优越性,为用户提供HA高可用,保证用户业务系统的连续性和高可用性,让用户的业务实现零宕机风险;专业的管理软件,保证硬件系统和软件系统的可管理性,为用户节市管理投资成本。

3.2 建设内容

云计算平台建设主要包括以下建设内容: 1、资源池化系统(服务器、存储、网络资源池) 2、云平台管理及运营系统 3、云计算安全支撑系统

3.3 建设原则

本项目建设遵循以下建设原则: ? 先进性

基础设施平台建设采用的产品和技术具有云平台的特征及技术的先进性,保障平台的资源使用周期最大化。但采用先进的技术也有一定的风险,即可能存在技术不成熟问题。我们采用充分论证及测试的方式,在选择先进技术时,把技术风险降低。并通过平台的小规模运营实践,逐步淘汰不成熟、不可行的技术,将整个平台建设成技术领先的基础设施系统。

? 高可靠性

- 22 -

云计算平台作为承载未来企业应用的重要IT基础设施,承担着稳定运行和业务创新的重任。伴随着数据与业务的集中,云计算平台的建设及运维给信息部门带来了巨大的压力,因此平台的建设从基础资源池(计算、存储、网络)、虚拟化平台、云平台等多个层面充分考虑业务的高可用,基础单元出现故障后业务应用能够迅速进行切换与迁移,用户无感知,保证业务的连续性。 ? 可扩展性

可实现通过简单的硬件扩容达到系统动态扩容的目的,可动态伸缩,满足应用和用户规模增长的需要。 ? 易管理

云计算的最终目标是要实现系统的按需运营,多种服务的开通,而这依赖于对计算、存储、网络资源的调度和分配,同时提供用户管理、组织管理、工作流管理、自助Portal界面等。从用户资源的申请、审批到分配部署的智能化。管理系统不仅要实现对传统的物理资源和新的虚拟资源进行管理,还要从全局而非割裂地管理资源,因此统一管理与自动化将成为必然趋势。 ? 开放性

当前阶段云计算整个产业化还不够成熟,相关标准还不完善。为保证多厂商的良好兼容性,避免厂商技术锁定,方案的设计充分保证与第三方厂商设备保持良好的对接。此外,为保证方案的前瞻性,设备的选型应充分考虑对已有的云计算相关标准(如EVB/802.1Qbg等)的扩展支持能力,保证良好的先进性,以适应未来的技术发展。

传统的管理系统与上层系统对接,注重故障的上报和信息的查询。而云计算的管理系统更关注如何实现自动化的部署,在接口方面更关注资源调度和分配,这就需要管理系统在业务调度方面实现开放。为保证服务器、存储、网络等资源能够被云计算运营平台良好的调度与管理,要求系统提供开放的API接口,云计算运营管理平台能够通过API接口、命令行脚本实现对设备的配置与策略下发联动。同时云平台也提供开放的API接口,未来可以基础这些接口进行二次定制开

- 23 -

放,将云管理平台与企业应用相融合,实现面向云计算的企业应用管理平台。

3.4 建设思路

随着XXX信息化的深入,数据大集中以及信息交换的要求很高的计算能力。传统企业数据中心建设和运维的成本(包括电力成本、空间成本、维护成本等)在不断上升。简单的通过设备叠加和设备性能增强已经难以适应上述的要求。因此,当XXX数据中心建设的核心需求为在IT建设模式上进行转变。改变传统的“竖井式”IT建设模式而引入云计算建设模式来整合优化当前信息中心内的硬件资源,提升数据中心的资源弹性、运行效率、交付能力以及扩展能力,并从根本上降低数据中心的建设成本,如下图所示。

云计算架构下的IT建设模式并没有完全颠覆传统IT的建设方式,在硬件资源大集中的前提下,先完成计算、存储、网络的资源集中化,同时增加虚拟化层与云层解决硬件统一整合以及资源按需分配的问题。

- 24 -

有别于传统建设模式单机单用的情况,虚拟化层通过在裸金属服务器上加装虚拟化内核Hypervisor这一层从而实现单个物理计算节点能够虚拟出多个逻辑隔离的计算节点即虚拟机的方式来承载多个应用,通过虚拟化层的集中管理能够为企业带来如下好处:

? 提高现有资源的利用率,传统单机单用的业务部署模式对硬件资源独占

无法共享,而大部分时间硬件资源利用率都较低部分业务甚至不足3%,虚拟化层可通过一虚多的方式,充分利用每一个计算服务器的资源,提高现有资源的利用率;

? 降低数据中心成本,传统建设模式业务部署或扩容更多的都是硬件设备

的追加,通过虚拟化层可以利用现有的服务器进行业务整合,未来新建部署的业务系统也可以通过虚拟机承载的方式快速部署,建设硬件成本的追加,同时硬件设备数量的减少也可以带来数据中心空间成本的节省以及数据中心耗电的节省;

? 提高 业务连续性,基于虚拟化迁移、集群、负载均衡等技术,任何虚

拟机或者承载于虚拟机上的业务系统并不依托于某一个硬件节点存在,

- 25 -

所以对于整个数据中心计算资源池节点,单个物理节点出现问题并不会出现业务服务的中断,在不追加任何冗余设备的技术上日高了业务本身的连续性;

如果说虚拟化层解决的是资源整合管理的技术问题,那么云层解决的就是资源按需申请分配的管理问题,系统管理员能够通过云层资源编排的功能把后台的资源通过模板的方式行程服务发布出来,而使用者能够通过云层自主Portal的方式按需申请资源,真正实现使用者---资源---管理者间的流程自动化。

需要强调的是,转变现有的建设模式而引入云计算架构并不是彻底的推翻现有IT系统进行重建,建设中需要充分考虑对现有业务系统的兼容和平滑升级,在方案部分也会重点从虚拟化层以及云层这两个方面详细描述。

- 26 -

第4章 建设方案

4.1 系统总体架构

本项目的总体架构如下图所示:

根据本期工程的需求和建设目标云计算平台总体逻辑拓扑结构如上图所示。整个平台由网络资源池、计算资源池、存储资源池、管理中心四部分组成,网络出口与XXX广域网相连。

网络资源池

采用业界主流的“核心+接入”扁平化组网,核心交换机采用2台H3C S10508数据中心级交换机,部署IRF2虚拟化技术,并在机框内部署入侵检测(IPS)和防火墙(FW)插卡,实现业务的入侵防御和安全隔离防护,外联至2台广域网出口路由器SR6602X,实现与XXX各单位互通;接入交换机采用2台H3C 5820V2设备,部署IRF2虚拟化技术,通过10G链路和2台核心交换机相连。管理网交换机采用1台H3C S5100EI设备,与服务器、存储设备的管理接口互联。IP SAN交换机采用2台H3C 5820X设备,部署IRF2虚拟化技术,1套H3C P4500存储通过10G链路和X台H3C R390服务器相连。

计算资源池

- 27 -

采用H3Cloud云计算操作系统软件,将X台h3C R390机架服务器组建HA集群,在虚拟机上部署企业业务应用,并配合HA和动态负载均衡等高级功能,实现业务的连续性,减少计划内宕机时间,提高资源利用率。

H3C FlexServer R390机架式服务器

H3C FlexServer R390机架服务器系列定义了下一代2U双插槽机架式服务器的标准。借助可维护性方面的改进、无与伦比的性能、强大的配置灵活性和受用户启发的设计模式,H3C FlexServer R390所提供的完美解决方案能满足当今不断扩展的数据中心所需的动态计算机要求。H3C FlexServer R390服务器支持iLO管理引擎,这是一套全面的嵌入式管理特性,可支持服务器的完整生命周期(从初始部署到运行管理、再到服务警报和远程支持)。

处理器 处理器数 内存 内存类型 网络控制器 存储控制器 电源类型 H3C FlexServer R390 英特尔至强E5-2620(6 核、2 GHz、15 MB) 2 64GB DDR3 1 个 1 Gb 331FLR 以太网适配器(4 端口) 1 个智能阵列 P420i/1GB FBWC 2 个 460 瓦通用插槽金级热插拔电源

存储资源池

采用1套H3C p4500存储阵列,统一存放虚拟机镜像文件和业务系统数据,这样做不会在运行虚拟机的云计算计算节点主机上引起任何额外的负载。

H3C FlexStorage P4500 SAS存储系统

H3Cloud云计算解决方案中的存储组件提供了经济实惠的企业功能,并具有

- 28 -

全面的功能集,简化了对所有位置的集中管理,是具有各种虚拟服务器、客户端虚拟化、数据库、电子邮件和业务应用程序的环境的理想选择。

存储组件中集成了各种出色的应用程序可用性和灾难恢复功能,在任何情况下都可进行自动故障转移/故障恢复, 并针对虚拟化环境进行了优化,并为用户和应用程序提供了即时满足需求的连续数据可用性。

对虚拟环境来说,FlexStorage P4500 14.4TB SAS虚拟化SAN提供了优化的共享存储,可确保实现经济高效的高可用性、可扩展的性能以及无中断的配置变更。

硬盘说明 硬盘类型 支持24块LFF SAS硬盘 600GB 6G 15K LFF双端口ENT SAS硬盘; 附带24块 最小14.4TB 最大230.4TB 使用存储集群能力,并向SAN环境逐步添加FlexStorage P4500存储系统,以扩展存储容量:H3C FlexStorage P4500 7.2TB SAS存储系统。 1GbE iSCSI (4)端口 可升级到10GbE iSCSI (4)端口 Apple OS X Citrix XenServer HP-UX IBM AIX Microsoft Windows 2003 支持的操作系统 Microsoft Windows 2008 Novell NetWare Oracle Enterprise Linux Red Hat Linux SUN Solaris SUSE Linux VMware 基于SAN/IQ的全面的企业级特性 超冗余集群存储 冗余、热插拔电源;冗余风扇;冗余、热插拔硬盘;集成的存储控制器(带电池- 29 -

容量 存储扩展选件 主机接口

支持的DDR2高速缓存);磁盘RAID 5、6和10;超冗余集群存储;网络RAID级别(每卷) 0、5、6、10、10+1和10+2最多支持4个数据拷贝,即使在电源、网络、磁盘、控制器、存储节点或站点出现故障时,您的数据将仍然可用。 精简配置功能 集成应用的快照 远程复制。异步复制和带宽遏制;多站点/灾难恢复解决方案包和同步复制。 SmartClone 集中的管理控制——H3C Integrated Lights-Out 2 Remote Management、Baseboard Management Controller IPMI 2.0 保修 三年部件、三年人工、三年现场、下一工作日

管理中心

采用2台H3C R390机架服务器,分别部署H3C iMC DCM数据中心管理套件和H3Cloud CAS(含CVM、CIC),实现对云计算资源池的统一管理及调度。

4.2 计算资源池

服务器是云计算平台的核心,其承担着云计算平台的“计算”功能。对于云计算平台上的服务器,通常都是将相同或者相似类型的服务器组合在一起,作为资源分配的母体,即所谓的服务器资源池。在这个服务器资源池上,再通过安装虚拟化软件,使得其计算资源能以一种虚拟服务器的方式被不同的应用使用。这里所提到的虚拟服务器,是一种逻辑概念。对不同处理器架构的服务器以及不同的虚拟化平台软件,其实现的具体方式不同。在x86系列的芯片上,其主要是以常规意义上的VMware虚拟机或者H3Cloud虚拟机的形式存在。

- 30 -

4.2.1.1 资源池分类设计

在搭建服务器资源池之前,首先应该确定资源池的数量和种类,并对服务器进行归类。归类的标准通常是根据服务器的CPU类型、型号、配置、物理位置来决定。对云计算平台而言,属于同一个资源池的服务器,通常就会将其视为一组可互相替代的资源。所以,一般都是将相同处理器、相近型号系列并且配置与物理位置接近的服务器——比如相近型号、物理距离不远的机架式服务器或者刀片服务器。在做资源池规划的时候,也需要考虑其规模和功用。如果单个资源池的规模越大,可以给云计算平台提供更大的灵活性和容错性:更多的应用可以部署在上面,并且单个物理服务器的宕机对整个资源池的影响会更小些。但是同时,太大的规模也会给出口网络吞吐带来更大的压力,各个不同应用之间的干扰也会更大。如果有条件的话,通常推荐先审视一下企业自身的业务应用。可以考虑将应用分级,将某些级别高的应用尽可能地放在某些独立而规模较小的资源池内,辅以较高级别的存储设备,并配备高级别的运维值守。而那些级别比较低的应用,则可以被放在那些规模较大的公用资源池(群)中。

初期的资源池规划应该涵盖所有可能被纳管到云计算平台的所有服务器资源,包括那些为搭建云计算平台新购置的服务器、企业内部那些目前闲置着的服务器以及那些现有的并正在运行着业务应用的服务器。在云计算平台搭建的初期,那些目前正在为业务系统服务的服务器并不会直接被纳入云计算平台的管辖。但是随着云计算平台的上线和业务系统的逐渐迁移,这些服务器也将逐渐地被并入云计算平台的资源池中。

对于x86系列的服务器,除了用于生产系统的资源池以外,还需要专门搭建一个测试用资源池,以便云计算平台项目实施过程以及平台上线以后运维过程中使用。

在云计算平台搭建完毕以后,企业的服务器资源池可以如下图所示:

- 31 -

在云计算平台上线以后,原有非云计算平台上的应用会逐步向云计算平台迁移,空出的服务器资源池也会逐渐并入云计算平台的资源池中。其状态可以用下图所示:

H3Cloud CVM虚拟化管理平台体系将IT数据中心的物理服务器资源以树形结构进行组织管理,统一称之为云资源。

云资源是H3Cloud云计算软件分层管理模型的核心节点之一,用来统一管理数据中心内所有的、复杂的硬件基础设施,不仅包括基本的IT基础设施(如硬件服务器系统),还包括其它与之配套的设备(如网络和存储系统)。默认情况下,H3Cloud云计算管理平台出厂配置中已经添加了一个名为“云资源”的根节点,准备使用H3Cloud云计算软件进行管理的所有物理资源都需要手工逐一添加到该节点下进行统一的管理。

云资源中的被管理对象之间的关系可以用下图描述:

4.2.1.2 主机池设计

在H3Cloud云计算软件体系架构中,主机池是一系列主机和集群的集合体,

- 32 -

主机有可能已加入到集群中,也可能没有。没有加入集群的主机全部在主机池中进行管理。

在H3Cloud云计算管理平台主界面导航菜单窗口中点击“云资源”,在快捷工具栏中选择<增加主机池>按钮。

或者右键单击“云资源”,在弹出的上下文菜单中选择<增加主机池>子菜单。

在弹出的增加主机池对话框中,输入主机池名称后,单击<确定>按钮完成主机池的添加。

4.2.1.3 HA集群设计

传统数据中心内的服务器高可靠性保障通常会选择依赖于集群技术的部署。而云计算平台将计算资源虚拟化以后,可以利用虚拟服务器自身虚拟化的特点实现传统物理服务器上无法实现的高可靠性。

为了提升云业务系统的可靠性,在云计算平台的计算资源池建设时,可以将多个物理主机合并为一个具有共享资源池的集群。CVM HA功能会监控该集群下所有的主机和物理主机内运行的虚拟主机。当物理主机发生故障,出现宕机时,HA功能组件会立即响应并在集群内另一台主机上重启该物理主机内运行的虚拟机。当某一虚拟服务器发生故障时,HA功能也会自动的将该虚拟机重新启动来恢复中断的业务。具体操作如下图所示:

- 33 -

除了对集群中的物理服务器节点进行持续检测之外,H3C CAS HA软件模块还对运行于物理服务器节点之上的虚拟机进行持续检测。

在每台服务器节点上都运行了一个LRMd(Local Resource Manager daemon,本地资源管理器守护进程),它是HA软件模块中直接操作所管理的各种资源的一个子模块,负责对本地的虚拟化资源进行状态检测,并通过shell脚本调用方式实现对资源的各种操作。

当LRMd守护进程检测到本机的某台虚拟机出现通信故障时,首先将事件通知给DC,由DC统一将该虚拟机状态告知集群内所有的物理服务器节点,并按照一定的策略算法,为该故障的虚拟机选择一个空闲的服务器节点,在该节点上重启该虚拟机。

- 34 -

共享存储池SAN/iSCSI/NFS在集群内自动为虚拟机选择空闲的服务器节点,实现动态迁移和业务的高可靠性服务器集群VMVMVMLRMdCVKVMVMVMDCCVKVMVMVMLRMd持续检测本机虚拟机运行状态,由DC为故障的VM自动选择迁移后的服务器节点。CVKIP network使用H3C CAS云计算软件HA特性进行虚拟机故障切换

H3C CAS HA技术有效的解决了目前其它高可用性解决方案面临的问题:

当物理服务器发生硬件故障时,所有运行于该服务器的虚拟机可以自动切

换到其它的可用服务器上,相对传统的双机容错方案,H3C CAS HA可以最大程度减少因硬件故障造成的服务器故障和服务中断时间。 不同于其它HA的双机热备方式,所有参与HA的物理服务器都在运行生产

系统,充分利用现有硬件资源。同时,对众多的操作系统和应用程序,H3C CAS提供统一的HA解决方案,避免了针对不同操作系统或者应用,采用不同的HA方案带来的额外开销和复杂性。

通过H3C CAS HA,IT部门可以:

为没有容错功能的应用提供冗余保护

传统意义上HA实现很复杂并且价格昂贵,多用于关键性的服务或应用,而H3C CAS HA为所有的应用程序提供了高性价比的HA解决方案。

为整个IT环境提供“第一条安全防线”

- 35 -

不同于其它基于操作系统和应用的HA实现方式,H3C CAS HA为IT系统提供了更统一、更易于管理的高可用性解决方案。H3C CAS用最少的成本和最简单的管理方式为所用的应用提供了最基本的冗余保护功能。

综上所述,H3C CAS HA解决方案的技术特点总结如下: 1.自动侦测物理服务器和虚拟机失效

H3C CAS会自动的监测物理服务器和虚拟机的运行状态,如果发现服务器或虚拟机出现故障,会在其它的服务器上重新启动故障机上所有虚拟机,这个过程无需任何人为干预。

2.资源预留

H3C CAS永远会保证资源池里有足够的资源提供给虚拟机,当物理服务器宕机后,这部分资源可以保证虚拟机能够顺利的重新启动。

3.虚拟机自动重新启动

通过在其它的物理服务器上重新启动虚拟机, HA可以保护任何应用程序不会因为硬件失效而中断服务。

4.智能选择物理服务器

当与H3C CAS动态负载均衡功能共同使用时,H3C CAS HA可以根据资源的使用情况,为失效物理服务器上的虚拟机选择能获得最佳运行效果的物理服务器。

HA功能给企业云计算平台带来的价值如下: ?

简便的设置和启动:使用“新建集群”向导来进行初始设置,使用H3C CVM虚拟化管理平台添加主机和新的虚拟机。 ?

降低硬件成本和设置:在传统集群解决方案中,必须有重复的软硬件,而且各个组件必须正确连接和配置。使用CVM集群时,只要保证有足够的资源容纳要确保其故障切换的主机的数量,就可以便捷自动地完成主机故障切换。 ?

无论硬件和操作系统平台如何,CVM HA都通过为应用程序提供可用的、经济的高可靠性,而使其更“大众化”。

- 36 -

4.2.1.4 主机设计

集群创建成功之后,没有任何主机或虚拟机包含于其中,为了基于将主机和虚拟机基于集群进行管理,首先需要将主机添加到集群。

在H3Cloud云计算管理平台主界面导航菜单窗口中点击需要增加主机的集群,在快捷工具栏中选择<增加主机>按钮。

或者右键单击需要增加主机的集群,在弹出的上下文菜单中选择<增加主机>子菜单。

在弹出的增加主机对话框中,输入需要被添加到集群的主机的IP地址、通过SSH协议访问主机的用户帐号及密码后,单击<确定>按钮完成主机池的添加。

4.2.1.5 虚拟机生命周期管理

传统的虚拟机生命周期是指虚拟机从创建到删除所经历的各个阶段,最常见的划分为“创建、运行、终结”三个阶段。在IaaS架构中,虚拟机作为最为重要的IT基础设施,它的生命周期供贯穿于整个云业务服务的流程之中,并直接关系着云计算平台的资源利用状况。因此,为了更好的将虚拟机的生命周期管理和云业务及资源平台管理结合在一起,在H3Cloud 云计算解决方案中,将虚拟机的生命周期外延为“规划、创建、运行、调整、

- 37 -

终结”五个阶段。在云解决方案中,虚拟机生命周期的管理除了关注虚拟机正常的生命阶段以外,还需要关注虚拟机两个外延属性——业务和资源。

? 规划

虚拟机的规划是IT架构的关键设计范畴。在这个阶段需要将业务需求转化为IT需求,并落实到业务和资源两个方面的规划设计中来。着重考虑两个方面的内容:

? 业务梳理和评估

? 通过对业务的梳理,评估数据中心平台各业务部门对虚拟机类型和规模的需求 定义各部门组织以及给组织划分其所属的虚拟资源,包括计算资源,网络资源,存储资源以及虚拟机模板等。实际操作流程如下图所示:

? 创建

- 38 -

虚拟机的创建是虚拟机实体诞生并提供给用户业务的开始。H3Cloud 云方案提供了多种方式来创建虚拟机:从模板生成,自定义参数,克隆等。

虚拟机创建时需要考虑硬件资源(CPU数量(核数)&CPU调度优先级 ,IO资源:存储资源&IO优先级 。内存大小 ,网络资源 等)和系统和应用( 操作系统等))两方面的内容。 这些因素在H3C 云管理平台中虚拟机创建流程中都会有涉及,具体操作界面如下图所示:

? 运行

虚拟机的运行可以实现完整的传统物理机运行状态。而且依托虚拟化技术实现更加灵活的虚拟机使用模式:启动、休眠、关闭、暂停、恢复、重启。用户可以依托H3C云管理平台简单的实现上述虚拟机的状态的切换,具体如下图所示:

? 调整

- 39 -

虚拟机的调整是云业务管理员根据虚拟机所承载的业务的变化需求对现有虚拟机所占资源的主动行为。这种调整可以是由于业务扩展带来的虚拟机硬件资源扩张,也可能是业务收缩后对多余资源的释放。虚拟机的调整是云计算业务资源弹性最直观的体现,也是云计算技术给业务开展带来敏捷性的根本所在。H3C云计算平台可以在线的调整虚拟机所占用的系统资源,实际操作如下图所示:

? 终结

如下图所示,虚拟机在云计算管理平台上被删除,即意味着虚拟机生命周期的终结。在虚拟机生命周期终结时要关注虚拟机所占用系统资源的回收。H3C云管理平台在虚拟删除

- 40 -

后,会自动回收CPU和内存等资源,为了保证虚拟机数据安全其所占用的存储资源不会自动回收。

4.2.1.6 DRS动态资源调度

CVM提供的动态资源调整功能可以持续不断地监控计算资源池的各物理主机的利用率,并能够根据用户业务的实际需要,智能地在计算资源池各物理主机间给虚拟机分配所需的计算资源。通过自动的动态分配和平衡计算资源,动态资源调整特性能够:

整合服务器,降低IT成本,增强灵活性; 减少停机时间,保持业务的持续性和稳定性; 减少需要运行服务器的数量,提高能源的利用率。

随着业务量的增长,虚拟机对计算资源需求会相应的迅速增加。此时其所在物理主机的可用资源可能就不能再满足其上承载的虚拟机的计算需要。CVM动态资源调整功能组件可以自动并持续地平衡计算资源池中的容量,可以动态的将虚拟机迁移到有更多可用计算资源的主机上,以满足虚拟机对计算资源的需求。即便大量运行SQL Server的虚拟机,只要开启了动态资源调整功能,就不必再对CPU和内存的瓶颈进行一一监测。全自动化的资源分配和负载平衡功能,也可以显著地提升数据中心内计算资源的利用效率,降低数据中心的成本与运营费用。

VMVMVMVMVMVMVMVMVMVMVMVM物理服务器物理服务器物理服务器集群

如上图所示,动态资源调整功能通过心跳机制,定时监测集群内主机的CPU利用率,并根据用户自定义的规则来判断是否需要为该主机在集群内寻找有更多可用资源的主机,以将该主机上的虚拟机迁移到另外一台具有更多合适资源的服务器上。具体操作如下图所示:

- 41 -

除了定时检测和动态迁移之外,H3C CAS还充分考虑了虚拟机对物理服务器主机的亲和性因素,即衡量虚拟机对当前物理主机的依赖程度。例如,用户可能希望某些虚拟应用系统只允许在固定的物理主机上运行,而不允许其动态迁移。此时,只需要在H3C CAS云计

算管理平台上,去勾选虚拟机的自动迁移属性即可(虚拟机自动迁移属性配置)。

动态资源调整技术特色总结

根据业务需求自动调整资源

- 42 -

H3C CAS动态资源调度功能将物理服务器主机资源聚合到集群中,通过监控CPU和内存等关键计算资源的利用率持续优化虚拟机跨物理主机的分发,将这些资源动态自动分发到各虚拟机中。

自动平衡计算容量

H3C CAS动态资源调度功能会不间断地平衡资源池内的计算容量,提高服务级别并确保每个虚拟机能随时访问相应资源,满足虚拟应用程序的高可用性。

4.2.1.7 虚拟机资源限额

默认情况下,H3C CAS给每台物理服务器主机上的虚拟机分配数量相同的CPU、内存以及磁盘I/O资源。但是,并不是所有虚拟机工作负载天生相同,例如,SQL服务器和Web服务器的访问需求就不尽相同,因此,手动调整分配给每个虚拟机的资源就显得非常重要。

CPUCPU优先级VM #1VM #2VM #3高中低磁盘I/O优先级中高低高服务器集群VMVMVMVMVMVMVM #1VM #2VM #3中低I/O中低IP network

H3C CAS通过资源限额方式来为虚拟机指定资源调度的优先级。有三种预设的限额分配方式:高、中、低,调度优先级权重分别为4:2:1,反映到份额上的数值如下表所示:

优先级权重

4 高 2 中 1 - 43 -

低 100%高100%

CPU调度优先级数值 CPU调度优先级百分比 磁盘I/O调度优先级数值 2048 57.1% 800 1024 28.6% 500 31.2% 512 14.3% 300 18.8% 磁盘I/O调度优先级百分比 50.0% 比如,一台物理服务器主机上分配了5个虚拟机,CPU调度优先级分别为高、中、中、低、低,那么,高优先级的虚拟机至少可以获得4/(4+2+2+1+1)=40%的CPU资源,中优先级的虚拟机至少可以获得20%的CPU资源,而低优先级的虚拟机至少可以获得10%的CPU资源。

需要强调的是,虚拟机资源限额机制的真正目的是为了确保每个虚拟机对资源的调度下限,如果物理服务器上没有发生虚拟机的资源抢占行为,那么,即使是低优先级的虚拟机也有可能独享该物理服务器上绝大部分的资源。

高SQL服务器VM #1中Web服务器VM #2低Mail服务器VM #3高SQL服务器VM #1中Web服务器VM #2低Mail服务器VM #3VM #1VM #1VM #2资源发生抢占的情况下,CPU资源调度优先级严格按照4:2:1的权重确保所有的虚拟机都能抢占到一定的资源,保证业务的可用性。VM #2VM #3假如高优先级的虚拟机处于负载低潮时,中优先级和低优先级的虚拟机可以抢占本属于高优先级虚拟机的资源,以提高应用程序的效率和物理资源的利用率。VM #3

当所有的虚拟机都处于满负载运行的情况下,CPU资源严格按照4:2:1的权重比例进行调度,以确保所有的虚拟机都能抢占到一定数量的资源,保证业务的可用性。一旦某个虚拟机的负载回落到权重比例之下,那么,其它的虚拟机可以抢占本属于该虚拟机的资源,以最大限度地利用物理资源的利用率,保证应用程序的运行效率。

4.2.1.8 虚拟机备份

随着云平台对IT信息化系统的依赖加深,业务系统备份是必不可少的组件。相应的,在云计算平台中,针对计算资源池中虚拟机备份也至关重要。

- 44 -

H3Cloud Virtualization Manager实现了透明的定时备份和即时备份功能,会在暂停虚拟机中的应用程序之后,为正在运行的虚拟机创建快照,从而对备份工作进行集中处理,以确保文件系统的一致性。如下图所示:

H3Cloud Virtualization Manager的备份特性是一种高效而低成本的灾难恢复特性,它将给用户带来如下价值:

? 基于磁盘的备份功能,为虚拟机提供快速、简单的数据保护 ? 无需额外代理的备份,简化了部署复杂度

? 支持全自动的定时备份和手工干预的即时备份,满足不同的应用要求

4.2.1.9 完善的性能状态监控

? 基于物理服务器的性能监控

提供物理服务器CPU和内存等计算资源的图形化报表及其运行于其上的虚拟机利用率TOP 5报表,为管理员实施合理的资源规划提供详尽的数据资料。

- 45 -

物理服务器性能图形报表

? 基于虚拟机的性能监控

提供虚拟机CPU、内存、磁盘I/O、网络I/O等重要资源在内的关键元件进行全面的性能监测。

虚拟机性能图形报表

? 基于虚拟交换机的性能监控

提供虚拟机交换机上各个虚端口的流量统计与模拟面板图形化显示。

- 46 -

虚拟交换机状况监测

?

基于虚拟网卡的性能监控

提供进出虚拟机虚端口的流量的图形化实时显示。

虚拟网卡性能状况监测

- 47 -

4.3 存储资源池

目前主流的存储架构包括DAS、 NAS、 SAN,下面针对3种主流应用系统做架构分析。

直连方式存储(Direct Attached Storage - DAS)。顾名思义,在这种方式中,存储设备是通过电缆(通常是SCSI接口电缆)直接到服务器。I/O请求直接发送到存储设备。

存储区域网络(Storage Area Network - SAN)。存储设备组成单独的网络,大多利用光纤连接,服务器和存储设备间可以任意连接。I/O请求也是直接发送到存储设备。如果SAN是基于TCP/IP的网络,则通过iSCSI技术,实现IP-SAN网络。

网络连接存储(Network Attached Storage - NAS)。NAS设备通常是集成了处理器和磁盘/磁盘柜,连接到TCP/IP网络上(可以通过LAN或WAN),通过文件存取协议(例如NFS,CIFS等)存取数据。NAS将文件存取请求转换为内部I/O请求。

上述几种存储方式的优劣势分析:

主机的扩展性受到限制,主机和存DAS 费用低;适合于单独的服务器连接 储的连接距离受到限制,只能实现网络备份,对业务网络的压力较大 高性能,高扩展性;光纤连接距离远;SAN 可连接多个磁盘阵列或磁带库组成存储池,易于管理;通过备份软件,可以做到- 48 -

成本较高

Server-Free和LAN-Free备份,减轻服务器和网络负担。 安装过程简单;易于管理;利用现有的网络实现文件共享;高扩展性。 NAS 不支持数据库应用 通过以上对比可以看出SAN具有如下优点:

关键任务数据库应用,其中可预计的响应时间、可用性和可扩展性是基本要素;

SAN具有出色的可扩展性;

SAN克服了传统上与SCSI相连的线缆限制,极大地拓展了服务器和存储之间的距离,从而增加了更多连接的可能性;

改进的扩展性还简化了服务器的部署和升级,保护了原有硬件设备的投资。 集中的存储备份,其中性能、数据一致性和可靠性可以确保关键数据的安全;高可用性和故障切换环境可以确保更低的成本、更高的应用水平;可扩展的存储虚拟化,可使存储与直接主机连接相分离,并确保动态存储分区;

改进的灾难容错特性,在主机服务器及其连接设备之间提供光纤通道高性能和扩展的距离。

考虑到IP SAN的扩展性比FC SAN更加出色。我们可以在IP SAN中使用SCSI、FC、SATA、SAS等多种磁盘阵列来扩展IP SAN的容量,我们推荐使用IP-SAN存储架构。

为了达到系统的故障快速切换,本方案中配置后端共享存储,以实现动态HA和迁移,我们配置一台IP-SAN存储,这样可以将云计算平台中每个虚拟机的文件系统创建在共享的SAN集中存储阵列上。

H3Cloud虚拟机文件系统是一种优化后的高性能集群文件系统,允许多个云计算计算节点同时访问同一虚拟机存储。由于虚拟架构系统中的虚拟机实际上是被封装成了一个档案文件和若干相关环境配置文件,通过将这些文件放在SAN存储阵列上的文件系统中,可以让不同服务器上的虚拟机都可以访问到该文件,从而消除了单点故障。系统支持一台故障后,快速切换到另一台的功能,切换时间大概在0-10分钟以内。

- 49 -

存储是指虚拟机文件(含数据文件和配置文件)保存的地方。按照存储的位置可以划分为两类:本地磁盘存储和通过网络存储在远端服务器上。本地存储包括:本地目录文件、LVM逻辑存储卷、SCSI/FC存储;网络存储则包含:iSCSI网络存储、NFS网络文件系统、共享文件系统和Windows系统共享目录。这里我们选择比较典型的三种应用配置来说明: 本地目录文件、iSCSI存储和共享文件系统。

4.3.1.1 本地存储设计

服务器本地存储用于安装虚拟化平台(如H3Cloud CVK和CVM)和保存资源池的元数据。本地存储建议配置两块SAS硬盘,设置为RAID-1,通过镜像(Mirror)方式放置本地磁盘出现单点故障,以提高H3Cloud本身的可用性。

H3Cloud云计算管理平台初始安装后,会默认创建一个本地的默认存储: defaultpool,位于/vms/images目录下。

- 50 -

本文来源:https://www.bwwdw.com/article/6xgo.html

Top