基于随机Petri网的云数据中心能耗感知调度研究与性能分析

更新时间:2023-06-08 16:09:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

基于随机Petri网的云数据中心能耗感知调度研究与性能分析

摘 要:随着云计算的广泛应用,云数据中心的节能问题也获得越来越多的关注。虽然,许多研究针对云数据中心的能耗问题提出了相关的调度策略与节能技术,但很少有人关注如何有效的对云数据中心的能耗问题进行建模与性能评价。性能评价可以在云服务供应商的成本-收益与基于服务水平协议(SLA)定义的服务质量(QoS)之间找到一个合适的权衡点,又能研究虚拟化技术对云数据中心性能的影响。在本文中,在考虑资源多样性和虚拟机迁移的前提下,我们以优化能耗为目标提出了一个能耗感知虚拟机迁移算法。此外,我们还通过引入动态可扩展随机Petri网(DSSPN)对云数据中心的重要性能指标进行随机建模和性能分析。接着,我们定义了一些性能参数来评价模型中在不同运行时间和机器数量下的任务积压、吞吐量、资源利用率和能耗。最后,我们使用SPNP方针出这些性能参数的解析解。分析结果表明,DSSPN适用于建模和评价复杂的云系统,并有利于分析优化云数据中心的性能。

关键词:云计算;随机Petri网;服务质量;节能;性能评价

概述

云计算是一种按需提供服务的商业计算范式,能基于互联网为用户提供便捷、灵活的访问,进入可配臵的共享资源池(包括网络、服务器、存储、应用程序和服务)[1]。云计算的服务供应商通过部署和管理分布在世界各地的云数据中心,能直接为用户提供三种服务模式:基础设施即服务(IaaS)、软件即服务(SaaS)和平台即服务(IaaS)[2]。大数据时代的到来,使得云计算的重要底层基础设施——数据中心的规模也越来越庞大,对能源的需求也急剧增加。目前,许多研究都仅关注云数据中心的性能改进和满足用户的服务质量(QoS)需求方面,而很少重视能耗问题[3]。根据统计数据,数据中心的能源消耗耗预估达到美国总能耗的40%,在能耗上的花费也占到数据中心总运营成本的42%[4-6]。因此,提高云数据中心的能源效率在云计算的发展和应用中变得越来越重要。云供应商既需要确保自己的利润和投资回报不会因为能源成本增加而减少,又要保障用户基于服务水平协议(SLA)所定义的服务质量(QoS)需求。此外,提高能源利用率可以降低资源消耗,减少环境污染,并实现云数据中心的可持续发展。然而,如何对实现有效节能的云数据中心的资源调度问题进行建模和性能评价仍然面临着诸多挑战。

这是因为以下几点原因:(1)构成云数据中心的底层基础设施的物理资源(即PMs)是异构的,并且在地理位臵上是分布地。这意味着服务能力和能源消耗会随着资源类型而改变。(2)由于引入了虚拟化技术,云数据中心能在少量的PM上为多个用户提供多个可运行的虚拟机(VM)实例。虽然这样可以通过关闭闲臵的PM或将PM切换到较低的性能级别上(如使用DVFS技术)来降低能源消耗,但是当多个VM运行在一个PM上时,会严重降低云数据中心的性能[7]。这意味着,要确保数据中心的性能必须在节能和QoS保障之间找到一个合适的权衡点。(3)在云数据中心中,VM是可以动态迁移的,这有利于实现负载均衡,还可以避免出现热点从而降低故障率。(4)最为重要的是,云数据中心的特性(如大规模性、动态性、异构性和多样性等)使得系统性能评价越来越复杂。但是至今为止,较少有人关注如何为云环境的性能评价提供直观的模型描述和有效的分析方法。

性能评价的主要任务是研究系统配臵、系统负载和性能指标之间的相互关系。性能评价方法主要可以分为三种:测量方法、仿真方法和模型方法。通过一定的测量设备或测量程序,测量和仿真方法能直接从系统中测得各项性能指标或与之相关的数据量,然后经过一些简单的运算求出相应的性能指标[8]。Calheiros等提出了一种可扩展的仿真工具Cloudsim,以建模、仿真

和评价云计算系统的性能和应用配臵环境[9]。Cloudsim能模拟单节点和多节点云环境,现已被多个组织机构用于研究云数据中心的资源分配和节能问题。基于ISO25010中的软件质量概念,Bautista等介绍了一种云计算系统的性能测量框架(PMF)[10]。PMF通过定义需求、数据类型和评价准则来评价“集群行为”的性能。Kim等研究实时应用中VM的能量感知供应,并基于动态电压和频率调节(DVFS)技术提出了几种用于数据中心硬实时服务的能源感知VM供应方案[11]。虽然测量和仿真方法在性能评价中比较直接,但是只能适用于已经存在并运行的系统,而且需要花费较多时间。此外,这两种方法不适用于大规模复杂系统,尤其是动态变化且包含大量参数的云系统,也无法找出系统中的性能瓶颈。

为了克服这些困难,一些研究者提出了某些模型方法来分析和评价系统性能。Xia等使用基于网络的随机排队方法来分析易出错环境中可迁移云的性能,并定义了一些性能矩阵来评价不同负载和错误强度下的利用率、预期任务完成时间和任务拒绝率[2]。接着,作者还通过信任区间对比分析该方法与现实世界云系统中实验性能数据的差别。Khazaei等将云数据中心建模为一个具有单任务到达和有限任务缓冲区的M/G/m/m+r排队系统,并使用基于变换的分析模型和近似马尔可夫链来获取响应时间的分布概率、积压概率和系统中的任务数量[12]。此外,Khazaeri还将复杂的云系统划分为多个子模型,引入连续时间马尔可夫链(CTMC)来建模分析这些子系统,并使用迭代方法求出所需精度的解[12]。

与上述研究工作相比,我们主要研究云数据中心的能耗感知虚拟机迁移策略,并引入动态可扩展随机Petri网(DSSPN)来建模和评价云系统在不同运行时间和不同数量PM下的某些重要参数,如平均队列长度(能反映任务缓冲区中的数据积压)、平均吞吐量、平均能耗和资源利用率。DSSPN是一种扩展的随机Petri网(SPN),适用于分布式系统的图形建模和性能分析 [8]。它不仅能以一种直观有效的方式清晰刻画系统的动态行为,还易于发现系统的性能瓶颈和缺陷。

基于上述讨论,本文主要设计和建模分析能有效节能并提高云数据中心性能的虚拟机迁移策略,主要贡献有以下几点:

(1)我们提出了云数据中心(EAC)的体系结构框架,并抽象出它的任务调度和VM分配模型。

(2)为了提高能源利用率并确保数据中心集群的性能,本文提出了能耗感知虚拟机迁移(EAVMM)算法。

(3)基于SPN和随机回报网[14](SRN),我们提出了动态可扩展随机Petri网(DSSPN),并用DSSPN对云数据中心进行建模和性能评价。

(4)为了验证EAVMM算法的有效性与DSSPN的可用性,我们进行了实验仿真,得到不同运行时间与不同数量PM下的一些重要性能参数,如平均队列长度、平均吞吐量、平均能耗和平均资源利用率。

2 云数据中心

云作为下一代的数据中心,通过管理程序技术将节点虚拟化为虚拟机,并动态地为用户按需提供个性化资源集(如硬件、数据库、用户接口、应用逻辑等),然后通过“协商”来满足特定的服务水平协议[3]。因此,云数据中心通常被看作通过网络服务技术(如SOAP、REST等)访问的组合服务。图1说明了云数据中心数据中心的理论高级体系架构。主要包含五个实体[15]:

(1)用户/代理:世界各地的用户或代理根据各自的需求向云数据中心提交服务请求。需要注意的是,这些用户可分为两类:一类是使用已有云服务的用户;一类是在云上部署应用程序的用户。例如,一个公司可以在云上部署一个能根据访问的用户数量来改变工作负载的Web

应用程序。

(2)用户接口:用户和云数据中心交互的统一接口,主要用于Web服务的通信、访问和管理,以及Web应用程序的设计与开发。目前三种主流的Web服务实现方案为:REST、SOAP和XML RPC。

(3)服务水平协议资源分配器:为外部用户/代理和云数据中心/云服务供应商提供交互接口。它通过以下的交互机制来支持面向服务水平协议(SLA)的资源管理:

i)服务请求检查其和准入控制:该机制先提取收

图1 云数据中心的高级系统架构

到的服务请求的QoS需求,然后确认该QoS需求是否超出了资源的负荷范围(这可以避免由于有限的可用资源而导致无法完成服务请求)。接着,根据从虚拟机监视器获取的可用资源信息,以及从服务请求监测器获取的工作负载处理信息做出有效的资源分配决策。最后,为该服务请求分配虚拟机。

ii)定价:决定如何对服务请求进行收费,并通过管理计算资源的供应和需求来促进有效的服务分配。

iii)计费:通过维护服务请求的实际使用资源来计算用户所需支付的最终费用。

iv)虚拟机监视器:该机制追踪所有的可用虚拟机以及它们的资源权限。

v)能源检测器:观察虚拟机和物理机器的能源消耗,并将该信息提交给虚拟机管理器,以便做出节能资源分配决策。

vi)调度器:该机制在对应的虚拟机上执行所接受的服务请求。

vii)服务请求检测器:追踪服务请求的执行过程。

(4)虚拟机:在一台物理机器上可以根据传入的请求来动态的启动和停止多个虚拟机。因此,可以同一台物理机器上灵活的配臵各种资源划分以适应不同的服务请求需求。多个虚拟机可以在同一台物理机器上并发地运行基于不同操作系统环境的应用程序。通过不同物理机器间虚拟机的动态迁移可以有效的整合工作负载,并将不使用的资源切换到低能耗模式,或关机,或配臵到低性能模式执行(例如使用动态调频调压)以节省能源消耗。

(5)物理基础设施:作为底层的物理计算服务器为服务需求提供可以虚拟化的硬件基础设施。 3 系统模型

本文提出的云数据中心EAC是一种“绿色云”,它通过网络将数据中心联接起来为用户提供虚拟可配臵服务,可以降低大约40%的总能耗成本[16]。图2描述了云数据中心的任务调度与虚拟机分配过程。

图2 云数据中心的任务调度模型

在本文中,我们假设要建模的系统服务模式为:基础设施即服务(IaaS)[1]。系统中包括k个数据中心集群,每个集群DCi由npi个异构服务器/机器组成(如高性能计算机、工作站、机架式服务器),如图1所示。其中,k N+,i {1,…,k},npi N+,N+ = {1, 2, 3,…}。则系统中拥有的服务器总数量为:

tnp ik 1npi (1)

需要注意的是,为了便于分析,本文假设这些异构的服务器具有相同的功能,而仅是处理器(CPU)和存储器的性能参数有所不同。例如,数据中心DC1中有2台服务器PM1和PM2,PM1的性能为pc1=1000MIPS,而PM2的性能则为pc2=800MIPS,MIPS是CPU的单位。

假设每个服务器PMj上最多可同时运行mv个独立的虚拟机,符号nvj(nvj∈N+)表示目前在服务器PMj上同时运行的虚拟机个数,则系统中同时运行的虚拟机总数为:

tnv tnumj 1nvj (2)

11nvjVM1虚拟机集合为VM={VMnvj,VM12,…, VM1nv1,…,VMtnp,…,VMtnp},j {1, 2,…,tnp}。vpuljj

l分别表示服务器PMj上第l台虚拟机的处理器利用率。其中,vpulj 0,且0 lnvj 1vpuj pcj。

在给定的时间内,第j台服务器PMj的CPU利用率PPUj为:

l1PPUj lnv 1vpuj pcj,0 PPUj 1 (3)

为了便于形式化问题描述,现在做出如下假设:

(1)用户提交一个任务,云数据中心接受该请求,并将它放入等待队列。这些任务之间相互独立,且到达速率服从指数分布,平均到达速率为 。

(2)等待队列的缓冲容量为C,等待队列中的虚拟机请求按先到先服务(FCFS)的原则等候处理。虚拟机调度以时隙为单位,每个时隙长度相同,记为 T。其中,C N+, T 0。

(3)不同数据集群中的服务器是异构的,但同一个数据集群中的服务器是同构的,且每个服务器PMj的工作状态是相互独立的,即PMj可以单独关闭或打开,或切换到较低的性能服务等级(如使用DVFS技术)。

(4)每个VM都能根据到达的任务请求动态的开始或结束,并在运行时均有可能由于故障而失效。每个VM都能通过故障恢复管理单元修复到正常工作状态。假设失效率为γ ,修复率为 ,且都服从指数分布。其中,1 γ 0,1 0。

(5)当虚拟机VMlj发生故障时,在VMlj上运行的任务失败。这些未完成的任务被重新提交给等待队列,重新提交率为 ( 0),且服从指数分布。

(6)每个虚拟机VMlj(l {1, 2,…,nvj},j {1, 2,…,tnp})匀速提供服务,服务速率为 lj。注意,VMlj的性能与所在的服务器一致。也就是说,如果VMlj在服务器PMj上运行,PMj的服务速率为 j,则 lj j。

(7)每台PM上均使用动态电压和频率调节(DVFS)技术,以便在能耗和性能之间找到一个合适的权衡。每个服务器PMj均有两个服务模式,分别对应不同的服务速率。对 PMj,当n(PMj)nvj 时,PMj的服务等级为1,以正常模式提供服务。否则为节省能源消耗,服务等级降低为2,以休闲模式提供服务。其中,n(PMj)表示当前正在PMj上运行的虚拟机个数, 为控制阈值,且0< <1,详细说明见下一章。

在本文中,为了便于分析,我们仅考虑服务器的处理器能耗。这是因为:(1)在数据中心中,服务器的能耗主要是由CPU、内存、磁盘存储和网络组件部分所决定的。与其他系统资源相比,CPU占了能耗的主要部分,因此,在本章中,我们主要研究CPU的能耗和利用率;(2)在使用DVFS技术后,PM的能源消耗与CPU的利用率之间存在线性关系;(2)本文的主要目的是为了检测能耗感知虚拟机迁移策略是如何影响EAC的能源消耗的,而其余的能耗都有比较固定的标准,两者相加就可以得出整体能耗。

文献[17]和[18]的研究工作表明,服务器的能耗可通过与CPU相关的线性公式来准确描述,见公式(4)。之所以有这种线性关系,是因为DVFS仅用在CPU部分,并通过状态的数量来调节CPU的电压和频率[18-19]。此外,通过研究发现平均一台空闲服务器的能耗约为该服务器在正常工作状态下能耗的70%。因此,当服务器空闲时将其切换到休闲模式可以降低总能耗。

P(u) k Pwm (1 k) Pwm u Pwm (0.7 0.3u)

(4)

其中,Pwm表示服务器在正常工作状态下的能耗,k = 70%,u为CPU利用率。

如上所述,服务器维持峰值速率时所消耗能源要远远高于它在其他速率时的消耗。为了降低能耗,可以对虚拟机个数较多的服务器进行迁移。虚拟机迁移即能避免出现热点,又能实现服务器的负载均衡。负载均衡可以提高云的资源利用率,还能降低由于机器故障/错误所引起的任务失败率。

4 基于动态可扩展随机Petri网的随机建模

根据上文讨论,我们引入动态可扩展随机Petri网(DSSPN)来建模EAC系统的任务调度过程。DSSPN是一种扩展的SPN,它的发生规则以及状态转移与SPN类似,这里由于篇幅所限就不再详细描述[8]。图3描述了虚拟机分配和迁移的详细流程,图4刻画了虚拟机动态迁移的DSSPN分解模型。需要注意的是,调度或决策是由图3和4中所关联的可实施谓词与随机开关表示的。

图3 云数据中心虚拟机分配与迁移的DSSPN模型

t1图4 虚拟机动态迁移的DSSPN分解模型

4.1 云数据中心的DSSPN模型

云数据中心的DSSPN任务调度模型EAC为:EAC=(P, T, F, K, , TS, G, E, f, g, M0),如图3和图4所示。其中,P是图中所有库所集合;T是图中的变迁集合,由即时变迁集TI和时间变迁集TT构成,F是图中的弧集,K是库所P的容量集合, 是时间变迁的发生速率集合,TS是类型集合,G 1

是将库所或弧映射到类型的函数,E是指定类型对应值得函数,f和g分别为变迁的可实施谓词函数与随机开关函数,M0为库所P的初始标识。

EAC中各集合定义如下:

(1)库所集为:P = {pwq} { pmj, swmj, ssmj, qwmj, qsmj, serrj, sresj j∈{1, 2, …, tnp}}。

i, j∈{1,2,…,tnp},且i j }。 (2)即时变迁集为:TI = {twj, tsj, twtsj, tstwj, tij, terrj, terrj

(3)时间变迁集为:TT = {tc, s1j, s2j, trepj, tresj j∈{1, 2, …, tnp }}。

(4)弧集F以及与弧相关的G与E,见图3和图4上所示的有向弧及标注。

(5)K、 、G、E、f、g与M0的详细描述见下文。

(6)类型集为:TS={ Rk, PMj, < Rk,PMj> k∈N+, j∈{1, 2, …, tnp}}。

EAC中所包含的库所与变迁描述如下:

(1)tc:服从指数分布的时间变迁,表示用户提交的一个虚拟机分配请求,它的发生速率为 ,即任务的平均到达速率。当变迁tc发生时,有一个任务到达等待队列库所pw中。它的可实施谓词为f (tc):

f(tc):M(pwq) C (5)

(2)pwq:等待队列库所,用来缓存用户提交的任务/虚拟机分配请求,容量为C,即K(pwq) = C。例如,库所中的每个标记的类型为G(pi) = Rk(表示该标记所代表的请求的类型),该类型值为E(pwq)∈N+(表示该请求需处理任务的大小,单位为MB)。也就是说,库所中的标记属性是一个二元组<Rk, E(pwq)>。其中,k∈N+,j∈{1, 2, …, tnp}。

(3)pmi,pmj:对应服务器PMi和PMj的库所,库所中的标记数表示当前该服务器上可用的虚拟机个数,初始标识为M0(pmi) = nvi,M0(pmj) = nvj。K(pmi) = nvi,G(pmi) = PMk,E(pmi) ∈[1, nvi]。 pmj与pmi的定义类似,这里就不再复述。。

(4)twi,twj:即时变迁,与库所pmi,pmj,pwq,结合在一起为等待队列中的请求分配虚拟机,i j。通过设臵可实施谓词与随机开关来表示调度策略,具体描述见下文。

(5)qwmi,qwmj::库所中的标志表示服务器PMi和PMj在不同工作状态(正常工作状态或休闲工作状态)下运行的虚拟机个数。

(6)si,sj:时间变迁,表示服务器PMi和PMj在不同的工作状态以不同的服务速率为应用/任务提供服务,对应的服务速率分别为 i = j或 i = si,且服从指数分布。其中, i表示PMi在正常状态下的服务速率,而 si表示PMi在休闲状态下的服务速率。 j与 i的定义类似,这里就不再复述。

(7)serri,serrj:表示由于故障而需要修复的虚拟机与重新提交的任务,且K(serri) = ni,ni∈[1, M0(Pmi)]。serrj与serri的定义类似,这里就不再复述。

(8)terri,terrj:即时变迁,表示运行任务的虚拟机是否发生故障。失效率为γ,随机开关gerri为:

,if(M(serri) K(serri))gerri 0,otherwise (6)

terrj与terri的定义相同,这里就不再复述。

(9)trepi,trepj:时间变迁,表示故障的修复过程,修复率为 repi = repj = ,且服从指数分布。

(10)tij,tji:即时变迁,表示虚拟机的迁移过程,可实施谓词与随机开关描述见下文。

4.2 虚拟机动态迁移算法

云数据中心允许虚拟机在不同服务器上进行动态迁移,且仅需很短的时间,而不用暂停服务器 。但是,动态迁移会影响运行在该虚拟机上的应用程序的性能。Voorsluys William等对虚拟机动态迁移进行了实验研究,并找出了一种建模方法[19]。他们发现动态迁移过程中的性能退化和停机时间取决于运行的应用程序的行为,也就是说,在该应用程序执行期间需要使用的存储器数量[19]。虚拟机的动态迁移时间取决于该虚拟机所使用的存储器总量可用的网络带宽。本文所考虑的总目标是系统使用的能耗,因此,我们仅考虑迁移所消耗的能量。由于理节点在休眠状态下的能耗远小于正常工作状态的能耗,本文仅对处于正常工作状态的物理节点上的虚拟机进行迁移,且迁移的目的节点仅选择那些处于休闲状态的物理节点。在本文,我们提出了能耗感知虚拟机迁移(EAVMM)算法来分配、迁移云数据中心的VM,如表1所示。

图3中所描述的虚拟机分配变迁的可实施谓词与随机开关描述如下:

(1)twj:描述服务器PMj在正常工作状态下的虚拟机分配,可实施谓词为:

M(qwmj) f(twj): nvj

M(qwmj)M(qwmi) i j, nvnvji (7)

其中, 表示物理节点的上限阈值。当一个物理节点的虚拟机比值达到上限阈值时,不能在该节点上再创建新的虚拟机。

节点PM序列, PM上可同时运行的最大虚拟机数序列nv,当前

可用的虚拟机序列VM,所有物理节点的工作状态序列S,物理节

点在不同工作状态下的能源消耗率序列ER(PM(w))和ER(PM(s)),

转换阈值 ,带宽B。

2. for j=1 to |PM| do

3. countj ←PMj上正在运行的虚拟机个数;

4. if ( j 1(nvj countj) 等待队列中的请求数)

5. 虚拟机暂时不进行迁移;

6. else

7. 计算在虚拟机VMl

j上的应用在物理节点PMj上所需的能

耗ECj;

8. for i=1 to |PM| do

9. if (i j)

10. if (countj 1)nvj

11. 计算在虚拟机VMl

j上的应用在物理节点PMi上所

需的能耗ECi;

12. if ((TECl

j ECi) ECj)

13. 将虚拟机VMl

j迁移到物理节点PMi上;

14. endif

15. endif

16. endif

17. endfor

18. endif |PM|

随机开关为:

WEA(M)|,j WEA(M)gwj(M) 0,otherwise

(8)

M(qwmj)WEA(M) j nvj

M(qwm1)M(qwmtnp) min , , nvtnp nv1 (9) M(q)nvj,}j∈{1, 2, …, tnp},|WEA(M)|表示集合WEA(M)中的其中,min_wec min{(wmj

元素个数。

(2)tji:即时变迁,结合库所qwmj,pmi与pmj一起描述虚拟机的动态迁移策略。可实施谓词为:

M(qwmi) f(tji):(M(pmi) 0) nvi

M(qwmj).x min_ec ( i j, pci

M(qwmj).xM(qwmj).x M(qwmj).x ) Bpcpcij

M(qwmj).xM(qwmj).x min_ec min , , pcpc 1tnp (10) (11)

其中,i j,且i = j∈{1,2,…,tnp}。

随机开关gji (M)为:

MDP(M)|, i j j MDP(M) gij(M) 0,otherwise

MDP(M) j

M(qwmj).x min_ec pci (12)

M(qwmi).xM(qwmi).x M(qwmi).x i j, Bpcjpci (13)

其中,|MDP(M)|表示集合MDP(M)中的元素个数,i = j∈{1,2,…,tnp}。tij表示虚拟机从服务器PMi迁移到PMj,与tji类似就不再复述。

5 性能分析

根据上文所述,我们在这一章中将基于稳态概率,进一步分析EAMC'模型的性能和能耗。与其他建模方法相比,如马尔可夫决策过程,DSSPN可以使用Petri网工具(如SPNP)中继承的功能实现自动推导出状态的稳态概率,而不需要再使用随机数学公式进行计算[20]。如表2所示,即时仅有2台服务器的可迁移云的状态也能达到几百甚至上千个。

可达状态数

发生变迁数 283 923 569 1977 1088 3928 1594 5842

(1)在时刻t,PMj上正在运行的虚拟机个数nwvj (t)

nwvj(t) M(qwmj(t)) (14)

其中,M (qwmj(t))表示在时刻t库所qwmj的标记个数。

(2)在时刻t,PMj上空闲的虚拟机个数nsvj (t)

nsvj(t) M(pmj(t)) (15)

其中,M (pmj(t))表示在时刻t库所qwmj的标记个数。

(3)在时刻t,系统的平均队列长度AQL(t)

AQL(t) ty 0M(pwq(y)) (16)

其中,M (pwq(y))表示在时刻y库所pwq中的标记个数。

(4)在时刻t,系统的平均吞吐量ATP(t)

分析系统的吞吐量,可以利用服务器的服务变迁饱和时,标记在库所pwq中的堆积特性来分析。这与等待队列的容量,以及服务器的服务速率及最大可用虚拟机数相关。

ATP(t) ty 0 tnpj 1nwvj(y) (17)

(5)在时刻t,服务器PMj以休闲工作状态服务的平均概率ASRj(t):

ASRj(t) ty 0P(M(qwmj(y)) ( nvj)) (18)

其中,P(M (pwq(y))>C)表示在时刻y库所pwq中标记数大于等待队列容量的概率C。

(6)在时刻t,服务器PMj的利用率URj(t)为

URj(t) M(qwmj(t))nvj (19)

(7)由公式(5)可以得出,在时刻t系统的平均能耗率AECR(t)

AECR(t) URj(y)) Pwmj ty 0 j 1(0.7 0.3

t tnptnp (20)

其中,Pwmj表示服务器PMj的能耗,单位为瓦特(Watts)。

6 案例研究及仿真

在这一小节,我们提供了一个案例来研究DSSPN对我们提出的云数据中心框架的适用性。我们在使用Intel i5-4210多核处理器的便携式电脑上实现云数据中心的一个案例,并使用SPNP平台来自动推导出EAC模型的解析解,如图5到8所示。我们使用文献[21]中对处理器的规范和说明,如表3所示。为了便于分析,我们将标准化服务速率与处理器能耗放大10倍。

1

2

3

4 0.3333 0.5000 0.6666 1.0000 0.279 0.390 0.570 0.925

系统中的服务器数tnp从1到4,等待队列容量C从30到50,状态转换开关 为0.5。任务请求到达率为20,出错率为0.2,故障修复率为0.1,失败任务重新提交率为0.3,且均服从指数分布。系统中服务器类型为2类,一类最多能同时运行3个虚拟机,服务等级为2和4,且服从指数分布;

另一类最多能同时运行2个虚拟机,服务等级为1和3,且服从指数分布。

图5 不同服务器个数下的平均队列长度

图5说明了系统中的平均队列长度是如何随着运行时间t而变化的。在服务器个数为1和2时,系统中任务的到达速率要大于系统的服务速率,因此,队列长度随着运行时间t而不断增加,并逐步趋于等待队列的容量。而当服务器个数为3和4,且0 t 1时,等待队列中的任务数要小于系统的服务能力,此时等待队列中没有积压的任务请求。图5(b)说明,当前参数设臵下,3台服务器就能满足系统需求,而几乎不会有任务积压。

图6 不同服务器个数下的平均吞吐量

图6说明了在不同时刻t系统中服务器个数对系统平均吞吐量的影响。在等待队列容量为30,到达速率为20个/秒的情况下,且0 t 1时,服务器个数为1和2时,系统吞吐量受系统处理能力的限制;而当服务器个数为3和4的时候,则说明,系统的处理能力完全能满足用户的需求,而不需要等待。 图6进一步说明了,当前需求下,3台服务器和4台服务器的系统平均吞吐量几乎一样。

图7 不同服务器个数下的平均能耗

图7说明了在不同时刻t系统中服务器个数对系统平均能耗的影响。当0 t 1时,系统的平均能耗随着运行的稳定逐步趋向于一个常量。随着服务器个数的增加,系统的平均能耗也越高。当系统中仅包含1台或2台服务器时,系统以峰值为用户提供服务,因此,系统的平均能耗基本稳定,变化不大。而当服务器个数为3或4的时候,每台服务器的利用率随着时间的增长而逐步稳定。系统中包含3台服务器时,服务器平均以55.46%的概率以休闲状态为用户提供服务;当系统中包含4台服务器是,服务器平均以60.49%的概率以休闲状态为用户提供服务。

图8 不同服务器个数下的平均资源利用率

图8说明了在不同时刻t系统中服务器个数对系统平均资源利用率的影响。当0 t 1时,只有1台服务器是资源利用率最高,最高可以达到98.39%;而当有两台服务器时,平均资源利用率约为48%,服务器有56.75%的概率以等级1和2提供服务。当服务器个数为3时,平均资源利用率约为69.04%,服务器有18.48%的概率以等级1和2提供服务。当服务器个数为4时,平均资源利用率约为78%,服务器仅有7.38%的概率以等级1和2提供服务。

结束语

本文基于DSSPN提出了一个全面的随机模型来分析云数据中心的性能和能源效率。“云”中的服务器使用DVFS来调节CPU在不同负载下的服务速率,从而降低系统能耗。本文提出的EAC模型建模了工作负载、虚拟机故障和恢复、服务器个数、虚拟机动态迁移以及DVFS调节策略之间的逻辑关系,然后提出了能耗感知虚拟机迁移(EAVMM)算法,并通过设臵EAC模型中变迁的可实施谓词与随机开关来建模EAVMM算法。最后,通过SPNP平台的仿真得到研究案例的性能参数解析解,进一步分析了系统的某些性能,如平均等待队列长度(即数据积压)、系统平均吞吐量和系统平均能耗。实验结果表明,与其他建模分析方法相比,DSSPN更加直观、便捷,即使系统状态达到上千个,仍然可以仿真出解析结果,而不需要用户进行大量复杂的分析与计算。

目前,对虚拟云数据中心的研究才刚刚起步,未来的研究工作将从以下几个方面进一步展开:

(1)本文在研究云数据中心数据中心时,仅简单提出了它的概念物理架构,并没有详细描述它的性质与运行机制,也没有考察网络体系结构对虚拟数据中心的影响。因此,下一步将考察云数据中心基于网络的详细体系架构,以及运行机制。

(2)本文在对研究云数据中心数据中心进行算法研究与性能评价时,仅从能耗和负载均衡的角度考虑调度算法,而没有考虑其他因素对它的优化调度的影响,因此,下一步将考虑任务多样性前提下,进行其他优化目标对云数据中心算法进行研究。

(3)由理论推导的算法性能分析结果与算法在实际系统中运行结果是有偏差的。例如,在本文中研究的虚拟机迁移策略,远远没有实际系统中的虚拟机迁移复杂,下一步工作中,将尽可能从现实数据中心的迁移策略出发,研究虚拟迁移对系统性能的影响。

本文来源:https://www.bwwdw.com/article/fmf1.html

Top