云计算
更新时间:2024-04-13 19:52:01 阅读量: 综合文库 文档下载
1、虚拟化技术在云计算中的哪些地方发挥了作用? 答:虚拟化是支撑云计算的重要技术基石,云计算中所有应用的物理平台和部署环境都依赖虚拟平台的管理、扩展、迁移和备份,各操作都通过虚拟化层次完成。
服务器层面:将服务器虚拟化,它是将底层物理设备与上层操作系统、软件分离的一种去耦合技术,它将硬件、操作系统和应用程序一同装入一个可迁移的虚拟机档案文件中。虚拟化通过其管理软件将多个物理设备纳入统一的资源池进行管理,从而增强了物理设备和物理设备之间的耦合性。在单一物理服务器上可同时运行多个虚拟机,同时虚拟机之间相互隔离,以提高资源利用率,降低能耗,实现服务器的共享和隔离。虚拟机可以根据其需求弹性增加或减少其分配的硬件资源,提高资源配置的灵活性,以实现资源弹性。可实现将高负载节点中的某些虚拟机实时迁移到低负载的节点,把多个低负载的虚拟机合并到一个物理节点,并将多余的空闲物理节点关闭,以提高资源的使用效率,使负载达到均衡,从而使上层应用的性能得到了保障,同时还达到了减少能耗的目的。
存储层面:将存储虚拟化,指对存储硬件资源进行抽象化的表现,通过将一个或多个目标服务或功能与其它附加的功能集成,统一提供有用的全面功能服务。虚拟化是作用在一个或者多个实体上的,而这些实体则是用来提供存储资源或服务,存储虚拟化是一种贯穿于其中,用于简化本来可能会相对复杂的底层基础架构的技术。存储虚拟化的思想是将资源的逻辑映像与物理存储分开,从而为系统和管理员提供一幅简化、无缝的资源虚拟。同时还使得每个虚拟机都是在被分配在划定的云计算资源模块中工作,内存、磁盘等和数据安全密切相关的存储资源相互之间实现了资源隔离,虚拟机中的数据与信息形成相对独立的资源,保证了数据的隔离性和安全性。
网络层面:将网络虚拟化,网络虚拟化能使不同需求的用户组访问同一个物理网络,但逻辑上却进行一定程度的隔离,使其保持相对的独立性,以确保网络的安全使用。通过网络虚拟化技术可把多个 闭的用户组设置在单一物理基础设施上,更能确保整个网络保持高度的实用性、安全性、可管理性和可扩展性。
2、服务器虚拟化、存储器虚拟化和网络虚拟化有哪些实现方式? 答:(1)服务器端虚拟化在服务器层可以很方便的实现存储的集中管理,因为每台服务器都可以连通到所有的存储设备,如果进行了访问授权则每台服务器都可以使用所有的存储空间,现在只需要在服务器上管理好这些空间就可以。最简单的方案是使用服务器操作系统的功能,比如利用WINDOWS系统的动态卷功能,可以将多台存储设备上的空间虚拟映射成一个空间,这样就轻松的实现了多存储设备的虚拟化。当然这种方式比价简单,对服务器的性能也有较大影响。如果有较高要求,则可以使用第三方厂商的软件,比较著名有Symantec的Volume Manager。 (2)有三种主要的存储虚拟化方法:基于主机的虚拟存储;基于存储设备的虚拟存储;基于网络的虚拟存储。基于主机的虚拟存储依赖于代理或管理软件,它们安装在一个或多个主机上,实现存储虚拟化的控制和管理。基于存储设备的存储虚拟化方法依赖于提供相关功能的存储模块。如果没有第三方的虚拟软件,基于存储的虚拟化经常只能提供一种不完全的存储虚拟化解决方案。许多基于设备的虚拟化提供商也提供附加的功能模块来改善系统的整体性能,能够获得比标准操作系统更好的性能和更完善的功能,但需要更高的硬件成本。但是,基于设备的方法也继承了基于主机虚拟化方法的一些缺陷,因为它仍然需要一个运行在主机上的代理软件或基于主机的适配器,任何主机的故障或不适当的主机配置都可能导致访问到不被保护的数据。同时,在异构操作系统间的互操作性仍然是一个问题。
(3)网络虚拟化是通过使用openvswitch虚拟交换机,搭建openstack平台,通过netrun plugin到平台上。允许远程用户访问组织的内部网络,就像物理上连接到该网络一样。网
络虚拟化可以帮助保护 IT 环境,防止来自 Internet 的威胁,同时使用户能够快速安全的访问应用程序和数据。
3、讨论桌面虚拟化的实现和作用
答:实现:目前有两种高水平的部署HVD的方式。第一种模式通常叫做“一对一”的方式,第二种是“一对多”的方式。
一对一的方式是每一个用户都有自己的在数据中心运行的完整的虚拟机。这种方法被认为是完整的桌面(包括所有的应用程序)都集中地存储和执行,而不是在物理台式电脑或者笔记本电脑/上网本等设备上本地运行。这种模式已经被目前的许多机构采用,其方法是物理向虚拟的转换,这样,一个用户现有的物理台式电脑就应用到了虚拟世界,所有以前的物理操作系统和相关的应用程序现在实际上都从数据中心运行。
第二种模式稍微复杂一些,因为它假设有一个中心的“黄金镜像”,所有的“用户”虚拟桌面都以它为基础。接下来,每一个“用户”都有某种形式的不同的硬盘存储从初始化的黄金镜像(特别是对于当前的用户环境)以来的所有的变化。这些项目合在一起的组成用户的个人工作环境。这个环境是,企业只需要容纳少量的能够集中使用补丁和管理的黄金镜像。这种方法不仅能够让企业能够减少桌面财产的管理成本,而且还能够通过显著减少存储的需求而降低交付在数据中心中的桌面的成本。 作用:(1)减少管理时间。桌面虚拟化的最大好处是集中配置客户端计算机需要的应用程序。网络管理员只需要在服务器上即可管理所有应用程序,可以加强对应用软件和补丁管理的控制,不必再到每个用户的计算机上进行管理。
(2)更好的管理应用程序补丁。网络管理员只需在服务器上安装并调试应用程序更新后,所有客户端计算机即可使用新版本,从而降低了部署时间、难度以及工作强度。
(3)降低应用程序和其他软件的冲突。客户端计算机往往安装的软件比较多,部署新应用程序时可能会造成冲突或故障。而在服务器端集中部署,完全避免这些情况。
(4)提高客户端计算机的执行效率。用户在运行桌面虚拟化程序时,在客户端计算机上会加载任何DLL文件,所有的计算都是在服务器中完成,客户端仅显示结果,并不运行应用程序。应用程序可以使用客户端的本地资源,并没有永久性安装在客户端上带来的开销问题。 (5)应用程序安装在服务器上,因此,对客户端计算机硬件没有要求,即使配置较低也能运行,从而降低客户端计算机硬件投资。
(6)支持并发运行。桌面虚拟化技术允许用户在多台计算机上同时运行同一个应用程序,而不是分发给所有的用户。
(7)发布应用软件,而不是分发整个桌面环境。可以将某个应用程序发给某个用户,而不是分发给所有的用户。
(8)发布应用程序RDP链接。在Windows SP3和Windows Vista/2008系统中直接运行远程桌面服务器创建的RDP文件,即可执行远程桌面服务器上的应用程序。 4、微软云计算包含哪几个部分?每部分的作用是什么? 答:(1)、Windows Azure:云计算服务的操作系统,也是云计算的基础服务层,主要从事虚拟化计算资源管理和智能化任务分配;(2)、SQL Azure:云中的数据库,SQL Azure运行云计算的关系数据库服务,是一种云存储的实现,并提供网络型的应用程序数据存储的服务;(3)、Windows Azure Platform AppFabric:基于 Web的开发服务,可以把现有应用和服务与云平台的连接和互操作变得更为简单,AppFabric作为中间件层,起到连接非云端程序与云端程序的桥梁的功能,提供了两大服务,服务总线和访问控制。
5、Windows Azure存储服务提供了几种类型的存储方式?阐述每种存储方式主要存储 对象。
答:三种。(1)、Blob(Binary large objects bytes):每个blob都有自己的URI,作为唯一确定这个blob的地址。在使用Blob时,需要先通过storage account创建一个或多个“container”,其中每个container都可以包含一个或者多个blob。主要用来存储影像,视频等等;(2)、Table:可以通过ADO.NET Data Services或者LINQ来进行访问,与blob相同,通过http协议。这里的Table里面每个Entity可以有不同的属性,换言之,Windows Azure Table是没有schema的。主要用于数据的存储访问;(3)、Queue :Queue中每条消息长度最大为8KB,当Web Role向Queue中写入一个消息后,Worker Role读取Queue中消息时,Queue中的消息会在一段时间(默认30s)不可见,但并不会被自动删除,用户需要处理完成之后显示的手动删除该消息。对于消息的处理顺序没有规定,并且不强制规定每个消息只能够被处理一次。主要用于Windows Azure不同部分的通信,例如Web Role与Worker Role之间的消息传递。
6、简述SQL Azure和SQL Server的相同点和不同点。
答:相同点:二者都是基于微软的服务平台,为人们提供数据存储、读取、恢复和构建的作用。 不同点:(1)、SQL Server在服务提供方面,一般情况是由数据库管理员或IT部门来准备和配置所需的硬件和软件;SQL Azure在服务提供方面的这些任务都由SQL Azure的服务提供程序来完成。(2)、SQL Server Transact-SQL语句可以通过参数指定文件组或物理文件的路径;SQL Azure不支持这些类型的参数,它们依赖于物理配置。(3)、SQL Azure采用了更先进的架构设计,由微软基于云进行托管,提供的是可扩展、多租户、高可用的数据库服务;SQL Server则提供更加基础和稳定的基础层服务。 7、分析比较Hadoop的优缺点 答:Hadoop的主要优点:
Hadoop集群的扩展性是其一大特点,Hadoop可以扩展至数千个节点,对数据持续增长,数据量特别巨大的需求很合适。 2. Hadoop的成本是其另一大优势,由于Hadoop是开源项目,而且不仅从软件上节约成本,硬件上的要求也不高。目前去IOE潮流风行,低成本的Hadoop也是一大推手。3. Hadoop生态群活跃,其周边开源项目丰富,HBase, Hive,Impala等等基础开源项目众多。 Hadoop的不足之处:
全量场景,任务内串行2.重吞吐量,响应时间完全没有保证3. 中间结果不可见,不可分享4.单输入单输出,链式浪费严重5. 链式MR不能并行6. 粗粒度容错,可能会造成陷阱7. 图计算不友好8. 迭代计算不友好。
8、hadoop里有哪些机制 解决了哪些问题?
答:Hadoop的核心机制是通过HDFS文件系统和MapReduce算法进行存储资源、内存和程序的有效利用与管理。然后Hadoop还包括的项目:mapreduce分布式处理模型;HDFS分布式文件系统;pig数据流语言和运行环境;hive分布式按列存储的数据仓库;主要解决了海量数据的存储、分析和学习问题,因为随着数据的爆炸式增长,一味地靠硬件提高数据处理效率及增加存储量,不仅成本高,处理高维数据的效率也不会提高很多,遇到了瓶颈了,hadoop的搭建只需要普通的pc机,它的hdfs提供了分布式文件系统,mapreduce是一个并行编程模型,为程序员提供了编程接口,两者都屏蔽了分布式及并行底层的细节问题,用户使用起来简单方便。
9、HDFS有哪些保障可靠性的措施?
答:HDFS的主要设计目标之一就是在故障情况下也能保证数据存储的可靠性。HDFS具备了
较为完善的冗余备份和故障恢复机制,可以实现在集群中可靠地存储海量文件。所谓冗余备份,就是多准备一份或几份,以备不时之需。硬件错误是常态而不是异常。错误检测并快速自动恢复是HDFS的最核心设计目标流式数据访问。运行在HDFS上的应用主要是以流式读为主,做批量处理;更注重数据访问的高吞吐量。超大规模数据集。HDFS的一般企业级的文件大小可能都在TB级别或者PB级别,支持大文件存储,而且提供整体上高的数据传输带宽,一个单一的HDFS实例应该能支撑数以千万计的文件,并且能在一个集群里扩展到数百个节点。简单一致性模型。HDFS的应用程序一般对文件实行一次性读写、多次读的访问模式。移动计算比移动数据更简单。对于大文件来说,移动数据比移动计算的代价要高。操作海量数据时效果越加明显,这样可以提高系统的吞吐量和减少网络的拥塞。
10、简单存储服务与传统文件系统有哪些区别?
文件系统是操作系统用于明确磁盘或分区上的文件的方法和数据结构,即在磁盘上组织文件的方法。也指用于存储文件的磁盘或分区,或文件系统种类。操作系统中负责管理和存储文件信息的软件机构称为文件管理系统,简称文件系统。 Amazon S3(简单存储服务)系统是构架在Dynamo之上的,它采取的并不是传统的关系数据库存储方式。这么做主要有两个原因:一方面是为了使文件操作尽量简单、高效;另一方面对于一个普通的用户来说最常用的操作是存储和读取数据,传统的关系数据库最擅长的查询在此无用武之地,使用关系数据库只会增加系统的复杂性。S3为了保证用户数据的一致性而采取的一种折中手段,即在数据被充分传播到所有的存放节点之前返回给用户的仍是原数据。 11、如何理解传统数据库在可扩展性方面的能力较弱?
答:SQL数据库是关系型,其存储的大部分都是存在关系的数据内容。一旦将这些数据记录分割到多台服务器,你需要维护这些关系,并且需要在客户端重建这些关系,因此分片也同时抹杀了关系型数据库最大的优点。 从库技术是最好扩展SQL数据库的选项,即横向扩展了读,而且可以做到对上层的透明化。因此,许多大型的MySQL应用都使用了主从同步复制。但是,这仍然有很多的限制。由于只有主库提供写服务,因此在写负载很重的场景里主库将成为系统的瓶颈。这违反了第三点标准:系统存在单点。不仅是在主库宕机的时候,当你需要对服务器进行维护的时候,这都成为了问题。将只读的从库提升为主库可以使尽快恢复服务,但是这种切换需要系统管理员的关注和动手。 同时,从库对读性能具备了水平扩展能力,但是对于写和存储容量而言作用不大什么没有什么扩展。水平扩展本应该同时提高读写负载和数据存储容量,就像RAID一样,加上更多的磁盘就可以拥有更大的存储空间。但是提供只读服务的从库是对数据的完全拷贝,因此仍然存在数据存储在容量上的天花板。
12、NoSQL数据库是如何解决可扩展性问题的?
可以水平扩展:通过增加更多的数据库服务器来扩展存储容量。
扩展对应用系统时透明的:应用系统的业务逻辑不受数据库扩展的影响。
没有单点失效的问题:不会因为某台数据库服务器的当机,导致整个系统崩溃。 根据以上标准,硬件世界种的RAID5磁盘阵列提供了真正的可扩展性: 我们可以应用4个盘、8个盘、20个盘的RAID5来提高存储容量和性能。
应用系统把RAID磁盘整列当作一个单一设备,它并不关心数据是如何被分片存储在多个磁盘上的。我们可以取出一个磁盘,RAID系统将继续运转如常。替换磁盘,它还能自动重建磁盘内容。以上所发生的一切并不需要应用系统的参与。
下面我们来看一下关系数据库用到的几个处理可扩展性问题的技术,看看为什么它们无法满足以上标准。
一个扩展数据库的办法是购买更大容量的设备。这就是通常所说的“垂直扩展”。
13、Google云计算技术包括那些内容?
Google文件系统GFS、分布式计算机编程模型MapReduce、分布式锁服务Chubby、分布式结构化数据表Bigtable、分布式存储系统Megastore、分布式监控系统Dapper、海量数据的交互式分析工具Dremel,以及内存大数据分析系统PowerDrill等。
14、当前主流分布式文件系统有哪些?各有什么优缺点? 当前主流分布式文件系统有RedHat的GFS(Global File System)、IBM的GPFS、Sun的Lustre等。RedHat的GFS优点:以本地文件系统的形式出现。多个Linux机器通过网络共享存储设备,每一台机器都可以将网络共享磁盘看作是本地磁盘,如果某台机器对某个文件执行了写操作,则后来访问此文件的机器就会读到写以后的结果。可以根据对性能或是可扩展性,或者以经济性多个原则进行不同方案的部署。
缺点:后来访问此文件的机器就会读到写以后的结果。
IBM的GPFS优点:它保证在资源组内的 所有节点可以并行访问整个文件系统;而且针对此文件系统的服务操作,可以同时安全地在 使用此文件系统的多个节点上实现。 GPFS 允许客户共享文件,而这些文件可能分布在不同节点的不同硬盘上;它提供了许多标准的 UNIX 文件系统接口,允许应用不需修改或者重新编辑就可以在其上运行。 Sun的Lustre优点:只对原数据管理器MDS提供容错解决方案。
缺点:对于具体的数据存储节点OST来说,依赖其自身来解决容错的问题。
15、GFS采用了哪些容错措施来确保整个系统的可靠性? (1),Master容错
Master上保存了GFS的三种元数据:1、明命名空间;2、Chunk与文件名的映射表;3、Chunk副本的位置信息,每一个Chunk默认有三个副本。
当Master发生故障时,在磁盘数据保存完好的情况下,可以迅速恢复以上元数据。为了防止Master彻底死机的情况,GFS还提供了Master远程的实时备份,这样在当前的GFS Master出现故障无法工作的时候,另外一台GFS Master可以迅速接替其工作。 (2),Chunk Server容错
GFS采用副本的方式实现Chunk Server的容错,当读取一个Chunk副本时,Chunk Server会将读取的数据和校验和进行比较,如果不匹配,就会返回错误,使Client选择其他Chunk Server上的副本。
16、MapReduce与传统的分布式程序设计相比有何优点?
答:与传统的分布式程序设计相比,MapReduce封装了并行处理、容错处理、本地化计算、负载均衡等细节,还提供了一个简单而强大的接口。通过这个接口,可以把大尺度的计算自动地并发和分布执行,使编程变得非常容易。另外,MapReduce也具有较好的通用性,大量不同的问题都可以简单地通过MapRudeuce来解决。
17、Chubby的设计目标是什么?
答:高可用性和高可靠性。这是系统设计的首要目标,在保证这一目标的基础上再考虑系统的吞吐量和存储能力。
高扩展性。将数据存储在价格较为低廉的RAM,支持大规模用户访问文件。 支持粗粒度的建议性锁服务。提供这种服务的根本目的是提高系统的性能。
服务信息的直接存储。可以直接存储包括元数据、系统参数在内的有关服务的信息,而不需要再维护另一个服务。
支持通报机制。客户可以及时地了解到事件的发生。
支持缓存机制。通过一致性缓存将常用信息保存在客户端,避免频繁地访问主服务器。
18、Paxos算法在Chubby中起什么作用?
答:选择一个副本成为协调者(Coordinator)。
协调者从客户端提交的值中选择一个,然后通过一种被称为accept的消息广播给所有的副本,其他副本收到广播之后,可以选择接受或者拒绝这个值,并将决定结果反馈给协调者。 一旦协调者收到大多数副本的接受消息后,就认为达到了一致性接着协调者向相关的副本发送一个commit消息。
19、阐述Bigtable的数据模型和系统结构? 答:数据模型:Bigtable是一个分布式多维映射表,表中的数据通过一个行关键字(Row Key)、一个列关键字(Column Key)以及一个时间戳进行索引。Bigtable对存储在其中的数据不做任何解释,一律看做字符串,具体数据结构的实现需要用户自行处理。
系统结构: Bigtable主要有三个部分组成:客户端程序库、一个主服务器和多个子表服务器。客户访问Bigtable服务时,首先要利用其库函数执行Open()操作来打开一个锁,锁打开以后客户端就可以和子表服务器进行通信了。
20、分布式存储系统Megastore的核心技术是什么? 核心技术是复制,一种介于传统的关系型数据库和NoSQL之间的存储技术,尽可能的到达高可用性和高可扩展性的统一,Megastore是谷歌一个内部的存储系统,它提供快速读与快速写的机制。
它的底层数据存储依赖Bigtable(是非关系型数据库,是一个稀疏的、分布式的、持久化存储的多维度排序Map。Bigtable的设计目的是快速且可靠地处理PB级别的数据,并且能够部署到上千台机器上。),也就是基于NoSql(泛指非关系型的数据库)实现的,但是和传统的NoSql不同的是,它实现了类似RDBMS的数据模型(便捷性),同时提供数据的强一致性解决方案(同一个datacenter,基于MVCC的事务实现),并且将数据进行细颗粒度的分区(这里的分区是指在同一个datacenter,所有datacenter都有相同的分区数据),然后将数据更新在机房间进行同步复制 (这个保证所有datacenter中的数据一致)。
Megastore的数据复制是通过paxos进行同步复制的,也就是如果更新一个数据,所有机房都会进行同步更新,因为使用paxos进行复制,所以不同机房针对同一条数据的更新复制到所有机房的更新顺序都是一致的.
21、大规模分布式系统的监控基础架构Dapper关键技术是什么?
关键性技术是通过轻量级的核心功能库跟二次抽样技术来实现应用透明层。
将Dapper的核心监控实现限制在一个通用线程、控制流和RPC代码库组成的小规模库基础上。其中关键代码基础是基本RPC、线程和控制流函数库的实现,主要功能是实现区间创建,抽样和在本地磁盘上记录日志。
Dapper最初是为了追踪在线服务系统的请求处理过程。当请求处理发生异常时,需要快速发现问题,并准确定位到是哪个环节出了问题,这是非常重要的,Dapper就是为了解决这样的问题。
对系统行为进行跟踪必须是持续进行的,因为异常的发生是无法预料的,而且可能是难以重现的。同时跟踪需要是无所不在,遍布各处的,否则可能会遗漏某些重要的点。基于此Dapper有如下三个最重要的设计目标:低的额外开销,对应用的透明性,可扩展。同时产生的跟踪
数据需要可以被快速分析,这样可以帮助用户实时获取在线服务状态。
22、Google App Engine 提供了哪些服务?
答:为开发者一体化的可自动升级的在线应用服务。提供对JPEG和PNG格式的图像进行缩放、裁剪、旋转和翻转等操作。提供电子邮件服务。提供高性能的内存键值缓存,可以使用应用程序的实例来访问这个缓存。Google App Engine的功能和账号是集成的,因此应用程序可以让用户使用他们自身的Google账号登录。Google App Engine提供了一个强大的分布式的数据存储服务,该服务包括查询引擎、事务功能等功能,并且该数据库规模可以随着访问量的上升而扩大。
23、Google App Engine的沙盒对开发人员进行哪些限制?
答:1.用户的应用程序只能通过Google App Engine提供的网址抓取API和电子邮件服务API来访问互联网中其他的计算机,并且其他计算机如请求与该应用程序相连接,只能在标准口上通过HTTP或HTTPS进行。 应用程序无法对Google App Engine的文件系统进行写入操作,只能读取应用程序代码上的文件,并且该应用程序必须使用Google App Engine的Data Store数据库来存储应用程序运行期间持续存在的数据。
应用程序只有在响应网络请求时才运行,并且这个响应时间必须极短,在几秒之内必须完成。与此同时,请求处理的程序不能在自己的响应发送后产生子进程或执行代码。 分布式文件系统通常指C/S架构或网络文件系统,用户数据没有直接连接到本地主机,而是存储在远程存储服务器上。NFS/CIFS是最为常见的分布式文件系统,这就是我们说的NAS系统。姬骇灌较弑记鬼席邯芦分布式文件系统中,存储服务器的节点数可能是1个(如传统NAS),也可以有多个(如集群NAS)。对于单个节点的分布式文件系统来说,存在单点故障和性能瓶颈问题。除了NAS以外,典型的分布式文件系统还有AFS,以及集群文件系统(如Lustre, GlusterFS, PVFS2等)。
24、如何理解传统数据库子可扩展性方面的能力较弱? (1)、如果传统数据库您指的是关系数据库的话,那主要是因为他们管理有结构数据,特点是设计维护要按照更严格的规范做,速度快,护麻烦。 (2)、扩展时不能破坏原有结构,修改结构后有重构数据。 (3)、大数据处理是同时存三份、且只增加、修改不删除。相当于存储备份同时做。扩展容易,廉价的硬件是就可实现。
25、NoSQL数据库是如何解决可扩展性问题的?
答:传统的SQL数据库满足CAP原则(一致性(Consistency)、可用性(Availability)、分区容忍性(Partition Tolerance))的C和A,所以在P方面很弱,进而导致传统数据库在可扩展方面,面临很多问题。NoSQL数据库满足CAP原则的A和P,所以在C比较弱,进而使得非关系数据库无法满足ACID要求。NoSQL数据库最大的优点是非常高的可扩展性,可以通过增加服务器的数量不断提高存储规模,具有很强的并发处理能力,但缺乏数据一致性保证。
26、微软云计算平台包含几个部分?每部分的作用是什么? 计算服务:为在Azure平台中运行的应用提供支持 存储服务:用来存储二进制和结构化的数据 Fabric 控制器:部署、管理和监控应用
内容分发网络CDN:通过维持世界各地数据缓存副本,提高全球用户访问Windows Azure存储中的二进制数据的速度
Windows Azure Connect:在本地计算机和Windows Azure之间创建IP级连接
Windows Azure存储服务提供了几种类型的存储方式?阐述每种存储方式主要存储对象。 Windows Azure提供云存储服务 1)本地应用云存储 2)托管应用云存储
本地或者托管应用能够直接访问Widows Azure存储,访问速度比访问本地存储慢,但可以使存储变得更便宜、更具有可伸缩性、更可靠
27、分析比较Hadoop的优缺点。 答:Hadoop的主要优点:
Hadoop集群的扩展性是其一大特点,Hadoop可以扩展至数千个节点,对数据持续增长,数据量特别巨大的需求很合适。Hadoop的成本是其另一大优势,由于Hadoop是开源项目,而且不仅从软件上节约成本,硬件上的要求也不高。目前去IOE潮流风行,低成本的Hadoop也是一大推手。
Hadoop生态群活跃,其周边开源项目丰富,HBase, Hive,Impala等等基础开源项目众多。 高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖;
高效性。Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。高容错性。Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配。 Hadoop的缺点:
不适合低延迟数据访问。 无法高效存储大量小文件。
不支持多用户写入及任意修改文件。
4、采用Java实现。Java的IO处理虽然没有性能瓶颈,但是对于CPU密集型的任务是一个噩耗。这点可以通过对比HBase和Hypertable两个开源的Bigtable实现来做初步的验证。 5、 开源项目。开源本身是一柄双刃剑,它方便了大多数人,但是对于一个有一定规模的公司,项目发展方向的把握,技术保密,技术支持等都是采用Hadoop这种开源项目必须考虑的问题。另外,Hadoop作为一个比较新的项目,性能和稳定性的提升还需要一定时间。
28、Hadoop里有哪些机制?解决了哪些问题?
答:Hadoop的核心机制是通过HDFS文件系统和MapReduce算法进行存储资源、内存和程序的有效利用与管理。然后Hadoop还包括的项目:
mapreduce分布式处理模型;HDFS分布式文件系统;pig数据流语言和运行环境;hive分布式按列存储的数据仓库;HBase,ZooKeeper,Sqoop
29、HDFS有哪些保障可靠性的措施?
答:HDFS具备了较为完善的冗余备份和故障恢复机制,可以实现在集群中可靠地存储海量文件。
冗余备份:每个文件存储成一系列数据块(Block),默认块大小为64MB(可配置)。为了容错,文件的所有数据块都会有副本(副本数量即复制因子,可配置)。
副本存放:采用机架感知(Rack-aware)的策略来改进数据的可靠性、可用性和网络带宽的利用率。
心跳检测:NameNode周期性地从集群中的每个DataNode接受心跳包和块报告,收到心跳包说明该DataNode工作正常。
安全模式:NameNode周期性地从集群中的每个DataNode接受心跳包和块报告,收到心跳包说明该DataNode工作正常
数据完整性检测:系统启动时,NameNode会进入一个安全模式。此时不会出现数据块的写操作
空回收:文件被用户或应用程序删除时,先把它移动到/trash目录里;只要还在这个目录里,文件就可以被迅速恢复
元数据磁盘失效:NameNode可以配置为支持维护映像文件和事务日志的多个副本,任何对映像文件或事务日志的修改,都将同步到它们的副本上
快照:快照支持存储某个时间的数据复制,当HDFS数据损坏时,可以回滚到过去一个已知正确的时间点。HDFS目前还不支持快照功能
30、MapReduce模型适合(不适合)那些环境?
答:MapReduce处理的任务基本要求:待处理的数据集可以分解成许多小的数据集,而且每一个小数据集都可以完全并行地进行处理。
映射阶段,用户输入的数据分割为M个片断,对应M个Map任务。每一个Map操作的输入是数据片断中的键值对
化简阶段,每一个Reduce操作的输入是一个
31、阐述Hbase与Bigtable相同点与不同点 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase是一个分布式的、面向列的开源数据库。
BigTable是非关系型数据库,是一个稀疏的、分布式的、持久化存储的多维度排序Map。Bigtable的设计目的是快速且可靠地处理PB级别的数据,并且能够部署到上千台机器上。 Bigtable已经实现了以下的几个目标:适用性广泛、可扩展、高性能和高可用性。
Hbase与BigTable的相同点是:均支持读/写/修改的原子性、数据块的压缩、词典顺序的排行、控制访问、数据TTL、批量写入、值计数器、行过滤器、事件记录。
不同点是BigTable不支持KeyVaue缓存、完全内存ColumFamily、储存位置分组等
32、虚拟化技术在云计算中的哪些地方发挥了作用? 服务器虚拟化、面向应用和资源及存储虚拟化三个方面
33、比较VMware、Xen等虚拟化产品的关键技术,以及对云计算技术提供的支持。 KVM是指基于Linux内核(Kernel-based)的虚拟机(Virtual Machine)。KVM最大的好处就在于它是与Linux内核集成的,所以速度很快。KVM的宿主操作系统必须是Linux,支持的客户机操作系统包括Linux、Windows、Solaris和BSD,运行在支持虚拟化扩展的x86和x86_64硬件架构上,这意味着KVM不能运行在老式CPU上,新CPU如果不支持虚拟化扩展也不能运行(如英特尔的Atom处理器)。
Xen是一个开放源代码虚拟机监视器,由剑桥大学开发。Xen的缺点是操作系统必须进行显
式地修改(“移植”)以在Xen上运行(但是提供对用户应用的兼容性),所以比较麻烦。使得Xen无需特殊硬件支持,就能达到高性能的虚拟化。Linux的官方内核在较早之前已经去掉了对Xen的支持。
VMWare (Virtual Machine ware)是一个“虚拟PC”软件公司。它的产品可以使你在一台机器上同时运行二个或更多Windows、DOS、LINUX系统。与“多启动”系统相比,VMWare采用了完全不同的概念。多启动系统在一个时刻只能运行一个系统,在系统切换时需要重新启动机器。VMWare是真正“同时”运行,多个操作系统在主系统的平台上,就象标准Windows应用程序那样切换。而且每个操作系统你都可以进行虚拟的分区、配置而不影响真实硬盘的数据,你甚至可以通过网卡将几台虚拟机用网卡连接为一个局域网,极其方便。安装在VMware操作系统性能上比直接安装在硬盘上的系统低不少,因此,比较适合学习和测试。 二、(1)、基础设施组件
Citrix公司和VMware公司在桌面基础设施方面采取了非常相似的策略,至少都基于相同的架构方式。每个供应商都提供自己的系统管理工具,真正的虚拟桌面存储在其中。对于XenDesktop和VMware View来说,到虚拟机(VM)的会话连接都是由服务器进行管理,其充当一个连接代理。尽管两种虚拟桌面基础设施(VDI)系统的架构大致上是一样的,但是Citrix和VMware通过不同的方式来支持系统管理方式。VMware View是针对ESX和ESXi服务器而设计的。而且,这些服务器必须是vCenter服务器的一部分。Citrix则更加灵活。Citrix拥有自己的系统管理工具XenServer,并且还可以运行于vSphere甚至微软的Hyper-V之上。 (2)、连接性
VMware View和Citrix XenDesktop都支持通过微软的远程桌面协议(RDP)进行客户端连接 。即便对于远程会话连接,RDP几乎已经变成了一个通用标准,VMware和Citrix仍然提供各自的协议。
XenDesktop支持Citrix的HDX(高分辨率体验)协议,但是View支持PC over IP,其基于用户数据报协议。两种协议都针对于改进终端用户体验而推出,以缓解缓慢或者潜在的网络连接不稳定。至于XenDesktop和View的对 比,大家一直都在讨论哪种协议更好,但是还没有明确的定论。 (3)、客户端支持
和其他VDI平台一样,XenDesktop和View按照终端用户物理设备来运行和连接代理通讯的客户端。VMware和Citrix都可以支持全系列的Windows、Mac和Linux客户端。XenDesktop和View都支持Apple iOS和Google Android等移动客户端。并且两种平台也支持一些不太普及的客户端类型,比如VMware有Kindle Fire客户端,而Citrix有Java客户端。 (4)、虚拟桌面类型
XenDesktop和View的对比表明他们都支持相似的虚拟桌面类型。它们都支持创建虚拟桌面池,用户可以随机连接到池中的任何一个桌面。两种产品都支持特定虚拟桌面(也被称为私有虚拟桌面)。它们是分配给特定用户的虚拟桌面。当用户需要控制他们桌面的配置或应用程序设定时,私有虚拟桌面就可以发挥作用了。除此之外,它们都支持离线模式。离线模式这种技术可以允许将用户的虚拟机复制到物理设备上,以使得用户可以在离线的情况下使用虚拟桌面。对于移动用户来说,离线桌面有很大帮助,因为它们不能保证长时间连接到企业网络当中。
尽管两个产品都支持离线模式 ,IT部门也许还需要设定其他的基础设施组件。比如,VMware提供一个特殊的支持“本地模式”的客户端,但是并不是所有的平台都有“本地模式”的客户端。可以确信的是VMware和Citrix XenDesktop都是可以承载虚拟桌面的企业级平台。它们都提供自己的特性,但是大体上核心特性是相同的。而且,XenDesktop和View都可以
轻松地进行扩展,以满足中型到大型企业的需求。
34、服务器虚拟化、存储器虚拟化和网络虚拟化都有哪些实现方式? 服务器虚拟化是通过企业级服务器虚拟化技术和云计算操作系统来实现,在服务器层可以很方便的实现存储的集中管理,因为每台服务器都可以连通到所有的存储设备,如果进行了访问授权则每台服务器都可以使用所有的存储空间,现在只需要在服务器上管理好这些空间就可以。
最简单的方案是使用服务器操作系统的功能,比如利用WINDOWS系统的动态卷功能,可以将多台存储设备上的空间虚拟映射成一个空间,这样就轻松的实现了多存储设备的虚拟化。当然这种方式比价简单,对服务器的性能也有较大影响。那么在交换层是否同样可以实现存储虚拟化呢?交换层是服务器和存储的连通桥梁,可以与所有的服务器和存储都发生联系,这样交换层上只要加入管理功能就可实现对所有存储设备的管理,存储虚拟化可完美实现,而且交换层可直接面对服务器层,所以就不存在服务器之间的协调问题,只要交换层对各服务器做好授权即可。
也可以使用openvswitch虚拟交换机,搭建openstack平台,通过netrun plugin到平台上
35、讨论桌面虚拟化的实现和作用
桌面虚拟化是指利用虚拟化技术将用户桌面的镜像文件存放到数据中心。当用户关闭系统时,通过第三方配置文件管理软件,可以做到用户个性化定制以及保留用户的任何设置。桌面虚拟化对云计算用户来说,是非常实用的,推动了云计算的发展。 第一代桌面实现了在同一个独立的计算机硬件平台上,同时安装多个操作系统,并同时运行这些操作系统,使得桌面虚拟化技术的大规模应用成为可能。虚拟桌面的核心与关键,不是后台服务器虚拟化技术,而是让用户能够通过各种手段、任何时间任何地点、通过任何设备都能够访问到自己的桌面。对于管理员而言,则实现了集中的控制。为了提高管理性,第二代桌面虚拟化技术进一步将桌面系统的运行环境与安装环境、应用于桌面配置文件进行拆分,从而大大降低了管理复杂度与成本,提高了管理效率。
36、集装箱数据中心有哪些优点?常见的节能措施有哪些? 答:(1)、高密度。集装箱数据中心模块可容纳高密度计算设备。(2)、模块化。集装箱数据中心将有利于数据中心的模块化,可以建立一个最优的数据中心生态系统。(3)、按需快速部署。为企业快速增加存储和计算能力。(4)、移动便携。可以灵活机动地放到一个搞大型活动的区域。(5)、节能措施。缩短送风距离,提高冷通道温度,冷/热通道完全隔离,隔热保温材料,Free Cooling功能:减少压缩机工作时间,提高能源利用效率。(6)、低PUE:集装箱式数据中心容易实现冷热通道隔离,其PUE值一般都会比传统的数据中心低上很多,所以自集装箱式数据中心诞生之日起,节能就是一大卖点。那么集装箱式数据中心是如何做到的呢?在设备室里,两排机柜背对背地摆放,中间留出一个散热通道,所以其实是热通道跟热通道叠加在一起,共享这个散热通道。冷空气从机柜的两侧压进设备室,滤热后,再从中间的散热通道吸回上层的制冷室,从而完成一个循环。(7)、一站式专业服务:数据中心属于专业产品,设计、制造、硬件都需要专业服务与运营的保障,集装箱式数据中心融合了硬件厂商的硬件制造经验,世纪互联则融入了自己十年的IDC设计、建设与运营经验,一站式专业服务为客户解决大量筹备与外包问题。(8)、即插即用:模块的安装非常容易,只需提供电源连接、水源连接(用于冷却)和数据连接即可。(9)、投资灵活:降低首期投资和拥有总成本按需投资,首期投资小;按需部署,投资回报高,仅节电费用就可在1-2年内收回投资。
37、云计算数据中心配电系统节能的原理是什么?
云计算配套用房采用变频多联空调机,夏季制冷,冬季采暖。由于数据中心的IDC机房、UPS室、空调控制室、发电机控制室、主配线区主要集中布置于公共数据中心、集团数据中心、研发数据中心三层以上建筑内,因而宜采用工艺空调,冷源为离心式冷水机,采用N+1配置,一台备用,安装在公共数据中心地上一层及研发数据中心地下一层内;每台冷水机配备冷却塔,冷却塔集中布置于公共数据中心与集团数据中心顶层,当室外环境温度较低时,关闭制冷机组,采用板式换热器进行换热,实现自然冷却;工艺空调末端采用水冷精密空调机,即恒温恒湿风柜加浸透气化式加湿器。冷冻站发电机房冬季采暖采用散热器接入市政热力管网,不单独设置集中采暖系统,采暖热媒为40-45℃热水;云计算中心配套用房等采用变频多联空调机,夏季制冷,冬季采暖。
38、能源利用效率(PUE)的计算方式是什么?
答:电力使用效率(PUE)是衡量数据中心能源效率的最基本和最有效的指标之一。其计算方法是以数据中心设施所消耗的总功率除以IT设备所消耗的功率。由此产生的比率提供有效的电源机组负荷的IT负荷。
39、比较淘宝TFS分布式文件系统、cStor分布式文件系统与阿里云分布式文件系统有何异同?
答:以关系数据库为例,SQL语言是一种非过程化的面向集合的语言,它虽然用起来非常简单,但由于是解释实现,效率不如人意。因此许多应用仍然是由高级程序设计语言(如C)来实现的,但是高级程序设计语言是过程化的,而且是面向单个数据的,这使得SQL与它之间存在着不匹配,我们把它叫做“阻抗失配”。不论你是用嵌入式SQL,还是CLI,都需要化很多工夫去完成两种语言之间的相互转化。 但是关系数据库在数据库系统方面发展地非常完善,有强大的管理功能和可操纵性。另外,关系模型具有坚实的数学基础。
面向对象数据库的产生主要是为了解决“阻抗失配”,它强调高级程序设计语言与数据库的无缝连接。什么叫无缝连接,假设你 不用数据库,用C语言编了一个程序,你可以不需要(或基本不需要)任何改动就将它作用于数据库,即你可以用C语言透明访问数据库,就好象数据库根本不存在一样,所以也有人把面向对象数据库理解为语言的持久化。怎么样,听起来挺玄的吧,可是我们自己开发的数据库系统——OSCAR早就做到了这一点。 由于实现了无缝连接,使得面向对象数据库能够支持非常复杂的数据模型,从而特别适用于工程设计领域。打个比方,想象CAD中的一个复杂部件,它可能由成千上万个不同的零件组成,要是用关系模型中的表来表达,得用多少张表啊?而描述这种复杂的部件,正好是高级程序设计语言的强项。
此外,面向对象数据库还吸收了面向对象程序设计语言的思想,如支持类、方法、继承等概念。 面向对象数据库很好地解决了阻抗失配的问题,但它也有缺点。它的缺点正好是关系数据库的强项,由于模型较为复杂(而且缺乏数学基础),使得很多系统管理功能难以实现(如权限管理),也不具备SQL处理集合数据的强大能力。
另一方面,随着多媒体数据的大量出现和应用的日益复杂,关系数据库也在不断吸收面向对象数据库的优点,出现了现在所谓的对象关系型数据库(象ORACLE8i、DB2-5以上都是这种系统)。其主要改进包括支持自定义类型(UDT),方法,继承(目前仅DB2-6支持),和引用(使得对象间可以直接引用,想想原来的关系数据库需要靠连接来实现引用,性能真是惨不忍睹)。 总之,数据库系统发展的趋势是,面向对象数据库和关系数据库将不断融合。而对象关系数据库由于继承了上述两者的优点,已经成为目前数据库发展的主流。
40、比较分布式数据库OceanBase、数据立方 DataCube与传统关系数据库有何异同? 与传统服务器相比,使用云服务器的优势在哪里?
答:云计算服务器(又称云服务器或云主机)主要面向中小企业用户与高端用户提供基于互联网的基础设施服务,这一用户群体庞大,且对互联网主机应用的需求日益增加。该用户群体具备如下特征:业务以主机租用与虚拟专用服务器为主,部分采用托管服务,且规模较大;注重短期投资回报率,对产品的性价比要求较高;个性化需求强,倾向于全价值链、傻瓜型产品。用户在采用传统的服务器时,由于成本、运营商选择等诸多因素,不得不面对各种棘手的问题,而弹性的云计算服务器的推出,则有效的解决了这一问题。
41、简述我国云技术发展概况。
答:中国云计算产业分为市场准备期、起飞期和成熟期三个阶段。当前,中国云计算产业尚处于导入和准备阶段,处于大规模爆发的前夜。准备阶段(2007--2010):主要是技术储备和概念推广阶解决方案和商业模式尚在尝试中。用户对云计算认知度仍然较低,成功案例较少。初期以政府公共云建设为主。 起飞阶段(2010--2015):产业高速发展,生态环境建设和商业模式构建成为这一时期的关键词,进入云计算产业的“黄金机遇期”。此时期,成功案例逐渐丰富,用户了解和认可程度不断提高。
越来越多的厂商开始介入,出现大量的应用解决方案,用户主动考虑将自身业务融入云,公有云、私有云、混合云建设齐头并进。 成熟阶段(2015--):云计算产业链、行业生态环境基本稳定;各厂商解决方案更加成熟稳定,提供丰富的XaaS产品。用户云计算应用取得良好的绩效,并成为IT系统不可或缺的组成部分,云计算成为一项基础设施。
当前,中国云计算产业尚处于导入和准备阶段,处于大规模爆发的前夜。
42、OpenStack是什么?
OpenStack是一个云平台管理的项目,它不是一个软件。这个项目由几个主要的组件组合起来完成一些具体的工作。OpenStack是一个旨在为公共及私有云的建设与管理提供软件的开源项目,OpenStack被公认作为基础设施即服务(简称IaaS)资源的通用前端。
43、总结OpenStack的主要组件及功能。
(一)OpenStack计算设施—-Nova Nova是OpenStack计算的弹性控制器。 功能及特点:
实例生命周期管理;计算资源管理;网络与授权管理;基于REST的API;异步连续通信;支持各种宿主:Xen、XenServer/XCP、KVM、UML、VMware vSphere及Hyper-V (二)OpenStack镜像服务器—-GlanceOpenStack镜像服务器是一套虚拟机镜像发现、注册、检索系统,我们可以将镜像存储到以下任意一种存储中: 功能及特点
提供镜像相关服务
(三)OpenStack存储设施—-Swift
Swift为OpenStack提供一种分布式、持续虚拟对象存储,它类似于Amazon Web Service的S3简单存储服务。Swift具有跨节点百级对象的存储能力。Swift内建冗余和失效备援管理,也能够处理归档和媒体流,特别是对大数据(千兆字节)和大容量(多对象数量)的测度非常高效。 功能及特点
海量对象存储;大文件(对象)存储;数据冗余管理;归档能力—–处理大数据集;为虚拟机和云应用提供数据容器;处理流媒体;对象安全存储;备份与归档;良好的可伸缩性 (四)OpenStack管理的Web接口—-Horizon
Horizon是一个用以管理、控制OpenStack服务的Web控制面板,它可以管理实例、镜像、创建密匙对,对实例添加卷、操作Swift容器等。除此之外,用户还可以在控制面板中使用终端(console)或VNC直接访问实例。总之,Horizon具有如下一些特点:
实例管理:创建、终止实例,查看终端日志,VNC连接,添加卷等;访问与安全管理:创建安全群组,管理密匙对,设置浮动IP等;偏好设定:对虚拟硬件模板可以进行不同偏好设定;镜像管理:编辑或删除镜像;查看服务目录;管理用户、配额及项目用途;用户管理:创建用户等;卷管理:创建卷和快照;对象存储处理:创建、删除容器和对象;为项目下载环境变量
44、与传统服务器相比,使用云服务器的优势在哪里?
答:云计算服务器(又称云服务器或云主机)主要面向中小企业用户与高端用户提供基于互联网的基础设施服务,这一用户群体庞大,且对互联网主机应用的需求日益增加。该用户群体具备如下特征:业务以主机租用与虚拟专用服务器为主,部分采用托管服务,且规模较大;注重短期投资回报率,对产品的性价比要求较高;个性化需求强,倾向于全价值链、傻瓜型产品。用户在采用传统的服务器时,由于成本、运营商选择等诸多因素,不得不面对各种棘手的问题,而弹性的云计算服务器的推出,则有效的解决了这一问题。
正在阅读:
云计算04-13
园艺学总论 南农习题07-24
《内科学》见习指导 消化 修改后11-30
高中优秀班主任励志评语08-23
OpenSSL 中文手册03-11
政府采购询价函08-21
管理学经典案例分析题汇总04-12
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 计算
- 产量监控岗位责任制
- 2013 会计系毕业论文选题(1)
- 感党恩颂党情2、2
- 五四红旗团支部先进事迹材料
- AMS-100 门禁考勤软件使用说明V3.0 - 图文
- 全国黄金行业工作交流
- 县委新闻宣传中心上半年工作总结(多篇范文)
- 人教版数学四年级《认识折线统计图》教学反思
- 磁场竞赛辅导讲义
- XX街道XX村农村集体资产产权制度改革实施方案
- CPSM2 练习
- 解决IE11兼容HTML5 设置
- 物业秩序部工作计划(共9篇)
- 国贸系“跨国公司经营管理”课堂讨论选题
- 四川省广安市矿产资源总体规划
- 2017年江苏盐城市中考英语试卷含答案解析(Word版)
- 《宏观经济学》课程教学大纲
- 国际商法案例
- 2017年注册会计师考试财务成本管理试题及答案解析
- 让课堂结尾更有趣