南开大学20秋学期《大数据开发技术(一)》在线作业-1

更新时间:2023-04-06 18:35:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1.优点是查找速度快,可扩展性强,容易进行分布式扩展,复杂性低的数据库是()

A.列族数据库

B.键值数据库

C.图数据库

D.文档数据库

答案:A

2.Hbase中采用()保证系统出错时及时恢复

A.MemStore

B.Hlog

C.StoreFile

D.客户端

答案:B

3.Google Cloud SQL是谷歌公司推出的基于()的云数据库

A.MySQL

B.SQL Server

C.Hbase

D.Oracle

答案:A

4.流数据采取()计算模式

A.批量

B.实时

C.大数据

D.动态

答案:B

5.Google Fusion Tables是哪种可视化工具()

A.信息图表

B.地图工具

C.时间线工具

D.分析工具

答案:B

6.以下亚马逊的产品中哪个是关系数据库()

A.RDS

B.SimpleDB

C.DynamoDB

D.Redshift

答案:A

7.应用于专门用于处理具有高度相互关联关系的数据,比较适合于社交网络的数据库是哪种()

A.列族数据库

B.键值数据库

C.图数据库

D.文档数据库

答案:C

8.大数据摩尔定律体现了大数据的哪个体征()。

A.数据体量大

B.数据产生速度快

C.数据种类多

D.数据计算快

E.数据价值高

答案:A

9.优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()

A.列族数据库

B.键值数据库

C.图数据库

D.文档数据库

答案:C

10.Hbase中()文件记录了-ROOT-表的位置

A.Master

B.Region

C.Zookeeper

D.Chubby

答案:C

11.以下亚马逊的产品中哪个是键值数据库()

A.RDS

B.SimpleDB

C.DynamoDB

D.Redshift

答案:B

12.UMP系通过()来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能

A.Controller服务器

B.Procy服务器

C.愚公系统

D.Agent服务器

答案:A

13.Hbase在寻址过程客户端只需询问Zookeeper服务器,不需要链接()

A.Master

B.Region

C.Zookeeper

D.Chubby

答案:A

14.Xtimeline是哪种可视化工具()

A.信息图表

B.地图工具

C.时间线工具

D.分析工具

答案:C

15.以下不属于物联网关键技术的是()。

A.RFID

B.传感器

C.交换机

D.矩阵式二维码

答案:C

16.关于MapReduce工作流程,说法错误的是()。

A.不同的Map任务之间不会进行通信

B.不同的Reduce任务之间不会发生任何信息交换

C.用户可以显式地从一台机器向另一台机器发送消息

D.所有的数据交换都是通过MapReduce框架自身去实现的

答案:C

17.D3是哪种可视化工具()

A.信息图表

B.地图工具

C.时间线工具

D.分析工具

答案:A

18.Hadoop中执行MapReduce任务不含哪种方式()。

A.Mahout

B.Hadoop jar

C.Shell脚本

D.Python

答案:A

19.MapReduce处理关系的()运算时,Map过程需要记录元组的信息及该元组来源。

A.投影

B.差

C.交

D.并

答案:B

20.Hadoop启动所有进程的命令为()。

A.all-stat.sh

B.all-start.

C.start-all.sh

D.start-all.

答案:C

21.R是哪种可视化工具()

A.信息图表

B.地图工具

C.时间线工具

D.分析工具

答案:D

22.关于Storm中Topology说法错误的是()。

A.Topology可视为流转换图

B.Topology可以被提交到Storm集群执行

C.在Topology里面可以指定每个组件的并行度,Storm会在集群里面分配那么多的线程来同时计算

D.Topology里面的每一个组件都是串行运行的

答案:D

23.Weka是哪种可视化工具()

A.信息图表

B.地图工具

C.时间线工具

D.分析工具

答案:D

24.信息技术发展史上的第三次信息化浪潮解决的问题是什么()。

A.信息处理

B.信息增长

C.信息爆炸

D.信息传输

答案:C

25.UMP系通过()来实现实现管理每台物理机上的MySQL实例

A.Controller服务器

B.Procy服务器

C.愚公系统

D.Agent服务器

答案:D

26.关于Strom中Bolt说法错误的是()。

A.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作

B.Bolt是一个被动的角色,Spout是一个主动的角色

C.Bolt不仅可以处理Tuple还可以创建新的Tuple

D.Bolt是Streams的状态转换过程的抽象含义

答案:C

27.Gephi是哪种可视化工具()

A.信息图表

B.地图工具

C.时间线工具

D.分析工具

答案:D

28.以下哪种属于文档数据库()

A.MongoDB

B.Redis

C.Hbase

D.Neo4j

答案:A

29.针对流数据,“量子恒道”开发了海量数据实时流计算框架()。

A.Time Tunnel

B.Spark

C.Super Mario

D.Storm

答案:C

30.以下针对Hive的说法不正确的是()。

A.Hive是一个基于Hadoop的数据仓库工具

B.Hive是关系数据库

C.Hive QL是一种查询语言

D.Hive可以提供查询分析存储等功能

答案:B

31.Hadoop配置文件中说法错误的是()。

A.core-site.xml中hadoop.tmp.dir表示存放临时数据的目录,仅为NameNode的数据

B.core-site.xml中fs.defaultFS表示HDFS路径的逻辑名称

C.hdfs-site.xml中11493909ff0a79563c1ec5da50e2524de418d06c.dir表示存储fsimage文件的地方

D.hdfs-site.xml中dfs.replication表示副本的数量,伪分布式要设置为0

E.hdfs-site.xml中dfs.datanode.data.dir表示HDFS数据存放block的地方

答案:AC

32.以下哪些是数据可视化分析工具()

A.R

B.Weka

C.Gephi

D.Tableau

答案:ABC

33.HDFS中客户端在读取到数据后,会采用()对数据块进行校验,已确定正确性

A.md5

B.哈希桶

C.sha1

D.奇偶校验

答案:AC

34.以下哪种数据库属于NoSQL数据库()

A.关系数据库

B.键值数据库

C.文档数据库

D.分布式数据库

答案:BC

35.HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。

A.FsImage

B.DataNode

C.Block

D.EditLog

答案:AD

36.以下属于流计算框架的是()。

A.Twitter Storm

B.Spark

C.MapReduce

D.Pregel

E.Yahoo S4

答案:ABE

37.以下图计算软件哪种属于基于遍历算法的、实时的图数据库()

A.Neo4j

B.OrientDB

C.Infinite Graph

D.Pregel

答案:ABC

38.Hadoop集群的整体性能取决于哪些性能间的平衡()

A.CPU

B.GPU

C.内存

D.存储

E.网络

答案:ACDE

39.以下哪种数据库属于NoSQL数据库()

A.MySQL

B.DynamoDB

C.InfiniteGraph

D.MongoDB

答案:BCD

40.MapReduce可以解决哪些计算问题()。

A.矩阵乘法

B.关系代数运算

C.聚合运算

D.关系投影运算

答案:ABCD

41.Hadoop是典型的实时处理模型。()

T.对

F.错

答案:F

42.HDFS在块的大小的设计上明显要小于普通文件系统,可以最小化寻址开销。()

T.对

F.错

答案:F

43.Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。()

T.对

F.错

答案:T

44.在概念视图层面,HBase中的每个表是采用了基于列的存储方式。()

T.对

F.错

答案:F

45.Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记。()

T.对

F.错

答案:T

46.“hadoop dfs”和“hadoop fs”两条命令适用于任何不同的文件系统。()

T.对

F.错

答案:F

47.Pregel中无论在哪台机器上,都可以简单根据顶点ID判断出该顶点属于哪个分区,即使该顶点可能已经不存在了。()

T.对

F.错

答案:F

48.HDFS集群中的数据节点一般是一个节点运行多个数据节点进程,负责处理文件系统客户端的读/写请求。()

T.对

F.错

答案:F

49.Pregel将计算细化到顶点,同时在顶点内控制循环迭代次数,而MapReduce则将计算批量化处理,按任务进行循环迭代控制。()

T.对

F.错

答案:T

50.对于每个顶点而言,Pregel只保存一份顶点值和边值,但是,会保存两份“标志位”和输入消息队列,分别用于当前超步和下一个超步。()

T.对

F.错

答案:T

本文来源:https://www.bwwdw.com/article/362l.html

Top