3.1 FusionInsight 技术基础 - Spark架构原理

更新时间：2023-04-17 18:25:01 阅读量：实用文档文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

●Spark是AMP LAB贡献到Apache社区的开源项目，是AMP大数据栈的基础组件。

●AMP：ALGORITHMS MACHINES PEOPLE，加州大学伯克利分校一个致力于机器学习和

云计算的组织。

●AMP LAB：AMP实验室，从事大数据方面的研究。

●迭代计算：是数值计算中一类典型方法，其基本思想是逐次逼近，先取一个粗糙的近

似值，然后用同一个递推公式，反复校正此初值，直至达到预定精度要求为止。

MR：MapReduce，和Spark一样是计算框架。

●Scala是一门函数式的面向对象语言，Spark核心代码由Scala语言实现。Scala中的trait相

当于java中的interface。

●即席查询：用户根据自己的需求，灵活的选择查询条件，系统能够根据用户的选择生

成相应的统计报表。

●Hive：基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库

表，并提供简单的SQL查询功能，可以将SQL语句转换为MapReduce任务运行。

●Pregel：主要绘制大量网上信息之间关系的“图形数据库”。

●亚秒：接近秒的时间延迟。

●Mesos是Apache下的开源分布式资源管理框架，它被称为是分布式系统的内核。

●即席查询：用户根据自己的需求，灵活的选择查询条件，系统能够根据用户的选择生

成相应的统计报表。

●Pregel：主要绘制大量网上信息之间关系的“图形数据库”。

●Scala trait：scala中的trait相当于java中的interface，但比interface更灵活。

●PowerGraph:一个分布式并行的图像计算框架，点分割是一种基于点的分割算法

相关文章：

正在阅读：