rdd是spark中个哪个架构提出的概念（）A、spark coreB、spark streamingC、mlbaseD、Grophx

题目

rdd是spark中个哪个架构提出的概念（）

A、spark core
B、spark streaming
C、mlbase
D、Grophx

相似考题

1.以下关于sparkstreaming说法正确的是（）A、spark streaming分布式微批架构B、spark streaming实时存储架构C、spark streaming是普通存储架构D、spark streaming分布式实时计算架构

2.spark中的rdd是一个（）数据集A、弹性分布式B、弹性计算C、运送数据D、心跳

3.spark架构中哪些架构可以相互转化（）A、spark coreB、spark sqlC、spark streamingD、spark R

4.以下选项中属于spark架构中的图计算框架的是（）A、spark coreB、spark streamingC、mlbaseD、Grophx

参考答案和解析

正确答案:A

更多“rdd是spark中个哪个架构提出的概念（）A、spark coreB、spark streamingC、mlbaseD、Grophx”相关问题

第1题：

spark支持的分布式部署方式中哪个是错误的（）
- A、standalone
- B、spark on mesos
- C、spark on YARN
- D、spark on local
正确答案:D
第2题：

spark中，可以运行sql脚本的框架是哪个（）
- A、spark？core
- B、hdfs
- C、hadoop
- D、spark？sql
正确答案:D
第3题：

spark中可以整合机器学习库，并可以对外提供接口的框架是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、spark sql
正确答案:C
第4题：

spark架构中的rdd相当于java中的（）概念
- A、类
- B、接口
- C、方法
- D、内部类
正确答案:A
第5题：

spark中的实时计算系统是哪个（）
- A、spark？core
- B、spark？streaming
- C、mlbase
- D、Grophx
正确答案:B
第6题：

描述Spark集群计算中RDD的含义和作用。

正确答案:Spark的核心概念是RDD (resilientdistributed dataset)，指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD，把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算，数据在内存中将大大提升IO操作。这也是Spark涉及的核心：内存计算。Spark和RDD的关系可以理解为：RDD是一种具有容错性基于内存的集群计算抽象方法，Spark则是这个抽象方法的实现。
第7题：

spark中的rdd相当于java中的（）概念
- A、类
- B、接口
- C、方法
- D、内部类
正确答案:A
第8题：

spark架构中会出现控制算子的原因是以下哪个选项（）
- A、spark备份的安全原因
- B、spark用户的要求
- C、兼容hive
- D、兼容hbase
正确答案:A
第9题：

spark框架中，机器学习库的框架是哪个（）
- A、hadoop
- B、spark？streaming
- C、mlbase
- D、RDD
正确答案:C
第10题：

以下哪个选项是spark的核心框架？（）
- A、spark？core
- B、spark？streaming
- C、hdfs
- D、hadoop
正确答案:A
第11题：

spark中的图计算框架是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、Grophx
正确答案:D
第12题：

问答题
描述Spark集群计算中RDD的含义和作用。

正确答案： Spark的核心概念是RDD (resilientdistributed dataset)，指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD，把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算，数据在内存中将大大提升IO操作。这也是Spark涉及的核心：内存计算。Spark和RDD的关系可以理解为：RDD是一种具有容错性基于内存的集群计算抽象方法，Spark则是这个抽象方法的实现。
解析：暂无解析
第13题：

spark中如果想要获取hdfs中的数据，则需要使用哪个系统（）
- A、spark？core
- B、spark？streaming
- C、mapreduce
- D、Grophx
正确答案:C
第14题：

spark可以编写sql脚本的框架是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、spark sql
正确答案:D
第15题：

spark读取hdfs数据是调用哪个技术实现的（）
- A、spark？core
- B、spark？streaming
- C、mapreduce
- D、Grophx
正确答案:C
第16题：

spark框架中，整合机器学习库，并对外提供接口的框架是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、spark sql
正确答案:C
第17题：

spark的核心框架是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、Grophx
正确答案:A
第18题：

以下选项中可以在spark中编写sql的框架是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、spark sql
正确答案:D
第19题：

spark架构中cache算子应具有以下哪些特性？（）
- A、spark？core
- B、spark？streaming
- C、Grophx
- D、spark？sql
正确答案:A,B,D
第20题：

以下选项中是spark的核心框架的是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、Grophx
正确答案:A
第21题：

下列选项中是spark组件的有？（）
- A、spark core
- B、spark streaming
- C、Grophx
- D、spark sql
正确答案:A,B,C,D
第22题：

spark的组件不包含哪个（）
- A、spark core
- B、hdfs
- C、Graphx
- D、spark streaming
正确答案:B
第23题：

问答题
试述如下Spark的几个主要概念：RDD、DAG、阶段、分区、窄依赖、宽依赖。

正确答案： ①RDD://是弹性分布式数据集（Resilient Distributed Dataset）的英文缩写，是分布式内存的一个抽象概念，提供了一种高度受限的共享内存模型。
②DAG://是Directed Acyclic Graph（有向无环图）的英文缩写，反映RDD之间的依赖关系。
③阶段：是作业的基本调度单位，一个作业会分为多组任务，每组任务被称为“阶段”，或者也被称为“任务集”。
④分区：一个RDD就是一个分布式对象集合，本质上是一个只读的分区记录集合，每个RDD可以分成多个分区，每个分区就是一个数据集片段。
⑤窄依赖：父RDD的一个分区只被一个子RDD的一个分区所使用就是窄依赖。
⑥宽依赖：父RDD的一个分区被一个子RDD的多个分区所使用就是宽依赖。
解析：暂无解析

rdd是spark中个哪个架构提出的概念（）A、spark coreB、spark streamingC、mlbaseD、Grophx

题目

相似考题

参考答案和解析

更多“rdd是spark中个哪个架构提出的概念（）A、spark coreB、spark streamingC、mlbaseD、Grophx”相关问题

相关内容