参考答案和解析
正确答案:A
更多“rdd是spark中个哪个架构提出的概念()A、spark coreB、spark streamingC、mlbaseD、Grophx”相关问题
  • 第1题:

    spark支持的分布式部署方式中哪个是错误的()

    • A、standalone
    • B、spark on mesos
    • C、spark on YARN
    • D、spark on local

    正确答案:D

  • 第2题:

    spark中,可以运行sql脚本的框架是哪个()

    • A、spark?core
    • B、hdfs
    • C、hadoop
    • D、spark?sql

    正确答案:D

  • 第3题:

    spark中可以整合机器学习库,并可以对外提供接口的框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、spark sql

    正确答案:C

  • 第4题:

    spark架构中的rdd相当于java中的()概念

    • A、类
    • B、接口
    • C、方法
    • D、内部类

    正确答案:A

  • 第5题:

    spark中的实时计算系统是哪个()

    • A、spark?core
    • B、spark?streaming
    • C、mlbase
    • D、Grophx

    正确答案:B

  • 第6题:

    描述Spark集群计算中RDD的含义和作用。


    正确答案:Spark的核心概念是RDD (resilientdistributed dataset),指的是一个只读的,可分区的分布式数据集,这个数据集的全部或部分可以缓存在内存中,在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD,把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算,数据在内存中将大大提升IO操作。这也是Spark涉及的核心:内存计算。Spark和RDD的关系可以理解为:RDD是一种具有容错性基于内存的集群计算抽象方法,Spark则是这个抽象方法的实现。

  • 第7题:

    spark中的rdd相当于java中的()概念

    • A、类
    • B、接口
    • C、方法
    • D、内部类

    正确答案:A

  • 第8题:

    spark架构中会出现控制算子的原因是以下哪个选项()

    • A、spark备份的安全原因
    • B、spark用户的要求
    • C、兼容hive
    • D、兼容hbase

    正确答案:A

  • 第9题:

    spark框架中,机器学习库的框架是哪个()

    • A、hadoop
    • B、spark?streaming
    • C、mlbase
    • D、RDD

    正确答案:C

  • 第10题:

    以下哪个选项是spark的核心框架?()

    • A、spark?core
    • B、spark?streaming
    • C、hdfs
    • D、hadoop

    正确答案:A

  • 第11题:

    spark中的图计算框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、Grophx

    正确答案:D

  • 第12题:

    问答题
    描述Spark集群计算中RDD的含义和作用。

    正确答案: Spark的核心概念是RDD (resilientdistributed dataset),指的是一个只读的,可分区的分布式数据集,这个数据集的全部或部分可以缓存在内存中,在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD,把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算,数据在内存中将大大提升IO操作。这也是Spark涉及的核心:内存计算。Spark和RDD的关系可以理解为:RDD是一种具有容错性基于内存的集群计算抽象方法,Spark则是这个抽象方法的实现。
    解析: 暂无解析

  • 第13题:

    spark中如果想要获取hdfs中的数据,则需要使用哪个系统()

    • A、spark?core
    • B、spark?streaming
    • C、mapreduce
    • D、Grophx

    正确答案:C

  • 第14题:

    spark可以编写sql脚本的框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、spark sql

    正确答案:D

  • 第15题:

    spark读取hdfs数据是调用哪个技术实现的()

    • A、spark?core
    • B、spark?streaming
    • C、mapreduce
    • D、Grophx

    正确答案:C

  • 第16题:

    spark框架中,整合机器学习库,并对外提供接口的框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、spark sql

    正确答案:C

  • 第17题:

    spark的核心框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、Grophx

    正确答案:A

  • 第18题:

    以下选项中可以在spark中编写sql的框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、spark sql

    正确答案:D

  • 第19题:

    spark架构中cache算子应具有以下哪些特性?()

    • A、spark?core
    • B、spark?streaming
    • C、Grophx
    • D、spark?sql

    正确答案:A,B,D

  • 第20题:

    以下选项中是spark的核心框架的是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、Grophx

    正确答案:A

  • 第21题:

    下列选项中是spark组件的有?()

    • A、spark core
    • B、spark streaming
    • C、Grophx
    • D、spark sql

    正确答案:A,B,C,D

  • 第22题:

    spark的组件不包含哪个()

    • A、spark core
    • B、hdfs
    • C、Graphx
    • D、spark streaming

    正确答案:B

  • 第23题:

    问答题
    试述如下Spark的几个主要概念:RDD、DAG、阶段、分区、窄依赖、宽依赖。

    正确答案: ①RDD://是弹性分布式数据集(Resilient Distributed Dataset)的英文缩写,是分布式内存的一个抽象概念,提供了一种高度受限的共享内存模型。
    ②DAG://是Directed Acyclic Graph(有向无环图)的英文缩写,反映RDD之间的依赖关系。
    ③阶段:是作业的基本调度单位,一个作业会分为多组任务,每组任务被称为“阶段”,或者也被称为“任务集”。
    ④分区:一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合,每个RDD可以分成多个分区,每个分区就是一个数据集片段。
    ⑤窄依赖:父RDD的一个分区只被一个子RDD的一个分区所使用就是窄依赖。
    ⑥宽依赖:父RDD的一个分区被一个子RDD的多个分区所使用就是宽依赖。
    解析: 暂无解析