更多“Spark Streaming类似于Apache Storm,用于流式数据的处理”相关问题
  • 第1题:

    Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性


    正确答案:正确

  • 第2题:

    以下关于sparkstreaming说法正确的是()

    • A、spark streaming分布式微批架构
    • B、spark streaming实时存储架构
    • C、spark streaming是普通存储架构
    • D、spark streaming分布式实时计算架构

    正确答案:A

  • 第3题:

    spark中如果想要获取hdfs中的数据,则需要使用哪个系统()

    • A、spark?core
    • B、spark?streaming
    • C、mapreduce
    • D、Grophx

    正确答案:C

  • 第4题:

    Spark Streaming有高吞吐量和容错能力强等特点


    正确答案:正确

  • 第5题:

    spark能够通过jdbc读取mysql数据库中的数据


    正确答案:正确

  • 第6题:

    以下关于流处理系统Storm描述错误的是

    • A、关注数据流的处理
    • B、关注的是数据多次写入,多次查询使用
    • C、Storm运行起来后是持续不断的
    • D、只在业务需要时调用数据

    正确答案:B,D

  • 第7题:

    storm和?spark?streaming?最大的区别?()

    • A、科学统计支持
    • B、是否具有schema
    • C、是否是真正的实时计算框架
    • D、不同公司的产品

    正确答案:C

  • 第8题:

    spark的组件不包含哪个()

    • A、spark core
    • B、hdfs
    • C、Graphx
    • D、spark streaming

    正确答案:B

  • 第9题:

    spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集

    • A、单机
    • B、集中式
    • C、分布式
    • D、NOSQL

    正确答案:C

  • 第10题:

    多选题
    下面关于Storm和Spark Streaming说法正确的是()。
    A

    Strom实时计算延迟度为毫秒级

    B

    Strom吞吐量高

    C

    SparkStreaming不支持且完善事务机制

    D

    SparkStreaming支持动态调整并行度


    正确答案: C,B
    解析: 暂无解析

  • 第11题:

    问答题
    从Hadoop+Storm架构转向Spark架构可带来哪些好处?

    正确答案: (1)实现一键式安装和配置、线程级别的任务监控和告警;
    (2)降低硬件集群、软件维护、任务监控和应用开发的难度;
    (3)便于做成统一的硬件、计算平台资源池。
    解析: 暂无解析

  • 第12题:

    单选题
    大数据中spark生态支持的组件有:()和spark streaming。
    A

    eMBB

    B

    spark SQL

    C

    ETC

    D

    spark streaming


    正确答案: C
    解析: 暂无解析

  • 第13题:

    流媒体的编解码技术主要用于转换数据格式,典型情况下是在()之间转换。

    • A、压缩数据和非压缩数据
    • B、数字信号和模拟信号
    • C、流式数据和事件数据
    • D、流式数据和非流式数据

    正确答案:A

  • 第14题:

    Spark Streaming数据输入后可以用Spark的高度抽象原语如:map、reduce、join、window等进行运算


    正确答案:正确

  • 第15题:

    spark的源码是由哪几种语言编写完成的()

    • A、acheSpark是一种快速、通用、可扩展的大数据分析引擎
    • B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集
    • C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费
    • D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景

    正确答案:A,B

  • 第16题:

    spark读取hdfs数据是调用哪个技术实现的()

    • A、spark?core
    • B、spark?streaming
    • C、mapreduce
    • D、Grophx

    正确答案:C

  • 第17题:

    DataFrame可以通过多种来源创建:()

    • A、SparkConf
    • B、SparkContext
    • C、SQLContext
    • D、Spark Streaming

    正确答案:A,B,C,D

  • 第18题:

    Spark提供了统一的解决方案。Spark可以用于批处理、交互式查询(SparkSQL)、实时流处理(SparkStreaming)、机器学习(SparkMLlib)和图计算(GraphX)


    正确答案:正确

  • 第19题:

    spark本身自带读取hdfs数据的方法


    正确答案:错误

  • 第20题:

    storm系统和spark?streaming系统最大的区别是哪个?(?)()

    • A、科学统计支持
    • B、是否具有schema
    • C、是否是真正的实时计算框架
    • D、不同公司的产品

    正确答案:C

  • 第21题:

    大数据处理框架-Spark诞生于()

    • A、伯克利大学AMPLab
    • B、Apache孵化器项目
    • C、Apache顶级项目
    • D、开源项目

    正确答案:A

  • 第22题:

    问答题
    Spark是基于内存计算的大数据计算平台,试述Spark的主要特点。

    正确答案: S.park具有如下4个主要特点:
    ①运行速度快;②容易使用;③通用性;④运行模式多样。
    解析: 暂无解析

  • 第23题:

    判断题
    Spark是一个类似于MapReduce的分布式计算框架,其核心是弹性分布式数据集
    A

    B


    正确答案:
    解析: 暂无解析