下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是().A、FSDataInputStream扩展了DataInputStream以支持随机读B、为实现细粒度并行,输入分片应该越小越好C、一台机器可能被指派从输入文件的任意位置开始处理一个分片D、输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割

题目

下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是().

  • A、FSDataInputStream扩展了DataInputStream以支持随机读
  • B、为实现细粒度并行,输入分片应该越小越好
  • C、一台机器可能被指派从输入文件的任意位置开始处理一个分片
  • D、输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割

相似考题
更多“下列关于HDFS为存储MapReduce并行切分和处理的数据做的”相关问题
  • 第1题:

    关于并行数据库系统的叙述中,错误的是

    A.无共享的结构是支持并行数据库系统的最好的并行结构

    B.在并行处理中,许多操作是同时执行的,而不是串行处理的

    C.共享主存储器系统有时又称作群机

    D.并行系统通过并行的使用多个CPU和磁盘来提高处理速度


    正确答案:C
    解析:无共享的结构是支持并行数据库系统的最好的并行结构;在并行处理中,许多操作是同时执行的,而不是串行处理的,共享磁盘系统有时又称作群机,并行系统通过并行的使用多个CPU和磁盘来提高处理速度。注意:共享磁盘系统有时又称作群机,而不是共享主存储器系统。

  • 第2题:

    在将数据源经过分析挖掘到最终获得价值的大数据处理过程中,MapReduce是在( )阶段应用分布式并行处理关键技术的常用工具。

    A.数据采集

    B.数据管理

    C.数据存储

    D.数据分析与挖掘


    正确答案:B

  • 第3题:

    MapReduce包括()和()两个阶段,可以进行海量数据分割、任务分解与结果汇总,从而完成海量数据的并行处理。

    • A、分布
    • B、映射
    • C、分析
    • D、化简

    正确答案:B,D

  • 第4题:

    并行数据处理技术MapReduce是由哪家公司最先提出的()。

    • A、谷歌公司
    • B、百度公司
    • C、雅虎公司
    • D、脸谱公司

    正确答案:A

  • 第5题:

    MapReduce是一种处理海量数据的并行编程模式,用于()大规模数据集的并行运算。

    • A、通常大于1GB
    • B、通常大于1ZB
    • C、通常大于1TB
    • D、通常大于1PB

    正确答案:C

  • 第6题:

    MapReduce执行过程中,数据存储位置不是在GFS上的是()

    • A、Map处理结果
    • B、Reduce处理结果
    • C、日志

    正确答案:B

  • 第7题:

    ()并行数据处理系统适用于需要多次操作特定数据集的场景,非常适合于机器学习中迭代算法的执行。

    • A、Spark
    • B、Hive
    • C、Haystack
    • D、HDFS

    正确答案:A

  • 第8题:

    单选题
    下面关于HDFS架构关键设计要点错误的是()。
    A

    支持回收站机制,以及副本数的动态设置机制

    B

    数据存储以数据块为单位,存储在操作系统的HDFS文件系统上

    C

    提供JAVAAPI,HTTP方式,SHELL方式访问HDFS数据

    D

    HDFS对外仅呈现多个统一的文件系统


    正确答案: A
    解析: 暂无解析

  • 第9题:

    判断题
    适合用MapReduce来处理的数据集(或任务)有一个基本要求:待处理的数据集可以分解成许多小的数据集,而且每一个小数据集都可以完全并行地进行处理。(  )
    A

    B


    正确答案:
    解析:

  • 第10题:

    多选题
    MapReduce包括()和()两个阶段,可以进行海量数据分割、任务分解与结果汇总,从而完成海量数据的并行处理。
    A

    分布

    B

    映射

    C

    分析

    D

    化简


    正确答案: C,B
    解析: 暂无解析

  • 第11题:

    单选题
    并行数据处理框架MapReduce是()公司在大数据领域的重要贡献。
    A

    百度

    B

    谷歌

    C

    脸谱

    D

    腾讯


    正确答案: D
    解析: 暂无解析

  • 第12题:

    单选题
    下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是().
    A

    FSDataInputStream扩展了DataInputStream以支持随机读

    B

    为实现细粒度并行,输入分片应该越小越好

    C

    一台机器可能被指派从输入文件的任意位置开始处理一个分片

    D

    输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割


    正确答案: C
    解析: 暂无解析

  • 第13题:

    下列关于MapReduce说法不正确的是( )。

    A.MapReduce是一种计算框架

    B.MapReduce来源于google的学术论文

    C.MapReduce程序只能用java语言编写

    D.MapReduce隐藏了并行计算的细节,方便使用


    正确答案:C

  • 第14题:

    MapReduce是一种编程模型,用于大规模数据集的并行运算,可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项?()

    • A、实时性
    • B、高容错性
    • C、易于扩展
    • D、易于编程

    正确答案:B,C,D

  • 第15题:

    MapReduce将传统的查询、分解及数据分析进行分布式处理,将处理任务分配到不同的处理(),因此具有更强的并行处理能力。

    • A、模块
    • B、节点
    • C、集群
    • D、工作流

    正确答案:B

  • 第16题:

    spark进行数据切分的时候,划分完成的partition个数和hdfs中block个数一致


    正确答案:正确

  • 第17题:

    与传统的分布程序设计相比,MapReduce封装了()等细节,还提供了一个简单而强大的接口

    • A、并行处理
    • B、容错处理
    • C、数据分布
    • D、负载均衡

    正确答案:A,B,C,D

  • 第18题:

    并行数据处理框架MapReduce是()公司在大数据领域的重要贡献。

    • A、百度
    • B、谷歌
    • C、脸谱
    • D、腾讯

    正确答案:B

  • 第19题:

    单选题
    关于Hive和Hadoop其他组件的关系,以下描述错误的是?()
    A

    Hive最终将数据存储在HDFS中

    B

    HiveSQL其本质是执行MapReduce任务

    C

    Hive是Hadoop平台的数据仓库工具

    D

    Hive对HBase有强依赖


    正确答案: D
    解析: 暂无解析

  • 第20题:

    单选题
    MapReduce执行过程中,数据存储位置不是在GFS上的是()
    A

    Map处理结果

    B

    Reduce处理结果

    C

    日志


    正确答案: B
    解析: 暂无解析

  • 第21题:

    单选题
    文件上传到HDFS时,文件切分成数据块的工作是在?()
    A

    Namenode完成的

    B

    Datanode完成的

    C

    client完成的

    D

    SecondaryNamenode完成的


    正确答案: D
    解析: 暂无解析

  • 第22题:

    单选题
    MapReduce是一种处理海量数据的并行编程模式,用于()大规模数据集的并行运算。
    A

    通常大于1GB

    B

    通常大于1ZB

    C

    通常大于1TB

    D

    通常大于1PB


    正确答案: A
    解析: 暂无解析

  • 第23题:

    单选题
    Hadoop中哪个模块负责HDFS的数据存储?()
    A

    NameNode

    B

    DataNode

    C

    ZooKeeper

    D

    JobTraoker


    正确答案: B
    解析: 暂无解析