下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计，错误的是（）.A、FSDataInputStream扩展了DataInputStream以支持随机读B、为实现细粒度并行，输入分片应该越小越好C、一台机器可能被指派从输入文件的任意位置开始处理一个分片D、输入分片是一种记录的逻辑划分，而HDFS数据块是对输入数据的物理分割

题目

下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计，错误的是（）.

A、FSDataInputStream扩展了DataInputStream以支持随机读
B、为实现细粒度并行，输入分片应该越小越好
C、一台机器可能被指派从输入文件的任意位置开始处理一个分片
D、输入分片是一种记录的逻辑划分，而HDFS数据块是对输入数据的物理分割

相似考题

1.下面哪个程序负责 HDFS 数据存储?()ANameNodeBJobtrackerCDatanodeDsecondaryNameNodeEtasktracker

2.关于Block和Split两个概念,下面说法错误的是()。A、Block是HDFS中最小的数据存储单位B、Split是MapReduce中最小的计算单元C、Block与Split是一一对应关系D、Block和Split之间对应关系是任意的，可由用户控制

3.MapReduce与传统并行计算框架的对比中,说法正确的是()。A.MapReduce属于共享式集群架构，容错性好B.传统并行计算框架比MapReduce硬件更加便宜C.传统并行计算框架适用于实时、细粒度计算D.MapReduce适用于数据密集型，传统并行计算框架适用于计算密集型

4.在大数据关键技术中，Hadoop的分布式文件系统HDFS属于大数据（）。A.存储技术B.分析技术C.并行分析技术D.挖掘技术

更多“下列关于HDFS为存储MapReduce并行切分和处理的数据做的”相关问题

第1题：

关于并行数据库系统的叙述中，错误的是
A．无共享的结构是支持并行数据库系统的最好的并行结构
B．在并行处理中，许多操作是同时执行的，而不是串行处理的
C．共享主存储器系统有时又称作群机
D．并行系统通过并行的使用多个CPU和磁盘来提高处理速度

正确答案：C
解析：无共享的结构是支持并行数据库系统的最好的并行结构；在并行处理中，许多操作是同时执行的，而不是串行处理的，共享磁盘系统有时又称作群机，并行系统通过并行的使用多个CPU和磁盘来提高处理速度。注意：共享磁盘系统有时又称作群机，而不是共享主存储器系统。
第2题：

在将数据源经过分析挖掘到最终获得价值的大数据处理过程中，MapReduce是在（）阶段应用分布式并行处理关键技术的常用工具。
A.数据采集
B.数据管理
C.数据存储
D.数据分析与挖掘

正确答案：B
第3题：

MapReduce包括（）和（）两个阶段，可以进行海量数据分割、任务分解与结果汇总，从而完成海量数据的并行处理。
- A、分布
- B、映射
- C、分析
- D、化简
正确答案:B,D
第4题：

并行数据处理技术MapReduce是由哪家公司最先提出的（）。
- A、谷歌公司
- B、百度公司
- C、雅虎公司
- D、脸谱公司
正确答案:A
第5题：

MapReduce是一种处理海量数据的并行编程模式，用于（）大规模数据集的并行运算。
- A、通常大于1GB
- B、通常大于1ZB
- C、通常大于1TB
- D、通常大于1PB
正确答案:C
第6题：

MapReduce执行过程中，数据存储位置不是在GFS上的是（）
- A、Map处理结果
- B、Reduce处理结果
- C、日志
正确答案:B
第7题：

（）并行数据处理系统适用于需要多次操作特定数据集的场景，非常适合于机器学习中迭代算法的执行。
- A、Spark
- B、Hive
- C、Haystack
- D、HDFS
正确答案:A
第8题：

单选题
下面关于HDFS架构关键设计要点错误的是（）。
A
支持回收站机制，以及副本数的动态设置机制
B
数据存储以数据块为单位，存储在操作系统的HDFS文件系统上
C
提供JAVAAPI，HTTP方式，SHELL方式访问HDFS数据
D
HDFS对外仅呈现多个统一的文件系统

正确答案： A
解析：暂无解析
第9题：

判断题
适合用MapReduce来处理的数据集(或任务)有一个基本要求:待处理的数据集可以分解成许多小的数据集，而且每一个小数据集都可以完全并行地进行处理。( )
A
对
B
错

正确答案：对
解析：
第10题：

多选题
MapReduce包括（）和（）两个阶段，可以进行海量数据分割、任务分解与结果汇总，从而完成海量数据的并行处理。
A
分布
B
映射
C
分析
D
化简

正确答案： C,B
解析：暂无解析
第11题：

单选题
并行数据处理框架MapReduce是（）公司在大数据领域的重要贡献。
A
百度
B
谷歌
C
脸谱
D
腾讯

正确答案： D
解析：暂无解析
第12题：

单选题
下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计，错误的是（）.
A
FSDataInputStream扩展了DataInputStream以支持随机读
B
为实现细粒度并行，输入分片应该越小越好
C
一台机器可能被指派从输入文件的任意位置开始处理一个分片
D
输入分片是一种记录的逻辑划分，而HDFS数据块是对输入数据的物理分割

正确答案： C
解析：暂无解析
第13题：

下列关于MapReduce说法不正确的是( )。

A.MapReduce是一种计算框架
B.MapReduce来源于google的学术论文
C.MapReduce程序只能用java语言编写
D.MapReduce隐藏了并行计算的细节，方便使用

正确答案：C
第14题：

MapReduce是一种编程模型，用于大规模数据集的并行运算，可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项？（）
- A、实时性
- B、高容错性
- C、易于扩展
- D、易于编程
正确答案:B,C,D
第15题：

MapReduce将传统的查询、分解及数据分析进行分布式处理，将处理任务分配到不同的处理（），因此具有更强的并行处理能力。
- A、模块
- B、节点
- C、集群
- D、工作流
正确答案:B
第16题：

spark进行数据切分的时候，划分完成的partition个数和hdfs中block个数一致

正确答案:正确
第17题：

与传统的分布程序设计相比，MapReduce封装了（）等细节，还提供了一个简单而强大的接口
- A、并行处理
- B、容错处理
- C、数据分布
- D、负载均衡
正确答案:A,B,C,D
第18题：

并行数据处理框架MapReduce是（）公司在大数据领域的重要贡献。
- A、百度
- B、谷歌
- C、脸谱
- D、腾讯
正确答案:B
第19题：

单选题
关于Hive和Hadoop其他组件的关系，以下描述错误的是？（）
A
Hive最终将数据存储在HDFS中
B
HiveSQL其本质是执行MapReduce任务
C
Hive是Hadoop平台的数据仓库工具
D
Hive对HBase有强依赖

正确答案： D
解析：暂无解析
第20题：

单选题
MapReduce执行过程中，数据存储位置不是在GFS上的是（）
A
Map处理结果
B
Reduce处理结果
C
日志

正确答案： B
解析：暂无解析
第21题：

单选题
文件上传到HDFS时，文件切分成数据块的工作是在？（）
A
Namenode完成的
B
Datanode完成的
C
client完成的
D
SecondaryNamenode完成的

正确答案： D
解析：暂无解析
第22题：

单选题
MapReduce是一种处理海量数据的并行编程模式，用于（）大规模数据集的并行运算。
A
通常大于1GB
B
通常大于1ZB
C
通常大于1TB
D
通常大于1PB

正确答案： A
解析：暂无解析
第23题：

单选题
Hadoop中哪个模块负责HDFS的数据存储？（）
A
NameNode
B
DataNode
C
ZooKeeper
D
JobTraoker

正确答案： B
解析：暂无解析

题目

相似考题

更多“下列关于HDFS为存储MapReduce并行切分和处理的数据做的”相关问题

相关内容