当前分类: 大数据智能办公系统知识
问题:SparkSQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用...
查看答案
问题:SCALA有以下哪些特点?()A、Scala是一门多范式(multi-paradigm)的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性B、Scala运行在Java虚拟机上,并兼容现有的Java程序C、Scala源代码被编译成Java字节码,所以它可以运行于JVM之上,并可以调用现有的Java类库D、SCALA语言简洁优雅大方,很多大数据底层框架采用scala去实现与编程...
问题:关于scala中的类和它的伴生对象,以下说法不正确的是()A、类和它的伴生对象定义在同一个文件中B、类和它的伴生对象可以有不同的名称C、类和它的伴生对象的名称必须相同D、类和它的伴生对象可以互相访问私有特性...
问题:和spark中执行算子相对应的那个()A、jobB、taskC、driverD、stage...
问题:scala语言中,关于List的定义。不正确的是?()A、vallist=List(1,2,3)B、vallist=List[Int](1,2,3)C、vallist=List[String](‘a’,’b’,’c’)D、vallist=List[String]()...
问题:下面算子中哪个是宽依赖的()A、mapB、flatmapC、reducebykeyD、sample...
问题:函数可以作为其他函数的参数...
问题:在scala中定义方法使用关键字()A、defB、mainC、objectD、class...
问题:flume由以下哪个公司开发的组件()A、ClouderaB、阿里巴巴C、京东D、google...
问题:spark中的实时计算系统是哪个()...
问题:spark架构中cache算子具有以下哪个特性()A、延迟执行B、立即执行C、等待执行D、陈列执行...
问题:spark中的action算子的特性是()A、懒执行B、立即执行C、一致性D、冗余性...
问题:以下对集合的描述正确的是()A、Set是一组没有先后次序的值B、Map是一组(键,值)对偶C、每个Scala集合特质或类都有一个带有apply方法的伴生对象,可以用此方法来构建该集合中的实例D、为了顾及安全性问题,Scala仅支持不可变集合而不支持可变集合。...
问题:saveAsSequenceFile动作算子将数据集中的元素以Hadoopsequencefile的格式保存到指定的目录下,可以使HDFS或者其他Hadoop支持的文件系统...
问题:distinct算子对源RDD进行去重后返回一个新的RDD...
问题:DataFrame可以通过多种来源创建:()A、SparkConfB、SparkContextC、SQLContextD、Spark Streaming...
问题:在scala中所有值类型的父类型是()A、AnyRefB、AnyValC、ObjectD、object...
问题:spark框架的API支持哪种语言进行开发()A、javaB、pythonC、scalaD、go...
问题:在大数据系统中的日志收集系统flume现在使用的版本是()A、OGB、NGC、MGD、BG...
问题:Spark是一种快速、通用、可扩展的大数据分析引擎,2009年诞生于加州大学伯克利分校AMPLab...