ETL是()Transform Load的缩写,描述一个过程,是构建数据仓库系统非常核心的过程A、ExportB、ExplainC、ExtractD、Electric

题目

ETL是()Transform Load的缩写,描述一个过程,是构建数据仓库系统非常核心的过程

  • A、Export
  • B、Explain
  • C、Extract
  • D、Electric

相似考题
更多“ETL是()Transform Load的缩写,描述一个过程,是”相关问题
  • 第1题:

    Why do dates require special treatment during the ETL process?

    为什么在ETL的过程中需要对日期进行特殊处理?


    正确答案:
    答:在数据仓库的项目中,分析是主导需求,而基于日期和时间的分析更是占了很大的比重。而在操作型源系统中,日期通常都是SQL的DATETIME型的。如果在分析时,使用SQL对这种类型的字段临时处理会出现一些问题,如效率很差,不同的用户会采用不同的格式化方法导致报表不统一。所以,在数据仓库的建模时都会建立日期维度表和时间维度表,将用到的和日期相关的描述都冗余到该表中。
    但是,并不是所有的日期都被转化为日期维度表的外键。日期维度表中的记录是有限的,有些日期如生日等可能会比日期维度表中记录的最小日期还要早,这类字段可以直接在数据仓库中保存SQL的DATETIME型。而像购买日期等与分析的业务紧密相关的通常都需要转化为日期维度表的外键,可以用日期维度表中统一的描述信息进行分析。

  • 第2题:

    Describe the different types of ETL metadata and provide examples of each.

    举例说明各种ETL过程中的元数据。


    正确答案:
    答:元数据是ETL项目组面对的一个非常重要的主题,对于整个数据仓库项目也是非常重要的一部分。对于元数据的分类和使用没有很确定的定义。
    通常来说,我们可以把元数据分为三类,分别为业务元数据(Business Metadata),技术元数据(Technical Metadata)和过程处理元数据(Process Execution Metadata)。
    业务元数据,是从业务的角度对数据的描述。通常是用来给报表工具和前端用户对数据进行分析和使用提供帮助。
    技术元数据,是从技术的角度对数据的描述。通常包括数据的一些属性,如数据类型、长度、或者数据概况分析后一些结果。
    过程处理元数据,是ETL处理过程中的一些统计数据,通常包括有多少条记录被加载,多少条记录被拒绝接受等数据

  • 第3题:

    在Web Service中用于描述WEB服务的语言是( )。

     A、WSDL

     B、UML

     C、XML

     D、ETL

    求答案与解析。


    Web service描述语言(WSDL)就是这样一个基于XML的语言,用于描述Web service及其函数、参数和返回值。因为是基于XML的,所以WSDL既是机器可阅读的,又是人可阅读的,这将是一个很大的好处。一些最新的开发工具既能根据你的Web service生成WSDL文档,又能导入WSDL文档,生成调用相应Web service的代码。 

  • 第4题:

    什么是ETL?


    正确答案: E.TL用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。
    E.TL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。

  • 第5题:

    关于375型现场通讯器的缩写描述错误的是:()

    • A、PV是过程变量
    • B、LRV是下限值
    • C、HRV是上限值
    • D、URV是上限值

    正确答案:C

  • 第6题:

    以下关于ETL质量控制表述不正确的是哪一个()

    • A、ETL质量控制的目标是保证ETL程序完成并通过测试,数据装载进入数据仓库并通过数据验证与检查
    • B、以“检查单”的形式对跟踪检查过程中发现的问题进行分析,并提出解决方案建议
    • C、依据数据源状态报告、需求分析说明书、数据仓库逻辑模型机说明文档、数据仓库物理模型及说明文档对ETL过程中得关键点进行跟踪检查
    • D、ETL质量控制饿目标位保证模型的设计、加载策略、权限设计以及前端展现设计严格满足需求分析的要求;保证为最终用户提供共享多维信息的快速分析和即时数据库查询

    正确答案:D

  • 第7题:

    下面有关Select菜单下的Transform Selection(变形选区)命令与Edit菜单下的Free Transform(自由变形)命令描述正确的是()。

    • A、Transform Selection命令只能将选择区域变形,而不能对选择区域中的对象进行变形
    • B、Transform Selection可以将选择区域和选择区域中的对象一起变形
    • C、Free Transform命令只能将选择区域中的对象变形,而不能将选择区域变形
    • D、Free Transform命令可以将选择区域和选择区域中的对象一起变形

    正确答案:A,D

  • 第8题:

    以下关于ETL质量控制表述不正确的是哪一个()

    • A、ETL质量控制的目标是保证ETL程序完成并通过测试,数据装载进入数据仓库并通过数据验证与检查
    • B、以“检查单”的形式对跟踪检查过程中发现的问题进行分析,并提出解决方案建议
    • C、依据数据源状态报告、需求分析说明书、数据仓库逻辑模型及说明文档、数据仓库物理模型及说明文档对ETL过程中的关键点进行跟踪检查
    • D、ETL质量控制的目标为保证模型的设计、加载策略、权限设计以及前端展现设计严格满足需求分析的要求;保证为最终用户提供共享多维信息的快速分析和即时数据库查询

    正确答案:D

  • 第9题:

    数据仓库的数据ETL过程中,ETL软件的主要功能包括:

    • A、数据抽取
    • B、数据转换
    • C、数据加载
    • D、数据稽核

    正确答案:A,B,C

  • 第10题:

    单选题
    以下哪个是ETL的实现方式?()
    A

    存储过程

    B

    数据转换

    C

    元数据服务

    D

    全文目录


    正确答案: D
    解析: 暂无解析

  • 第11题:

    多选题
    数据仓库的数据ETL过程中,ETL软件的主要功能包括:
    A

    数据抽取

    B

    数据转换

    C

    数据加载

    D

    数据稽核


    正确答案: B,C
    解析: 暂无解析

  • 第12题:

    单选题
    窗体Form1的名称属性是frm,它的Load事件过程名是()
    A

    frm_Load

    B

    Me_CmdOK

    C

    Form-Load

    D

    Form_Load


    正确答案: D
    解析: 暂无解析

  • 第13题:

    Name the three fundamental fact grains and describe an ETL approach for each.

    简述三种基本事实表,并说明ETL的过程中如何处理它们。


    正确答案:
    答:事实表从粒度的角色来划分可以分为三类,分别是交易粒度事实表(Transaction Grain)、周期快照粒度事实表(Periodic Snapshot)和累计快照粒度事实表(Accumulating Snapshot)。在事实表的设计时,一定要注意一个事实表只能有一个粒度,不能将不同粒度的事实建立在同一张事实表中。
    交易粒度事实表的来源伴随交易事件成生的数据,例如销售单。在ETL过程中,以原子粒度直接进行迁移。
    周期快照事实表是用来记录有规律的,固定时间间隔的业务累计数据,例如库存日快照。在ETL过程中,以固定的时间间隔生成累计数据。
    累积快照事实表用来记录具有时间跨度的业务处理过程的整个过程的信息。在ETL过程中,随着业务处理过程的步骤逐步完善该表中的记录。

  • 第14题:

    Describe how to estimate the load time of a large ETL job.

    Real Time ETL

    简述如何评估大型ETL数据加载时间。


    正确答案:
    答:评估一个大型的ETL的数据加载时间是一件很复杂的事情。数据加载分为两类,一类是初次加载,另一类是增量加载。
    在数据仓库正式投入使用时,需要进行一次初次加载,而这次初次加载需要的时间一般较难预料。在数据仓库的日常使用和维护中,每天需要对数据仓库进行增量加载。增量加载的数据量要比初次加载小很多。
    下面以初次加载为例来谈谈如何评估大型ETL的数据加载时间。
    对初次加载的加载时间进行预估,需要将整个ETL过程分成抽取、转换和加载三部分,分别对这三部分进行评估。
    1.对抽取时间的评估。
    抽取通常占用的ETL的大部分时间,而且对这部分需要时间的评估也是非常困难的。为了对这部分时间进行评估,我们可以将查询时间分成两部分,一部分是查询响应时间,另一部分是数据返回时间。查询响应时间指从查询开始执行到结果开始返回这段时间。数据返回时间指第一条记录返回到最后一条记录返回的时间。
    另外,初次加载的数据量太大,我们可以考虑选择其中的一部分来评估整体的时间,实际处理中,可以选择事实表的一个分区。一般来说各个分区的数据量差不多,评估出一个分区的时间,乘上分区数可以作为整体的评估时间。
    2.对数据转换时间的评估
    数据转换工作通常在内存中完成,一般来说都有着非常快的速度,占总体时间的比重比较小。如果要评估这部分需要的时间的话,最简单的评估方法是先评估出抽取时间和加载时间,然后运行整个过程,用整体时间减去抽取时间和加载时间。
    3.对加载时间的评估
    很多原因都可能影响加载时间,其中最重要的两个分别是索引和日志。
    对加载时间的评估,也可以像评估抽取时间时一样,选择加载数据的一部分,如1/200进行加载,计算出时间后乘以200来作为整体加载时间。
    总之,大型ETL数据的加载时间的评估是很困难的,我们采用的方法主要是类比评估,即选择一部分数据减少整体时间进行评估。在进行评估时要注意到测试环境和生产环境的配置等的差别会引起评估结果的偏差。虽然这种对时间的评估一定会有误差,但是可以做为整体加载时间的一个参考。

  • 第15题:

    数据仓库的数据ETL过程中,ETL软件的主要功能包括:

    A.数据抽取

    B.数据转换

    C.数据加载

    D.数据稽核


    参考答案:A,B,C

  • 第16题:

    抽取、转换、加载过程的目的是为决策支持应用提供一个()、权威数据源。因此,我们要求ETL过程产生的数据是详细的、历史的、规范的、可理解的、即时的和质量可控制的。


    正确答案:单一的

  • 第17题:

    DB中的数据真正要存储到DW中,还必须经过ETL过程,即()()和()的过程。


    正确答案:抽取;转换;装载

  • 第18题:

    什么是数据仓库的数据ETL过程?


    正确答案: 数据的ETL过程就是负责将操作型数据转换成调和数据的过程。数据调和是构建一个数据仓库中最难的和最具技术挑战性的部分。在为企业级数据仓库填充数据的过程中,数据调和可分为两个阶段:一是企业级数据仓库(EDW)首次创建时的原始加载;二是接下来的定期修改,以保持EDW的当前有效性和扩展性。
    整个过程由四个步骤组成:抽取、清洗、转换、加载和索引。事实上,这些步骤可以进行不同的组合,如,可以将数据抽取与清洗组合为一个过程,或者将清洗和转换组合在一起。

  • 第19题:

    以下哪个是ETL的实现方式()

    • A、存储过程
    • B、数据转换
    • C、元数据服务
    • D、全文目录

    正确答案:A

  • 第20题:

    以下操作可以将div大小缩小为原来的1/2,css正确的是()。

    • A、transform:scale(1)
    • B、transform:scale(0.5)
    • C、transform:skew(2)
    • D、scale(2)

    正确答案:B

  • 第21题:

    以下有关ETL表述不正确的是哪一个()

    • A、ETL由三个子过程构成:数据抽取、数据转换和数据加载
    • B、ETL又可以扩展为可以分为4个步骤:数据抽取、数据清洗、数据转换盒数据加载,即ETCL
    • C、ETL设计涉及到错误恢复过程设计、归档转储过程设计、作业调度过程设计等内容
    • D、根据选用的数据仓库工具将数据从数据源抽取到数据库,然后根据业务规则转换和集成为数据仓库中需要的数据格式,最后将换转的结果装入数据仓库

    正确答案:D

  • 第22题:

    多选题
    ETL即()的过程,是构建数据仓库的重要环节。
    A

    数据抽取

    B

    转换

    C

    装载


    正确答案: C,A
    解析: 暂无解析

  • 第23题:

    单选题
    ETL是()Transform Load的缩写,描述一个过程,是构建数据仓库系统非常核心的过程
    A

    Export

    B

    Explain

    C

    Extract

    D

    Electric


    正确答案: C
    解析: 暂无解析

  • 第24题:

    单选题
    You design a Business Intelligence (BI) solution by using SQL Server 2008. You create a SQL Server 2008 Integration Services (SSIS) package to perform an extract, transform, and load (ETL) process to load data to a DimCustomer dimension table that contains 1 million rows. Your data flow uses the following components: A SQL Destination data flow task to insert new customers An OLE DB Command transform that updates existing customers On average, 25 percent of existing customer records is updated each night. You need to reduce the amount of time required to update customer records. What should you do?()
    A

     Modify the UPDATE statement in the OLE DB Command transform to use the PAGLOCK table hint. 

    B

     Modify the UPDATE statement in the OLE DB Command transform to use the TABLOCK table hint. 

    C

     Stage the data in the data flow. Replace the OLE DB Command transform in the data flow with an Execute SQL task in the control flow.

    D

     Stage the data in the data flow. Replace the UPDATE statement in the OLE DB Command transform with a DELETE statement followed by an INSERT statement.


    正确答案: D
    解析: 暂无解析