A.数据审核
B.数据编码
C.创建数据库
D.数据录人
第1题:
3、数据清洗包括检查数据一致性、处理无效值和缺失值等。
第2题:
清洗数据是发现并纠正数据文件中可识别错误的最后一道程序,包括()。
A.问卷扫描归档
B.检查数据的一致性
C.处理无效值
D.处理缺失值
第3题:
下列关于缺失值产生的原因不正确的是()
A.不可能是人为因素造成的。#B.属性或属性值暂时无法获取,或者获取所付出的代价太大。#C.属性值不存在。在某些情况下,缺失值并不意味着数据有错误,对一些属性来说属性值本身就是不存在的。采集数据的需求发生变化,造成属性集合的变化。#D.忘记填写或对数据理解错误等一些人为因素造成的遗漏,也可能是由于数据采集设备/存储介质/传输媒体的故障等客观因素造成的遗漏。第4题:
噪声数据的产生原因主要有()。
A.在数据录入过程中发生了人为或计算机错误
B.数据采集设备有问题
C.数据传输过程中发生错误
D.由于命名规则或数据代码不同而引起的不一致
第5题:
数据清洗包括检查数据一致性、处理无效值和缺失值等。