数据清洗 本书是一本专门针对数据清洗工作的需要而编写的一本实操性非常强的一本技术参考书,本书给出了大量案例和实操步骤,使初学者很快能掌握数据清洗的方法,快速上手从事数据清洗工作。本书既是数据清洗初学者的自学教材
数据清洗是大数据技术不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,把 脏 的数据变为 干净 的数据。本书详细讲解了ETL技术方法和常用工具、常用的数据清洗工具、数据抽取、数据转换与加载、对Web数据的采集、对RDBMS数据的清洗操作。目前市面上此类书还很少,对数据清洗从业人员是一本不可多得的技术参考书,也可以作为应用型院校的课程教材。
¥40.60定价:¥58.00 (7折)
刘鹏 张燕 李法平 陈潇潇 /2018-06-19 /清华大学出版社