•  Hadoop构建数据仓库实践 9787302469803

    Hadoop构建数据仓库实践 9787302469803

    Product Details 基本信息 ISBN-13 书号 9787302469803 Author 作者 王雪迎 著 Format 版本 平装-胶订 Pages Number 页数 434页 Publisher 出版社 清华大学出版社 Publication Date 出版日期 2017-07-01 Product Dimensions 商品尺寸 16开 Language 语种 其它(含多语) Book Contents 内容简介 本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。 本书内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维

    ¥66.00定价:¥132.00 (5折)

    中国进口图书旗舰店

    王雪迎 /2017-07-01 /清华大学出版社

  •  Kettle构建Hadoop ETL系统实践 9787302582618

    Kettle构建Hadoop ETL系统实践 9787302582618

    Product Details 基本信息 ISBN-13 书号 9787302582618 Author 作者 王雪迎 Format 版本 平装-胶订 Pages Number 页数 332页 Publisher 出版社 清华大学出版社 Publication Date 出版日期 2021-08-01 Product Dimensions 商品尺寸 16开 Language 语种 其它(含多语) Book Contents 内容简介 Kettle是一款国外开源的ETL工具,纯Java编写,无须安装,功能完备,数据抽取高效稳定。 本书介绍并演示如何用Kettle完成Hadoop数据仓库上的ETL过程,所有的描绘场景与实验环境都是基于Linux操作系统的虚拟机。全书共分10章,主要内容包括ETL与Kettle的基本概念、Kettle安装与配置、Kettle对Hadoop的支持、建立ETL示例模型、数据转换与装载、定期自动执行ETL作业、维度表技术、事实表技术,以及Kettle并行、集群与分区技术。 本书既适合大数据分析系统开发、数据仓库系统设

    ¥59.00定价:¥118.00 (5折)

    中国进口图书旗舰店

    王雪迎 /2021-08-01 /清华大学出版社

  •  Greenplum 构建实时数据仓库实践 9787302611653

    Greenplum 构建实时数据仓库实践 9787302611653

    Product Details 基本信息 ISBN-13 书号 9787302611653 Author 作者 王雪迎 Format 版本 平装-胶订 Pages Number 页数 360页 Publisher 出版社 清华大学出版社 Publication Date 出版日期 2022-08-01 Product Dimensions 商品尺寸 16开 Language 语种 其它(含多语) Book Contents 内容简介 Greenplum分布式数据库具有可选存储模式、事务支持、并行查询与数据装载、容错与故障转移、数据库统计、过程化语言扩展等方面的功能特性,因此Greenplum成为一款理想的分析型数据库产品。本书详解Greenplum数据仓库构建与数据分析技术,配套示例源码。本书共分10章。内容包括数据仓库简介、数据仓库设计基础、Greenplum与数据仓库、Greenplum安装部署、实时数据同步、实时数据装载、维度表技术、事实表技术、Greenplum运维与监控、集成机器学习库MADlib。本书适合Green

    ¥66.00定价:¥132.00 (5折)

    中国进口图书旗舰店

    王雪迎 /2022-08-01 /清华大学出版社

广告