Kettle构建Hadoop ETL系统实践 轻松运用Kettle完成Hadoop数据仓库的FTL过
Kettle易用性好,编码工作量小,功能完备,基于Java,允许多线程与并发执行以提高效率。本书以CDH作为Hadoop平台,结合销售订单示例,详细介绍并演示如何使用Kettle完成Hadoop数据仓库的ETL过程。本书适合大数据分析系统开发、数据仓库系统设计与开发、DBA、架构师等相关技术人员阅读。
¥75.10定价:¥79.00 (9.51折) 电子书:¥27.65
Greenplum构建实时数据仓库实践 详解Greenplum构建实时数据仓库技术,使用纯SQL处理历史全量数据
本书详解Greenplum构建实时数据仓库,涉及的具体技术包括: MySQL主从复制,保证为业务系统提供可靠的数据库服务,并提供数据来源。 Canal Server实时获取增量MySQL binlog,并将其传入Kafka消息队列。 Kafka将消息持久化,同时提供可伸缩、高吞吐的消息服务。 Canal ClientAdapter负责消费Kafka中的消息,将数据流传输到Greenplum。 Greenplum提供实时ETL功能,自动维护操作数据存储、维度表与事实表。 Greenplum数据库权限与角色管理、数据导入导出、性能优化、监控与维护。 Greenplum集成机器学习库MADlib,对数据进行分析与挖掘。
¥84.60定价:¥89.00 (9.51折) 电子书:¥62.30
网上关于MySQL的资料比比皆是,但大部分都是针对单一具体问题的解答,例如如何配置MySQL双主复制等,全面系统讲述MySQL高可用这方面的资料并不多见。而且,这些资料大多只给出简单的实现方法,缺少相应的理论背景知识和分析验证过程。这是我写这本书的第二个原因,希望能填补缺口,让读者不但知其然,也知其所以然。 从2000年至今的20年里,我一直从事各种数据库相关的应用开发和管理工作,尤其是近年来一直跟MySQL数据库打交道。从*简单的单实例,到各种复制,再到集群以及与中间件的配合,在其使用上积累了一些经验和心得。这是我写这本书的第三个原因,希望将它们加以归纳和总结,汇集成书与读者分享。
¥78.20定价:¥99.00 (7.9折) 电子书:¥69.30
Hadoop构建数据仓库实践 清华大学出版社 新华书店正版,关注店铺成为会员可享店铺专属优惠,团购客户请咨询在线客服!
¥66.80定价:¥89.00 (7.51折)
SQL机器学习库MADlib技术解析 掌握MADlib,使用SQL快速实现机器学习
作为一名数据库开发人员或DBA,当面对聚类分析或主成分分析等问题时可能会一筹莫展。原因很简单,用经典SQL语言实现这类复杂模型基本是不可能的。现在,DBA利用MADlib,只需使用SQL查询就能实现简单的机器学习,这也正是编写本书的初衷。MADlib与其他机器学习工具具有完全不同的设计理念。它不是面向程序员的,而是面向数据库开发人员或DBA的,是基于SQL的大数据机器学习库。MADlib将SQL的简单易用性与机器学习的复杂算法相结合,充分利用了两者的优势和特点。对于广大传统数据库应用技术人员来说,学习和从事机器学习工作的门槛将大大降低。对用户而言,MADlib提供了可在SQL查询语句中调用的函数,不仅包括基本的线性代数运算和统计函数,还提供了常用的、现成的机器学习模型函数,实现了分类、聚类、关联、回归、预测、评估等应用中的常见算法。用户
¥59.60定价:¥79.00 (7.55折)
Hadoop构建数据仓库实践 通过构建数据仓库,深入学习Hadoop, 轻松掌握大数据技术
本书共13章,主要内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用Hive进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训学校相关专业的师生教学参考。
¥84.60定价:¥89.00 (9.51折) 电子书:¥26.99
HAWQ数据仓库与数据挖掘实战 通过HAWQ与MADlib,深入学习大数据分析技术
HAWQ安装、连接、对象与资源管理、查询优化、备份恢复、高可用性、运维监控ETL处理、自动调度系统、维度表与事实表技术、OLAP与数据的图形化表示降维、协同过滤、关联规则、回归、聚类、分类等常见数据挖掘与机器学习方法
¥74.00定价:¥98.00 (7.56折) 电子书:¥49.00
MySQL高可用实践 清华大学出版社 新华书店正版,关注店铺成为会员可享店铺专属优惠,团购客户请咨询在线客服!
"网上关于MySQL的资料比比皆是,但大部分都是针对单一具体问题的解答,例如如何配置MySQL双主复制等,全面系统讲述MySQL高可用这方面的资料并不多见。而且,这些资料大多只给出简单的实现方法,缺少相应的理论背景知识和分析验证过程。这是我写这本书的第二个原因,希望能填补缺口,让读者不但知其然,也知其所以然。从2000年至今的20年里,我一直从事各种数据库相关的应用开发和管理工作,尤其是近年来一直跟MySQL数据库打交道。从最简单的单实例,到各种复制,再到集群以及与中间件的配合,在其使用上积累了一些经验和心得。这是我写这本书的第三个原因,希望将它们加以归纳和总结,汇集成书与读者分享。"
¥83.20定价:¥99.00 (8.41折)
Hadoop构建数据仓库实践 王雪迎著 大数据技术教程 Hadoop数据仓库搭建指南 深入学习Hadoop构建数据仓库 B8
¥73.90定价:¥88.00 (8.4折)
【正版新书.天】Greenplum构建实时数据仓库实践王雪迎清华大学出版社9787302611653 【本店支持开发票 如需帮助请联系客服】
¥91.34定价:¥91.34