Kettle构建Hadoop ETL系统实践 轻松运用Kettle完成Hadoop数据仓库的FTL过
Kettle易用性好,编码工作量小,功能完备,基于Java,允许多线程与并发执行以提高效率。本书以CDH作为Hadoop平台,结合销售订单示例,详细介绍并演示如何使用Kettle完成Hadoop数据仓库的ETL过程。本书适合大数据分析系统开发、数据仓库系统设计与开发、DBA、架构师等相关技术人员阅读。
¥77.40定价:¥79.00 (9.8折) 电子书:¥27.65
Greenplum构建实时数据仓库实践 详解Greenplum构建实时数据仓库技术,使用纯SQL处理历史全量数据
本书详解Greenplum构建实时数据仓库,涉及的具体技术包括: MySQL主从复制,保证为业务系统提供可靠的数据库服务,并提供数据来源。 Canal Server实时获取增量MySQL binlog,并将其传入Kafka消息队列。 Kafka将消息持久化,同时提供可伸缩、高吞吐的消息服务。 Canal ClientAdapter负责消费Kafka中的消息,将数据流传输到Greenplum。 Greenplum提供实时ETL功能,自动维护操作数据存储、维度表与事实表。 Greenplum数据库权限与角色管理、数据导入导出、性能优化、监控与维护。 Greenplum集成机器学习库MADlib,对数据进行分析与挖掘。
¥87.20定价:¥89.00 (9.8折) 电子书:¥62.30
网上关于MySQL的资料比比皆是,但大部分都是针对单一具体问题的解答,例如如何配置MySQL双主复制等,全面系统讲述MySQL高可用这方面的资料并不多见。而且,这些资料大多只给出简单的实现方法,缺少相应的理论背景知识和分析验证过程。这是我写这本书的第二个原因,希望能填补缺口,让读者不但知其然,也知其所以然。 从2000年至今的20年里,我一直从事各种数据库相关的应用开发和管理工作,尤其是近年来一直跟MySQL数据库打交道。从*简单的单实例,到各种复制,再到集群以及与中间件的配合,在其使用上积累了一些经验和心得。这是我写这本书的第三个原因,希望将它们加以归纳和总结,汇集成书与读者分享。
¥97.00定价:¥99.00 (9.8折) 电子书:¥69.30
SQL机器学习库MADlib技术解析 掌握MADlib,使用SQL快速实现机器学习
作为一名数据库开发人员或DBA,当面对聚类分析或主成分分析等问题时可能会一筹莫展。原因很简单,用经典SQL语言实现这类复杂模型基本是不可能的。现在,DBA利用MADlib,只需使用SQL查询就能实现简单的机器学习,这也正是编写本书的初衷。MADlib与其他机器学习工具具有完全不同的设计理念。它不是面向程序员的,而是面向数据库开发人员或DBA的,是基于SQL的大数据机器学习库。MADlib将SQL的简单易用性与机器学习的复杂算法相结合,充分利用了两者的优势和特点。对于广大传统数据库应用技术人员来说,学习和从事机器学习工作的门槛将大大降低。对用户而言,MADlib提供了可在SQL查询语句中调用的函数,不仅包括基本的线性代数运算和统计函数,还提供了常用的、现成的机器学习模型函数,实现了分类、聚类、关联、回归、预测、评估等应用中的常见算法。用户
¥59.60定价:¥79.00 (7.55折)
Hadoop构建数据仓库实践 清华大学出版社 新华书店正版,关注店铺成为会员可享店铺专属优惠,团购客户请咨询在线客服!
¥66.80定价:¥89.00 (7.51折)
Hadoop构建数据仓库实践 王雪迎 著 新华书店正版,关注店铺成为会员可享店铺专属优惠,团购客户请咨询在线客服!
¥89.00定价:¥89.00