
2014年天猫双11购物狂欢节成交额创下了571.12亿元的纪录! 交易创建峰值能力达到每秒钟8万笔,支付宝的支付峰值突破了每分钟285万笔。 成功创下这项纪录背后,有ODPS很大的功劳! *集团副总裁刘振飞表示,云计算在今年双11起到了非常重要的基础性作用。天猫、*、支付宝的大数据处理,都是基于阿里云计算的大数据处理平台ODPS完成,ODPS为天猫双十一的商品个性化推荐提供了技术支持,这是自主研发能力的一个很大提升。 ODPS(OpenDataProcessingService)是*自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很好的口碑,正逐步走向第三方开放市场? 本书是学习和掌握ODPS的权威指南,作者来自阿里ODPS团队。 本书包括以下重


1.本书提供Mooc等辅助教学资源,方便教学。2.每章*后小节给出一个完整项目实践案例,帮助读者系统理解数据库技术应用方法。解决传统教材理论知识与产业工程实践脱节、工程案例偏少的问题。3.本书第7章介绍了目前大量应用的NoSQL数据库技术及其应用方法,如键值对数据库、列存储数据库、文档数据库、图形数据库等技术知识。

本书以MySQL数据库的基础及维护为切入点,重点介绍了MySQL数据库应用系统的性能调优,以及高可用可扩展的架构设计。



1. 强调实战2. 覆盖大数据行业主流技术岗位,紧跟市场与企业步伐3. 来自企业的骨灰级大咖授课4. 内容结构完整,根据循序渐的认识规律设计章节顺序

本书是实用的PostgreSQL快速上手指南,简明扼要地介绍了PostgreSQL核心概念与功能特性,可以帮助读者快速学习、理解并运用好这款源数据库。除了用诸多示例重演示如何实现在别的数据库中难以实现或者根本不可能实现的任务,作者还介绍了ANSI-SQL语法、外部数据封装器增强、全文检索函数和运算符、XML语法、逻辑复制等PostgreSQL 9.5之后版本的新增功能,充分展示了PostgreSQL作为全栈数据库的强大功能和企业级特性。- 执行基本的数据库管理任务,比如角色管理、数据库创建、数据备份和恢复等;- 使用psql命令行工具以及pgAdmin图形化管理工具;- PostgreSQL的表、约束和索引等数据库对象的特性和使用方法;- PostgreSQL所特有的若干功能强大的SQL语法;- 使用多种不同的编程语言来编写PostgreSQL函数;- 实施语句调优以充分挖掘服务器硬件的潜能;- 通过外部数据封装器来查询

介绍了当前*热门的基于浏览器的数据可视化库D3,它可以把数据加载到网页中并给予数据生产各种图表。要看懂这本书,之前有没有编程经验不太重要。也许你写过程序,也听说过JavaScript语言的各种传闻,那你可以从D3和数据可视化入手,,跟JavaScript**次亲密接触。

众多公司花费了大量的时间和金钱获取数据,并将大量的数据保存在一个叫做数据湖的数据容器中。但是,其中又能有多少公司把数据从数据湖中取回并加以利用呢?事实上,很少有公司能把数据湖当成信息的金矿来使用。多数公司zui终得到的仅仅是一个垃圾场。本书将会告诉你如何去构建一个有用的数据湖,从而让数据科学家与数据分析师能够面对业务挑战并发现新的商机。通过阅读本书,你将能够学习如何:?构建数据湖并模拟数据;?应用数据及基于文本的数据池,从而将业务价值zuida化;?理解原始数据池的角色定位;?掌握使用归档数据池的时机;?利用4大核心组件:元数据、业务的整合对应,语境及元过程信息。本书的作者曾经让我们放眼于数据仓库的架构与成效,如今他又将我们带到数据湖架构的新高度。

面对庞杂的大数据,可视化提供了良好的解读角度与方法,是大数据分析与应用的利器。 本书全面、细致地梳理了可视化的历史,理论,工具与应用案例,旁征博引,图文并茂,内容翔实丰富,专业严谨,是了解可视化知识的不二之选,也特别值得相关从业人员作为案头参考书备存。 本书选十二五国家重图书出版规划项目“大数据丛书”,并获得该领域著名学术带头人之一马匡六教授,石教英教授的专序推荐。 本书同时配备了在线资料提供与更新服务,读者可以随时与作者互动,深探讨。

这本书不要求读者的编程基础和数学知识,以尽量通俗易懂的语言来解释晦涩的数据挖掘算法原理,本书所保留的数学公式都是*基本的、不得不保留的公式,这将本书的阅读门槛降到了**。学习本书,读者将掌握*实用的数据挖掘算法,并能够立刻应用它们。

本书用轻松话语讲述一线数据分析技术,既有统计方法与分析技巧,更有奇闻趣事和哲学感悟,为你的数据分析之路指点迷津。


精通实时大数据分析! Druid项目主要创始人杨仿今、蚂蚁金服CTO鲁肃、饿了么CTO张雪峰、Testin云测总裁徐琨、 Druid中国用户组发起人陈冠诚、 TalkingData CTO肖文峰、 OneAPM创始人,董事长何晓阳、Cloudera大中华区技术总监刘隶放、神策数据公司创始人 CEO桑文锋、AdMaster(精硕科技)技术副总裁卢亿雷、微软中国研发中心,高级研发总监 Sherman Tong、AdHoc吆喝科技创始人CEO 王晔联合力荐!


特别推荐: 自己动手写 CPU( 含 CD 光盘 1 张 ) Java 特种兵(上册)(含 CD 光盘 1 张) 搜酷 : 全球智能硬件与技术精华集 ( 全彩 ) 三分虚拟技术,七分分布式管理,十二分大数据,深大数据系统设计、环境安装、发实践,助你快速投实战,直具备大数据系统研发能力。 推荐: 大数据:技术与应用实践指南 推荐阅读: 创新设计:如何造赢得用户的产品、服务与商业模式 互联网创业密码(互联网创业真人真事深度访谈实录:唱吧、胡莱和百思不得姐、春雨医生、视频达人秀、醋溜科技、爱记账、布丁、恺英、3W 咖啡、塔防三国志和贝瓦。) 同作者作品: 软件需求十步走——新一代软件需求工程实践指南(国内真正讲清软件需求的著作!切实解决软件需求的不完整、不准确等难问题,有助发能用、好用、耐用的软件产品) 推荐:管理海量

关于数据中心运维管理的书籍很多,但本书不落俗套,令人耳目一新之处在于: 资深的主创团队本书支持单位和主创团队绝大多数参与过《数据中心场地基础设施运维管理标准》的编写; 业内罕见的揭秘深度本书由国内运维经营们联袂创作,其中不仅有成功经验,还有对挫折和教训的反思,甚至还有惊心动魄的数据中心火灾过程。 新颖的内容布局本书的两大部分, 运维人手记 和 关键设备运维指南 ,既有内容丰富有趣的小说,还有专业的运维知识介绍。


中国商业联合会数据分析专业委员会组织的数据分析员(CDA)考试丛书,针对数据分析门者。包括: 《CDA数据分析考试大纲》 《CDA数据分析:零基础门》 《CDA数据分析实务》 中国商业联合会数据分析专业委员会是经国务院国有资产监督管理委员会审核同意、中华人民共和国民政部正式批准和登记的中国数据分析行业主管协会。协会推出的人才培养体系: CPDA数据分析师 CDA数据分析员 协会网址:http://www.chinacpda.org 培训网址:http://www.cdachina.com

大数据作为人工智能的基石,当前正站在计算机技术发展的风口, 而作为Apache*项目的HBase的优势是高性能读写、弹性伸缩、面向列族存储,能够轻松应对数据存储的爆发,提供对千万级QPS低延时需求支持,毫无疑问是企业搭建大数据在线实时应用的*。Hadoop生态系统的HDFS和MapReduce分别为大数据提供了存储和分析处理能力,但是对在线实时的数据存取则爱莫能助,而HBase弥补了Hadoop的这一缺陷,满足了在线实时系统低延时的需求。本书以精炼的语言介绍HBase基础知识,让初学者能够快速上手使用HBase,对HBase 的核心架构思想(如数据读取、数据备份等)有深的了解,并且剖析HBase源码,介绍HBase 1.X 以及2.0带来的新特性,让有经验的HBase发人员也能够循序渐地深理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,同时不

Hadoop 是目前受关注的大数据处理平台和解决方案,并且已经广泛应用于生产环境。本书基于新的 Hadoop ( CDH5 , ApacheHadoop 2.6 )版本介绍 Hadoop 技术的相关知识,不但详细介绍了 Hadoop 、 HDFS 、 YARN 、 MapReduce 、 Hive 、 Sqoop 和 HBase 等,还深探讨了 Hadoop 、 HBase 的运维和性能调优,并包含了一个具有代表性的完整的基于 Hadoop 的商业智能系统的设计和实现。 本书的大特是面向实践。基础篇介绍 Hadoop 及相关组件的同时,包含了大量动手实例,而应用篇包含的基于 Hadoop 的完整实例脱胎于生产环境的真实项目。在应用篇中,读者不仅能够通过项目实战巩固基础篇的学习效果,还能学习商业智能系统的发过程。 本书由浅至深,从理论基础到项目实战,适合 Hadoop 的初学者阅读,也可以作为高等院校相关课程的教学参考书。 本书主要内容 包含了 Hadoop 新版本的几

SQLServer2012王者归来——基础、安全、开发及性能优化(光盘内容另行下载,地址见书封底)
资深程序员10年开发经验的总结,深入剖析SQL Server 2012的精髓 全面涵盖SQL Server 2012数据库基础、安全、管理、开发及性能优化 视频教学:专门录制了18小时高清配套教学视频,便于读者更加高效、直观地学习 内容全面:从基础的SQL语法,到复杂的性能优化,涵盖了SQL Server 2012大部分功能 内容新颖:紧跟SQL Server数据库技术的**趋势,总结了大量的全新观点和应用 示例丰富:提供了670个精巧示例和操作,并用T-SQL语句和可视化操作两种方式实现 由浅入深:从基本的数据库概念和操作开始,逐步深入到数据库安全、开发和性能优化 讲解详细:对每个知识点都从概念、语法、示例、技巧和应用等多个角度进行分析 对比分析:对SQL Server 2005/2008/2012等几个*常用版本的不同特性进行了对比分析 推荐阅读(请点击链接): “Linux典藏大系” (丛书畅销10万册,

本书是一本广受好评的Cassandra图书。


本书基于Neo4j数据库3.5版本及其对应的ALGO和APOC扩展包,详细介绍了近二百个主要过程和函数的定义、相关理论、使用方法、代码样例,让广大Neo4j图数据库的设计和发人员能够快速掌握正确和高效的图数据库分析方法及其应用发技能。





信息和网络技术的高速发展使得大数据成为当前学术界和工业界的研究热,数据爆炸式的增长给人类社会带来了前所未有的机遇与挑战。一方面,基于大数据的处理、分析和共享等技术可以提高企业经济和社会效益。另一方面,隐私已经成为大数据应用领域亟待解决的重要问题。在大数据时代,如何做到获取和利用数据与个人隐私安全的平衡,已然成为当下亟需解决的一个时代命题。


《数据决策:企业数据的管理、分析与应用》详细介绍了数据战略规划,企业数字化运营,客户智能运营,业务主题优化,行业应用案例

分析和总结了工业大数据应用过程中的做法和经验,为实践提供指导。

全面系统地介绍了达梦数据库体系结构、数据库日常维护操作和数据库基本参数设置,是学习达梦数据库的基础教材和参考用书。

本书在Oracle社区中被公认为是zui好的Oracle PL SQL程序设计权V指南。如果想要充分利用PL SQL,本书无疑是绝佳的资源。本书第6版全面讲解了PL SQL的特性和功能,涵盖了直到Oracle数据库12c R1版本发生的新变化。在过去20多年,成千上万的PL SQL程序发人员从本书中受益,这次的新版延续了之前的风格,提供了丰富的代码示例,穿插了程序发人员才能看懂的小幽默。本书介绍了PL SQL语言的基础知识、高级编码技巧,并提供了zui佳实践来帮助大家解决真实世界中的问题。本书讲解了如下内容:借助于有关执行、跟踪、调试和管理代码的清晰指导,快速编写和运行PL SQL程序;学习12.1版本的新特性,包括ACCESIBLE_BY子句、WITH FUNCTION和UDF杂注以及视图的BEQUEATH CURRENT_USER权限;充分利用书中提供的大量代码示例(从易于遵循的示例到可重用的包工具,不一而足);使用诸如PL Scope和PL SQL

实用的Python源模块的大集合;简单易懂、示例丰富的数据分析教程;掌握数据可视化、机器学习等高端主题;新手变身数据分析专家的上好读本;


推荐: 《 Spark 大数据处理技术》 ( SharkSpark SQLSpark StreamingGraphxTachyon 深度解密 Spark 完整生态 ** Committer 凝聚一流实力与超前视野 Spark 创始人及实践先驱联合推荐) 《 Hadoop 硬实战》 学习 Hadoop 和 Mapreduce 不二之选 85 个 Hadoop 高级技巧实战案例 《寻路大数据:海量数据与大规模分析》 ( Google 大数据专家力作超豪华译者 作序者微博 高德 UCloud 三大老总联合作序推荐真正梳理趋势与生态 方案与工具选型 应用场景与价值挖掘的独家内参) 《深理解 Oracle RAC 12c 》 本土Oracle数据库性能优化**大师泣血力作 集十数年实战修行与潜心钻研之大成 盖国强等国内数据库一线名家联合推荐 囊括数据库性能优化技术所有分支与脉络,讲解通俗,实例经典


数据科学和大数据分析是指利用数据的力量来发现新的见解。本书涵盖了数据科学涉及的行为广度以及所使用的方法和工具。本书内容侧重于任何行业和技术环境中都会用到的概念、原理和实际应用,并通过源软件来分析案例,以帮助读者更好地理解。本书将帮助您:成为数据科学团队中的一名贡献者;部署结构化的生命周期方法来分析数据问题;应用合适的分析技术和工具来分析大数据;学习如何用数据来讲一个动人的故事,以推动商业行为;备考EMC Proven Professional数据科学家认证。EEMC专家认证是IT行业领先的教育和认证项目,涵盖了信息存储技术、虚拟化技术、云计算、数据科学与大数据分析等领域。通过认证是一种很好的自我投资方式,同时也是对自己专业知识的正式验证。本书可以作为准备数据科学专员(EMCDSA)认证的资料。在驱动企业和服务提供商转型

《*、天猫电商数据分析与挖掘实战(第2版)》第1版获得了很多读者的认可,甚至有不少高校将其改编成了教程,但《*、天猫电商数据分析与挖掘实战(第2版)》依旧有许多不足之处,比如对于运营模块内容较少而且不够深,特别是数据挖掘套件的安装和部署难倒了许多读者。 《*、天猫电商数据分析与挖掘实战(第2版)》第2版为了跟上时代的变化和解决软件部署烦琐的问题,首先将线下的数据平台改成新平台,或是用其他平台替代;其次是对于软件方面的升级,将 SQL Server 的挖掘套件换成了SmartMining 个人版,部分章节使用了 Excel 2016 版本,用 Power Pivot 实现数据建模,用PowerQuery 提升数据清洗的能力。

《数据分析与量化投资 基于SAS的应用》基于SAS EG平台,采用项目管理的过程流方式,介绍数据分析及量化投资策略,让不熟悉编程的读者可以利用类似于SPSS的功能去完成统计分析,还可以调用本书中提供的宏语法快速行分析。

MySQL是世界上*受欢迎的数据库管理系统之一,其高效、稳定、灵活、可扩展性强并且简单易学,这些特性使其在全球获得越来越多的发人员的青睐。与其他数据库相比,MySQL易学易用。通过本书的学习,读者可以轻松掌握前沿的MySQL技术,为以后高级特性的学习和应用程序的发夯实数据库基础理论。 本书以零基础讲解为宗旨,以MySQL 5.7为蓝本,突出MySQL 5.7的新特性,用实例引导读者深学习,深浅出地讲解MySQL的各项技术及实战技能。本书并不是枯燥的介绍理论,而是通过不同难度的案例结合,比较全面地介绍MySQL数据库。 本书适合任何想学习MySQL的人员,无论你是否从事计算机相关行业,是否触过MySQL,通过本书的学习均可快速掌握MySQL管理和发的方法和技巧。

数学菜鸟也能搞懂数据分析! 从零学起:没有深奥的理论和晦涩的知识 实际体验:免费软件RStudio 提供模拟数据 应用R语言轻松学统计: 平均值/直方图/t检验/卡方检验/相关/回归分析/逻辑回归分析/文本挖掘 商家的抽奖促销有猫腻? 面包店的面包缺金少两? 调查问卷的结果该怎么分析? 曾经的热销商品为什么不好卖了? 网络上的匿名中伤者找得出来吗? 坏事的发生是否能预测? 让数据告诉你答案!

Oracle数据库管理从入门到精通(光盘内容另行下载,地址见书封底)
提供13.6小时配套教学视频,赠送7.8小时PL/SQL进阶教学 全面涵盖Oracle数据库管理与应用的各种技术细节,提供系统化的学习方案 对Oracle数据库管理、SQL及PL/SQL开发用到的各种技术做了原理分析和实战演练 真正做到了从Oracle实际工作的视角剖析Oracle数据库的应用, 深入浅出地介绍了Oracle管理、监控、SQL及PL/SQL开发的要点 精选了实际工作中常用的知识点,并配以大量实例,让读者快速上手, 提供了2个有很高参考价值的案例,提升读者的实战水平 提供了各种实际应用场景,引导读者将知识应用于实际工作中, 代码精炼,注释丰富,通过研读代码,即可获得大量的经验 推荐阅读(请点丛书链接查看) 《 Oracle PL/SQL 从入门到精通》 (本书姊妹篇, PL/SQL 经典畅销书,大量读者好评, Oracle 进阶) 《 SQL Server 入门很简单》 (数