
精通实时大数据分析! Druid项目主要创始人杨仿今、蚂蚁金服CTO鲁肃、饿了么CTO张雪峰、Testin云测总裁徐琨、 Druid中国用户组发起人陈冠诚、 TalkingData CTO肖文峰、 OneAPM创始人,董事长何晓阳、Cloudera大中华区技术总监刘隶放、神策数据公司创始人 CEO桑文锋、AdMaster(精硕科技)技术副总裁卢亿雷、微软中国研发中心,高级研发总监 Sherman Tong、AdHoc吆喝科技创始人CEO 王晔联合力荐!


特别推荐: 自己动手写 CPU( 含 CD 光盘 1 张 ) Java 特种兵(上册)(含 CD 光盘 1 张) 搜酷 : 全球智能硬件与技术精华集 ( 全彩 ) 三分虚拟技术,七分分布式管理,十二分大数据,深大数据系统设计、环境安装、发实践,助你快速投实战,直具备大数据系统研发能力。 推荐: 大数据:技术与应用实践指南 推荐阅读: 创新设计:如何造赢得用户的产品、服务与商业模式 互联网创业密码(互联网创业真人真事深度访谈实录:唱吧、胡莱和百思不得姐、春雨医生、视频达人秀、醋溜科技、爱记账、布丁、恺英、3W 咖啡、塔防三国志和贝瓦。) 同作者作品: 软件需求十步走——新一代软件需求工程实践指南(国内真正讲清软件需求的著作!切实解决软件需求的不完整、不准确等难问题,有助发能用、好用、耐用的软件产品) 推荐:管理海量


关于数据中心运维管理的书籍很多,但本书不落俗套,令人耳目一新之处在于: 资深的主创团队本书支持单位和主创团队绝大多数参与过《数据中心场地基础设施运维管理标准》的编写; 业内罕见的揭秘深度本书由国内运维经营们联袂创作,其中不仅有成功经验,还有对挫折和教训的反思,甚至还有惊心动魄的数据中心火灾过程。 新颖的内容布局本书的两大部分, 运维人手记 和 关键设备运维指南 ,既有内容丰富有趣的小说,还有专业的运维知识介绍。


读者对象 ★零基础的MySQL自学者。 ★希望快速、全面掌握MySQL应用技术的人员。 ★高等院校的老师和学生。 ★相关培训机构的老师和学生。 ★初、中级MySQL数据库运维人员。 ★参加毕业设计的学生。 ★★贴身辅导:免费微视频课程。 ★★强化实用:模拟真实发环境,让编程更容易。 ★★小白实战手册:3个真实项目实训,快速积累行业经验。 ★★面试宝典:求职资源库、面试资源库和笔试题库,轻松找工作。 ★★教学无忧:课后实战训练、教学大纲和精美幻灯片,让教学更轻松。 ★★互动教学:定期和作者在线答疑,解决自学路上的困惑。


机器学习的应用是高度自度化且自动修正的。学习到的数据越多,机器学习应用需要的人工干预越少。为了解决现实世界中复杂的数据问题,科学家们发出专门的机器学习算法来解决这些问题。数据科学正是通过算法和统计分析来帮助读者从现有数据中获取新知识的。 本书将解决如何高效地行数据分类及预测的问题。本书主要讲解7种数据科学算法,有k*近邻算法、朴素贝叶斯算法、决策树、随机森林,k-means聚类、回归分析和时间序列分析。 此外,你还会掌握如何对数据行预聚类,以便针对大型数据集行优化和分类。*后,你将了解如何根据数据集中的现有趋势来预测数据。本书的各章还有配套的练习题,以帮助你夯实内容,扩展相关知识。读完本书后,你将了解如何选择机器学习算法行聚类、分类或回归,并知道选择哪种算法来解决实际问题。 本书主要包括以下


中国商业联合会数据分析专业委员会组织的数据分析员(CDA)考试丛书,针对数据分析门者。包括: 《CDA数据分析考试大纲》 《CDA数据分析:零基础门》 《CDA数据分析实务》 中国商业联合会数据分析专业委员会是经国务院国有资产监督管理委员会审核同意、中华人民共和国民政部正式批准和登记的中国数据分析行业主管协会。协会推出的人才培养体系: CPDA数据分析师 CDA数据分析员 协会网址:http://www.chinacpda.org 培训网址:http://www.cdachina.com

大数据作为人工智能的基石,当前正站在计算机技术发展的风口, 而作为Apache*项目的HBase的优势是高性能读写、弹性伸缩、面向列族存储,能够轻松应对数据存储的爆发,提供对千万级QPS低延时需求支持,毫无疑问是企业搭建大数据在线实时应用的*。Hadoop生态系统的HDFS和MapReduce分别为大数据提供了存储和分析处理能力,但是对在线实时的数据存取则爱莫能助,而HBase弥补了Hadoop的这一缺陷,满足了在线实时系统低延时的需求。本书以精炼的语言介绍HBase基础知识,让初学者能够快速上手使用HBase,对HBase 的核心架构思想(如数据读取、数据备份等)有深的了解,并且剖析HBase源码,介绍HBase 1.X 以及2.0带来的新特性,让有经验的HBase发人员也能够循序渐地深理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,同时不

MySQL运维内参:MySQL、Galera、Inception核心原理与最佳实践
去哪儿DBA老大ACE DirectorMySQL用户组主席周彦伟领衔造 源码专家强势加盟,集三大主流源项目源码剖析与实战于一书 一呼百应,MySQL官方指定专家*NoSQLReplication独家内幕 DBA案头,覆盖服务器性能集群高可用自动化运维高级话题

在这里,有面试笔试常见技巧的提炼与总结; 在这里,有面试笔试高频Oracle数据库知识的整理与剖析; 在这里,有面试笔试历年Oracle数据库真题的解答与拓展。

Hadoop 是目前受关注的大数据处理平台和解决方案,并且已经广泛应用于生产环境。本书基于新的 Hadoop ( CDH5 , ApacheHadoop 2.6 )版本介绍 Hadoop 技术的相关知识,不但详细介绍了 Hadoop 、 HDFS 、 YARN 、 MapReduce 、 Hive 、 Sqoop 和 HBase 等,还深探讨了 Hadoop 、 HBase 的运维和性能调优,并包含了一个具有代表性的完整的基于 Hadoop 的商业智能系统的设计和实现。 本书的大特是面向实践。基础篇介绍 Hadoop 及相关组件的同时,包含了大量动手实例,而应用篇包含的基于 Hadoop 的完整实例脱胎于生产环境的真实项目。在应用篇中,读者不仅能够通过项目实战巩固基础篇的学习效果,还能学习商业智能系统的发过程。 本书由浅至深,从理论基础到项目实战,适合 Hadoop 的初学者阅读,也可以作为高等院校相关课程的教学参考书。 本书主要内容 包含了 Hadoop 新版本的几

SQLServer2012王者归来——基础、安全、开发及性能优化(光盘内容另行下载,地址见书封底)
资深程序员10年开发经验的总结,深入剖析SQL Server 2012的精髓 全面涵盖SQL Server 2012数据库基础、安全、管理、开发及性能优化 视频教学:专门录制了18小时高清配套教学视频,便于读者更加高效、直观地学习 内容全面:从基础的SQL语法,到复杂的性能优化,涵盖了SQL Server 2012大部分功能 内容新颖:紧跟SQL Server数据库技术的**趋势,总结了大量的全新观点和应用 示例丰富:提供了670个精巧示例和操作,并用T-SQL语句和可视化操作两种方式实现 由浅入深:从基本的数据库概念和操作开始,逐步深入到数据库安全、开发和性能优化 讲解详细:对每个知识点都从概念、语法、示例、技巧和应用等多个角度进行分析 对比分析:对SQL Server 2005/2008/2012等几个*常用版本的不同特性进行了对比分析 推荐阅读(请点击链接): “Linux典藏大系” (丛书畅销10万册,


本书是一本广受好评的Cassandra图书。


本书注重理论结合实践,既介绍大数据驱动的智能车间技术体系框架,深介绍每项技术解决的问题,又介绍各项技术的具体应用场景与企业实际案例,突出前沿大数据技术在智能车间中的实用价值。

季昕华、徐羽作序,连城/胡熠/武泽胜/肖磊/靳志辉联袂推荐 腾讯专家首次分享Spark*实践 基于真实数据,用案例分析全面解读大数据应用设计


本书基于Neo4j数据库3.5版本及其对应的ALGO和APOC扩展包,详细介绍了近二百个主要过程和函数的定义、相关理论、使用方法、代码样例,让广大Neo4j图数据库的设计和发人员能够快速掌握正确和高效的图数据库分析方法及其应用发技能。


编写高效率的数值计算处理程序,可以大大提高科研水平。




Oracle ACE总监、Oracle畅销书作者盖国强亲自策划,汇集五位一线Oracle DBA工作思考的心得,从不同视角展示数据库诊断与优化的思路。



信息和网络技术的高速发展使得大数据成为当前学术界和工业界的研究热,数据爆炸式的增长给人类社会带来了前所未有的机遇与挑战。一方面,基于大数据的处理、分析和共享等技术可以提高企业经济和社会效益。另一方面,隐私已经成为大数据应用领域亟待解决的重要问题。在大数据时代,如何做到获取和利用数据与个人隐私安全的平衡,已然成为当下亟需解决的一个时代命题。


《数据决策:企业数据的管理、分析与应用》详细介绍了数据战略规划,企业数字化运营,客户智能运营,业务主题优化,行业应用案例

分析和总结了工业大数据应用过程中的做法和经验,为实践提供指导。

全面系统地介绍了达梦数据库体系结构、数据库日常维护操作和数据库基本参数设置,是学习达梦数据库的基础教材和参考用书。

本书在Oracle社区中被公认为是zui好的Oracle PL SQL程序设计权V指南。如果想要充分利用PL SQL,本书无疑是绝佳的资源。本书第6版全面讲解了PL SQL的特性和功能,涵盖了直到Oracle数据库12c R1版本发生的新变化。在过去20多年,成千上万的PL SQL程序发人员从本书中受益,这次的新版延续了之前的风格,提供了丰富的代码示例,穿插了程序发人员才能看懂的小幽默。本书介绍了PL SQL语言的基础知识、高级编码技巧,并提供了zui佳实践来帮助大家解决真实世界中的问题。本书讲解了如下内容:借助于有关执行、跟踪、调试和管理代码的清晰指导,快速编写和运行PL SQL程序;学习12.1版本的新特性,包括ACCESIBLE_BY子句、WITH FUNCTION和UDF杂注以及视图的BEQUEATH CURRENT_USER权限;充分利用书中提供的大量代码示例(从易于遵循的示例到可重用的包工具,不一而足);使用诸如PL Scope和PL SQL

实用的Python源模块的大集合;简单易懂、示例丰富的数据分析教程;掌握数据可视化、机器学习等高端主题;新手变身数据分析专家的上好读本;

原版图书多年畅销,并改正第2版的错误,具有以下特: ① 直观易懂性。 ② 先性。 ③ 实用性。 ④ 结构清晰,讲解详尽。 ⑤ 全部的案例数据、程序与多媒体示范相结合。



本书从大数据架构的角度全面解析大数据技术及算法,探讨大数据的发展和趋势,全面介绍大数据的相关技术、算法和应用场景,帮助读者培养大数据的技术选型和系统架构能力。

Selenium WebDriver 3 实战宝典(Java版)

推荐: 《 Spark 大数据处理技术》 ( SharkSpark SQLSpark StreamingGraphxTachyon 深度解密 Spark 完整生态 ** Committer 凝聚一流实力与超前视野 Spark 创始人及实践先驱联合推荐) 《 Hadoop 硬实战》 学习 Hadoop 和 Mapreduce 不二之选 85 个 Hadoop 高级技巧实战案例 《寻路大数据:海量数据与大规模分析》 ( Google 大数据专家力作超豪华译者 作序者微博 高德 UCloud 三大老总联合作序推荐真正梳理趋势与生态 方案与工具选型 应用场景与价值挖掘的独家内参) 《深理解 Oracle RAC 12c 》 本土Oracle数据库性能优化**大师泣血力作 集十数年实战修行与潜心钻研之大成 盖国强等国内数据库一线名家联合推荐 囊括数据库性能优化技术所有分支与脉络,讲解通俗,实例经典


在本书第1版的基础上,按照离线大数据和流式大数据两个场景行划分 在代码实现上以Python为主,紧贴主流编程语言 代码的可用性增强


数据科学和大数据分析是指利用数据的力量来发现新的见解。本书涵盖了数据科学涉及的行为广度以及所使用的方法和工具。本书内容侧重于任何行业和技术环境中都会用到的概念、原理和实际应用,并通过源软件来分析案例,以帮助读者更好地理解。本书将帮助您:成为数据科学团队中的一名贡献者;部署结构化的生命周期方法来分析数据问题;应用合适的分析技术和工具来分析大数据;学习如何用数据来讲一个动人的故事,以推动商业行为;备考EMC Proven Professional数据科学家认证。EEMC专家认证是IT行业领先的教育和认证项目,涵盖了信息存储技术、虚拟化技术、云计算、数据科学与大数据分析等领域。通过认证是一种很好的自我投资方式,同时也是对自己专业知识的正式验证。本书可以作为准备数据科学专员(EMCDSA)认证的资料。在驱动企业和服务提供商转型



暂无

《从1始 数据分析师成长之路》从简单的制作报表始和大家一起学习数据分析的五大模块:报表BI系统、异常数据分析、解决数据需求、项目性数据分析以及数据建模,为大家全方位、体系化地呈现数据分析到底是什么。

本书从MySQL DBA新手的视角出发,详解MySQL 8数据库管理系统,引导初学者在较短的时间内掌握MySQL数据库管理技术。

数据可视化与数据挖掘——基于Tableau和SPSS Modeler图形界面
讲解过程图文并茂,读者学习时更加轻松; 讲解详细,并安排了项目实例,使读者能够边学边练,在短时间内就可以有一个较大的提高。采用由浅深、简单实用的形式,方便读者快速掌握可视化软件的基本操作,并通过系统的案例使读者迅速掌握应用技巧。

《*、天猫电商数据分析与挖掘实战(第2版)》第1版获得了很多读者的认可,甚至有不少高校将其改编成了教程,但《*、天猫电商数据分析与挖掘实战(第2版)》依旧有许多不足之处,比如对于运营模块内容较少而且不够深,特别是数据挖掘套件的安装和部署难倒了许多读者。 《*、天猫电商数据分析与挖掘实战(第2版)》第2版为了跟上时代的变化和解决软件部署烦琐的问题,首先将线下的数据平台改成新平台,或是用其他平台替代;其次是对于软件方面的升级,将 SQL Server 的挖掘套件换成了SmartMining 个人版,部分章节使用了 Excel 2016 版本,用 Power Pivot 实现数据建模,用PowerQuery 提升数据清洗的能力。

以商业数据分析为主线,立足互联网工作现实。从如何获取数据到如何在实际工作场景中分析数据,*后以如何完美呈现数据分析的结果为结尾。帮助读者从零阶,玩转商业数据分析。

★ 本书是全面搭建数据运营体系 首著 ★ 是更适合国内企业的数据运营实践方法论 ★ 可协助企业在数据运营的道路上少走弯路 ★ 其中有工具和方法,还有大量实战案例 ★ 更有作者15年相关从业经验的总结 ★ 便于读者快速上手具体的运营问题 ★ 书中的知识和见解可以复用于很多企业 ★ 这是一本多年数据运营实战的总结之作 ★ 也是一本搭建数据运营体系的指导之作 ★ 可以说是整个数据行业的 宝贵财富 ★ 不同的读者都将从本书中获益匪浅 ★ 初数据行业的大学毕业生可找到快速上手的方法 ★ 行五年到八年左右的资深人士可收获更丰富的行业案例 ★ 企业管理者可了解数据运营如何为业务创造价值,以及如何从0到1搭建和管理数据团队

《数据分析与量化投资 基于SAS的应用》基于SAS EG平台,采用项目管理的过程流方式,介绍数据分析及量化投资策略,让不熟悉编程的读者可以利用类似于SPSS的功能去完成统计分析,还可以调用本书中提供的宏语法快速行分析。

MySQL是世界上*受欢迎的数据库管理系统之一,其高效、稳定、灵活、可扩展性强并且简单易学,这些特性使其在全球获得越来越多的发人员的青睐。与其他数据库相比,MySQL易学易用。通过本书的学习,读者可以轻松掌握前沿的MySQL技术,为以后高级特性的学习和应用程序的发夯实数据库基础理论。 本书以零基础讲解为宗旨,以MySQL 5.7为蓝本,突出MySQL 5.7的新特性,用实例引导读者深学习,深浅出地讲解MySQL的各项技术及实战技能。本书并不是枯燥的介绍理论,而是通过不同难度的案例结合,比较全面地介绍MySQL数据库。 本书适合任何想学习MySQL的人员,无论你是否从事计算机相关行业,是否触过MySQL,通过本书的学习均可快速掌握MySQL管理和发的方法和技巧。

(1)本书以基本概念与实例相结合的方法,由浅深、循序渐地对大数据思维、技术和应用做了全面系统的介绍。(2)本书在每一个环节都配有与理论学习内容相结合的案例介绍,还有使用Java和Python语言编写的应用实例,使读者能够在大数据平台上通过实践亲身体验大数据处理和分析的过程,从而加快和加深对大数据理论和技术的理解。(3)为了使读者方便检验和复习巩固学习到的知识,本书每章后面都配有丰富的作业供学生完成。