
近年来,随着Web技术的发展和应用的普及,大 量用户将线下行为转移到线上进行,并且通过各种社 会媒体随时随地进行社会交互和情感表达。

本书是完全来自于实践的Modeler数据分析与挖掘的实战型著作; 全书通过15个行业应用案例,介绍Modeler在数据分析与挖掘领域中的应用; 本书是作者在行业工作中的经验分享,因此所涉及到的案例具体很强的实用性,可以用来解决你在商业应用中的实际问题。


《Oracle数据库管理与开发习题集(适用于OCP认证)》是原教材《Oracle数据库管理与开发(适用于OCP认证)》的习题集,书中不仅给出了原教材每一道练习题的答案,而且对解题的步骤进行了详细的解释,并在解题过程中给出了求解所需要的知识和技巧。




系统介绍了DM SQL的功能、语法、应用及DM SQL程序设计方法,内容实用、操作性强,语言通俗、格式规范,可作为相关专业的教材,也可作为工程技术人员的参考书。

1. 强调实战2. 覆盖大数据行业主流技术岗位,紧跟市场与企业步伐3. 来自企业的骨灰级大咖授课4. 内容结构完整,根据循序渐的认识规律设计章节顺序

还在与bug、性能问题、程序崩溃、数据损坏以及令人费解的输出等问题死磕?如果你是一名数据库程序员或DBA,你将每天都要与这些问题交道。它们的应对之策是知道如何行迅速的恢复。本书采用独特的视角,通过大量案例来演示如何处理MySQL中遇到的棘手问题。 本书由Oracle的首席技术支持工程师编写,它提供了用于解决各种问题(从简单到复杂)的相关背景、工具和步骤。无论是你插的数据无法在查询中出现,还是因为服务器故障而导致整个数据库被损坏,只要本书在手,你都可以轻松应对这些问题。 即使问题很容易解决,也要理解问题产生的根源 当应用程序在多个线程上运行时,处理所发生的问题 调试和修复由配置选项引发的问题 探究操作系统调优如何影响服务器 使用特定的排错技术来重现问题 参考其他排错技术和工具,其中包括第三方解决方案 学习可实


对于应用程序,无论是在私有云部署还是在公有云部署,本书都列出了丰富实用的解决方案和示例。 即使不具备 Docker 相关知识,基于书中实用的解决方案,发人员也能在阅读几章之后包和部署分布式应用程序。如果你是一位运维人员,你将很快掌握如何使用 Docker 来改善自己的工作方式。如果你是一位 IT 专业人士,你将能够学习到如何解决日常问题,比如创建、运行、共享和部署 Docker 镜像。 管理容器、挂载数据卷和容器连 创建和共享镜像 单主机或多主机的 Docker 网络 处理 Docker 配置与发等阶问题 使用 Kubernetes 在分布式集群中部署多容器的应用程序 使用为 Docker 优化的新一代操作系统 学习用于应用程序部署、持续集成、服务发现和编排的工具 在 Amazon AWS 、 Google GCE 和 Microsoft Azure 上使用 D

暂无

MySQL主从原理是高可用架构的基石。 本书彻底地分析了MySQL主从原理。 本书是作者多年来研究MySQL原理和实践的成果。 MySQL从业人员应人手一本备在身边,以防不时之需。

大数据之美:挖掘,Hadoop,架构,更精准地发现业务与营销
本书以基本概念和发展现状作为切,对多种大数据关键技术行逻辑性阐述和分析,同时结合典型应用领域,论述了大数据技术在通信、互联网中扮演的重要角色,系统地向读者阐述了大数据的内涵。

1.DevOps传奇人物吉恩 金继《凤凰项目》后的又一力作,运维名著《凤凰项目:一个IT运维的传奇故事》的姊妹篇; 2.中国敏捷教练联盟秘书长肖然作序推荐; 3.DevOpsDays中国峰会核心组织者倾力翻译; 4.从软件发人员的角度继续讲述无极限零部件公司的故事。

Hadoop 是目前受关注的大数据处理平台和解决方案,并且已经广泛应用于生产环境。本书基于新的 Hadoop ( CDH5 , ApacheHadoop 2.6 )版本介绍 Hadoop 技术的相关知识,不但详细介绍了 Hadoop 、 HDFS 、 YARN 、 MapReduce 、 Hive 、 Sqoop 和 HBase 等,还深探讨了 Hadoop 、 HBase 的运维和性能调优,并包含了一个具有代表性的完整的基于 Hadoop 的商业智能系统的设计和实现。 本书的大特是面向实践。基础篇介绍 Hadoop 及相关组件的同时,包含了大量动手实例,而应用篇包含的基于 Hadoop 的完整实例脱胎于生产环境的真实项目。在应用篇中,读者不仅能够通过项目实战巩固基础篇的学习效果,还能学习商业智能系统的发过程。 本书由浅至深,从理论基础到项目实战,适合 Hadoop 的初学者阅读,也可以作为高等院校相关课程的教学参考书。 本书主要内容 包含了 Hadoop 新版本的几

本书是关于数据管理知识体系的专业指南,可以使从业者有效提升数据管理知识和技能,是DAMA国际推出的数据管理专业人士考试培训及备考的书籍。 在信息朝代,数据已经成为*重要的要素.数据管理对于提升企业对业绩、风险和市场响应的管理能力具有重要现实意义。

全面系统地介绍了达梦数据库体系结构、数据库日常维护操作和数据库基本参数设置,是学习达梦数据库的基础教材和参考用书。


数学菜鸟也能搞懂数据分析! 从零学起:没有深奥的理论和晦涩的知识 实际体验:免费软件RStudio 提供模拟数据 应用R语言轻松学统计: 平均值/直方图/t检验/卡方检验/相关/回归分析/逻辑回归分析/文本挖掘 商家的抽奖促销有猫腻? 面包店的面包缺金少两? 调查问卷的结果该怎么分析? 曾经的热销商品为什么不好卖了? 网络上的匿名中伤者找得出来吗? 坏事的发生是否能预测? 让数据告诉你答案!


1.Presto是由Facebook源的高性能分布式SQL查询引擎,其用户包括Netflix、Airbnb、LinkedIn、Twitter、Uber等知名公司。 2.作为高性能分布式SQL查询引擎,Presto能够针对不同的数据源高效、快速地执行交互式分析。大数据的兴起使得数据存储机制多样化。面对标准不一的存储系统,你可以利用Presto轻松破壁垒,连通数据孤岛。 3.本书由Presto项目创始成员参与执笔。你将学会用简单的Presto语句快速查询多个数据源,把握SQL-on-Anything的精髓。在任何规模、任何存储系统、任何环境中,你都能发挥SQL的威力。 - 门:探索Presto的用例,学习安装、配置和使用Presto。 - 阶:深理解Presto的架构,学习连器实例和SQL高级特性。 - 实践:了解如何在生产环境中使用Presto,保证安全性,与其他工具集成。


1.本书是日本公认的MySQL门首-选教程,原版长销13年,好评如潮,本书是第3次改版 2.本书有丰富的插图和示例程序,即使是初学者,也很容易理解和掌握相关知识 3.本书涉及的发环境和示例程序均可下载,读者可以一边操作一边学习。章末设有自我检查和练习题,方便读者确认知识的掌握情况 4.双色印刷,版式清晰合理,给读者带来良好的阅读体验

图形数据库经典产品Neo4j的核心人员力作。 世界上的大部分领域实际上都可以建模成图,而软件发人员或是数据库管理人员却在辛辛苦苦地将这些图转化成关系型数据库中的表。想象一下,假如你再也不用去做这样的转化,假如数据库的迁移可以变得轻松简单,你愿意去受一个全新的数据库吗?图数据库就是这样一个完全不同于关系型数据库的新型数据库,它处理的是大规模的数据和不断变化的需求,并且拥抱它们。 《图数据库》系统地介绍了图数据库的历史由来、建模方法、工作原理和一些真实的用户用例,详细地说明了图数据解决的是什么样的问题,并以Neon4j数据库和Cypher查询语言为例,阐述了图数据库的建模方法和领域用例,*后还介绍了图数据库的工作原理以及一些实用的图论算法。 《图数据库》的三位作者均为图数据库经典产品Neo4j的

大数据作为人工智能的基石,当前正站在计算机技术发展的风口, 而作为Apache*项目的HBase的优势是高性能读写、弹性伸缩、面向列族存储,能够轻松应对数据存储的爆发,提供对千万级QPS低延时需求支持,毫无疑问是企业搭建大数据在线实时应用的*。Hadoop生态系统的HDFS和MapReduce分别为大数据提供了存储和分析处理能力,但是对在线实时的数据存取则爱莫能助,而HBase弥补了Hadoop的这一缺陷,满足了在线实时系统低延时的需求。本书以精炼的语言介绍HBase基础知识,让初学者能够快速上手使用HBase,对HBase 的核心架构思想(如数据读取、数据备份等)有深的了解,并且剖析HBase源码,介绍HBase 1.X 以及2.0带来的新特性,让有经验的HBase发人员也能够循序渐地深理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,同时不



暂无

市场中**本Hive图书。 Hive在Hadoop系统中的应用趋势比较可观。

以内核发人员的角度抽丝剥茧,带您深浅出PostgreSQL查询引擎内核技术内幕。

数据科学和大数据分析是指利用数据的力量来发现新的见解。本书涵盖了数据科学涉及的行为广度以及所使用的方法和工具。本书内容侧重于任何行业和技术环境中都会用到的概念、原理和实际应用,并通过源软件来分析案例,以帮助读者更好地理解。本书将帮助您:成为数据科学团队中的一名贡献者;部署结构化的生命周期方法来分析数据问题;应用合适的分析技术和工具来分析大数据;学习如何用数据来讲一个动人的故事,以推动商业行为;备考EMC Proven Professional数据科学家认证。EEMC专家认证是IT行业领先的教育和认证项目,涵盖了信息存储技术、虚拟化技术、云计算、数据科学与大数据分析等领域。通过认证是一种很好的自我投资方式,同时也是对自己专业知识的正式验证。本书可以作为准备数据科学专员(EMCDSA)认证的资料。在驱动企业和服务提供商转型

本书是为计算机专业教学而编写的教材。它基于SQL Server2008数据库管理系统,共11章,主要内容包括安装和配置SQLServer2008,“电脑销售管理系统”项目设计,数据库管理、配置和维护,数据表对象的创建与管理,项目数据库安全管理,数据查询、视图及索引管理,存储过程管理,触发器和游标的管理,“电脑销售管理系统”项目发(#)及项目发布等。同时,为了方便读者巩固所学的知识,还针对章节附上了实训任务,以帮助学生加强知识的理解,提高实际操作的能力。

讲解分布式数据库的书并不多,讲解其架构及企业实践的就更少了。 本书基于国内知名的源分布式数据库中间件Mycat讲解了如何实现分布式数据库,很有实践及借鉴意义。 欢迎加本书交流群:463996643(QQ)



本书一方面对Flink的技术架构做了深的介绍,另一方面涵盖了Flink大多数API,本书每章都提供了一些实践案例和习题训练,帮助读者了解、上手和熟悉Flink技术。与其他中文Flink图书相比,本书从初学者角度出发,结合相关案例,深浅出,有助于读者学懂学会Flink。

精通实时大数据分析! Druid项目主要创始人杨仿今、蚂蚁金服CTO鲁肃、饿了么CTO张雪峰、Testin云测总裁徐琨、 Druid中国用户组发起人陈冠诚、 TalkingData CTO肖文峰、 OneAPM创始人,董事长何晓阳、Cloudera大中华区技术总监刘隶放、神策数据公司创始人 CEO桑文锋、AdMaster(精硕科技)技术副总裁卢亿雷、微软中国研发中心,高级研发总监 Sherman Tong、AdHoc吆喝科技创始人CEO 王晔联合力荐!


Kafka*初是由LinkedIn公司发的消息系统,现在已成为Apache的源项目。早期版本的Kafka主要是作为一个分布式、可分区和具有副本的消息系统,随着版本的不断迭代,在0.10.x版本之后Kafka已成为一个分布式流数据处理平台,特别是Kafka Streams的出现,使得Kafka对流数据处理变得更加简单。Kafka发展至今已具备很多特性,如分布式、高吞吐量、低延迟、高水平扩展性、高容错性等,也正是由于Kafka具备这些特性,使Kafka在大数据处理、日志收集、实时监控、离线统计分析等应用场景都被广泛使用。本书内容按照从抽象到具体、从到线再到面的学习思维模式行编排,由浅深、理论与实践相结合地对Kafka行了讲解和分析。剖析Kafka实现原理时,Kafka核心组件各成一节;讲解Kafka基本操作及应用实践时,从简单操作拓展到高级应用。全书的各章之间没有很强的依赖关系,读者可以从其中

本书共13章,主要内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用Hive行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训学校相关专业的师生教学参考。

这本书不要求读者的编程基础和数学知识,以尽量通俗易懂的语言来解释晦涩的数据挖掘算法原理,本书所保留的数学公式都是*基本的、不得不保留的公式,这将本书的阅读门槛降到了**。学习本书,读者将掌握*实用的数据挖掘算法,并能够立刻应用它们。

华为公司官方出品,曝光华为分布式数据库openGauss的系统架构,掌握软件与硬件结合的核心技术!中国人民大学教授王珊,中国工商银行软件发中心总经理杨龙如,中国邮政储蓄银行CIO牛新庄联袂作序!

本人的确对Oracle技术情有独钟。

本书从大数据架构的角度全面解析大数据技术及算法,探讨大数据的发展和趋势,全面介绍大数据的相关技术、算法和应用场景,帮助读者培养大数据的技术选型和系统架构能力。

本书是一本广受好评的Cassandra图书。

数据可视化经典著作 讲解清晰、示例丰富、实用性强 创作信息图的**参考指南

本书以Oracle数据库高阶技术为主,版本跨越9i10g11g,详细讲解了各种重要概念以及相关知识点,使得读者从新的层面和角度理解Oracle技术内涵,其中原理架构的讲解更侧重数据库管理和优化的内容,从系统层面看待架构的组成以及各类组件的作用。

从哲学、数学、物理、统计,到测量、实验、辩证、分析,用谈天说地的方式激发思考,归纳总结数据科学的实质及成就一位数据科学家所需要的基本素养。

1、凝结了作者10多年数据库营销从业经验,是纯实战经验的总结。 2、除总结了各种方法外,还提供了大量企业如何实施数据库营销的实例。 3、能够直提高董事长、总经理、企划人员、营销人员、客服人员的效率与业绩。

萧文龙、李逸婕、张雅茜编著的《Oracle11g数据库**入门教程》在讲述数据库原理的同时,详细介绍数据库的管理、表空间的管理、表的管理、数据的操作与管理、用户与权限的管理等。本书系统化介绍生产管理系统,包括基本需求说明、公司组织图、创建数据库表及关系说明、设置用户权限、添加表数据、开发程序代码、创建生产管理系统验证等。本书通过ASP和JSP程序访问Oracle 11g数据库、企业数据管理实战、Enterprise Manager实战。


云数据库时代的技能升级 超复杂数据库环境案例精粹 走向自动化、智能化的数据服务 安全 连续 高效 智能的解决方案实践


※ 易教易学:系统阐述音视频和编解码的基础知识,结合前沿技术,使读者在不知不觉中建立起宏观的知识体系,掌握晦涩难懂的概念和理论,为后续音视频发下坚实的基础。 ※ 前后衔:强调知识体系和分析方法的前后连贯性,并妥善处理好与前期知识和后续知识的衔性。 ※ 应用方向:引导读者行各个音视频应用领域的探索,思路,包括视频监控、视频直播、编解码、智能匹配、远程教学、语音识别,激发读者的学习兴趣,启发创新思想。



适读人群: 1.企业的创始人和管理者; 2.企业的技术团队和运营团队; 3.从事数字化转型的所有人。 本书由数据中台领域的领先企业数澜科技官方出品,数澜科技已经帮助万科、中信云网等百余家各行业头部企业建设和落地数据中台。 7位作者都是有10年 经验的资深数据人,大部分作者来自原阿里数据中台团队和华为。 本书得到了阿里巴巴集团联合创始人谢世煌、原阿里集团副总裁卜鹰等近10位行业专家的高度评价和推荐。 本书从建设、管理、运营、安全4个维度详细讲解了数据中台概念、认知、架构、原理、组成,以及从0到1的完整过程。

Kyligence 联合创始人兼 CEO , Apache Kylin 项目管理委员会主席( PMC Chair )韩卿 武汉市云升科技发展有限公司董事长, 《 智慧城市 大数据、物联网和云计算之应用 》作者 杨正洪 万达网络科技集团大数据中心副总经理,《 Spark 高级数据分析》中文版译者龚少成 数据架构师, IT 脱口秀(清风那个吹)创始人,《开源大数据分析引擎 Impala 实战》作者贾传青 等等业内专家联合推荐 Apache Kylin 将传统的数据仓库及商务智能分析能力带入到了大数据时代,作为新兴的技术已经被广大用户所使用。作为创始作者,我非常欣喜能看到关于 Apache Kylin 相关书籍的出版, 这无疑对中国用户更好地使用 Kylin ,解决实际的大数据分析架构及业务问题有很大帮助。 韩卿 Kyl