
大数据之美:挖掘,Hadoop,架构,更精准地发现业务与营销
本书以基本概念和发展现状作为切,对多种大数据关键技术行逻辑性阐述和分析,同时结合典型应用领域,论述了大数据技术在通信、互联网中扮演的重要角色,系统地向读者阐述了大数据的内涵。

推荐: 《 Spark 大数据处理技术》 ( SharkSpark SQLSpark StreamingGraphxTachyon 深度解密 Spark 完整生态 ** Committer 凝聚一流实力与超前视野 Spark 创始人及实践先驱联合推荐) 《 Hadoop 硬实战》 学习 Hadoop 和 Mapreduce 不二之选 85 个 Hadoop 高级技巧实战案例 《寻路大数据:海量数据与大规模分析》 ( Google 大数据专家力作超豪华译者 作序者微博 高德 UCloud 三大老总联合作序推荐真正梳理趋势与生态 方案与工具选型 应用场景与价值挖掘的独家内参) 《深理解 Oracle RAC 12c 》 本土Oracle数据库性能优化**大师泣血力作 集十数年实战修行与潜心钻研之大成 盖国强等国内数据库一线名家联合推荐 囊括数据库性能优化技术所有分支与脉络,讲解通俗,实例经典


本书共13章,主要内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用Hive行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训学校相关专业的师生教学参考。

云数据库时代的技能升级 超复杂数据库环境案例精粹 走向自动化、智能化的数据服务 安全 连续 高效 智能的解决方案实践

1 作者为中科院软件所博士,其多年发表论文的经验使得这本书的行文完全会让你眼前一亮,严谨且准确。 2 作者精心绘制200余幅图,本书用四色印刷尽力真实还原出来,呈现着作者强大的技术工匠精神。 3 本书采用问题驱动的叙述方式,强调基本原理的阐述,内容非常扎实,且更多的是关乎大数据处理框架的底层原理描述,所以一旦学懂,肯定会让你在大数据领域更上一层楼。

MYSQL 5.5从零开始学(光盘内容另行下载,地址见书封底)
本书是面向MySQL数据库管理系统初学者的一本高质量的书籍。

Python语言在科学计算和数据处理领域应用前景广阔。大数据时代,催生了人们处理大量数据的实际需求。Python应用领域的拓展,越来越多的人将Python用于处理大型数值数据集,使用标准格式来行数据的存储和通信也显得越来越重要,而HDF5也正迅速成为人们存储科学数据的选择。本书会带你迅速了解使用HDF5对大小从GB至TB的数字数据集行存档和共享的细节、实践以及陷阱,体验在Python语言中用HDF5存储科学数据。通过真实世界的例子以及动手练习,你将依次学习科学数据集、层次性组织的组、用户定义的元数据,以及有互操作性的文件等主题。本书的例子对于Python2和Python3都适用。 本书包括以下内容:设置HDF5工具并创建HDF5文件。通过学习HDF5数据集对象来使用数据集。理解数据集分块和压缩等高级功能。使用组来学习如何利用HDF5层次性结构。使用HDF5的属性来添加元数




在大数据和人工智能的浪潮下,企业对数据分析师的需求与日俱增,要求也越来越高。本书犹如一本行动指南,将数据分析师面试与工作内容紧密结合,理论与实战兼顾。从数据到算法、从业务到创新,帮助读者造一专多能的数据分析技能树,对想要从事数据分析工作的人员而言是一份不可多得的资料。


1.DevOps传奇人物吉恩 金继《凤凰项目》后的又一力作,运维名著《凤凰项目:一个IT运维的传奇故事》的姊妹篇; 2.中国敏捷教练联盟秘书长肖然作序推荐; 3.DevOpsDays中国峰会核心组织者倾力翻译; 4.从软件发人员的角度继续讲述无极限零部件公司的故事。

信息和网络技术的高速发展使得大数据成为当前学术界和工业界的研究热,数据爆炸式的增长给人类社会带来了前所未有的机遇与挑战。一方面,基于大数据的处理、分析和共享等技术可以提高企业经济和社会效益。另一方面,隐私已经成为大数据应用领域亟待解决的重要问题。在大数据时代,如何做到获取和利用数据与个人隐私安全的平衡,已然成为当下亟需解决的一个时代命题。

暂无

本书帮你从看流量到看懂流量,从看数据到看懂数据,从了解访客的浏览行为到理解用户的搜索请求。




数学菜鸟也能搞懂数据分析! 从零学起:没有深奥的理论和晦涩的知识 实际体验:免费软件RStudio 提供模拟数据 应用R语言轻松学统计: 平均值/直方图/t检验/卡方检验/相关/回归分析/逻辑回归分析/文本挖掘 商家的抽奖促销有猫腻? 面包店的面包缺金少两? 调查问卷的结果该怎么分析? 曾经的热销商品为什么不好卖了? 网络上的匿名中伤者找得出来吗? 坏事的发生是否能预测? 让数据告诉你答案!

作为新一代的源流处理器,Flink是众多大数据处理框架中一颗冉冉升起的新星。它以同一种技术支持流处理和批处理,并能同时满足高吞吐、低延迟和容错的需求。本书由Flink项目核心成员执笔,系统阐释Flink的适用场景、设计理念、功能、用途和性能优势。- Flink的适用场景- 流处理架构相较于批处理架构的优势- Flink中的时间概念- Flink的检查机制- Flink的性能优势

本书内容严谨精细、生动活泼,从内容来看,共分为四大部分,共11章。


本书以数据库零基础的读者为对象,循序渐地讲解Oracle的各项管理技术及实战技能,用实例引导读者深学习。本书适合任何想学习Oracle数据库的人员,无论你是否从事计算机相关行业,是否触过Oracle,通过学习本书均可快速掌握Oracle的管理方法和技巧。本书配套下载包中,每一章内容都录制了相应的多媒体视频,极大地方便了读者快速、高效地学习和理解Oracle 12c数据库。

1.本书以一个虚构的餐厅评应用程序为例,完整地展示了图应用程序的构建过程。 2.本书示例采用企业级应用程序的常用语言Gremlin,在不同图数据库产品之间具有较强的可迁移性。 3.完整清晰的学习结构,通过11章内容帮助读者从门到实践,再到阶学习图数据库: 门:掌握基本概念、图数据建模、图遍历。 实践:使用图数据库构建 友聚 应用程序。 阶:分析性能,避免陷阱和反模式。 戴夫和乔希是成绩斐然的图架构师和发人员,我想不出还有谁能更好地引导你踏上理解图数据库的旅程并帮助你规划路线。 Ted Wilmes,JanusGraph技术指导委员会委员 这本书深浅出地介绍了图应用程序的构建过程。无论是对数据建模还是对数据库技术感兴趣的朋友,均可以通过此书领略图数据库的魅力。 付晓岩,IBM副合伙人



(1)讲解企业数据架构、数据模型基础概念,以及经典数据建模方法论。 (2)全面介绍数据模型从设计到落地及管控等方面的细节。 (3)提供证券、保险、教育、航空业的数据架构及数据模型的案例和实践路径,为政企数字化转型提供参考。

新增了大量实战案例的分析和讲解,并精选书中的部分案例由作者制作成视频教学资料(DVD光盘)随书附赠。


讲解分布式数据库的书并不多,讲解其架构及企业实践的就更少了。 本书基于国内知名的源分布式数据库中间件Mycat讲解了如何实现分布式数据库,很有实践及借鉴意义。 欢迎加本书交流群:463996643(QQ)

Kafka*初是由LinkedIn公司发的消息系统,现在已成为Apache的源项目。早期版本的Kafka主要是作为一个分布式、可分区和具有副本的消息系统,随着版本的不断迭代,在0.10.x版本之后Kafka已成为一个分布式流数据处理平台,特别是Kafka Streams的出现,使得Kafka对流数据处理变得更加简单。Kafka发展至今已具备很多特性,如分布式、高吞吐量、低延迟、高水平扩展性、高容错性等,也正是由于Kafka具备这些特性,使Kafka在大数据处理、日志收集、实时监控、离线统计分析等应用场景都被广泛使用。本书内容按照从抽象到具体、从到线再到面的学习思维模式行编排,由浅深、理论与实践相结合地对Kafka行了讲解和分析。剖析Kafka实现原理时,Kafka核心组件各成一节;讲解Kafka基本操作及应用实践时,从简单操作拓展到高级应用。全书的各章之间没有很强的依赖关系,读者可以从其中

也许你未曾意识到,但你时常在与MySQL或其分支交道。作为高效且稳定的源数据库,MySQL备受各大电商网站和社会媒体网站青睐。若想快速并深了解如何使用和维护MySQL,本书便是绝佳参考。这本注重实践的学习指南以简单明了、条理清晰的方式,教你安装、使用和维护MySQL及其重要分支MariaDB。 本书作者既是MySQL与MariaDB专家,也是小说家。他以生动的语言和翔实的示例分析带你领略数据库设计和数据管理的方方面面。章末精心设计的习题将有助于你温故而知新。 创建和修改MySQL表,并在其中声明字段和列 通过示例,掌握数据的插、选取、更新、删除、连和子查询 使用字符串函数对列中的文本行查找、抽取、格式化和转换 学习用于数学或统计运算,以及日期和时间格式化的相关函数 执行管理任务,例如管理账号、备份数据库和批量导数据 使用PHP等各种编

作者携手数据领域的强大智囊团为读者贡献的一本处理噪音数据的指南。本书囊括众多真实世界的应用案例以及高水平的方法和策略。本书汇集国外数据社区的技术骨干和活跃分子的集体智慧,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。噪音数据就是那些"给你惹麻烦的数据",从蹩脚的存储到糟糕的说明,再到令人误解的策略,有多重情况可能导致噪音数据。那么什么才是决定性因素呢?有人认为是技术方面的问题,比如缺失值或格式不对的记录,但是噪音数据包含更多的问题。本书介绍了多种有效的方式来应对噪音数据。在本书中,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。通过阅读本书,你将学会:测试你的数据,判断它是否适合分析;将电子表格数据转变成可用的格式;处理潜藏在文本数据里的编码问题;行一种

本着“把Oracle数据库从高雅的象牙塔中带出来,使它的‘贵族’身份平民化,为大学生、普通IT工作者和爱好者提供一套买得起、容易学、用得上的Oracle数据库实用教材”的写作理念,《Oracle数据库管理与开发(适用于OCP认证)》结合大量生动而简单的生活例子来解释复杂的计算机和数据库概念,避免了计算机例子的晦涩难懂。

《穿越数据的迷宫:数据管理执行指南》一书是DAMA(国际数据管理协会)强烈推荐的关于数据管理和数据治理的重要书籍,也是《DAMA数据管理知识体系指南(原书第2版)》( DAMA DMBOK2 )认证培训配套教材。该书重从管理层的角度阐述为什么数据管理很重要,数据管理包括了哪些内容,以及如何行数据管理,从而帮助管理层在了解数据管理的过程中不致迷失在技术术语的迷宫之中。


《*、天猫电商数据分析与挖掘实战(第2版)》第1版获得了很多读者的认可,甚至有不少高校将其改编成了教程,但《*、天猫电商数据分析与挖掘实战(第2版)》依旧有许多不足之处,比如对于运营模块内容较少而且不够深,特别是数据挖掘套件的安装和部署难倒了许多读者。 《*、天猫电商数据分析与挖掘实战(第2版)》第2版为了跟上时代的变化和解决软件部署烦琐的问题,首先将线下的数据平台改成新平台,或是用其他平台替代;其次是对于软件方面的升级,将 SQL Server 的挖掘套件换成了SmartMining 个人版,部分章节使用了 Excel 2016 版本,用 Power Pivot 实现数据建模,用PowerQuery 提升数据清洗的能力。



与其在茫茫表格中搜索数字,不如将数据图形化,让复杂数据关系一目了然。本书是数据分析和可视化门首-选,以功能强大的R语言为工具,教你创建各种实用的数据图形,掌握高亮数据中的重要关系和趋势、简化数据形式、突出重数字等技能。本书适合所有需要数据分析的读者,也可作为统计课程的补充教材,无需数学、统计学或计算机编程背景。R语言基本知识创建单变量图,如饼图、箱线图、直方图等创建双变量图,如散图、折线图、高密度图等创建多变量图,如散图矩阵、三维图、树状图、热图等配套视频讲解,并可下载App观看AR视频:https: h5.arbook.io zhuanlan.html?book_id=30 status=bookdetail

1. 强调实战2. 覆盖大数据行业主流技术岗位,紧跟市场与企业步伐3. 来自企业的骨灰级大咖授课4. 内容结构完整,根据循序渐的认识规律设计章节顺序

SQL Server入门很简单(光盘内容另行下载,地址见书封底)(仅适用PC阅读)
超好用的SQL Server入门书,极速入门,效率100%!数据库畅销书作者执笔 浅显易懂,零门槛学习SQL Server数据库,真的很简单 娓娓道来,亲切自然,老鸟带领菜鸟,快速跨入SQL Server的大门 10小时高清教学视频、217个典型实例、2个综合项目案例,通过动手实践提高开发水平 超值光盘,含本书配套教学视频和实例源文件,赠送418个SQL Server实例源代码和12小时教学视频 推荐阅读 (请点击链接查看): 入门很简单丛书 (精品畅销丛书,有口皆碑,新手) 零点起飞学编程 (新手学编程好帮手,编程其实并不难) Web开发典藏大系 (涵盖众多Web开发的前言技术,由一线Web开发人员打造) “Linux典藏大系”(丛书畅销10万册,全面、详细、深入、实用,Linux爱好者经典) 《Oracle数据库管理从入门到精通》 (全面介绍Oracle数据库管理与维护

大数据时代书系(一本书读懂大数据+一本书读懂互联网思维+一本书读懂互联网+一本书读懂互联网金融)套装共四册



介绍了当前*热门的基于浏览器的数据可视化库D3,它可以把数据加载到网页中并给予数据生产各种图表。要看懂这本书,之前有没有编程经验不太重要。也许你写过程序,也听说过JavaScript语言的各种传闻,那你可以从D3和数据可视化入手,,跟JavaScript**次亲密接触。