
Spark发者出品! 《Spark快速大数据分析》是一本为Spark初学者准备的书,它没有过多深实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于Spark的用法,它对Spark的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。 本书介绍了源集群计算系统Apache Spark,它可以加速数据分析的实现和运行。利用Spark,你可以用Python、Java以及Scala的简易API来快速操控大规模数据集。 本书由Spark发者编写,可以让数据科学家和工程师即刻上手。你能学到如何使用简短的代码实现复杂的并行作业,还能了解从简单的批处理作业到流处理以及机器学习等应用。

《*、天猫电商数据分析与挖掘实战(第2版)》第1版获得了很多读者的认可,甚至有不少高校将其改编成了教程,但《*、天猫电商数据分析与挖掘实战(第2版)》依旧有许多不足之处,比如对于运营模块内容较少而且不够深,特别是数据挖掘套件的安装和部署难倒了许多读者。 《*、天猫电商数据分析与挖掘实战(第2版)》第2版为了跟上时代的变化和解决软件部署烦琐的问题,首先将线下的数据平台改成新平台,或是用其他平台替代;其次是对于软件方面的升级,将 SQL Server 的挖掘套件换成了SmartMining 个人版,部分章节使用了 Excel 2016 版本,用 Power Pivot 实现数据建模,用PowerQuery 提升数据清洗的能力。

本书内容严谨精细、生动活泼,从内容来看,共分为四大部分,共11章。

在大数据和人工智能的浪潮下,企业对数据分析师的需求与日俱增,要求也越来越高。本书犹如一本行动指南,将数据分析师面试与工作内容紧密结合,理论与实战兼顾。从数据到算法、从业务到创新,帮助读者造一专多能的数据分析技能树,对想要从事数据分析工作的人员而言是一份不可多得的资料。


作者携手数据领域的强大智囊团为读者贡献的一本处理噪音数据的指南。本书囊括众多真实世界的应用案例以及高水平的方法和策略。本书汇集国外数据社区的技术骨干和活跃分子的集体智慧,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。噪音数据就是那些"给你惹麻烦的数据",从蹩脚的存储到糟糕的说明,再到令人误解的策略,有多重情况可能导致噪音数据。那么什么才是决定性因素呢?有人认为是技术方面的问题,比如缺失值或格式不对的记录,但是噪音数据包含更多的问题。本书介绍了多种有效的方式来应对噪音数据。在本书中,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。通过阅读本书,你将学会:测试你的数据,判断它是否适合分析;将电子表格数据转变成可用的格式;处理潜藏在文本数据里的编码问题;行一种


DB2数据库是IBM公司关系型数据库核心产品,在国内以及全球有着广泛的应用。

本书作者从事计算机、电子、自动化、数字媒体技术等专业的教学工作多年,较清楚不同层次学生的需求;本书针对每个知识,结合案例行说明,程序均在VC 6.0环境下调试通过。

大数据作为人工智能的基石,当前正站在计算机技术发展的风口, 而作为Apache*项目的HBase的优势是高性能读写、弹性伸缩、面向列族存储,能够轻松应对数据存储的爆发,提供对千万级QPS低延时需求支持,毫无疑问是企业搭建大数据在线实时应用的*。Hadoop生态系统的HDFS和MapReduce分别为大数据提供了存储和分析处理能力,但是对在线实时的数据存取则爱莫能助,而HBase弥补了Hadoop的这一缺陷,满足了在线实时系统低延时的需求。本书以精炼的语言介绍HBase基础知识,让初学者能够快速上手使用HBase,对HBase 的核心架构思想(如数据读取、数据备份等)有深的了解,并且剖析HBase源码,介绍HBase 1.X 以及2.0带来的新特性,让有经验的HBase发人员也能够循序渐地深理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,同时不

暂无

本书一方面对Flink的技术架构做了深的介绍,另一方面涵盖了Flink大多数API,本书每章都提供了一些实践案例和习题训练,帮助读者了解、上手和熟悉Flink技术。与其他中文Flink图书相比,本书从初学者角度出发,结合相关案例,深浅出,有助于读者学懂学会Flink。

重可平衡:数据中台为主讲解中台建设中的产经经理工作技巧,兼顾业务中台。 落地易操作:图解化理论,没有高高在上的说教,手把手教你如何操作。 以 案 促教:以阿里巴巴、58等中台应用较为成熟的公司为依托讲解。


《数据决策:企业数据的管理、分析与应用》详细介绍了数据战略规划,企业数字化运营,客户智能运营,业务主题优化,行业应用案例



MYSQL 5.5从零开始学(光盘内容另行下载,地址见书封底)
本书是面向MySQL数据库管理系统初学者的一本高质量的书籍。

与其在茫茫表格中搜索数字,不如将数据图形化,让复杂数据关系一目了然。本书是数据分析和可视化门首-选,以功能强大的R语言为工具,教你创建各种实用的数据图形,掌握高亮数据中的重要关系和趋势、简化数据形式、突出重数字等技能。本书适合所有需要数据分析的读者,也可作为统计课程的补充教材,无需数学、统计学或计算机编程背景。R语言基本知识创建单变量图,如饼图、箱线图、直方图等创建双变量图,如散图、折线图、高密度图等创建多变量图,如散图矩阵、三维图、树状图、热图等配套视频讲解,并可下载App观看AR视频:https: h5.arbook.io zhuanlan.html?book_id=30 status=bookdetail

SQL Server入门很简单(光盘内容另行下载,地址见书封底)(仅适用PC阅读)
超好用的SQL Server入门书,极速入门,效率100%!数据库畅销书作者执笔 浅显易懂,零门槛学习SQL Server数据库,真的很简单 娓娓道来,亲切自然,老鸟带领菜鸟,快速跨入SQL Server的大门 10小时高清教学视频、217个典型实例、2个综合项目案例,通过动手实践提高开发水平 超值光盘,含本书配套教学视频和实例源文件,赠送418个SQL Server实例源代码和12小时教学视频 推荐阅读 (请点击链接查看): 入门很简单丛书 (精品畅销丛书,有口皆碑,新手) 零点起飞学编程 (新手学编程好帮手,编程其实并不难) Web开发典藏大系 (涵盖众多Web开发的前言技术,由一线Web开发人员打造) “Linux典藏大系”(丛书畅销10万册,全面、详细、深入、实用,Linux爱好者经典) 《Oracle数据库管理从入门到精通》 (全面介绍Oracle数据库管理与维护

介绍了当前*热门的基于浏览器的数据可视化库D3,它可以把数据加载到网页中并给予数据生产各种图表。要看懂这本书,之前有没有编程经验不太重要。也许你写过程序,也听说过JavaScript语言的各种传闻,那你可以从D3和数据可视化入手,,跟JavaScript**次亲密接触。