
1.本书作者均来自Spark的母公司Databricks。他们将带你始使用Spark,并了解如何利用它适应这个属于大数据和机器学习的新时代。 2.第2版在第1版的基础上做了大量更新,涵盖Spark 3.0的新特性,并着重展示如何利用机器学习算法执行大数据分析。 3.Spark项目创始人Matei Zaharia、Spark PMC成员Reynold Xin力荐。 毋庸置疑,数据已经成为现代化企业的重要资产,大数据分析技术则是企业挖掘数据价值的核心利器。一直以来,Spark就是大数据分析领域的佼佼者,也已经成为一站式大数据分析引擎的事实标准。 * 学习使用Python、Java、Scala的结构化数据API * 理解Spark SQL引擎的原理 * 掌握Spark应用的优化技巧 * 了解如何读写数据源:JSON、Parquet、CSV、Avro、ORC等 * 使用Structured Streaming分析批式数据和流式数据 * 使用Spark和Delta Lake构建湖仓一体的系统 * 使用MLlib发机器学习流水线


大数据之美:挖掘,Hadoop,架构,更精准地发现业务与营销
本书以基本概念和发展现状作为切,对多种大数据关键技术行逻辑性阐述和分析,同时结合典型应用领域,论述了大数据技术在通信、互联网中扮演的重要角色,系统地向读者阐述了大数据的内涵。

与其在茫茫表格中搜索数字,不如将数据图形化,让复杂数据关系一目了然。本书是数据分析和可视化门首-选,以功能强大的R语言为工具,教你创建各种实用的数据图形,掌握高亮数据中的重要关系和趋势、简化数据形式、突出重数字等技能。本书适合所有需要数据分析的读者,也可作为统计课程的补充教材,无需数学、统计学或计算机编程背景。R语言基本知识创建单变量图,如饼图、箱线图、直方图等创建双变量图,如散图、折线图、高密度图等创建多变量图,如散图矩阵、三维图、树状图、热图等配套视频讲解,并可下载App观看AR视频:https: h5.arbook.io zhuanlan.html?book_id=30 status=bookdetail

本书一方面对Flink的技术架构做了深的介绍,另一方面涵盖了Flink大多数API,本书每章都提供了一些实践案例和习题训练,帮助读者了解、上手和熟悉Flink技术。与其他中文Flink图书相比,本书从初学者角度出发,结合相关案例,深浅出,有助于读者学懂学会Flink。

暂无

DB2数据库是IBM公司关系型数据库核心产品,在国内以及全球有着广泛的应用。

《数据决策:企业数据的管理、分析与应用》详细介绍了数据战略规划,企业数字化运营,客户智能运营,业务主题优化,行业应用案例



本书由多位数据库技术专家合著而成,融合了各行业DBA的工作经验与思考,包含了精心挑选的数据库性能优化与内部原理解析案例。

也许你未曾意识到,但你时常在与MySQL或其分支交道。作为高效且稳定的源数据库,MySQL备受各大电商网站和社会媒体网站青睐。若想快速并深了解如何使用和维护MySQL,本书便是绝佳参考。这本注重实践的学习指南以简单明了、条理清晰的方式,教你安装、使用和维护MySQL及其重要分支MariaDB。 本书作者既是MySQL与MariaDB专家,也是小说家。他以生动的语言和翔实的示例分析带你领略数据库设计和数据管理的方方面面。章末精心设计的习题将有助于你温故而知新。 创建和修改MySQL表,并在其中声明字段和列 通过示例,掌握数据的插、选取、更新、删除、连和子查询 使用字符串函数对列中的文本行查找、抽取、格式化和转换 学习用于数学或统计运算,以及日期和时间格式化的相关函数 执行管理任务,例如管理账号、备份数据库和批量导数据 使用PHP等各种编

大数据时代书系(一本书读懂大数据+一本书读懂互联网思维+一本书读懂互联网+一本书读懂互联网金融)套装共四册


无论是梦想颠覆某个行业的创业者,还是试图从企业内部激发变革的创新者,你面临的**挑战就是创造人们真正需要的产品。本书将引导你走上正确的道路。 精益丛书由精益思想创始人埃里克·莱斯为您呈现。该丛书旨在透过实际案例,为创业团队发人员、经理和其他成员介绍精益创业方法的精髓。在领悟这个方法的过程中,你会掌握各种工具,让你步步为营,迅速做出明智的决策。


(1)讲解企业数据架构、数据模型基础概念,以及经典数据建模方法论。 (2)全面介绍数据模型从设计到落地及管控等方面的细节。 (3)提供证券、保险、教育、航空业的数据架构及数据模型的案例和实践路径,为政企数字化转型提供参考。