图解Spark 大数据快速分析实战 基于大数据分析实战,图文并茂,系统讲解Spark内核的原理,有助于读者快速掌握Spark开源集群计算框架的使用方法,涵盖 Spark 3.0 新特性。
基于大数据分析实战,图文并茂,系统讲解Spark内核的原理,有助于读者快速掌握Spark开源集群计算框架的使用方法。 Spark 是专为大规模数据处理而设计的快速通用的计算引擎,本书涵盖 Spark 3.0 新特性。 本书结合大量原理图和流程图,系统介绍Spark内核的相关技术。 本书注重实战,图文并茂,系统讲解了Spark内核原理、Spark实战应用、 Spark数据源、Spark流式计算、Spark性能调优和数据湖等内容。 通过本书,读者不仅可以深入理解Spark的原理、使应用、运维、监控等技术,还可以快速编写出性能更好、可靠性更高的大数据应用。 本书主要内容: ?Spark内核的原理 ?Spark的作业调度和资源分配算法 ?Spark SQL、DataFrame、Dataset的原理和实战 ?Spark数据源 ?Spark 流式计算原理和实战 ?Spark 亿级数据处理平台Spark性能调优 ?Spark机器学习库 ?Spark 3.0的新特性和数据湖等
¥54.90定价:¥109.90 (5折) 电子书:¥38.43
导语_点评_推荐词
¥34.30定价:¥49.00 (7折)
¥41.30定价:¥59.00 (7折)