
(1)清华大学黄永峰教授、江铭虎教授郑重推荐。(2)《Spark大数据发与应用案例:视频教学版》系统讲解Spark3.5框架,全部内容都在培训机构长达8年的培训实践中,一遍一遍讲解过,一遍一遍实验过。(3)《Spark大数据发与应用案例:视频教学版》以通俗易懂的方式详解Spark原生态组件的基础与用法,每一章都结合大量的实战案例,讲解过程中注重知识的系统性和内容的实用性。(4)《Spark大数据发与应用案例:视频教学版》最后一章还给出Spark在大厂面试中经常问到的问题,精准覆盖工作中常见使用场景及互联网企业面试要,可以作为面试指南。(5)作者提供微信群答疑服务,读者在学习过程中碰到问题可以随时请教作者。(6)配套示例源码、PPT课件、集群环境、教学视频、配图PDF文件、作者微信群答疑服务。

《穿越数据的迷宫:数据管理执行指南》一书是DAMA(国际数据管理协会)强烈推荐的关于数据管理和数据治理的重要书籍,也是《DAMA数据管理知识体系指南(原书第2版)》( DAMA DMBOK2 )认证培训配套教材。该书重从管理层的角度阐述为什么数据管理很重要,数据管理包括了哪些内容,以及如何行数据管理,从而帮助管理层在了解数据管理的过程中不致迷失在技术术语的迷宫之中。

ChatGPT作为人工智能领域的重大突破,正在深刻地改变着我们的生活和工作方式。这本书以ChatGPT为工具,系统介绍了数据分析的各个环节,从数据收集、预处理、特征工程,到数据分析、可视化、模型构建,再到报告撰写,覆盖了数据分析的完整流程。更重要的是,它完全摆脱了代码的束缚,让数据分析变得更加简单易用、高效便捷、灵活可扩展,真正实现了 零代码 的数据分析,大大提高了数据分析的效率。这对于满足不同业务场景下的数据分析需求,对于任何希望在数据分析领域迅速提升技能的人而言,这本书将是不可多得的实用指南。

从动态的角度描述成为一个数据产品经理需要的能力

深阐述BI团队应发挥的核心价值; 全书贯穿电商、教育、外卖领域的实操案例; 剖析BI指标体系的设计模型与使用场景; 五大专题详述BI如何创造业务价值;

1.本书是《大数据》编委会针对校企合作的精心力作。 2.本书凝结了曙光瑞翼多年的教学经验,能够满足校企融合教学的需求。 3.本书旨在介绍分布式数据库的基础知识,为(将)从事大数据相关工作的读者奠定基础。 4.本书采用任务驱动的编写方式,读者可以直行实验效果体验,并行自由调整。 5.本书采用大量的实践案例,结合行业典型应用,编写行业实践。 6.本书提供丰富的教学资源,包括电子课件、实验设计等。

通过100个案例提升图表设计水平

1.本书通过丰富的案例展示如何造完整的分析价值:收集正确、可靠的数据,合理分析,获得见解,并将见解融决策过程; 2.前华为中国区CIO杨通鹏、EXIN亚太区总经理孙振鹏联合推荐; 3.一线案例分析,助力数字化转型。 在数字化转型如火如荼的当下,企业必须努力造数据驱动型文化。这不只意味着拥有数据分析精英团队--如果缺乏前瞻性分析,即使生成再多的报表,也不是数据驱动组织。 - 理解数据驱动的真正含义 - 学习评估数据质量的各个指标 - 收集和分析可靠的数据 - 用数据讲故事 - 用A/B测试行数据驱动决策 - 造数据驱动型文化

《循序渐Spark大数据应用发》是一本深浅出的Spark大数据发实战指南,专为希望掌握Apache Spark 3.x技术栈的发者量身定制。《循序渐Spark大数据应用发》不仅涵盖了Spark的基础概念和安装步骤,更通过丰富的实战案例和上机练习,引导读者逐步深理解并掌握Spark的核心组件、集群管理、SQL处理、流式数据处理以及机器学习与图计算等高级功能。 作者凭借一线发经验,精心编排了10个章节的内容,确保读者能够循序渐地学习Spark的各项关键技术。从最简单的Spark程序编写始,逐步过渡到复杂的数据处理和分析任务,每一章都充满了实用价值和操作指导。 特别值得一提的是,《循序渐Spark大数据应用发》提供了24个精心设计的实战案例和26个上机练习题,这些内容旨在帮助读者将理论知识转化为实践技能,快速提升解决实际问题的能力。无论是对于学生、大数据发人员还是架

1.本书作者均来自Spark的母公司Databricks。他们将带你始使用Spark,并了解如何利用它适应这个属于大数据和机器学习的新时代。 2.第2版在第1版的基础上做了大量更新,涵盖Spark 3.0的新特性,并着重展示如何利用机器学习算法执行大数据分析。 3.Spark项目创始人Matei Zaharia、Spark PMC成员Reynold Xin力荐。 毋庸置疑,数据已经成为现代化企业的重要资产,大数据分析技术则是企业挖掘数据价值的核心利器。一直以来,Spark就是大数据分析领域的佼佼者,也已经成为一站式大数据分析引擎的事实标准。 * 学习使用Python、Java、Scala的结构化数据API * 理解Spark SQL引擎的原理 * 掌握Spark应用的优化技巧 * 了解如何读写数据源:JSON、Parquet、CSV、Avro、ORC等 * 使用Structured Streaming分析批式数据和流式数据 * 使用Spark和Delta Lake构建湖仓一体的系统 * 使用MLlib发机器学习流水线