
1.本书是《大数据》编委会针对校企合作的精心力作。 2.本书凝结了曙光瑞翼多年的教学经验,能够满足校企融合教学的需求。 3.本书旨在介绍分布式数据库的基础知识,为(将)从事大数据相关工作的读者奠定基础。 4.本书采用任务驱动的编写方式,读者可以直行实验效果体验,并行自由调整。 5.本书采用大量的实践案例,结合行业典型应用,编写行业实践。 6.本书提供丰富的教学资源,包括电子课件、实验设计等。

1.本书作者均来自Spark的母公司Databricks。他们将带你始使用Spark,并了解如何利用它适应这个属于大数据和机器学习的新时代。 2.第2版在第1版的基础上做了大量更新,涵盖Spark 3.0的新特性,并着重展示如何利用机器学习算法执行大数据分析。 3.Spark项目创始人Matei Zaharia、Spark PMC成员Reynold Xin力荐。 毋庸置疑,数据已经成为现代化企业的重要资产,大数据分析技术则是企业挖掘数据价值的核心利器。一直以来,Spark就是大数据分析领域的佼佼者,也已经成为一站式大数据分析引擎的事实标准。 * 学习使用Python、Java、Scala的结构化数据API * 理解Spark SQL引擎的原理 * 掌握Spark应用的优化技巧 * 了解如何读写数据源:JSON、Parquet、CSV、Avro、ORC等 * 使用Structured Streaming分析批式数据和流式数据 * 使用Spark和Delta Lake构建湖仓一体的系统 * 使用MLlib发机器学习流水线

ChatGPT作为人工智能领域的重大突破,正在深刻地改变着我们的生活和工作方式。这本书以ChatGPT为工具,系统介绍了数据分析的各个环节,从数据收集、预处理、特征工程,到数据分析、可视化、模型构建,再到报告撰写,覆盖了数据分析的完整流程。更重要的是,它完全摆脱了代码的束缚,让数据分析变得更加简单易用、高效便捷、灵活可扩展,真正实现了 零代码 的数据分析,大大提高了数据分析的效率。这对于满足不同业务场景下的数据分析需求,对于任何希望在数据分析领域迅速提升技能的人而言,这本书将是不可多得的实用指南。

从动态的角度描述成为一个数据产品经理需要的能力

(1)清华大学黄永峰教授、江铭虎教授郑重推荐。(2)《Spark大数据发与应用案例:视频教学版》系统讲解Spark3.5框架,全部内容都在培训机构长达8年的培训实践中,一遍一遍讲解过,一遍一遍实验过。(3)《Spark大数据发与应用案例:视频教学版》以通俗易懂的方式详解Spark原生态组件的基础与用法,每一章都结合大量的实战案例,讲解过程中注重知识的系统性和内容的实用性。(4)《Spark大数据发与应用案例:视频教学版》最后一章还给出Spark在大厂面试中经常问到的问题,精准覆盖工作中常见使用场景及互联网企业面试要,可以作为面试指南。(5)作者提供微信群答疑服务,读者在学习过程中碰到问题可以随时请教作者。(6)配套示例源码、PPT课件、集群环境、教学视频、配图PDF文件、作者微信群答疑服务。

1.专业作者:赵杰博士和何贤英高级统计师都是在医疗信息化、远程医疗和临床药学方面具有丰富经验和深厚背景的专家。两位作者的专业知识和经验,使得本书具有很高的参考价值。 2.内容全面:本书立足于医疗大数据的挖掘与可视化,分为总体篇、数据挖掘篇、可视化篇、应用篇等,内容包括医疗大数据及其平台的发展概况,医疗大数据的采集、清洗、融合,以及通过实例展示医疗大数据分析平台的设计与使用方法等。 3.实用性:本书不仅介绍了医疗行业数据的基础知识,还重介绍了数据挖掘与可视化的常用工具和方法,并通过实例展示了相关技术的临床应用。对于想要了解和掌握医疗大数据技术的读者来说,本书提供了一本全面、实用的指南。 4.深度结合医疗数据:本书将医疗数据和数据挖掘及可视化技术深度结合,从医疗数据本身出发,寻找适用于医疗数

1.本书通过丰富的案例展示如何造完整的分析价值:收集正确、可靠的数据,合理分析,获得见解,并将见解融决策过程; 2.前华为中国区CIO杨通鹏、EXIN亚太区总经理孙振鹏联合推荐; 3.一线案例分析,助力数字化转型。 在数字化转型如火如荼的当下,企业必须努力造数据驱动型文化。这不只意味着拥有数据分析精英团队--如果缺乏前瞻性分析,即使生成再多的报表,也不是数据驱动组织。 - 理解数据驱动的真正含义 - 学习评估数据质量的各个指标 - 收集和分析可靠的数据 - 用数据讲故事 - 用A/B测试行数据驱动决策 - 造数据驱动型文化

暂无