
《循序渐Spark大数据应用发》是一本深浅出的Spark大数据发实战指南,专为希望掌握Apache Spark 3.x技术栈的发者量身定制。《循序渐Spark大数据应用发》不仅涵盖了Spark的基础概念和安装步骤,更通过丰富的实战案例和上机练习,引导读者逐步深理解并掌握Spark的核心组件、集群管理、SQL处理、流式数据处理以及机器学习与图计算等高级功能。 作者凭借一线发经验,精心编排了10个章节的内容,确保读者能够循序渐地学习Spark的各项关键技术。从最简单的Spark程序编写始,逐步过渡到复杂的数据处理和分析任务,每一章都充满了实用价值和操作指导。 特别值得一提的是,《循序渐Spark大数据应用发》提供了24个精心设计的实战案例和26个上机练习题,这些内容旨在帮助读者将理论知识转化为实践技能,快速提升解决实际问题的能力。无论是对于学生、大数据发人员还是架

试想,周五你安装并运行了一个新的数据库。周六,你会看到在日常使用中它是什么样子。到了周日,你已经学到了一些技巧,甚至可能让专家们感到惊讶!而下一周,你又会跳到另一个数据库。Ian Dees告诉我们这样的效率是有可能的。本书言简意赅、直主题,深每一种数据库,介绍它们的优势和不足,以及如何选取一种*符合你的应用需求的数据库,探究当前流行和具有代表性的七种数据库技术。你准备好了吗?

1. 职场小白 秒变 数据大咖 Foxtable以Excel之表,管理着数据库之芯:数据录、查询统计、表间关联、报表生成 全部手到拈来,无须编写任何代码。2.二次发不求人可以十倍于Excel VBA的工作效率,发出符合自身需要且能无限分发的数据管理软件。发过程中仅需关注商业逻辑,无须纠缠于具体功能的实现,因为Foxtable已经做了大量模块化的处理。3.一夫当关,玩转全端Foxtable拥有简单的服务器搭建方式,使用户无须其他任何第三方工具即能实现数据在C/S和B/S上的共享,轻松玩转PC端与移动端。

1.数字经济浪潮下的刚需之作; 2.助力企业转型,提升核心竞争力; 3.引领行业变革,赋能数字经济未来; 4.权威专家精心撰写,内容专业且权威; 5.紧扣数字经济核心,学术与实践价值兼备。

深阐述BI团队应发挥的核心价值; 全书贯穿电商、教育、外卖领域的实操案例; 剖析BI指标体系的设计模型与使用场景; 五大专题详述BI如何创造业务价值;

本书作者均来自微软全球技术中心,其中更有数据库发支持组的徐海蔚等业内专家,传递的都是一线实战经验。 这本书之所以鸿篇巨制,是因为在实操之外,对原理行了必要剖析。对读者而言,可以据此举一反三,彻底领悟数据库运行机理,灵活处理日常疑难。 内容基于新版软件。SQL Server功能繁复,极少有书可以全面覆盖,本书在完整性方面无出其右,可轻松代替其他相关书籍 关联 : 《高性能 MySQL (第 3 版)》 《基于 Oracle 的 SQL 优化》 《**技术这十年》 《海量数据库解决方案》

Python语言在科学计算和数据处理领域应用前景广阔。大数据时代,催生了人们处理大量数据的实际需求。Python应用领域的拓展,越来越多的人将Python用于处理大型数值数据集,使用标准格式来行数据的存储和通信也显得越来越重要,而HDF5也正迅速成为人们存储科学数据的选择。本书会带你迅速了解使用HDF5对大小从GB至TB的数字数据集行存档和共享的细节、实践以及陷阱,体验在Python语言中用HDF5存储科学数据。通过真实世界的例子以及动手练习,你将依次学习科学数据集、层次性组织的组、用户定义的元数据,以及有互操作性的文件等主题。本书的例子对于Python2和Python3都适用。 本书包括以下内容:设置HDF5工具并创建HDF5文件。通过学习HDF5数据集对象来使用数据集。理解数据集分块和压缩等高级功能。使用组来学习如何利用HDF5层次性结构。使用HDF5的属性来添加元数

本书具有以下特点:① 直观易懂性。② 先进性。③ 实用性。④ 结构清晰,讲解详尽。⑤ 全部的案例数据、程序与实例应用相结合。

本书是MathWorks图书计划作品。本书凝聚了薛定宇教授30年的MATLAB科研与教学积淀、30年的MATLAB推广与普及经历!其授课视频在爱课程与中国慕课数拥有十万读者学习的视频课程!英文版全球同步发行! 视频公课: 爱课程或中国大学MOOC(慕课) 现代科学运算 MATLAB语言与应用 控制系统仿真与CAD (非严格配套本书视频,仅供读者参考)。 配书源代码: 配书源代码可以到清华大学出版社网站本书页面下载。 薛定宇大讲堂系列图书将陆续出版: 薛定宇教授大讲堂(卷Ⅰ):MATLAB程序设计 薛定宇教授大讲堂(卷Ⅱ):MATLAB微积分运算 薛定宇教授大讲堂(卷Ⅲ):MATLAB线性代数运算 薛定宇教授大讲堂(卷Ⅳ):MATLAB*化计算 薛定宇教授大讲堂(卷Ⅴ):MATLAB微分方程求解 薛定宇教授大讲堂(卷Ⅵ):MATLAB/Simulink仿真

大数据之美:挖掘,Hadoop,架构,更精准地发现业务与营销
本书以基本概念和发展现状作为切,对多种大数据关键技术行逻辑性阐述和分析,同时结合典型应用领域,论述了大数据技术在通信、互联网中扮演的重要角色,系统地向读者阐述了大数据的内涵。



MYSQL 5.5从零开始学(光盘内容另行下载,地址见书封底)
本书是面向MySQL数据库管理系统初学者的一本高质量的书籍。

揭秘网站运营本质和策略解析数据驱动运营的奥秘多行业经典案列深剖析分享真实的网站运营技巧



了解SQL查询语言的基本原理,但仍感觉无法自由运用SQL?想在数据上线前用SQL跑一遍数据库?想一步提高SQL技能?以上需求《SQL经典实例》都可以满足。本书致力于让广大数据库相关人员了解SQL的强大数据处理能力。书中汇集了150多个SQL示例,给出了常见问题的解决方案,帮助读者扩宽思路并用学到的技术来解决新问题,既适合SQL初学者更深理解SQL,也适合SQL用户阶及日常查询参考。-where子句等常见查询语句-查询结果排序-连查询-如何获取数据库元信息-常见数字运算实例-字符串处理-日期处理-数据仓储和复杂报表生成领域的查询-与层次化有关的一些实例

1.内容更新换代 新增了SQL和大数据、分析函数以及处理大型数据库的策略等新内容。 2.独立知识,多配图注释,助你理解SQL 本书每章是独立的,使用大量插图和带有注解的示例介绍与一个关键的SQL概念或技术 3.习题 解析,巩固消化,帮助记忆 配套练习题可以让你练习并巩固所学技能,还可以参考对应习题答案,查漏补缺,让您的学习效率更上一层楼。 4.循序渐,容易上手 本书内容讲解由浅深,循序渐,适合作为数据库应用发人士和数据库管理员的门参考书籍

zi深数据库工程师写给初学者的实用指南!107张图表 209段代码 88个法则,菜鸟阶bi备!基于标准SQL编写,明示各RDBMS(PostgreSQL/DB2/MySQL/Oracle/SQL Server)的差异!1.畅销书全新升级,内容更新更全面!第1版豆瓣评分8.8分,重印13次,好评如潮。第2版基于新版本RDBMS全面升级,并新增一章介绍从应用程序执行SQL语句的方法。2.由浅深,结构清晰,真正适合初学者!从数据库、表的结构到查询、更新表的语法,常用的函数,表的联结等,内容逐步深。对于初学者常见的疑难,均通过专栏行讲解。各章节后精心设计了练习题,帮助读者巩固理解。3.双色印刷,排版独特,让你读起来不累!双色印刷赏心悦目, 学习重 KEYWORD 备忘 法则 专栏 等各种小模块帮你梳理知识,让学习过程事半功倍。

在本书第1版的基础上,按照离线大数据和流式大数据两个场景行划分 在代码实现上以Python为主,紧贴主流编程语言 代码的可用性增强



《循序渐进Oracle:数据库管理、优化与备份恢复》从基础知识入手,详细讨论了Oracle数据库的创建、从OEM到GridControl、Oracle的字符集、用户的创建与管理、表空间和数据文件、自动存储管理(ASM)、临时表空间和临时文件、备份与恢复、备份方案与特例恢复、Oracle的闪回特性、Oracle的数据加载与卸载、从Statspack到ADDM、故障诊断及分析方法等热点问题,并通过大量取自实际工作现场的实例,力图将Oracle知识全面、系统、深入地展现给读者。

Selenium WebDriver 3 实战宝典(Java版)

本书注重理论结合实践,既介绍大数据驱动的智能车间技术体系框架,深介绍每项技术解决的问题,又介绍各项技术的具体应用场景与企业实际案例,突出前沿大数据技术在智能车间中的实用价值。

本书基于Stata 15.0版本,精选52个专业范例和3个综合案例,以实验教程的形式讲解应用Stata工具解决各种统计分析问题;针对每一个实验范例,都遵循从 原理、目的与要求、内容及数据来源、操作指导 几个方面行讲解,达到理论与实践相结合,掌握统计学和计量学的方法和模型的应用。 本书每章附有习题,方便读者在实践练习的过程中快速提高应用水平。 本书配套制作了可供下载的多媒体教学视频,方便读者参照本书行 虚拟课堂 的学习。

我们不能用昨天的思维来解决今天的问题。 爱因斯坦 自2001年首次发布后,Oracle RAC一直是*畅销的Oracle数据库产品之一,也是Oracle技术领域中*难掌握的技能之一。 当Oracle产品线进化到11g时代,我们惊奇地发现它带来了太多的变化。到底这些变化因何而来呢? 如果用一个词描述Oracle 11g RAC和Oracle 10g RAC的区别,那就是“规模”。Oracle 10g RAC定位于单库,支撑关键业务。而Oracle 11g RAC定位于数据中心、私有数据云,致力于业务集成和智慧地球。 所以,对于Oracle 11g RAC的所有新特性,DBA必须打破自己以往的思维局限。“天低吴楚,眼空无物”,只有在一个更宏大的背景下来理解Oracle 11g的意义,才不会辜负Oracle的一番苦心。这也是本书的精彩所在。


1.MongoDB团队成员撰写,带你门主流NoSQL数据库; 2.第1版、第2版累计发行5万册,第3版对TTL和聚合管道等新特性行了讲解,还增加了配置MongoDB的章节; 3.内容适合MongoDB 4.2及以上版本。 如果你希望使用支持现代应用程序发的系统来管理数据,那么MongoDB是不错的选择。作为面向文档的NoSQL数据库,MongoDB功能多、灵活且易于扩展,在DB-Engines数据库流行度排行榜上名列前茅。 本书是由MongoDB团队成员撰写的门指南,涵盖从发到部署的各个方面,内容适合MongoDB 4.2及以上版本。无论你是NoSQL新手还是有经验的MongoDB用户,都可以在查询、索引、聚合、事务、副本集、分片、监控和安全等方面收获新的知识。 ●使用MongoDB执行写操作、查找文档并行复杂的查询 ●对集合行索引,对数据行聚合,在应用程序中使用事务 ●配置本地副本集,并了解复制机制如何与应用程序交互 ●创建

暂无



本书对天文信息学领域的专家具有一定借鉴价值,适合作为天文信息学、数据挖掘、人工智能等研究方向的科研人员和研究生的参考用书。

友情提示:一名职业经理人,使用Access管理各种数据是非常有价值的,能帮助您记录、分析和展示各种数据信息 本书主旨:揭示操作数据库所的、正确的技能和技巧,帮助您熟练使用Access管理数据库。本书将采用大量的专家级Access案例和技巧。教您如何更加有效地使用Access 特别价值:本书的内容并不是普及性的操作培训,而是应用型、提高型的使用技巧培训,是由技术提高到技巧、艺术的职业经理人必修技能之一,会使您成为使用Access制作和管理数据库的明星。 核心课程:涵盖数据库操作、表的应用、查询的应用、窗体的设计及应用、报表的设计及应用、宏应用、数据管理等关键,并均配以贴切的案例演示。 学习方法:图解教学模式,把各种技巧与实际案例紧密结合.让您快速掌握各种技巧,立竿见影,提高实际应用能力。

1.本书作者均来自Spark的母公司Databricks。他们将带你始使用Spark,并了解如何利用它适应这个属于大数据和机器学习的新时代。 2.第2版在第1版的基础上做了大量更新,涵盖Spark 3.0的新特性,并着重展示如何利用机器学习算法执行大数据分析。 3.Spark项目创始人Matei Zaharia、Spark PMC成员Reynold Xin力荐。 毋庸置疑,数据已经成为现代化企业的重要资产,大数据分析技术则是企业挖掘数据价值的核心利器。一直以来,Spark就是大数据分析领域的佼佼者,也已经成为一站式大数据分析引擎的事实标准。 * 学习使用Python、Java、Scala的结构化数据API * 理解Spark SQL引擎的原理 * 掌握Spark应用的优化技巧 * 了解如何读写数据源:JSON、Parquet、CSV、Avro、ORC等 * 使用Structured Streaming分析批式数据和流式数据 * 使用Spark和Delta Lake构建湖仓一体的系统 * 使用MLlib发机器学习流水线

30小时慕课教学视频同步讲解,让学习更高效快捷; 80个精彩课堂案例,12个课堂实验,1个综合案例,Java学习从门到精通; 66道习题,300道自测题,5套自测试卷,巩固所学知识; 提供免费教学资源,包括精品教学PPT、案例源代码、自测题库、拓展综合案例。

1.本书是日本公认的MySQL门首-选教程,原版长销13年,好评如潮,本书是第3次改版 2.本书有丰富的插图和示例程序,即使是初学者,也很容易理解和掌握相关知识 3.本书涉及的发环境和示例程序均可下载,读者可以一边操作一边学习。章末设有自我检查和练习题,方便读者确认知识的掌握情况 4.双色印刷,版式清晰合理,给读者带来良好的阅读体验

SQL Server 2016数据库应用与开发习题解答与上机指导
本书从基本操作着手,从教学实际需求出发,结合初学者的认知规律,由浅深、精心选择SQL Server 2008数据库管理与发过程中的知识,以数据库及相关数据库对象为基础,以备份、还原、复制、监视等数据库系统管理组件为目标,以形式多样、内容丰富习题和参考答案对基本操作行示范,与主教材一起造出比较完整的立体化教材的课程体系。

以商业数据分析为主线,立足互联网工作现实。从如何获取数据到如何在实际工作场景中分析数据,*后以如何完美呈现数据分析的结果为结尾。帮助读者从零阶,玩转商业数据分析。

通过45实例来讲解,培养动手能力 涉及 MongoDB和 Redis 带着具体任务去动手,引领式学习 层次清晰、语句简洁,阅读流畅 大项目:搭建一个完整的问答网站

这是一个“数据为王”的时代,数据驱动“工业4.0”、“互联网+”、“中国制造2025”滚滚前行;数据是企业沉睡的资产,是生生不息的宝藏;只有去认识、去发掘,大数据才能体现巨大的业务价值。

通过案例,将数据库的相关知识恰当地融到案例的分析和设计过程中,图文并茂、深浅出、通俗易懂、强调实践、突出应用,使读者在学习过程中不仅能掌握数据库的相关知识,而且能培养其综合分析问题和解决问题的能力。


本书从理论、系统、应用三个方面详细讲述了大数据的技术知识,并针对NoSQL数据库技术做了深的分享,是学习大数据技术的地图、指南手册。帮助读者跳出迷局,厘清思路,系统地做好相关知识储备,拥抱大数据时代!

(1)作者是资深的流式计算领域专家,是流式计算和Flink领域的先行者和布道者,已经利用Flink在银行、证券和铁路领域的头部企业做了大量的项目实践。 (2)作者是经验丰富的架构师,曾经是明略数据的大数据架构师,现为第四范式的AI项目架构师。 (3)从功能、原理、实战和调优4个维度循序渐讲解利用Flink行分布式流式应用发,指导读者从零基础门到阶。 (4)本书得到了第四范式的首席架构师胡时伟、明略科技集团技术VP杨威、国盛金控/极盛科技大数据总监罗志鹏等专家的强烈推荐。

微软MVP携手Linux运维专家倾力奉献手把手讲解知名数据库产品SQL Server突出运维监控,提供实际优化案例和脚本文件,方便读者动手实践

你的数据是资产吗? 评估数据资产有哪些方法? 应该怎样评估我的数据资产? 怎样保证数据的安全性与合规性? 本书能够成为数据资产评估领域的指南,帮助读者提升评估技能,优化数据资产管理策略。能够激发更多关于数据资产评估的讨论和创新。


《*、天猫电商数据分析与挖掘实战(第2版)》第1版获得了很多读者的认可,甚至有不少高校将其改编成了教程,但《*、天猫电商数据分析与挖掘实战(第2版)》依旧有许多不足之处,比如对于运营模块内容较少而且不够深,特别是数据挖掘套件的安装和部署难倒了许多读者。 《*、天猫电商数据分析与挖掘实战(第2版)》第2版为了跟上时代的变化和解决软件部署烦琐的问题,首先将线下的数据平台改成新平台,或是用其他平台替代;其次是对于软件方面的升级,将 SQL Server 的挖掘套件换成了SmartMining 个人版,部分章节使用了 Excel 2016 版本,用 Power Pivot 实现数据建模,用PowerQuery 提升数据清洗的能力。

Oracle Database In-Memory架构与实践
Database In-Memory是Oracle内存计算技术家族中的核心成员,也是Oracle数据库企业版重要的数据库选件之一。Database In-Memory通过独有的双格式数据库架构及一系列内存计算软硬件技术的结合,可以使传统的运营系统即刻启HTAP(混合事务/分析处理)能力,或者为传统的数据仓库系统提供实时分析的能力。《Oracle Database In-Memory架构与实践》全面深介绍Database In-Memory 架构和技术,涵盖了从12.1.0.2版本Database In-Memory 诞生到2021年8月发布的21c版本之间所有重要的Database In-Memory 特性。 《Oracle Database In-Memory架构与实践》面向对Oracle数据库和内存计算技术感兴趣的读者,适合的对象包括企业架构师、数据库管理员、数据分析师和应用发人员,不仅是读者全面学习Database In-Memory 内存计算技术的门指南,同时也是深了解Oracle Database In-Memory 的极有价值的参考书籍。

1.本书为*高等学校计算机类专业教学指导委员会-华为ICT产学结合项目的成果2.提供系统完整的数据科学与大数据专业解决方案3.名校名师造大数据领域精品力作4.全面介绍大数据技术概况5.讲解Hadoop生态圈平台、工具与技术

数据可视化与数据挖掘——基于Tableau和SPSS Modeler图形界面
讲解过程图文并茂,读者学习时更加轻松; 讲解详细,并安排了项目实例,使读者能够边学边练,在短时间内就可以有一个较大的提高。采用由浅深、简单实用的形式,方便读者快速掌握可视化软件的基本操作,并通过系统的案例使读者迅速掌握应用技巧。

在大数据和人工智能的浪潮下,企业对数据分析师的需求与日俱增,要求也越来越高。本书犹如一本行动指南,将数据分析师面试与工作内容紧密结合,理论与实战兼顾。从数据到算法、从业务到创新,帮助读者造一专多能的数据分析技能树,对想要从事数据分析工作的人员而言是一份不可多得的资料。

本书是为计算机专业教学而编写的教材。它基于SQL Server2008数据库管理系统,共11章,主要内容包括安装和配置SQLServer2008,“电脑销售管理系统”项目设计,数据库管理、配置和维护,数据表对象的创建与管理,项目数据库安全管理,数据查询、视图及索引管理,存储过程管理,触发器和游标的管理,“电脑销售管理系统”项目发(#)及项目发布等。同时,为了方便读者巩固所学的知识,还针对章节附上了实训任务,以帮助学生加强知识的理解,提高实际操作的能力。

Spark大数据商业实战三部曲:内核解密|商业案例|性能调优
基于*的Spark2.2.X版本,分为内核解密篇,商业案例篇,性能调优篇,共31章,学习过程中有任何疑问,可加QQ群,有专业人员答疑解惑。



数据分析用到哪些工具?数据分析需要利用哪些方法行?数据可视化怎样以图表的方式展现?本书以 零基础 为起,以 实战操作 为主线,通过7大数据分析方法、7种美化数据方式、8大专题全程讲解、70多个专家提醒、400多张图片全程图解,帮助读者实现数据分析从门到精通,从新手成为数据分析高手。我的数据分析书软件详解 制作过程 模版套用,应有尽有设计理念 制作技巧 效果展示,倾心放送


来自官方社区的权威资料|直击k8s技术深水区|使用开源技术构建云原生数据服务