

介绍大数据发展趋势和基于Spark的生态环境,全面系统地提供Spark发的基础知识,提供基于Docker容器发环境和编程实例,引导Spark技术学习者快速门,系统的掌握Spark的编程技术。

这本书非常适合想要了解或者始使用那些超越SQL数据库模型的新型数据存储和分析技术的读者阅读。这本书文字平实,并且使用了许多示例、用例和图解,阐述了NoSQL的概念、特性、优、潜力和局限性。读者先从将熟悉的数据库概念与准备替代或补充这些概念的新的NoSQL模式行对比手,然后探索关于大数据、搜索、可靠性和业务灵活性的案例(这些案例已经将新模式应用到业务问题中)。读者还将了解到NoSQL系统如何利用现代云计算和具有多路CPU的数据中心的资源。后几章将向读者介绍如何根据自身需求选择正确的NoSQL技术。本书主要内容NoSQL数据架构模式。大数据的NoSQL。搜索、高可用性和安全性。选择合适的架构。管理者和发者都会喜欢上这本清晰阐述NoSQL技术的潜力和能力的书。

数据架构师无疑是计算机技术领域金字塔***的职位,技术门槛高,市场需求也旺盛,人才缺口很大,成熟的数据架构师**是人才市场上被疯抢的紧俏人才;而近年兴起的商业智能技术,其相关人才也是被广大HR青睐的对象。本书兼顾了计算机技术领域当前*热门的两种技术,作者在一线从业多年,给多个世界500强企业的IT系统做顶层设计,本书总结了作者这些年数据架构设计和商业智能实现的心得和技巧,特别适合那些希望提升自身价值的IT工作者和希望有更好就业前景的相关专业学生学习。 相关图书推荐 商业智能深浅出——Cognos,Informatica技术与应用 完美软件发:方法与逻辑 软件研发成本度量规范释义 Java代码与架构之完美优化 实战经典 SAP商务智能实用发与高级功能详解


作者专业:阿里巴巴和贝壳找房专家撰写 内容实用:深LevelDB架构与源码,精通键-值数据库 更上层楼:掌握谷歌Bigtable数据库单机版设计精髓 学以致用:基于LevelDB,发分布式数据库


萧文龙、李逸婕、张雅茜编著的《Oracle11g数据库**入门教程》在讲述数据库原理的同时,详细介绍数据库的管理、表空间的管理、表的管理、数据的操作与管理、用户与权限的管理等。本书系统化介绍生产管理系统,包括基本需求说明、公司组织图、创建数据库表及关系说明、设置用户权限、添加表数据、开发程序代码、创建生产管理系统验证等。本书通过ASP和JSP程序访问Oracle 11g数据库、企业数据管理实战、Enterprise Manager实战。

从统计学观出发,以数理统计为基础,全面系统地介绍了机器学习的主要方法。 根据全新设计的学习路线图编写,注重夯实理论基础,更便于深化对知识的理解,建立系统性的全局观。 对机器学习所涉及的数学基础行了完整的解释和必要的铺垫,更便于读者对深化相关知识的理解。



※理论结合实际案例,全面、细致地分析了财务数据治理在应用方面的问题,深剖析原因,基于DAMA数据管理知识体系,从数据组织、数据架构、数据模型、数据标准、数据质量等方面介绍数据管理的方法论,提出财务数据治理的具体解决方案,并结合不同行业的企业案例,分析经验成果。 ※用133张关系图、流程图、结构图等,介绍数据治理中的复杂概念,明晰执行方案,将有效帮助财务人员认识、学习和实践数据治理,已被推荐为数据治理工程师(CDGA)和数据治理专家(CDGP)认证的官方指定教材。 ※由20位行业专家历时两年共同造,作为数据管理和数字化系列丛书的篇之作,致力于将实际国情和行业特性融数据治理理论。 ※针对财务工作场景,归纳财务数据的六大问题表现,包括财务数据集成、财务数据标准、财务数据质量等方面,分析五大财务数据问题场景

本书以Hadoop和Spark框架为线索,重介绍了Hadoop技术、Spark技术、大数据存储、大数据访问、大数据采集、大数据管理、大数据分析、大数据发、大数据环境自动化部署等内容,使读者对大数据技术有个比较全面的了解。

本书从大数据架构的角度全面解析大数据技术及算法,探讨大数据的发展和趋势,全面介绍大数据的相关技术、算法和应用场景,帮助读者培养大数据的技术选型和系统架构能力。


云数据库时代的技能升级 超复杂数据库环境案例精粹 走向自动化、智能化的数据服务 安全 连续 高效 智能的解决方案实践

《循序渐Spark大数据应用发》是一本深浅出的Spark大数据发实战指南,专为希望掌握Apache Spark 3.x技术栈的发者量身定制。《循序渐Spark大数据应用发》不仅涵盖了Spark的基础概念和安装步骤,更通过丰富的实战案例和上机练习,引导读者逐步深理解并掌握Spark的核心组件、集群管理、SQL处理、流式数据处理以及机器学习与图计算等高级功能。 作者凭借一线发经验,精心编排了10个章节的内容,确保读者能够循序渐地学习Spark的各项关键技术。从最简单的Spark程序编写始,逐步过渡到复杂的数据处理和分析任务,每一章都充满了实用价值和操作指导。 特别值得一提的是,《循序渐Spark大数据应用发》提供了24个精心设计的实战案例和26个上机练习题,这些内容旨在帮助读者将理论知识转化为实践技能,快速提升解决实际问题的能力。无论是对于学生、大数据发人员还是架

暂无

目前,数量众多的数据中心给企业、政府机关带来了非常沉重的运维负担。

深阐述BI团队应发挥的核心价值; 全书贯穿电商、教育、外卖领域的实操案例; 剖析BI指标体系的设计模型与使用场景; 五大专题详述BI如何创造业务价值;

本书作者均来自微软全球技术中心,其中更有数据库发支持组的徐海蔚等业内专家,传递的都是一线实战经验。 这本书之所以鸿篇巨制,是因为在实操之外,对原理行了必要剖析。对读者而言,可以据此举一反三,彻底领悟数据库运行机理,灵活处理日常疑难。 内容基于新版软件。SQL Server功能繁复,极少有书可以全面覆盖,本书在完整性方面无出其右,可轻松代替其他相关书籍 关联 : 《高性能 MySQL (第 3 版)》 《基于 Oracle 的 SQL 优化》 《**技术这十年》 《海量数据库解决方案》


本书用轻松话语讲述一线数据分析技术,既有统计方法与分析技巧,更有奇闻趣事和哲学感悟,为你的数据分析之路指点迷津。

本书是实用的PostgreSQL快速上手指南,简明扼要地介绍了PostgreSQL核心概念与功能特性,可以帮助读者快速学习、理解并运用好这款源数据库。除了用诸多示例重演示如何实现在别的数据库中难以实现或者根本不可能实现的任务,作者还介绍了ANSI-SQL语法、外部数据封装器增强、全文检索函数和运算符、XML语法、逻辑复制等PostgreSQL 9.5之后版本的新增功能,充分展示了PostgreSQL作为全栈数据库的强大功能和企业级特性。- 执行基本的数据库管理任务,比如角色管理、数据库创建、数据备份和恢复等;- 使用psql命令行工具以及pgAdmin图形化管理工具;- PostgreSQL的表、约束和索引等数据库对象的特性和使用方法;- PostgreSQL所特有的若干功能强大的SQL语法;- 使用多种不同的编程语言来编写PostgreSQL函数;- 实施语句调优以充分挖掘服务器硬件的潜能;- 通过外部数据封装器来查询

1.畅销经典教材。本书为修订教材第3版,配有习题与实验指导用书。主教材前2版累计印刷28次,累计库68200多册。 2.软件版本更新。Access数据库版本由2010版升级到2016版,增加了Access 2016提供的新功能,可以满足实际应用的需要。 3. 根据全国计算机等级二级考试需求编写。章节框架与Access全国计算机等级考试大纲相一致,内容上一步贴近等级考试要求,配有针对性实验与习题。 4.资源丰富详实。本书资源包括配套习题与实验指导、多媒体课件、课程大纲、相关习题答案等。

本书是一本偏重实战的MySQL图书,并非大而全,但处处可以体现实战二字,丰富的知识讲解取自企业中的实战案例解决方案,并结合老男孩十几年的数据库运维工作和教学工作行了梳理。

※ 深剖析ChatGPT,掌握其在各领域的强大应用,提升工作效率与创新思维。 ※ 系统学习高效利用ChatGPT的策略,优化复杂问题的解决过程,释放潜能。 ※ 构建数据分析框架,借助ChatGPT提升数据处理精准度,优化决策制定。 ※ 利用ChatGPT处理海量数据,洞察数据背后的深刻含义,发现关键趋势。 ※ 通过丰富案例,学习ChatGPT在数据分析中的应用,将理论转化为实战技能,实现能力飞跃。


Hadoop 是目前受关注的大数据处理平台和解决方案,并且已经广泛应用于生产环境。本书基于新的 Hadoop ( CDH5 , ApacheHadoop 2.6 )版本介绍 Hadoop 技术的相关知识,不但详细介绍了 Hadoop 、 HDFS 、 YARN 、 MapReduce 、 Hive 、 Sqoop 和 HBase 等,还深探讨了 Hadoop 、 HBase 的运维和性能调优,并包含了一个具有代表性的完整的基于 Hadoop 的商业智能系统的设计和实现。 本书的大特是面向实践。基础篇介绍 Hadoop 及相关组件的同时,包含了大量动手实例,而应用篇包含的基于 Hadoop 的完整实例脱胎于生产环境的真实项目。在应用篇中,读者不仅能够通过项目实战巩固基础篇的学习效果,还能学习商业智能系统的发过程。 本书由浅至深,从理论基础到项目实战,适合 Hadoop 的初学者阅读,也可以作为高等院校相关课程的教学参考书。 本书主要内容 包含了 Hadoop 新版本的几

推荐: 《 Spark 大数据处理技术》 ( SharkSpark SQLSpark StreamingGraphxTachyon 深度解密 Spark 完整生态 ** Committer 凝聚一流实力与超前视野 Spark 创始人及实践先驱联合推荐) 《 Hadoop 硬实战》 学习 Hadoop 和 Mapreduce 不二之选 85 个 Hadoop 高级技巧实战案例 《寻路大数据:海量数据与大规模分析》 ( Google 大数据专家力作超豪华译者 作序者微博 高德 UCloud 三大老总联合作序推荐真正梳理趋势与生态 方案与工具选型 应用场景与价值挖掘的独家内参) 《深理解 Oracle RAC 12c 》 本土Oracle数据库性能优化**大师泣血力作 集十数年实战修行与潜心钻研之大成 盖国强等国内数据库一线名家联合推荐 囊括数据库性能优化技术所有分支与脉络,讲解通俗,实例经典

1.Presto是由Facebook源的高性能分布式SQL查询引擎,其用户包括Netflix、Airbnb、LinkedIn、Twitter、Uber等知名公司。 2.作为高性能分布式SQL查询引擎,Presto能够针对不同的数据源高效、快速地执行交互式分析。大数据的兴起使得数据存储机制多样化。面对标准不一的存储系统,你可以利用Presto轻松破壁垒,连通数据孤岛。 3.本书由Presto项目创始成员参与执笔。你将学会用简单的Presto语句快速查询多个数据源,把握SQL-on-Anything的精髓。在任何规模、任何存储系统、任何环境中,你都能发挥SQL的威力。 - 门:探索Presto的用例,学习安装、配置和使用Presto。 - 阶:深理解Presto的架构,学习连器实例和SQL高级特性。 - 实践:了解如何在生产环境中使用Presto,保证安全性,与其他工具集成。

通俗地阐述了什么是云,什么是大数据,云与大数据有什么关系;介绍了相关的各项技术,以及在商业中怎样应用大数据。 本书系统性强,表述清晰,能将概念阐释和技术应用很好地融合。


(1)作者是曾就职于阿里等企业的有10余年工作经验的架构师和数据库连池专家,对HikariCP在内的各种数据库连池技术都有深研究。 (2)作者为Apache ShardingSphere、Apache Skywalking等知名源项目的技术社区做出过重要贡献。 (3)本书在出版前得到了褚霸、德哥、张亮、吴晟等近10位来自阿里、*等知名企业的专家的高度评价和一致推荐,同时在社区里也到了广泛好评。 (4)本书从设计思想、功能使用、原理实现、工程实践、技术扩展5个维度对HikariCP行全面讲解和深分析。

这本书不要求读者的编程基础和数学知识,以尽量通俗易懂的语言来解释晦涩的数据挖掘算法原理,本书所保留的数学公式都是*基本的、不得不保留的公式,这将本书的阅读门槛降到了**。学习本书,读者将掌握*实用的数据挖掘算法,并能够立刻应用它们。

本书是关于数据管理知识体系的专业指南,可以使从业者有效提升数据管理知识和技能,是DAMA国际推出的数据管理专业人士考试培训及备考的书籍。 在信息朝代,数据已经成为*重要的要素.数据管理对于提升企业对业绩、风险和市场响应的管理能力具有重要现实意义。

本书按照管理、应用、理解的需要,循序渐地,完备地描述Oracle 11g的特征和功能,并在Oracle11g环境中。对书中的全部例子行了运行。 本书把一个庞大的数据库管理概念和功能实现用简洁的语言表达出来,为读者提供了学习与管理Oracle 11g数据库所需的知识和方法。 数据库管理员。数据库安全管理员、网络管理员以及oracle数据库应用发人员都可以从本书中找到适合自己工作需要的内容。

让Oracle跑得更快2——基于海量数据的数据库设计与优化(试读本)
这本书可以看作《让Oracle跑得更快——Oracle10g性能分析与优化思路》的姊妹篇,它继承了上一本书的核心内容——Oracle数据库的性能;同时,也保持了上一本书的写作风格,就是用一种思考和启发的方式来写作。 如果说《让Oracle跑得更快——Oracle10g性能分析与优化思路》主要是以知识作为切来讨论Oracle数据库的性能分析和优化,比如并行技术、执行计划、优化器、AWR报告等;而本书就显得更加具体和有针对性,它主要就是讨论在海量数据的情况下,数据库的设计与优化相关的话题,它集中讨论了在海量数据环境下一些具体技术的应用,包括分区的选择和使用、索引的选择和使用、对象的属性设置、初始化参数的设置,以及数据库架构的选择和设计。 《让Oracle跑得更快2 ——基于海量数据的数据库设计与优化》和《让Oracle跑得更快——Oracle10g性能分析


以Hadoop、Spark两大生态系统为基础,以大数据背景、软件、采集、存储、处理、分析、可视化、安全以及应用为线索,结合Flume、Sqoop、HDFS、HBase、Kafka、Kylin、Hive、Redis、MongoDB等主要组件技术,详解大数据技术基础。
![大话数据结构[溢彩加强版]](images/model/guan/url_none.png)
编辑的话 2008年,一本特立独行的IT技术图书《大话设计模式》横空出世,创了一种新派技术图书风格,横扫各大排行。 作者程杰并没有满足这个成绩,耗时3年潜心创作了另外一本同样是程序员基础的著作 《大话数据结构》,不出意外地好评如潮。 直到今天,这两本书仍然常驻各大排行。作为本土原创图书,这个成绩简直不可思议 印象里只有国外经典技术图书具备如此强的生命力。 虽然在这十几年里程杰兄未再动笔,但依然与我保持着密切联系。非常荣幸的是,在这本新作中,我依然是他的编辑。 十几年来,IT技术已经有了翻天覆地的变化,当年的桌面程序基本都迁移到了当前的互联网和移动端上,以至人工智能、深度学习,发语言也从当初C、Java为主力语言变成如今包治百病的Python,我作为一个IT编辑,回顾起来其实还挺有意思的。 关于《大话数据结构【溢

任务驱动、内容丰富、结构合理、思路清晰、语言简练、图文并茂,所选实例具有很强的实用性和可操作性。作者三十余年一线教学经验。☆ 计算机公共基础课教材、计算机等级考试应试参考教材、PPT等。☆ 配套资源下载(华信教育资源网:www.hxedu.com.cn)

由浅入深学SQL Server:基础、进阶与必做300题(含DVD光盘1张)

系统介绍Access 2007的基本损伤,囊括表、查询、窗体与报表的创建和设计。 实例丰富、典型,读者可在学习完相关知识后边学边练,提高实际应用能力。 采用“本课目标+知识讲解+上机练习+疑难解答+课后练习”结构,有助读者温故而知新。 篇幅简约,内容实用、精练,特别适合Access 2007初学者。

PowerShell V3——SQL Server 2012数据库自动化运维权威指南
从本书可以学到: ·创建一个数据库属性和实例配置的清单; ·备份和恢复数据库; ·在多实例上执行查询; ·维护许可和用户安全性; ·导和导出XML 到SQL Server; ·从数据库抽取CLR 程序集和BLOB 对象; ·浏览数据库对象; ·管理和部署SSIS 包和SSRS 报表; ·管理和监控SQL Server 服务和**; ·解析和显示跟踪文件内容; ·创建SQL Server 作业、告警和操作者; ·查找妨碍数据库性能的阻塞程。

PostgreSQL是近年来应用非常广泛、热度逐渐提升的数据库软件。 而数据库性能的问题,一直是众多数据库管理员、发人员所关心的话题,也是难题。 《PostgreSQL 9.0性能调校》能有效帮助读者加速PostgreSQL系统,避免影响性能的常见陷阱。 《PostgreSQL 9.0性能调校》内容包括 · 为处理高要求的应用程序而升级PostgreSQL安装的**实践; ·揭秘硬件适合或不适合高性能数据库应用程序的原因; ·深研究在速度与稳定性之间行取舍的手段; ·调整操作系统以获得**的数据库性能; ·从硬件到应用,全方位评测整体系统; ·通过实例学习如何调整服务器参数,以及这些参数如何影响性能; ·监视服务器上的数据库的内外部情况; ·寻找**插件工具来扩展核心PostgreSQL数据库; ·探索如何使用PostgreSQL 9.0新增特性来架构复制的系

本书是全国中等职业学校计算机类专业数据库教材,是在《数据库应用技术——Visual Foxpro 6.0》的基础上编写的。


SQL Server 2019从入门到精通(视频教学超值版)
本书面向SQL Server 2019初学者、数据库应用发人员以及数据库系统管理人员。全书内容简明实用,通俗易懂,较全面地介绍了SQL Server 2019数据库管理与发的基础知识,提供了大量具体操作SQL Server 2019数据库的示例供读者实践。书中每个章节都清晰地阐述了代码如何工作及其作用,使读者能在短时间内掌握SQL Server数据库的管理与应用,为成为SQL Server数据库高手下基础。


(1) 资深Web技术专家经验结晶,根据Bootstrap**版本撰写,内容系统、分析深、实战性强,前端工程师*** (2) 授人以鱼,全面讲解各功能组件的使用方法,以及对现有插件和扩展的二次发;授人以渔,深分析其架构思想和源码实现,以及如何发自定义的完整插件和扩展

本书基于Tableau 2020.1编写,结合编者十余年数据分析行业从业经验,详细介绍了该版本的数据连功能、图形编辑与展示功能,包括软件的安装与激活、数据类型和运算符、连数据源、基础操作、数据与图形的导出、连大数据、基础图表、函数、高级数据操作、地图分析、故事、Tableau Online、Tableau Server等内容。可以帮助读者快速掌握软件使用并应用于工作实践。

本着“把Oracle数据库从高雅的象牙塔中带出来,使它的‘贵族’身份平民化,为大学生、普通IT工作者和爱好者提供一套买得起、容易学、用得上的Oracle数据库实用教材”的写作理念,《Oracle数据库管理与开发(适用于OCP认证)》结合大量生动而简单的生活例子来解释复杂的计算机和数据库概念,避免了计算机例子的晦涩难懂。

《穿越数据的迷宫:数据管理执行指南》一书是DAMA(国际数据管理协会)强烈推荐的关于数据管理和数据治理的重要书籍,也是《DAMA数据管理知识体系指南(原书第2版)》( DAMA DMBOK2 )认证培训配套教材。该书重从管理层的角度阐述为什么数据管理很重要,数据管理包括了哪些内容,以及如何行数据管理,从而帮助管理层在了解数据管理的过程中不致迷失在技术术语的迷宫之中。

本书是数据库管理员的工具书,助力企业实现数据库运维管理的专业化、标准化与智能化建设。

本书是关于Access 2007的大全类书籍,囊括了Access 2007的所有功能,尤其是Access 2007的新增功能(例如改进的全新用户界面、功能强大的模板、增强的排序和筛选功能、表格式布局、导航窗格等)进行了详尽阐释。

MySQL被设计为一个可移植的数据库,几乎能在所有的操作系统上运行,如Linux、Solaris、FreeBSD、Mac和Windows。源MySQL数据库发展到今天,已经拥有了非常广泛的用户基础,市场证明MySQL具有性价比高、使用灵活、支持良好和应用广泛的特。MySQL 8做了大量的改,性能比MySQL 5.7快两倍!MySQL 8.0是全球*受欢迎的源数据库之一。通过本书的实训,读者可以快速上手流行的数据库工具,掌握MySQL数据库技术。


策略产品经理是一种高阶的产品经理形态,是互联网企业重要的且难得的人才,也是值得很多产品经理(尤其是数据产品经理)和技术人员转型和投的方向。夏杰老师是这个领域的佼佼者,经历过多家大厂重项目的历练,其经验总结是非常珍贵的。
