

本书以Oracle数据库高阶技术为主,版本跨越9i10g11g,详细讲解了各种重要概念以及相关知识点,使得读者从新的层面和角度理解Oracle技术内涵,其中原理架构的讲解更侧重数据库管理和优化的内容,从系统层面看待架构的组成以及各类组件的作用。

云数据库时代的技能升级 超复杂数据库环境案例精粹 走向自动化、智能化的数据服务 安全 连续 高效 智能的解决方案实践

精通实时大数据分析! Druid项目主要创始人杨仿今、蚂蚁金服CTO鲁肃、饿了么CTO张雪峰、Testin云测总裁徐琨、 Druid中国用户组发起人陈冠诚、 TalkingData CTO肖文峰、 OneAPM创始人,董事长何晓阳、Cloudera大中华区技术总监刘隶放、神策数据公司创始人 CEO桑文锋、AdMaster(精硕科技)技术副总裁卢亿雷、微软中国研发中心,高级研发总监 Sherman Tong、AdHoc吆喝科技创始人CEO 王晔联合力荐!

《oracle云管理平台——企业管理器12c实战指南》系统介绍了oracle**的oracle enterprisemanager cloud control12c应用技术。

SAP 高性能分析应用软件(SAP High-Performance Analytic Appliance,SAP HANA)自2011年作为成熟的产品和解决方案向全球推广以来,引起了数据库领域非常强的一次震动。

SQL Server 2016数据库应用与开发习题解答与上机指导
本书从基本操作着手,从教学实际需求出发,结合初学者的认知规律,由浅深、精心选择SQL Server 2008数据库管理与发过程中的知识,以数据库及相关数据库对象为基础,以备份、还原、复制、监视等数据库系统管理组件为目标,以形式多样、内容丰富习题和参考答案对基本操作行示范,与主教材一起造出比较完整的立体化教材的课程体系。




与其在茫茫表格中搜索数字,不如将数据图形化,让复杂数据关系一目了然。本书是数据分析和可视化门首-选,以功能强大的R语言为工具,教你创建各种实用的数据图形,掌握高亮数据中的重要关系和趋势、简化数据形式、突出重数字等技能。本书适合所有需要数据分析的读者,也可作为统计课程的补充教材,无需数学、统计学或计算机编程背景。R语言基本知识创建单变量图,如饼图、箱线图、直方图等创建双变量图,如散图、折线图、高密度图等创建多变量图,如散图矩阵、三维图、树状图、热图等配套视频讲解,并可下载App观看AR视频:https: h5.arbook.io zhuanlan.html?book_id=30 status=bookdetail

MYSQL 5.5从零开始学(光盘内容另行下载,地址见书封底)
本书是面向MySQL数据库管理系统初学者的一本高质量的书籍。

本书一方面对Flink的技术架构做了深的介绍,另一方面涵盖了Flink大多数API,本书每章都提供了一些实践案例和习题训练,帮助读者了解、上手和熟悉Flink技术。与其他中文Flink图书相比,本书从初学者角度出发,结合相关案例,深浅出,有助于读者学懂学会Flink。



zi深数据库工程师写给初学者的实用指南!107张图表 209段代码 88个法则,菜鸟阶bi备!基于标准SQL编写,明示各RDBMS(PostgreSQL/DB2/MySQL/Oracle/SQL Server)的差异!1.畅销书全新升级,内容更新更全面!第1版豆瓣评分8.8分,重印13次,好评如潮。第2版基于新版本RDBMS全面升级,并新增一章介绍从应用程序执行SQL语句的方法。2.由浅深,结构清晰,真正适合初学者!从数据库、表的结构到查询、更新表的语法,常用的函数,表的联结等,内容逐步深。对于初学者常见的疑难,均通过专栏行讲解。各章节后精心设计了练习题,帮助读者巩固理解。3.双色印刷,排版独特,让你读起来不累!双色印刷赏心悦目, 学习重 KEYWORD 备忘 法则 专栏 等各种小模块帮你梳理知识,让学习过程事半功倍。

介绍数据科学基本知识的重量级读本,Google数据科学家作品。 数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为 21世纪头号性感职业 。本书从零始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识 数学和统计学。 作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。通过阅读本书,你可以:学到一堂Python速成课;学习线性代数、统计和概率论的基本方法,了解它们是怎样应用在数据科学中的;掌握如何收集、探索、清理、转换和操作数据;深理解机器学习的基础;运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型;探索推荐系统、自然语言处

市场中**本Hive图书。 Hive在Hadoop系统中的应用趋势比较可观。

《*、天猫电商数据分析与挖掘实战(第2版)》第1版获得了很多读者的认可,甚至有不少高校将其改编成了教程,但《*、天猫电商数据分析与挖掘实战(第2版)》依旧有许多不足之处,比如对于运营模块内容较少而且不够深,特别是数据挖掘套件的安装和部署难倒了许多读者。 《*、天猫电商数据分析与挖掘实战(第2版)》第2版为了跟上时代的变化和解决软件部署烦琐的问题,首先将线下的数据平台改成新平台,或是用其他平台替代;其次是对于软件方面的升级,将 SQL Server 的挖掘套件换成了SmartMining 个人版,部分章节使用了 Excel 2016 版本,用 Power Pivot 实现数据建模,用PowerQuery 提升数据清洗的能力。


本书全面介绍了SQL Server2008各方面的知识,全书由6部分组成:第1部分为数据库的基础篇,介绍了数据库的类型、概念、对象、SQL语言等;第2部分为SQL Server2008的准备篇,介绍了SQL Server2008的功能、特性、各版本的比较、安装方法、SQL Server2008的服务、客户端的工具等;第3部分为SQL Server2008的基本操作篇,介绍如何管理与配置SQL Server2008服务器,如何创建数据库和数据表,以及如何对数据库里的数据进行操作;第4部分为数据库管理篇,介绍如何使用T-SQL程序对数据进行复杂的运算,以及如何使用视图、存储过程、触发器、索引、用户定义数据类型、用户定义函数、全文索引、游标、事务和锁、统计信息和同义词等方面的知识;第5部分为SQL Server高级技术,介绍如何进行数据库备份与恢复,如何规划数据库,如何保证数据库的安全、复制与发布、自动化管理,如何使

2014年天猫双11购物狂欢节成交额创下了571.12亿元的纪录! 交易创建峰值能力达到每秒钟8万笔,支付宝的支付峰值突破了每分钟285万笔。 成功创下这项纪录背后,有ODPS很大的功劳! *集团副总裁刘振飞表示,云计算在今年双11起到了非常重要的基础性作用。天猫、*、支付宝的大数据处理,都是基于阿里云计算的大数据处理平台ODPS完成,ODPS为天猫双十一的商品个性化推荐提供了技术支持,这是自主研发能力的一个很大提升。 ODPS(OpenDataProcessingService)是*自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很好的口碑,正逐步走向第三方开放市场? 本书是学习和掌握ODPS的权威指南,作者来自阿里ODPS团队。 本书包括以下重

SQL Server从入门到精通(光盘内容另行下载,地址见书封底)

1.云计算专家,同济大学教授力作 2.华为公司提供真实企业发案例 3.提供典型源软件实训与案例 4.突出云计算系统内容,包括分布式计算、云计算架构、虚拟化技术及行业应用等 5.配套数字课程资源实训平台,并提供多媒体课件、案例代码等丰富的配套资源


《循序渐进Oracle:数据库管理、优化与备份恢复》从基础知识入手,详细讨论了Oracle数据库的创建、从OEM到GridControl、Oracle的字符集、用户的创建与管理、表空间和数据文件、自动存储管理(ASM)、临时表空间和临时文件、备份与恢复、备份方案与特例恢复、Oracle的闪回特性、Oracle的数据加载与卸载、从Statspack到ADDM、故障诊断及分析方法等热点问题,并通过大量取自实际工作现场的实例,力图将Oracle知识全面、系统、深入地展现给读者。

本书在Oracle社区中被公认为是zui好的Oracle PL SQL程序设计权V指南。如果想要充分利用PL SQL,本书无疑是绝佳的资源。本书第6版全面讲解了PL SQL的特性和功能,涵盖了直到Oracle数据库12c R1版本发生的新变化。在过去20多年,成千上万的PL SQL程序发人员从本书中受益,这次的新版延续了之前的风格,提供了丰富的代码示例,穿插了程序发人员才能看懂的小幽默。本书介绍了PL SQL语言的基础知识、高级编码技巧,并提供了zui佳实践来帮助大家解决真实世界中的问题。本书讲解了如下内容:借助于有关执行、跟踪、调试和管理代码的清晰指导,快速编写和运行PL SQL程序;学习12.1版本的新特性,包括ACCESIBLE_BY子句、WITH FUNCTION和UDF杂注以及视图的BEQUEATH CURRENT_USER权限;充分利用书中提供的大量代码示例(从易于遵循的示例到可重用的包工具,不一而足);使用诸如PL Scope和PL SQL

Hadoop 是目前受关注的大数据处理平台和解决方案,并且已经广泛应用于生产环境。本书基于新的 Hadoop ( CDH5 , ApacheHadoop 2.6 )版本介绍 Hadoop 技术的相关知识,不但详细介绍了 Hadoop 、 HDFS 、 YARN 、 MapReduce 、 Hive 、 Sqoop 和 HBase 等,还深探讨了 Hadoop 、 HBase 的运维和性能调优,并包含了一个具有代表性的完整的基于 Hadoop 的商业智能系统的设计和实现。 本书的大特是面向实践。基础篇介绍 Hadoop 及相关组件的同时,包含了大量动手实例,而应用篇包含的基于 Hadoop 的完整实例脱胎于生产环境的真实项目。在应用篇中,读者不仅能够通过项目实战巩固基础篇的学习效果,还能学习商业智能系统的发过程。 本书由浅至深,从理论基础到项目实战,适合 Hadoop 的初学者阅读,也可以作为高等院校相关课程的教学参考书。 本书主要内容 包含了 Hadoop 新版本的几


本书共13章,主要内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用Hive行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训学校相关专业的师生教学参考。

数据科学和大数据分析是指利用数据的力量来发现新的见解。本书涵盖了数据科学涉及的行为广度以及所使用的方法和工具。本书内容侧重于任何行业和技术环境中都会用到的概念、原理和实际应用,并通过源软件来分析案例,以帮助读者更好地理解。本书将帮助您:成为数据科学团队中的一名贡献者;部署结构化的生命周期方法来分析数据问题;应用合适的分析技术和工具来分析大数据;学习如何用数据来讲一个动人的故事,以推动商业行为;备考EMC Proven Professional数据科学家认证。EEMC专家认证是IT行业领先的教育和认证项目,涵盖了信息存储技术、虚拟化技术、云计算、数据科学与大数据分析等领域。通过认证是一种很好的自我投资方式,同时也是对自己专业知识的正式验证。本书可以作为准备数据科学专员(EMCDSA)认证的资料。在驱动企业和服务提供商转型

作为新一代的源流处理器,Flink是众多大数据处理框架中一颗冉冉升起的新星。它以同一种技术支持流处理和批处理,并能同时满足高吞吐、低延迟和容错的需求。本书由Flink项目核心成员执笔,系统阐释Flink的适用场景、设计理念、功能、用途和性能优势。- Flink的适用场景- 流处理架构相较于批处理架构的优势- Flink中的时间概念- Flink的检查机制- Flink的性能优势

还在与bug、性能问题、程序崩溃、数据损坏以及令人费解的输出等问题死磕?如果你是一名数据库程序员或DBA,你将每天都要与这些问题交道。它们的应对之策是知道如何行迅速的恢复。本书采用独特的视角,通过大量案例来演示如何处理MySQL中遇到的棘手问题。 本书由Oracle的首席技术支持工程师编写,它提供了用于解决各种问题(从简单到复杂)的相关背景、工具和步骤。无论是你插的数据无法在查询中出现,还是因为服务器故障而导致整个数据库被损坏,只要本书在手,你都可以轻松应对这些问题。 即使问题很容易解决,也要理解问题产生的根源 当应用程序在多个线程上运行时,处理所发生的问题 调试和修复由配置选项引发的问题 探究操作系统调优如何影响服务器 使用特定的排错技术来重现问题 参考其他排错技术和工具,其中包括第三方解决方案 学习可实


本书作者从事计算机、电子、自动化、数字媒体技术等专业的教学工作多年,较清楚不同层次学生的需求;本书针对每个知识,结合案例行说明,程序均在VC 6.0环境下调试通过。

大数据作为人工智能的基石,当前正站在计算机技术发展的风口, 而作为Apache*项目的HBase的优势是高性能读写、弹性伸缩、面向列族存储,能够轻松应对数据存储的爆发,提供对千万级QPS低延时需求支持,毫无疑问是企业搭建大数据在线实时应用的*。Hadoop生态系统的HDFS和MapReduce分别为大数据提供了存储和分析处理能力,但是对在线实时的数据存取则爱莫能助,而HBase弥补了Hadoop的这一缺陷,满足了在线实时系统低延时的需求。本书以精炼的语言介绍HBase基础知识,让初学者能够快速上手使用HBase,对HBase 的核心架构思想(如数据读取、数据备份等)有深的了解,并且剖析HBase源码,介绍HBase 1.X 以及2.0带来的新特性,让有经验的HBase发人员也能够循序渐地深理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,同时不


本书是关于Access 2007的大全类书籍,囊括了Access 2007的所有功能,尤其是Access 2007的新增功能(例如改进的全新用户界面、功能强大的模板、增强的排序和筛选功能、表格式布局、导航窗格等)进行了详尽阐释。


作者携手数据领域的强大智囊团为读者贡献的一本处理噪音数据的指南。本书囊括众多真实世界的应用案例以及高水平的方法和策略。本书汇集国外数据社区的技术骨干和活跃分子的集体智慧,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。噪音数据就是那些"给你惹麻烦的数据",从蹩脚的存储到糟糕的说明,再到令人误解的策略,有多重情况可能导致噪音数据。那么什么才是决定性因素呢?有人认为是技术方面的问题,比如缺失值或格式不对的记录,但是噪音数据包含更多的问题。本书介绍了多种有效的方式来应对噪音数据。在本书中,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。通过阅读本书,你将学会:测试你的数据,判断它是否适合分析;将电子表格数据转变成可用的格式;处理潜藏在文本数据里的编码问题;行一种

也许你未曾意识到,但你时常在与MySQL或其分支交道。作为高效且稳定的源数据库,MySQL备受各大电商网站和社会媒体网站青睐。若想快速并深了解如何使用和维护MySQL,本书便是绝佳参考。这本注重实践的学习指南以简单明了、条理清晰的方式,教你安装、使用和维护MySQL及其重要分支MariaDB。 本书作者既是MySQL与MariaDB专家,也是小说家。他以生动的语言和翔实的示例分析带你领略数据库设计和数据管理的方方面面。章末精心设计的习题将有助于你温故而知新。 创建和修改MySQL表,并在其中声明字段和列 通过示例,掌握数据的插、选取、更新、删除、连和子查询 使用字符串函数对列中的文本行查找、抽取、格式化和转换 学习用于数学或统计运算,以及日期和时间格式化的相关函数 执行管理任务,例如管理账号、备份数据库和批量导数据 使用PHP等各种编

《数据决策:企业数据的管理、分析与应用》详细介绍了数据战略规划,企业数字化运营,客户智能运营,业务主题优化,行业应用案例


1. 强调实战2. 覆盖大数据行业主流技术岗位,紧跟市场与企业步伐3. 来自企业的骨灰级大咖授课4. 内容结构完整,根据循序渐的认识规律设计章节顺序

SQL Server入门很简单(光盘内容另行下载,地址见书封底)(仅适用PC阅读)
超好用的SQL Server入门书,极速入门,效率100%!数据库畅销书作者执笔 浅显易懂,零门槛学习SQL Server数据库,真的很简单 娓娓道来,亲切自然,老鸟带领菜鸟,快速跨入SQL Server的大门 10小时高清教学视频、217个典型实例、2个综合项目案例,通过动手实践提高开发水平 超值光盘,含本书配套教学视频和实例源文件,赠送418个SQL Server实例源代码和12小时教学视频 推荐阅读 (请点击链接查看): 入门很简单丛书 (精品畅销丛书,有口皆碑,新手) 零点起飞学编程 (新手学编程好帮手,编程其实并不难) Web开发典藏大系 (涵盖众多Web开发的前言技术,由一线Web开发人员打造) “Linux典藏大系”(丛书畅销10万册,全面、详细、深入、实用,Linux爱好者经典) 《Oracle数据库管理从入门到精通》 (全面介绍Oracle数据库管理与维护

从统计学观出发,以数理统计为基础,全面系统地介绍了机器学习的主要方法。 根据全新设计的学习路线图编写,注重夯实理论基础,更便于深化对知识的理解,建立系统性的全局观。 对机器学习所涉及的数学基础行了完整的解释和必要的铺垫,更便于读者对深化相关知识的理解。

1.作者建设了国内高校首个大数据课程教师培训交流基地,造了中国高校大数据教学知名品牌,已经在国内高校形成了广泛的影响力。2.作者建设了国内高校首个大数据课程公共服务平台,为教师教学和学生学习大数据课程提供讲义PPT、学习指南、备课指南、上机习题、实验指南、技术资料、授课视频等,资源丰富。

图形数据库经典产品Neo4j的核心人员力作。 世界上的大部分领域实际上都可以建模成图,而软件发人员或是数据库管理人员却在辛辛苦苦地将这些图转化成关系型数据库中的表。想象一下,假如你再也不用去做这样的转化,假如数据库的迁移可以变得轻松简单,你愿意去受一个全新的数据库吗?图数据库就是这样一个完全不同于关系型数据库的新型数据库,它处理的是大规模的数据和不断变化的需求,并且拥抱它们。 《图数据库》系统地介绍了图数据库的历史由来、建模方法、工作原理和一些真实的用户用例,详细地说明了图数据解决的是什么样的问题,并以Neon4j数据库和Cypher查询语言为例,阐述了图数据库的建模方法和领域用例,*后还介绍了图数据库的工作原理以及一些实用的图论算法。 《图数据库》的三位作者均为图数据库经典产品Neo4j的

Kafka*初是由LinkedIn公司发的消息系统,现在已成为Apache的源项目。早期版本的Kafka主要是作为一个分布式、可分区和具有副本的消息系统,随着版本的不断迭代,在0.10.x版本之后Kafka已成为一个分布式流数据处理平台,特别是Kafka Streams的出现,使得Kafka对流数据处理变得更加简单。Kafka发展至今已具备很多特性,如分布式、高吞吐量、低延迟、高水平扩展性、高容错性等,也正是由于Kafka具备这些特性,使Kafka在大数据处理、日志收集、实时监控、离线统计分析等应用场景都被广泛使用。本书内容按照从抽象到具体、从到线再到面的学习思维模式行编排,由浅深、理论与实践相结合地对Kafka行了讲解和分析。剖析Kafka实现原理时,Kafka核心组件各成一节;讲解Kafka基本操作及应用实践时,从简单操作拓展到高级应用。全书的各章之间没有很强的依赖关系,读者可以从其中


本书由多位数据库技术专家合著而成,融合了各行业DBA的工作经验与思考,包含了精心挑选的数据库性能优化与内部原理解析案例。



暂无

1.本书作者均来自Spark的母公司Databricks。他们将带你始使用Spark,并了解如何利用它适应这个属于大数据和机器学习的新时代。 2.第2版在第1版的基础上做了大量更新,涵盖Spark 3.0的新特性,并着重展示如何利用机器学习算法执行大数据分析。 3.Spark项目创始人Matei Zaharia、Spark PMC成员Reynold Xin力荐。 毋庸置疑,数据已经成为现代化企业的重要资产,大数据分析技术则是企业挖掘数据价值的核心利器。一直以来,Spark就是大数据分析领域的佼佼者,也已经成为一站式大数据分析引擎的事实标准。 * 学习使用Python、Java、Scala的结构化数据API * 理解Spark SQL引擎的原理 * 掌握Spark应用的优化技巧 * 了解如何读写数据源:JSON、Parquet、CSV、Avro、ORC等 * 使用Structured Streaming分析批式数据和流式数据 * 使用Spark和Delta Lake构建湖仓一体的系统 * 使用MLlib发机器学习流水线

1.MongoDB团队成员撰写,带你门主流NoSQL数据库; 2.第1版、第2版累计发行5万册,第3版对TTL和聚合管道等新特性行了讲解,还增加了配置MongoDB的章节; 3.内容适合MongoDB 4.2及以上版本。 如果你希望使用支持现代应用程序发的系统来管理数据,那么MongoDB是不错的选择。作为面向文档的NoSQL数据库,MongoDB功能多、灵活且易于扩展,在DB-Engines数据库流行度排行榜上名列前茅。 本书是由MongoDB团队成员撰写的门指南,涵盖从发到部署的各个方面,内容适合MongoDB 4.2及以上版本。无论你是NoSQL新手还是有经验的MongoDB用户,都可以在查询、索引、聚合、事务、副本集、分片、监控和安全等方面收获新的知识。 ●使用MongoDB执行写操作、查找文档并行复杂的查询 ●对集合行索引,对数据行聚合,在应用程序中使用事务 ●配置本地副本集,并了解复制机制如何与应用程序交互 ●创建

从哲学、数学、物理、统计,到测量、实验、辩证、分析,用谈天说地的方式激发思考,归纳总结数据科学的实质及成就一位数据科学家所需要的基本素养。

1.本书以一个虚构的餐厅评应用程序为例,完整地展示了图应用程序的构建过程。 2.本书示例采用企业级应用程序的常用语言Gremlin,在不同图数据库产品之间具有较强的可迁移性。 3.完整清晰的学习结构,通过11章内容帮助读者从门到实践,再到阶学习图数据库: 门:掌握基本概念、图数据建模、图遍历。 实践:使用图数据库构建 友聚 应用程序。 阶:分析性能,避免陷阱和反模式。 戴夫和乔希是成绩斐然的图架构师和发人员,我想不出还有谁能更好地引导你踏上理解图数据库的旅程并帮助你规划路线。 Ted Wilmes,JanusGraph技术指导委员会委员 这本书深浅出地介绍了图应用程序的构建过程。无论是对数据建模还是对数据库技术感兴趣的朋友,均可以通过此书领略图数据库的魅力。 付晓岩,IBM副合伙人


数学菜鸟也能搞懂数据分析! 从零学起:没有深奥的理论和晦涩的知识 实际体验:免费软件RStudio 提供模拟数据 应用R语言轻松学统计: 平均值/直方图/t检验/卡方检验/相关/回归分析/逻辑回归分析/文本挖掘 商家的抽奖促销有猫腻? 面包店的面包缺金少两? 调查问卷的结果该怎么分析? 曾经的热销商品为什么不好卖了? 网络上的匿名中伤者找得出来吗? 坏事的发生是否能预测? 让数据告诉你答案!