

大数据作为人工智能的基石,当前正站在计算机技术发展的风口, 而作为Apache*项目的HBase的优势是高性能读写、弹性伸缩、面向列族存储,能够轻松应对数据存储的爆发,提供对千万级QPS低延时需求支持,毫无疑问是企业搭建大数据在线实时应用的*。Hadoop生态系统的HDFS和MapReduce分别为大数据提供了存储和分析处理能力,但是对在线实时的数据存取则爱莫能助,而HBase弥补了Hadoop的这一缺陷,满足了在线实时系统低延时的需求。本书以精炼的语言介绍HBase基础知识,让初学者能够快速上手使用HBase,对HBase 的核心架构思想(如数据读取、数据备份等)有深的了解,并且剖析HBase源码,介绍HBase 1.X 以及2.0带来的新特性,让有经验的HBase发人员也能够循序渐地深理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,同时不

作者携手数据领域的强大智囊团为读者贡献的一本处理噪音数据的指南。本书囊括众多真实世界的应用案例以及高水平的方法和策略。本书汇集国外数据社区的技术骨干和活跃分子的集体智慧,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。噪音数据就是那些"给你惹麻烦的数据",从蹩脚的存储到糟糕的说明,再到令人误解的策略,有多重情况可能导致噪音数据。那么什么才是决定性因素呢?有人认为是技术方面的问题,比如缺失值或格式不对的记录,但是噪音数据包含更多的问题。本书介绍了多种有效的方式来应对噪音数据。在本书中,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。通过阅读本书,你将学会:测试你的数据,判断它是否适合分析;将电子表格数据转变成可用的格式;处理潜藏在文本数据里的编码问题;行一种

本书作者从事计算机、电子、自动化、数字媒体技术等专业的教学工作多年,较清楚不同层次学生的需求;本书针对每个知识,结合案例行说明,程序均在VC 6.0环境下调试通过。

MYSQL 5.5从零开始学(光盘内容另行下载,地址见书封底)
本书是面向MySQL数据库管理系统初学者的一本高质量的书籍。

这个数据库框架灵活到难以控制,本书带你避衔,驾驭强大! 全程实践工作原理性能提升融 Swift ,你需要知道的这里都有! objc 是全球知名 iOS 教学网站,其精品图书更是惠及无数发者! Swifter 一书作者喵神王巍组织翻译objc系列精品图书将相继问世!

本着“把Oracle数据库从高雅的象牙塔中带出来,使它的‘贵族’身份平民化,为大学生、普通IT工作者和爱好者提供一套买得起、容易学、用得上的Oracle数据库实用教材”的写作理念,《Oracle数据库管理与开发(适用于OCP认证)》结合大量生动而简单的生活例子来解释复杂的计算机和数据库概念,避免了计算机例子的晦涩难懂。

《穿越数据的迷宫:数据管理执行指南》一书是DAMA(国际数据管理协会)强烈推荐的关于数据管理和数据治理的重要书籍,也是《DAMA数据管理知识体系指南(原书第2版)》( DAMA DMBOK2 )认证培训配套教材。该书重从管理层的角度阐述为什么数据管理很重要,数据管理包括了哪些内容,以及如何行数据管理,从而帮助管理层在了解数据管理的过程中不致迷失在技术术语的迷宫之中。

精通实时大数据分析! Druid项目主要创始人杨仿今、蚂蚁金服CTO鲁肃、饿了么CTO张雪峰、Testin云测总裁徐琨、 Druid中国用户组发起人陈冠诚、 TalkingData CTO肖文峰、 OneAPM创始人,董事长何晓阳、Cloudera大中华区技术总监刘隶放、神策数据公司创始人 CEO桑文锋、AdMaster(精硕科技)技术副总裁卢亿雷、微软中国研发中心,高级研发总监 Sherman Tong、AdHoc吆喝科技创始人CEO 王晔联合力荐!

信息和网络技术的高速发展使得大数据成为当前学术界和工业界的研究热,数据爆炸式的增长给人类社会带来了前所未有的机遇与挑战。一方面,基于大数据的处理、分析和共享等技术可以提高企业经济和社会效益。另一方面,隐私已经成为大数据应用领域亟待解决的重要问题。在大数据时代,如何做到获取和利用数据与个人隐私安全的平衡,已然成为当下亟需解决的一个时代命题。

本书内容严谨精细、生动活泼,从内容来看,共分为四大部分,共11章。

本书共13章,主要内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用Hive行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训学校相关专业的师生教学参考。

Access 2010数据库管理与应用从新手到高手(光盘内容另行下载,地址见书封底)

本书由多位数据库技术专家合著而成,融合了各行业DBA的工作经验与思考,包含了精心挑选的数据库性能优化与内部原理解析案例。

本书是关于Access 2007的大全类书籍,囊括了Access 2007的所有功能,尤其是Access 2007的新增功能(例如改进的全新用户界面、功能强大的模板、增强的排序和筛选功能、表格式布局、导航窗格等)进行了详尽阐释。

也许你未曾意识到,但你时常在与MySQL或其分支交道。作为高效且稳定的源数据库,MySQL备受各大电商网站和社会媒体网站青睐。若想快速并深了解如何使用和维护MySQL,本书便是绝佳参考。这本注重实践的学习指南以简单明了、条理清晰的方式,教你安装、使用和维护MySQL及其重要分支MariaDB。 本书作者既是MySQL与MariaDB专家,也是小说家。他以生动的语言和翔实的示例分析带你领略数据库设计和数据管理的方方面面。章末精心设计的习题将有助于你温故而知新。 创建和修改MySQL表,并在其中声明字段和列 通过示例,掌握数据的插、选取、更新、删除、连和子查询 使用字符串函数对列中的文本行查找、抽取、格式化和转换 学习用于数学或统计运算,以及日期和时间格式化的相关函数 执行管理任务,例如管理账号、备份数据库和批量导数据 使用PHP等各种编


1.作者建设了国内高校首个大数据课程教师培训交流基地,造了中国高校大数据教学知名品牌,已经在国内高校形成了广泛的影响力。2.作者建设了国内高校首个大数据课程公共服务平台,为教师教学和学生学习大数据课程提供讲义PPT、学习指南、备课指南、上机习题、实验指南、技术资料、授课视频等,资源丰富。

作为新一代的源流处理器,Flink是众多大数据处理框架中一颗冉冉升起的新星。它以同一种技术支持流处理和批处理,并能同时满足高吞吐、低延迟和容错的需求。本书由Flink项目核心成员执笔,系统阐释Flink的适用场景、设计理念、功能、用途和性能优势。- Flink的适用场景- 流处理架构相较于批处理架构的优势- Flink中的时间概念- Flink的检查机制- Flink的性能优势



市场中**本Hive图书。 Hive在Hadoop系统中的应用趋势比较可观。


《循序渐进Oracle:数据库管理、优化与备份恢复》从基础知识入手,详细讨论了Oracle数据库的创建、从OEM到GridControl、Oracle的字符集、用户的创建与管理、表空间和数据文件、自动存储管理(ASM)、临时表空间和临时文件、备份与恢复、备份方案与特例恢复、Oracle的闪回特性、Oracle的数据加载与卸载、从Statspack到ADDM、故障诊断及分析方法等热点问题,并通过大量取自实际工作现场的实例,力图将Oracle知识全面、系统、深入地展现给读者。

暂无

重可平衡:数据中台为主讲解中台建设中的产经经理工作技巧,兼顾业务中台。 落地易操作:图解化理论,没有高高在上的说教,手把手教你如何操作。 以 案 促教:以阿里巴巴、58等中台应用较为成熟的公司为依托讲解。

1.本书以一个虚构的餐厅评应用程序为例,完整地展示了图应用程序的构建过程。 2.本书示例采用企业级应用程序的常用语言Gremlin,在不同图数据库产品之间具有较强的可迁移性。 3.完整清晰的学习结构,通过11章内容帮助读者从门到实践,再到阶学习图数据库: 门:掌握基本概念、图数据建模、图遍历。 实践:使用图数据库构建 友聚 应用程序。 阶:分析性能,避免陷阱和反模式。 戴夫和乔希是成绩斐然的图架构师和发人员,我想不出还有谁能更好地引导你踏上理解图数据库的旅程并帮助你规划路线。 Ted Wilmes,JanusGraph技术指导委员会委员 这本书深浅出地介绍了图应用程序的构建过程。无论是对数据建模还是对数据库技术感兴趣的朋友,均可以通过此书领略图数据库的魅力。 付晓岩,IBM副合伙人

数学菜鸟也能搞懂数据分析! 从零学起:没有深奥的理论和晦涩的知识 实际体验:免费软件RStudio 提供模拟数据 应用R语言轻松学统计: 平均值/直方图/t检验/卡方检验/相关/回归分析/逻辑回归分析/文本挖掘 商家的抽奖促销有猫腻? 面包店的面包缺金少两? 调查问卷的结果该怎么分析? 曾经的热销商品为什么不好卖了? 网络上的匿名中伤者找得出来吗? 坏事的发生是否能预测? 让数据告诉你答案!

本书以Oracle数据库高阶技术为主,版本跨越9i10g11g,详细讲解了各种重要概念以及相关知识点,使得读者从新的层面和角度理解Oracle技术内涵,其中原理架构的讲解更侧重数据库管理和优化的内容,从系统层面看待架构的组成以及各类组件的作用。

与其在茫茫表格中搜索数字,不如将数据图形化,让复杂数据关系一目了然。本书是数据分析和可视化门首-选,以功能强大的R语言为工具,教你创建各种实用的数据图形,掌握高亮数据中的重要关系和趋势、简化数据形式、突出重数字等技能。本书适合所有需要数据分析的读者,也可作为统计课程的补充教材,无需数学、统计学或计算机编程背景。R语言基本知识创建单变量图,如饼图、箱线图、直方图等创建双变量图,如散图、折线图、高密度图等创建多变量图,如散图矩阵、三维图、树状图、热图等配套视频讲解,并可下载App观看AR视频:https: h5.arbook.io zhuanlan.html?book_id=30 status=bookdetail

Kafka*初是由LinkedIn公司发的消息系统,现在已成为Apache的源项目。早期版本的Kafka主要是作为一个分布式、可分区和具有副本的消息系统,随着版本的不断迭代,在0.10.x版本之后Kafka已成为一个分布式流数据处理平台,特别是Kafka Streams的出现,使得Kafka对流数据处理变得更加简单。Kafka发展至今已具备很多特性,如分布式、高吞吐量、低延迟、高水平扩展性、高容错性等,也正是由于Kafka具备这些特性,使Kafka在大数据处理、日志收集、实时监控、离线统计分析等应用场景都被广泛使用。本书内容按照从抽象到具体、从到线再到面的学习思维模式行编排,由浅深、理论与实践相结合地对Kafka行了讲解和分析。剖析Kafka实现原理时,Kafka核心组件各成一节;讲解Kafka基本操作及应用实践时,从简单操作拓展到高级应用。全书的各章之间没有很强的依赖关系,读者可以从其中



推荐: 《 Spark 大数据处理技术》 ( SharkSpark SQLSpark StreamingGraphxTachyon 深度解密 Spark 完整生态 ** Committer 凝聚一流实力与超前视野 Spark 创始人及实践先驱联合推荐) 《 Hadoop 硬实战》 学习 Hadoop 和 Mapreduce 不二之选 85 个 Hadoop 高级技巧实战案例 《寻路大数据:海量数据与大规模分析》 ( Google 大数据专家力作超豪华译者 作序者微博 高德 UCloud 三大老总联合作序推荐真正梳理趋势与生态 方案与工具选型 应用场景与价值挖掘的独家内参) 《深理解 Oracle RAC 12c 》 本土Oracle数据库性能优化**大师泣血力作 集十数年实战修行与潜心钻研之大成 盖国强等国内数据库一线名家联合推荐 囊括数据库性能优化技术所有分支与脉络,讲解通俗,实例经典


SQL Server入门很简单(光盘内容另行下载,地址见书封底)(仅适用PC阅读)
超好用的SQL Server入门书,极速入门,效率100%!数据库畅销书作者执笔 浅显易懂,零门槛学习SQL Server数据库,真的很简单 娓娓道来,亲切自然,老鸟带领菜鸟,快速跨入SQL Server的大门 10小时高清教学视频、217个典型实例、2个综合项目案例,通过动手实践提高开发水平 超值光盘,含本书配套教学视频和实例源文件,赠送418个SQL Server实例源代码和12小时教学视频 推荐阅读 (请点击链接查看): 入门很简单丛书 (精品畅销丛书,有口皆碑,新手) 零点起飞学编程 (新手学编程好帮手,编程其实并不难) Web开发典藏大系 (涵盖众多Web开发的前言技术,由一线Web开发人员打造) “Linux典藏大系”(丛书畅销10万册,全面、详细、深入、实用,Linux爱好者经典) 《Oracle数据库管理从入门到精通》 (全面介绍Oracle数据库管理与维护

本书用轻松话语讲述一线数据分析技术,既有统计方法与分析技巧,更有奇闻趣事和哲学感悟,为你的数据分析之路指点迷津。

本书是实用的PostgreSQL快速上手指南,简明扼要地介绍了PostgreSQL核心概念与功能特性,可以帮助读者快速学习、理解并运用好这款源数据库。除了用诸多示例重演示如何实现在别的数据库中难以实现或者根本不可能实现的任务,作者还介绍了ANSI-SQL语法、外部数据封装器增强、全文检索函数和运算符、XML语法、逻辑复制等PostgreSQL 9.5之后版本的新增功能,充分展示了PostgreSQL作为全栈数据库的强大功能和企业级特性。- 执行基本的数据库管理任务,比如角色管理、数据库创建、数据备份和恢复等;- 使用psql命令行工具以及pgAdmin图形化管理工具;- PostgreSQL的表、约束和索引等数据库对象的特性和使用方法;- PostgreSQL所特有的若干功能强大的SQL语法;- 使用多种不同的编程语言来编写PostgreSQL函数;- 实施语句调优以充分挖掘服务器硬件的潜能;- 通过外部数据封装器来查询


Python语言在科学计算和数据处理领域应用前景广阔。大数据时代,催生了人们处理大量数据的实际需求。Python应用领域的拓展,越来越多的人将Python用于处理大型数值数据集,使用标准格式来行数据的存储和通信也显得越来越重要,而HDF5也正迅速成为人们存储科学数据的选择。本书会带你迅速了解使用HDF5对大小从GB至TB的数字数据集行存档和共享的细节、实践以及陷阱,体验在Python语言中用HDF5存储科学数据。通过真实世界的例子以及动手练习,你将依次学习科学数据集、层次性组织的组、用户定义的元数据,以及有互操作性的文件等主题。本书的例子对于Python2和Python3都适用。 本书包括以下内容:设置HDF5工具并创建HDF5文件。通过学习HDF5数据集对象来使用数据集。理解数据集分块和压缩等高级功能。使用组来学习如何利用HDF5层次性结构。使用HDF5的属性来添加元数


《*、天猫电商数据分析与挖掘实战(第2版)》第1版获得了很多读者的认可,甚至有不少高校将其改编成了教程,但《*、天猫电商数据分析与挖掘实战(第2版)》依旧有许多不足之处,比如对于运营模块内容较少而且不够深,特别是数据挖掘套件的安装和部署难倒了许多读者。 《*、天猫电商数据分析与挖掘实战(第2版)》第2版为了跟上时代的变化和解决软件部署烦琐的问题,首先将线下的数据平台改成新平台,或是用其他平台替代;其次是对于软件方面的升级,将 SQL Server 的挖掘套件换成了SmartMining 个人版,部分章节使用了 Excel 2016 版本,用 Power Pivot 实现数据建模,用PowerQuery 提升数据清洗的能力。


1. 强调实战2. 覆盖大数据行业主流技术岗位,紧跟市场与企业步伐3. 来自企业的骨灰级大咖授课4. 内容结构完整,根据循序渐的认识规律设计章节顺序

本书在Oracle社区中被公认为是zui好的Oracle PL SQL程序设计权V指南。如果想要充分利用PL SQL,本书无疑是绝佳的资源。本书第6版全面讲解了PL SQL的特性和功能,涵盖了直到Oracle数据库12c R1版本发生的新变化。在过去20多年,成千上万的PL SQL程序发人员从本书中受益,这次的新版延续了之前的风格,提供了丰富的代码示例,穿插了程序发人员才能看懂的小幽默。本书介绍了PL SQL语言的基础知识、高级编码技巧,并提供了zui佳实践来帮助大家解决真实世界中的问题。本书讲解了如下内容:借助于有关执行、跟踪、调试和管理代码的清晰指导,快速编写和运行PL SQL程序;学习12.1版本的新特性,包括ACCESIBLE_BY子句、WITH FUNCTION和UDF杂注以及视图的BEQUEATH CURRENT_USER权限;充分利用书中提供的大量代码示例(从易于遵循的示例到可重用的包工具,不一而足);使用诸如PL Scope和PL SQL

图形数据库经典产品Neo4j的核心人员力作。 世界上的大部分领域实际上都可以建模成图,而软件发人员或是数据库管理人员却在辛辛苦苦地将这些图转化成关系型数据库中的表。想象一下,假如你再也不用去做这样的转化,假如数据库的迁移可以变得轻松简单,你愿意去受一个全新的数据库吗?图数据库就是这样一个完全不同于关系型数据库的新型数据库,它处理的是大规模的数据和不断变化的需求,并且拥抱它们。 《图数据库》系统地介绍了图数据库的历史由来、建模方法、工作原理和一些真实的用户用例,详细地说明了图数据解决的是什么样的问题,并以Neon4j数据库和Cypher查询语言为例,阐述了图数据库的建模方法和领域用例,*后还介绍了图数据库的工作原理以及一些实用的图论算法。 《图数据库》的三位作者均为图数据库经典产品Neo4j的


介绍了当前*热门的基于浏览器的数据可视化库D3,它可以把数据加载到网页中并给予数据生产各种图表。要看懂这本书,之前有没有编程经验不太重要。也许你写过程序,也听说过JavaScript语言的各种传闻,那你可以从D3和数据可视化入手,,跟JavaScript**次亲密接触。