
图形数据库经典产品Neo4j的核心人员力作。 世界上的大部分领域实际上都可以建模成图,而软件发人员或是数据库管理人员却在辛辛苦苦地将这些图转化成关系型数据库中的表。想象一下,假如你再也不用去做这样的转化,假如数据库的迁移可以变得轻松简单,你愿意去受一个全新的数据库吗?图数据库就是这样一个完全不同于关系型数据库的新型数据库,它处理的是大规模的数据和不断变化的需求,并且拥抱它们。 《图数据库》系统地介绍了图数据库的历史由来、建模方法、工作原理和一些真实的用户用例,详细地说明了图数据解决的是什么样的问题,并以Neon4j数据库和Cypher查询语言为例,阐述了图数据库的建模方法和领域用例,*后还介绍了图数据库的工作原理以及一些实用的图论算法。 《图数据库》的三位作者均为图数据库经典产品Neo4j的

作者携手数据领域的强大智囊团为读者贡献的一本处理噪音数据的指南。本书囊括众多真实世界的应用案例以及高水平的方法和策略。本书汇集国外数据社区的技术骨干和活跃分子的集体智慧,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。噪音数据就是那些"给你惹麻烦的数据",从蹩脚的存储到糟糕的说明,再到令人误解的策略,有多重情况可能导致噪音数据。那么什么才是决定性因素呢?有人认为是技术方面的问题,比如缺失值或格式不对的记录,但是噪音数据包含更多的问题。本书介绍了多种有效的方式来应对噪音数据。在本书中,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。通过阅读本书,你将学会:测试你的数据,判断它是否适合分析;将电子表格数据转变成可用的格式;处理潜藏在文本数据里的编码问题;行一种

与其在茫茫表格中搜索数字,不如将数据图形化,让复杂数据关系一目了然。本书是数据分析和可视化门首-选,以功能强大的R语言为工具,教你创建各种实用的数据图形,掌握高亮数据中的重要关系和趋势、简化数据形式、突出重数字等技能。本书适合所有需要数据分析的读者,也可作为统计课程的补充教材,无需数学、统计学或计算机编程背景。R语言基本知识创建单变量图,如饼图、箱线图、直方图等创建双变量图,如散图、折线图、高密度图等创建多变量图,如散图矩阵、三维图、树状图、热图等配套视频讲解,并可下载App观看AR视频:https: h5.arbook.io zhuanlan.html?book_id=30 status=bookdetail

暂无

1. 强调实战2. 覆盖大数据行业主流技术岗位,紧跟市场与企业步伐3. 来自企业的骨灰级大咖授课4. 内容结构完整,根据循序渐的认识规律设计章节顺序


MYSQL 5.5从零开始学(光盘内容另行下载,地址见书封底)
本书是面向MySQL数据库管理系统初学者的一本高质量的书籍。

《数据决策:企业数据的管理、分析与应用》详细介绍了数据战略规划,企业数字化运营,客户智能运营,业务主题优化,行业应用案例


1.本书作者均来自Spark的母公司Databricks。他们将带你始使用Spark,并了解如何利用它适应这个属于大数据和机器学习的新时代。 2.第2版在第1版的基础上做了大量更新,涵盖Spark 3.0的新特性,并着重展示如何利用机器学习算法执行大数据分析。 3.Spark项目创始人Matei Zaharia、Spark PMC成员Reynold Xin力荐。 毋庸置疑,数据已经成为现代化企业的重要资产,大数据分析技术则是企业挖掘数据价值的核心利器。一直以来,Spark就是大数据分析领域的佼佼者,也已经成为一站式大数据分析引擎的事实标准。 * 学习使用Python、Java、Scala的结构化数据API * 理解Spark SQL引擎的原理 * 掌握Spark应用的优化技巧 * 了解如何读写数据源:JSON、Parquet、CSV、Avro、ORC等 * 使用Structured Streaming分析批式数据和流式数据 * 使用Spark和Delta Lake构建湖仓一体的系统 * 使用MLlib发机器学习流水线


本书作者从事计算机、电子、自动化、数字媒体技术等专业的教学工作多年,较清楚不同层次学生的需求;本书针对每个知识,结合案例行说明,程序均在VC 6.0环境下调试通过。

大数据作为人工智能的基石,当前正站在计算机技术发展的风口, 而作为Apache*项目的HBase的优势是高性能读写、弹性伸缩、面向列族存储,能够轻松应对数据存储的爆发,提供对千万级QPS低延时需求支持,毫无疑问是企业搭建大数据在线实时应用的*。Hadoop生态系统的HDFS和MapReduce分别为大数据提供了存储和分析处理能力,但是对在线实时的数据存取则爱莫能助,而HBase弥补了Hadoop的这一缺陷,满足了在线实时系统低延时的需求。本书以精炼的语言介绍HBase基础知识,让初学者能够快速上手使用HBase,对HBase 的核心架构思想(如数据读取、数据备份等)有深的了解,并且剖析HBase源码,介绍HBase 1.X 以及2.0带来的新特性,让有经验的HBase发人员也能够循序渐地深理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,同时不

重可平衡:数据中台为主讲解中台建设中的产经经理工作技巧,兼顾业务中台。 落地易操作:图解化理论,没有高高在上的说教,手把手教你如何操作。 以 案 促教:以阿里巴巴、58等中台应用较为成熟的公司为依托讲解。

本书用轻松话语讲述一线数据分析技术,既有统计方法与分析技巧,更有奇闻趣事和哲学感悟,为你的数据分析之路指点迷津。

本书是实用的PostgreSQL快速上手指南,简明扼要地介绍了PostgreSQL核心概念与功能特性,可以帮助读者快速学习、理解并运用好这款源数据库。除了用诸多示例重演示如何实现在别的数据库中难以实现或者根本不可能实现的任务,作者还介绍了ANSI-SQL语法、外部数据封装器增强、全文检索函数和运算符、XML语法、逻辑复制等PostgreSQL 9.5之后版本的新增功能,充分展示了PostgreSQL作为全栈数据库的强大功能和企业级特性。- 执行基本的数据库管理任务,比如角色管理、数据库创建、数据备份和恢复等;- 使用psql命令行工具以及pgAdmin图形化管理工具;- PostgreSQL的表、约束和索引等数据库对象的特性和使用方法;- PostgreSQL所特有的若干功能强大的SQL语法;- 使用多种不同的编程语言来编写PostgreSQL函数;- 实施语句调优以充分挖掘服务器硬件的潜能;- 通过外部数据封装器来查询

大数据时代书系(一本书读懂大数据+一本书读懂互联网思维+一本书读懂互联网+一本书读懂互联网金融)套装共四册