
本书是完全来自于实践的Modeler数据分析与挖掘的实战型著作; 全书通过15个行业应用案例,介绍Modeler在数据分析与挖掘领域中的应用; 本书是作者在行业工作中的经验分享,因此所涉及到的案例具体很强的实用性,可以用来解决你在商业应用中的实际问题。


《Oracle数据库管理与开发习题集(适用于OCP认证)》是原教材《Oracle数据库管理与开发(适用于OCP认证)》的习题集,书中不仅给出了原教材每一道练习题的答案,而且对解题的步骤进行了详细的解释,并在解题过程中给出了求解所需要的知识和技巧。





本书作者从事计算机、电子、自动化、数字媒体技术等专业的教学工作多年,较清楚不同层次学生的需求;本书针对每个知识,结合案例行说明,程序均在VC 6.0环境下调试通过。

大数据作为人工智能的基石,当前正站在计算机技术发展的风口, 而作为Apache*项目的HBase的优势是高性能读写、弹性伸缩、面向列族存储,能够轻松应对数据存储的爆发,提供对千万级QPS低延时需求支持,毫无疑问是企业搭建大数据在线实时应用的*。Hadoop生态系统的HDFS和MapReduce分别为大数据提供了存储和分析处理能力,但是对在线实时的数据存取则爱莫能助,而HBase弥补了Hadoop的这一缺陷,满足了在线实时系统低延时的需求。本书以精炼的语言介绍HBase基础知识,让初学者能够快速上手使用HBase,对HBase 的核心架构思想(如数据读取、数据备份等)有深的了解,并且剖析HBase源码,介绍HBase 1.X 以及2.0带来的新特性,让有经验的HBase发人员也能够循序渐地深理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,同时不

联袂推荐暨南大学教授、博士生导师刘建平,暨南大学研究生院副院长、经济学院统计学系副主任、教授、博士生导师陈光慧,天善智能创始人梁勇,IBM技术专家刘咏梅,IBM数据科学家钟云飞,广东省环保厅环境咨询专家委员会专家、广东柯内特环境科技有限公司总经理朱斌本书特色内容全面:涉及数据读取、数据处理、数据可视化、统计分析与检验、数据挖掘算法、自动建模、集成与扩展、模型部署、性能优化、数据挖掘方法论等诸多内容;讲解透彻:既有理论的讲解,又涵盖应用的实践,而且在工具的介绍上,尽可能包括每一个选项的内容和应用形式,力求让读者 吃透 每一章节的内容;突出实战:集行业经验、项目实践、算法剖析、应用技巧于一身,配套提供数据文件以及数据模型文件,方便读者动手实践。

本书是为计算机专业教学而编写的教材。它基于SQL Server2008数据库管理系统,共11章,主要内容包括安装和配置SQLServer2008,“电脑销售管理系统”项目设计,数据库管理、配置和维护,数据表对象的创建与管理,项目数据库安全管理,数据查询、视图及索引管理,存储过程管理,触发器和游标的管理,“电脑销售管理系统”项目发(#)及项目发布等。同时,为了方便读者巩固所学的知识,还针对章节附上了实训任务,以帮助学生加强知识的理解,提高实际操作的能力。

Java微服务测试:基于Arquillian、Hoverfly、AssertJ、JUnit、Selenium与Mocki
微服务面临不可预知负载,分布式设计带来安全性能隐患,异步通信容器让挑战加剧。 内容涵盖自动化测试微服务系统集成测试以容器为中心的系统测试服务虚拟化 基于JVM微服务实现单元集成测试,实践高级混沌测试集成测试契约测试 ArquillianTomEE主创人员执笔,重磅企业场景测试实战力作首度问世 一切从用Java EEWildFly SwarmDocker来搭建微服务环境起步

本书由多位数据库技术专家合著而成,融合了各行业DBA的工作经验与思考,包含了精心挑选的数据库性能优化与内部原理解析案例。


本书共13章,主要内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用Hive行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训学校相关专业的师生教学参考。


1.Presto是由Facebook源的高性能分布式SQL查询引擎,其用户包括Netflix、Airbnb、LinkedIn、Twitter、Uber等知名公司。 2.作为高性能分布式SQL查询引擎,Presto能够针对不同的数据源高效、快速地执行交互式分析。大数据的兴起使得数据存储机制多样化。面对标准不一的存储系统,你可以利用Presto轻松破壁垒,连通数据孤岛。 3.本书由Presto项目创始成员参与执笔。你将学会用简单的Presto语句快速查询多个数据源,把握SQL-on-Anything的精髓。在任何规模、任何存储系统、任何环境中,你都能发挥SQL的威力。 - 门:探索Presto的用例,学习安装、配置和使用Presto。 - 阶:深理解Presto的架构,学习连器实例和SQL高级特性。 - 实践:了解如何在生产环境中使用Presto,保证安全性,与其他工具集成。

这是一个数据信息时代,每分每秒都在产生数不尽的数据。这些数据如何获取,有什么用途,如何与前沿的深度学习、机器学习等相结合,如何为我们所用,尽在本书中。 更多计算机好书请关注:电子工业出版社当当自营店

华为区块技术发团队编著。全新畅销升级版。全面介绍了区块技术的起源和演、关键技术原理、产业政策和发展概况、监管要求,分享剖析实际落地案例并示范应用实践过程,展望区块价值及未来发展趋势。本书附有精美电子课件。


SQL Server从入门到精通(光盘内容另行下载,地址见书封底)

2014年天猫双11购物狂欢节成交额创下了571.12亿元的纪录! 交易创建峰值能力达到每秒钟8万笔,支付宝的支付峰值突破了每分钟285万笔。 成功创下这项纪录背后,有ODPS很大的功劳! *集团副总裁刘振飞表示,云计算在今年双11起到了非常重要的基础性作用。天猫、*、支付宝的大数据处理,都是基于阿里云计算的大数据处理平台ODPS完成,ODPS为天猫双十一的商品个性化推荐提供了技术支持,这是自主研发能力的一个很大提升。 ODPS(OpenDataProcessingService)是*自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很好的口碑,正逐步走向第三方开放市场? 本书是学习和掌握ODPS的权威指南,作者来自阿里ODPS团队。 本书包括以下重


Python语言在科学计算和数据处理领域应用前景广阔。大数据时代,催生了人们处理大量数据的实际需求。Python应用领域的拓展,越来越多的人将Python用于处理大型数值数据集,使用标准格式来行数据的存储和通信也显得越来越重要,而HDF5也正迅速成为人们存储科学数据的选择。本书会带你迅速了解使用HDF5对大小从GB至TB的数字数据集行存档和共享的细节、实践以及陷阱,体验在Python语言中用HDF5存储科学数据。通过真实世界的例子以及动手练习,你将依次学习科学数据集、层次性组织的组、用户定义的元数据,以及有互操作性的文件等主题。本书的例子对于Python2和Python3都适用。 本书包括以下内容:设置HDF5工具并创建HDF5文件。通过学习HDF5数据集对象来使用数据集。理解数据集分块和压缩等高级功能。使用组来学习如何利用HDF5层次性结构。使用HDF5的属性来添加元数



从统计学观出发,以数理统计为基础,全面系统地介绍了机器学习的主要方法。 根据全新设计的学习路线图编写,注重夯实理论基础,更便于深化对知识的理解,建立系统性的全局观。 对机器学习所涉及的数学基础行了完整的解释和必要的铺垫,更便于读者对深化相关知识的理解。

本书全面介绍了SQL Server2008各方面的知识,全书由6部分组成:第1部分为数据库的基础篇,介绍了数据库的类型、概念、对象、SQL语言等;第2部分为SQL Server2008的准备篇,介绍了SQL Server2008的功能、特性、各版本的比较、安装方法、SQL Server2008的服务、客户端的工具等;第3部分为SQL Server2008的基本操作篇,介绍如何管理与配置SQL Server2008服务器,如何创建数据库和数据表,以及如何对数据库里的数据进行操作;第4部分为数据库管理篇,介绍如何使用T-SQL程序对数据进行复杂的运算,以及如何使用视图、存储过程、触发器、索引、用户定义数据类型、用户定义函数、全文索引、游标、事务和锁、统计信息和同义词等方面的知识;第5部分为SQL Server高级技术,介绍如何进行数据库备份与恢复,如何规划数据库,如何保证数据库的安全、复制与发布、自动化管理,如何使

※ 易教易学:系统阐述音视频和编解码的基础知识,结合前沿技术,使读者在不知不觉中建立起宏观的知识体系,掌握晦涩难懂的概念和理论,为后续音视频发下坚实的基础。 ※ 前后衔:强调知识体系和分析方法的前后连贯性,并妥善处理好与前期知识和后续知识的衔性。 ※ 应用方向:引导读者行各个音视频应用领域的探索,思路,包括视频监控、视频直播、编解码、智能匹配、远程教学、语音识别,激发读者的学习兴趣,启发创新思想。

精通实时大数据分析! Druid项目主要创始人杨仿今、蚂蚁金服CTO鲁肃、饿了么CTO张雪峰、Testin云测总裁徐琨、 Druid中国用户组发起人陈冠诚、 TalkingData CTO肖文峰、 OneAPM创始人,董事长何晓阳、Cloudera大中华区技术总监刘隶放、神策数据公司创始人 CEO桑文锋、AdMaster(精硕科技)技术副总裁卢亿雷、微软中国研发中心,高级研发总监 Sherman Tong、AdHoc吆喝科技创始人CEO 王晔联合力荐!

目前,数量众多的数据中心给企业、政府机关带来了非常沉重的运维负担。

这本书不要求读者的编程基础和数学知识,以尽量通俗易懂的语言来解释晦涩的数据挖掘算法原理,本书所保留的数学公式都是*基本的、不得不保留的公式,这将本书的阅读门槛降到了**。学习本书,读者将掌握*实用的数据挖掘算法,并能够立刻应用它们。

本人的确对Oracle技术情有独钟。


适读人群: 1.企业的创始人和管理者; 2.企业的技术团队和运营团队; 3.从事数字化转型的所有人。 本书由数据中台领域的领先企业数澜科技官方出品,数澜科技已经帮助万科、中信云网等百余家各行业头部企业建设和落地数据中台。 7位作者都是有10年 经验的资深数据人,大部分作者来自原阿里数据中台团队和华为。 本书得到了阿里巴巴集团联合创始人谢世煌、原阿里集团副总裁卜鹰等近10位行业专家的高度评价和推荐。 本书从建设、管理、运营、安全4个维度详细讲解了数据中台概念、认知、架构、原理、组成,以及从0到1的完整过程。




作为新一代的源流处理器,Flink是众多大数据处理框架中一颗冉冉升起的新星。它以同一种技术支持流处理和批处理,并能同时满足高吞吐、低延迟和容错的需求。本书由Flink项目核心成员执笔,系统阐释Flink的适用场景、设计理念、功能、用途和性能优势。- Flink的适用场景- 流处理架构相较于批处理架构的优势- Flink中的时间概念- Flink的检查机制- Flink的性能优势

新增了大量实战案例的分析和讲解,并精选书中的部分案例由作者制作成视频教学资料(DVD光盘)随书附赠。

图形数据库经典产品Neo4j的核心人员力作。 世界上的大部分领域实际上都可以建模成图,而软件发人员或是数据库管理人员却在辛辛苦苦地将这些图转化成关系型数据库中的表。想象一下,假如你再也不用去做这样的转化,假如数据库的迁移可以变得轻松简单,你愿意去受一个全新的数据库吗?图数据库就是这样一个完全不同于关系型数据库的新型数据库,它处理的是大规模的数据和不断变化的需求,并且拥抱它们。 《图数据库》系统地介绍了图数据库的历史由来、建模方法、工作原理和一些真实的用户用例,详细地说明了图数据解决的是什么样的问题,并以Neon4j数据库和Cypher查询语言为例,阐述了图数据库的建模方法和领域用例,*后还介绍了图数据库的工作原理以及一些实用的图论算法。 《图数据库》的三位作者均为图数据库经典产品Neo4j的

Spark发者出品! 《Spark快速大数据分析》是一本为Spark初学者准备的书,它没有过多深实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于Spark的用法,它对Spark的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。 本书介绍了源集群计算系统Apache Spark,它可以加速数据分析的实现和运行。利用Spark,你可以用Python、Java以及Scala的简易API来快速操控大规模数据集。 本书由Spark发者编写,可以让数据科学家和工程师即刻上手。你能学到如何使用简短的代码实现复杂的并行作业,还能了解从简单的批处理作业到流处理以及机器学习等应用。

Kyligence 联合创始人兼 CEO , Apache Kylin 项目管理委员会主席( PMC Chair )韩卿 武汉市云升科技发展有限公司董事长, 《 智慧城市 大数据、物联网和云计算之应用 》作者 杨正洪 万达网络科技集团大数据中心副总经理,《 Spark 高级数据分析》中文版译者龚少成 数据架构师, IT 脱口秀(清风那个吹)创始人,《开源大数据分析引擎 Impala 实战》作者贾传青 等等业内专家联合推荐 Apache Kylin 将传统的数据仓库及商务智能分析能力带入到了大数据时代,作为新兴的技术已经被广大用户所使用。作为创始作者,我非常欣喜能看到关于 Apache Kylin 相关书籍的出版, 这无疑对中国用户更好地使用 Kylin ,解决实际的大数据分析架构及业务问题有很大帮助。 韩卿 Kyl

本书是关于Access 2007的大全类书籍,囊括了Access 2007的所有功能,尤其是Access 2007的新增功能(例如改进的全新用户界面、功能强大的模板、增强的排序和筛选功能、表格式布局、导航窗格等)进行了详尽阐释。


作者携手数据领域的强大智囊团为读者贡献的一本处理噪音数据的指南。本书囊括众多真实世界的应用案例以及高水平的方法和策略。本书汇集国外数据社区的技术骨干和活跃分子的集体智慧,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。噪音数据就是那些"给你惹麻烦的数据",从蹩脚的存储到糟糕的说明,再到令人误解的策略,有多重情况可能导致噪音数据。那么什么才是决定性因素呢?有人认为是技术方面的问题,比如缺失值或格式不对的记录,但是噪音数据包含更多的问题。本书介绍了多种有效的方式来应对噪音数据。在本书中,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。通过阅读本书,你将学会:测试你的数据,判断它是否适合分析;将电子表格数据转变成可用的格式;处理潜藏在文本数据里的编码问题;行一种

SAP 高性能分析应用软件(SAP High-Performance Analytic Appliance,SAP HANA)自2011年作为成熟的产品和解决方案向全球推广以来,引起了数据库领域非常强的一次震动。


暂无

1 作者为中科院软件所博士,其多年发表论文的经验使得这本书的行文完全会让你眼前一亮,严谨且准确。 2 作者精心绘制200余幅图,本书用四色印刷尽力真实还原出来,呈现着作者强大的技术工匠精神。 3 本书采用问题驱动的叙述方式,强调基本原理的阐述,内容非常扎实,且更多的是关乎大数据处理框架的底层原理描述,所以一旦学懂,肯定会让你在大数据领域更上一层楼。

系统介绍了DM SQL的功能、语法、应用及DM SQL程序设计方法,内容实用、操作性强,语言通俗、格式规范,可作为相关专业的教材,也可作为工程技术人员的参考书。


MYSQL 5.5从零开始学(光盘内容另行下载,地址见书封底)
本书是面向MySQL数据库管理系统初学者的一本高质量的书籍。


萧文龙、李逸婕、张雅茜编著的《Oracle11g数据库**入门教程》在讲述数据库原理的同时,详细介绍数据库的管理、表空间的管理、表的管理、数据的操作与管理、用户与权限的管理等。本书系统化介绍生产管理系统,包括基本需求说明、公司组织图、创建数据库表及关系说明、设置用户权限、添加表数据、开发程序代码、创建生产管理系统验证等。本书通过ASP和JSP程序访问Oracle 11g数据库、企业数据管理实战、Enterprise Manager实战。

《数据决策:企业数据的管理、分析与应用》详细介绍了数据战略规划,企业数字化运营,客户智能运营,业务主题优化,行业应用案例



SQL Server 2016数据库应用与开发习题解答与上机指导
本书从基本操作着手,从教学实际需求出发,结合初学者的认知规律,由浅深、精心选择SQL Server 2008数据库管理与发过程中的知识,以数据库及相关数据库对象为基础,以备份、还原、复制、监视等数据库系统管理组件为目标,以形式多样、内容丰富习题和参考答案对基本操作行示范,与主教材一起造出比较完整的立体化教材的课程体系。

了解SQL查询语言的基本原理,但仍感觉无法自由运用SQL?想在数据上线前用SQL跑一遍数据库?想一步提高SQL技能?以上需求《SQL经典实例》都可以满足。本书致力于让广大数据库相关人员了解SQL的强大数据处理能力。书中汇集了150多个SQL示例,给出了常见问题的解决方案,帮助读者扩宽思路并用学到的技术来解决新问题,既适合SQL初学者更深理解SQL,也适合SQL用户阶及日常查询参考。-where子句等常见查询语句-查询结果排序-连查询-如何获取数据库元信息-常见数字运算实例-字符串处理-日期处理-数据仓储和复杂报表生成领域的查询-与层次化有关的一些实例