
近年来,随着Web技术的发展和应用的普及,大 量用户将线下行为转移到线上进行,并且通过各种社 会媒体随时随地进行社会交互和情感表达。

本书是完全来自于实践的Modeler数据分析与挖掘的实战型著作; 全书通过15个行业应用案例,介绍Modeler在数据分析与挖掘领域中的应用; 本书是作者在行业工作中的经验分享,因此所涉及到的案例具体很强的实用性,可以用来解决你在商业应用中的实际问题。


《Oracle数据库管理与开发习题集(适用于OCP认证)》是原教材《Oracle数据库管理与开发(适用于OCP认证)》的习题集,书中不仅给出了原教材每一道练习题的答案,而且对解题的步骤进行了详细的解释,并在解题过程中给出了求解所需要的知识和技巧。




2014年天猫双11购物狂欢节成交额创下了571.12亿元的纪录! 交易创建峰值能力达到每秒钟8万笔,支付宝的支付峰值突破了每分钟285万笔。 成功创下这项纪录背后,有ODPS很大的功劳! *集团副总裁刘振飞表示,云计算在今年双11起到了非常重要的基础性作用。天猫、*、支付宝的大数据处理,都是基于阿里云计算的大数据处理平台ODPS完成,ODPS为天猫双十一的商品个性化推荐提供了技术支持,这是自主研发能力的一个很大提升。 ODPS(OpenDataProcessingService)是*自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很好的口碑,正逐步走向第三方开放市场? 本书是学习和掌握ODPS的权威指南,作者来自阿里ODPS团队。 本书包括以下重

市场中**本Hive图书。 Hive在Hadoop系统中的应用趋势比较可观。


萧文龙、李逸婕、张雅茜编著的《Oracle11g数据库**入门教程》在讲述数据库原理的同时,详细介绍数据库的管理、表空间的管理、表的管理、数据的操作与管理、用户与权限的管理等。本书系统化介绍生产管理系统,包括基本需求说明、公司组织图、创建数据库表及关系说明、设置用户权限、添加表数据、开发程序代码、创建生产管理系统验证等。本书通过ASP和JSP程序访问Oracle 11g数据库、企业数据管理实战、Enterprise Manager实战。


云数据库时代的技能升级 超复杂数据库环境案例精粹 走向自动化、智能化的数据服务 安全 连续 高效 智能的解决方案实践

介绍数据科学基本知识的重量级读本,Google数据科学家作品。 数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为 21世纪头号性感职业 。本书从零始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识 数学和统计学。 作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。通过阅读本书,你可以:学到一堂Python速成课;学习线性代数、统计和概率论的基本方法,了解它们是怎样应用在数据科学中的;掌握如何收集、探索、清理、转换和操作数据;深理解机器学习的基础;运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型;探索推荐系统、自然语言处

了解SQL查询语言的基本原理,但仍感觉无法自由运用SQL?想在数据上线前用SQL跑一遍数据库?想一步提高SQL技能?以上需求《SQL经典实例》都可以满足。本书致力于让广大数据库相关人员了解SQL的强大数据处理能力。书中汇集了150多个SQL示例,给出了常见问题的解决方案,帮助读者扩宽思路并用学到的技术来解决新问题,既适合SQL初学者更深理解SQL,也适合SQL用户阶及日常查询参考。-where子句等常见查询语句-查询结果排序-连查询-如何获取数据库元信息-常见数字运算实例-字符串处理-日期处理-数据仓储和复杂报表生成领域的查询-与层次化有关的一些实例



系统介绍了DM SQL的功能、语法、应用及DM SQL程序设计方法,内容实用、操作性强,语言通俗、格式规范,可作为相关专业的教材,也可作为工程技术人员的参考书。

1.作者建设了国内高校首个大数据课程教师培训交流基地,造了中国高校大数据教学知名品牌,已经在国内高校形成了广泛的影响力。2.作者建设了国内高校首个大数据课程公共服务平台,为教师教学和学生学习大数据课程提供讲义PPT、学习指南、备课指南、上机习题、实验指南、技术资料、授课视频等,资源丰富。

重可平衡:数据中台为主讲解中台建设中的产经经理工作技巧,兼顾业务中台。 落地易操作:图解化理论,没有高高在上的说教,手把手教你如何操作。 以 案 促教:以阿里巴巴、58等中台应用较为成熟的公司为依托讲解。



这是一个数据信息时代,每分每秒都在产生数不尽的数据。这些数据如何获取,有什么用途,如何与前沿的深度学习、机器学习等相结合,如何为我们所用,尽在本书中。 更多计算机好书请关注:电子工业出版社当当自营店

全面系统地介绍了达梦数据库体系结构、数据库日常维护操作和数据库基本参数设置,是学习达梦数据库的基础教材和参考用书。


与其在茫茫表格中搜索数字,不如将数据图形化,让复杂数据关系一目了然。本书是数据分析和可视化门首-选,以功能强大的R语言为工具,教你创建各种实用的数据图形,掌握高亮数据中的重要关系和趋势、简化数据形式、突出重数字等技能。本书适合所有需要数据分析的读者,也可作为统计课程的补充教材,无需数学、统计学或计算机编程背景。R语言基本知识创建单变量图,如饼图、箱线图、直方图等创建双变量图,如散图、折线图、高密度图等创建多变量图,如散图矩阵、三维图、树状图、热图等配套视频讲解,并可下载App观看AR视频:https: h5.arbook.io zhuanlan.html?book_id=30 status=bookdetail

适读人群: 1.企业的创始人和管理者; 2.企业的技术团队和运营团队; 3.从事数字化转型的所有人。 本书由数据中台领域的领先企业数澜科技官方出品,数澜科技已经帮助万科、中信云网等百余家各行业头部企业建设和落地数据中台。 7位作者都是有10年 经验的资深数据人,大部分作者来自原阿里数据中台团队和华为。 本书得到了阿里巴巴集团联合创始人谢世煌、原阿里集团副总裁卜鹰等近10位行业专家的高度评价和推荐。 本书从建设、管理、运营、安全4个维度详细讲解了数据中台概念、认知、架构、原理、组成,以及从0到1的完整过程。

大数据之美:挖掘,Hadoop,架构,更精准地发现业务与营销
本书以基本概念和发展现状作为切,对多种大数据关键技术行逻辑性阐述和分析,同时结合典型应用领域,论述了大数据技术在通信、互联网中扮演的重要角色,系统地向读者阐述了大数据的内涵。


介绍了当前*热门的基于浏览器的数据可视化库D3,它可以把数据加载到网页中并给予数据生产各种图表。要看懂这本书,之前有没有编程经验不太重要。也许你写过程序,也听说过JavaScript语言的各种传闻,那你可以从D3和数据可视化入手,,跟JavaScript**次亲密接触。

Kafka*初是由LinkedIn公司发的消息系统,现在已成为Apache的源项目。早期版本的Kafka主要是作为一个分布式、可分区和具有副本的消息系统,随着版本的不断迭代,在0.10.x版本之后Kafka已成为一个分布式流数据处理平台,特别是Kafka Streams的出现,使得Kafka对流数据处理变得更加简单。Kafka发展至今已具备很多特性,如分布式、高吞吐量、低延迟、高水平扩展性、高容错性等,也正是由于Kafka具备这些特性,使Kafka在大数据处理、日志收集、实时监控、离线统计分析等应用场景都被广泛使用。本书内容按照从抽象到具体、从到线再到面的学习思维模式行编排,由浅深、理论与实践相结合地对Kafka行了讲解和分析。剖析Kafka实现原理时,Kafka核心组件各成一节;讲解Kafka基本操作及应用实践时,从简单操作拓展到高级应用。全书的各章之间没有很强的依赖关系,读者可以从其中

精通实时大数据分析! Druid项目主要创始人杨仿今、蚂蚁金服CTO鲁肃、饿了么CTO张雪峰、Testin云测总裁徐琨、 Druid中国用户组发起人陈冠诚、 TalkingData CTO肖文峰、 OneAPM创始人,董事长何晓阳、Cloudera大中华区技术总监刘隶放、神策数据公司创始人 CEO桑文锋、AdMaster(精硕科技)技术副总裁卢亿雷、微软中国研发中心,高级研发总监 Sherman Tong、AdHoc吆喝科技创始人CEO 王晔联合力荐!


作者携手数据领域的强大智囊团为读者贡献的一本处理噪音数据的指南。本书囊括众多真实世界的应用案例以及高水平的方法和策略。本书汇集国外数据社区的技术骨干和活跃分子的集体智慧,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。噪音数据就是那些"给你惹麻烦的数据",从蹩脚的存储到糟糕的说明,再到令人误解的策略,有多重情况可能导致噪音数据。那么什么才是决定性因素呢?有人认为是技术方面的问题,比如缺失值或格式不对的记录,但是噪音数据包含更多的问题。本书介绍了多种有效的方式来应对噪音数据。在本书中,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。通过阅读本书,你将学会:测试你的数据,判断它是否适合分析;将电子表格数据转变成可用的格式;处理潜藏在文本数据里的编码问题;行一种

从哲学、数学、物理、统计,到测量、实验、辩证、分析,用谈天说地的方式激发思考,归纳总结数据科学的实质及成就一位数据科学家所需要的基本素养。

无论是梦想颠覆某个行业的创业者,还是试图从企业内部激发变革的创新者,你面临的**挑战就是创造人们真正需要的产品。本书将引导你走上正确的道路。 精益丛书由精益思想创始人埃里克·莱斯为您呈现。该丛书旨在透过实际案例,为创业团队发人员、经理和其他成员介绍精益创业方法的精髓。在领悟这个方法的过程中,你会掌握各种工具,让你步步为营,迅速做出明智的决策。

1.权威内容尝鲜。早鸟5G趋势类图书,侧重趋势而非技术,腾讯内部数据支撑,经得起推敲。 2.流量*的作者。腾讯安全战略研究中心官方出品。作者翟尤为得到讲师、知乎live 5G同名课程讲师,人次过2万。谢呼为腾讯副总裁 3.权威人士推荐。工程院院士邬贺铨推荐 4.权威会议推荐。世界5G大会推荐图书 5.权威数据支撑。大融合领域、40个实际案例、51条重知识、55次深度分析、121个关键定义、162组新数据


1.Presto是由Facebook源的高性能分布式SQL查询引擎,其用户包括Netflix、Airbnb、LinkedIn、Twitter、Uber等知名公司。 2.作为高性能分布式SQL查询引擎,Presto能够针对不同的数据源高效、快速地执行交互式分析。大数据的兴起使得数据存储机制多样化。面对标准不一的存储系统,你可以利用Presto轻松破壁垒,连通数据孤岛。 3.本书由Presto项目创始成员参与执笔。你将学会用简单的Presto语句快速查询多个数据源,把握SQL-on-Anything的精髓。在任何规模、任何存储系统、任何环境中,你都能发挥SQL的威力。 - 门:探索Presto的用例,学习安装、配置和使用Presto。 - 阶:深理解Presto的架构,学习连器实例和SQL高级特性。 - 实践:了解如何在生产环境中使用Presto,保证安全性,与其他工具集成。




本书全面介绍了SQL Server2008各方面的知识,全书由6部分组成:第1部分为数据库的基础篇,介绍了数据库的类型、概念、对象、SQL语言等;第2部分为SQL Server2008的准备篇,介绍了SQL Server2008的功能、特性、各版本的比较、安装方法、SQL Server2008的服务、客户端的工具等;第3部分为SQL Server2008的基本操作篇,介绍如何管理与配置SQL Server2008服务器,如何创建数据库和数据表,以及如何对数据库里的数据进行操作;第4部分为数据库管理篇,介绍如何使用T-SQL程序对数据进行复杂的运算,以及如何使用视图、存储过程、触发器、索引、用户定义数据类型、用户定义函数、全文索引、游标、事务和锁、统计信息和同义词等方面的知识;第5部分为SQL Server高级技术,介绍如何进行数据库备份与恢复,如何规划数据库,如何保证数据库的安全、复制与发布、自动化管理,如何使

目前,数量众多的数据中心给企业、政府机关带来了非常沉重的运维负担。


数据可视化经典著作 讲解清晰、示例丰富、实用性强 创作信息图的**参考指南

华为区块技术发团队编著。全新畅销升级版。全面介绍了区块技术的起源和演、关键技术原理、产业政策和发展概况、监管要求,分享剖析实际落地案例并示范应用实践过程,展望区块价值及未来发展趋势。本书附有精美电子课件。


本书共13章,主要内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用Hive行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训学校相关专业的师生教学参考。

数据科学和大数据分析是指利用数据的力量来发现新的见解。本书涵盖了数据科学涉及的行为广度以及所使用的方法和工具。本书内容侧重于任何行业和技术环境中都会用到的概念、原理和实际应用,并通过源软件来分析案例,以帮助读者更好地理解。本书将帮助您:成为数据科学团队中的一名贡献者;部署结构化的生命周期方法来分析数据问题;应用合适的分析技术和工具来分析大数据;学习如何用数据来讲一个动人的故事,以推动商业行为;备考EMC Proven Professional数据科学家认证。EEMC专家认证是IT行业领先的教育和认证项目,涵盖了信息存储技术、虚拟化技术、云计算、数据科学与大数据分析等领域。通过认证是一种很好的自我投资方式,同时也是对自己专业知识的正式验证。本书可以作为准备数据科学专员(EMCDSA)认证的资料。在驱动企业和服务提供商转型

1.DevOps传奇人物吉恩 金继《凤凰项目》后的又一力作,运维名著《凤凰项目:一个IT运维的传奇故事》的姊妹篇; 2.中国敏捷教练联盟秘书长肖然作序推荐; 3.DevOpsDays中国峰会核心组织者倾力翻译; 4.从软件发人员的角度继续讲述无极限零部件公司的故事。

本书作者从事计算机、电子、自动化、数字媒体技术等专业的教学工作多年,较清楚不同层次学生的需求;本书针对每个知识,结合案例行说明,程序均在VC 6.0环境下调试通过。

大数据作为人工智能的基石,当前正站在计算机技术发展的风口, 而作为Apache*项目的HBase的优势是高性能读写、弹性伸缩、面向列族存储,能够轻松应对数据存储的爆发,提供对千万级QPS低延时需求支持,毫无疑问是企业搭建大数据在线实时应用的*。Hadoop生态系统的HDFS和MapReduce分别为大数据提供了存储和分析处理能力,但是对在线实时的数据存取则爱莫能助,而HBase弥补了Hadoop的这一缺陷,满足了在线实时系统低延时的需求。本书以精炼的语言介绍HBase基础知识,让初学者能够快速上手使用HBase,对HBase 的核心架构思想(如数据读取、数据备份等)有深的了解,并且剖析HBase源码,介绍HBase 1.X 以及2.0带来的新特性,让有经验的HBase发人员也能够循序渐地深理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,同时不

Java微服务测试:基于Arquillian、Hoverfly、AssertJ、JUnit、Selenium与Mocki
微服务面临不可预知负载,分布式设计带来安全性能隐患,异步通信容器让挑战加剧。 内容涵盖自动化测试微服务系统集成测试以容器为中心的系统测试服务虚拟化 基于JVM微服务实现单元集成测试,实践高级混沌测试集成测试契约测试 ArquillianTomEE主创人员执笔,重磅企业场景测试实战力作首度问世 一切从用Java EEWildFly SwarmDocker来搭建微服务环境起步

本书用轻松话语讲述一线数据分析技术,既有统计方法与分析技巧,更有奇闻趣事和哲学感悟,为你的数据分析之路指点迷津。

本书是实用的PostgreSQL快速上手指南,简明扼要地介绍了PostgreSQL核心概念与功能特性,可以帮助读者快速学习、理解并运用好这款源数据库。除了用诸多示例重演示如何实现在别的数据库中难以实现或者根本不可能实现的任务,作者还介绍了ANSI-SQL语法、外部数据封装器增强、全文检索函数和运算符、XML语法、逻辑复制等PostgreSQL 9.5之后版本的新增功能,充分展示了PostgreSQL作为全栈数据库的强大功能和企业级特性。- 执行基本的数据库管理任务,比如角色管理、数据库创建、数据备份和恢复等;- 使用psql命令行工具以及pgAdmin图形化管理工具;- PostgreSQL的表、约束和索引等数据库对象的特性和使用方法;- PostgreSQL所特有的若干功能强大的SQL语法;- 使用多种不同的编程语言来编写PostgreSQL函数;- 实施语句调优以充分挖掘服务器硬件的潜能;- 通过外部数据封装器来查询


《Oracle 12c数据库门与应用》的特色 书中采用大量的实例行讲解,力求通过实际操作使读者更容易地掌握Oracle数据库应用。 难度适中,内容由浅深,实用性强,覆盖面广,条理清晰。 知识全 紧紧围绕Oracle数据库展讲解,具有很强的逻辑性和系统性。 实例丰富 各章实例短小却又能体现出知识的精髓,让读者很轻松地学习,并能灵活地应用到实际项目中。 基于理论,注重实践 在讲述过程中,不仅仅只介绍理论知识,而且在合适位置安排综合应用实例或者小型应用程序,将理论应用到实践当中,来加强读者实际应用能力,巩固发基础和知识。

※ 易教易学:系统阐述音视频和编解码的基础知识,结合前沿技术,使读者在不知不觉中建立起宏观的知识体系,掌握晦涩难懂的概念和理论,为后续音视频发下坚实的基础。 ※ 前后衔:强调知识体系和分析方法的前后连贯性,并妥善处理好与前期知识和后续知识的衔性。 ※ 应用方向:引导读者行各个音视频应用领域的探索,思路,包括视频监控、视频直播、编解码、智能匹配、远程教学、语音识别,激发读者的学习兴趣,启发创新思想。
