图文详解Kafka的内部原理、设计与实现全面分析以Kafka为中心的分布式流平台 Kafka新特性详解,包括连接器、流处理
¥88.50定价:¥119.00 (7.44折)
大数据挖掘与处理经典套装 大数据 互联网大规模数据挖掘与分布式处理 + 数据挖掘导论(套装共2册) 大数据著作全新升级 信息管理专家 科技作家涂子沛倾情推荐 带你进入真正的大数据时代
这套书以大数据环境下的数据挖掘和机器学习为重点,全面介绍了实践中行之有效的数据挖掘知识和数据处理算法。
¥102.10定价:¥148.00 (6.9折)
鲜活的数据:数据可视化指南【数据可视化经典著作,创作信息图的参考指南】
数据可视化经典著作 讲解清晰、示例丰富、实用性强 创作信息图的**参考指南
¥51.70定价:¥69.00 (7.5折) 电子书:¥34.08
Spark高级数据分析 Cloudera公司数据科学家团队携手打造,教你用Spark进行大规模数据分析
这是一本实用手册,四位作者均是Cloudera公司的数据科学家,他们联袂展示了利用Spark进行大规模数据分析的若干模式,而且每个模式都自成一体。他们将Spark、统计学方法和真实数据集结合起来,通过实例向读者讲述了怎样解决分析型问题。 本书首先介绍了Spark及其生态系统,接着详细介绍了将分类、协同过滤及异常检查等常用技术应用于基因学、安全和金融领域的若干模式。如果你对机器学习和统计学有基本的了解,并且会用Java、Python或Scala编程,这些模式将有助于你开发自己的数据应用。 本书介绍了以下模式: 音乐推荐和Audioscrobbler数据集 用决策树算法预测森林植被 基于K均值聚类进行网络流量的异常检测 基于潜在语义分析技术分析维基百科 用GraphX分析伴生网络 对纽约出租车轨迹进行空间和时间数据分析 通过蒙
¥44.20定价:¥59.00 (7.5折)
大数据:互联网大规模数据挖掘与分布式处理【著名信息管理专家、科技作家涂子沛倾情推荐,大数据时代的及时雨、全球著名数据库技
推荐组合购买: 大数据分析:决胜互联网金融时代(大数据落地实践之作,汇集世界**数据专家思想精华,*高级专家团队精心译著,O'Reilly总经理作序,IBM首席科学家等6位专家联袂推荐) 大数据:互联网大规模数据挖掘与分布式处理【大数据时代的及时雨、全球著名数据库技术专家**力作】 推荐购买套装: 大数据:互联网大规模数据挖掘与分布式处理+数据挖掘导论(完整版)(套装共2册)(超值附赠《码农》光盘1张) 不知道大数据?你OUT了,还在看泡沫般的大数据书吗?一遍遍反复咀嚼基本概念?看的时候激动人心,看完之后两眼茫然。要真正掌握大数据技术,你需要干货!给你重磅干货!提示:量大货干,请自备大量饮用水! 大数据时代的及时雨 ,全球著名数据库技术专家**力作 ,理论与实际算法实现并重 。重点放在如何用数
¥44.20定价:¥59.00 (7.5折)
介绍了当前*热门的基于浏览器的数据可视化库D3,它可以把数据加载到网页中并给予数据生产各种图表。要看懂这本书,之前有没有编程经验不太重要。也许你写过程序,也听说过JavaScript语言的各种传闻,那你可以从D3和数据可视化入手,,跟JavaScript**次亲密接触。
¥40.70定价:¥59.00 (6.9折) 电子书:¥42.50
¥40.70定价:¥59.00 (6.9折)
数据科学实战 大数据时代的实战宝典,谷歌、微软、eBay等公司一线数据科学家真知灼见,揭秘数据科学相关的新算法、方法与模型
¥59.20定价:¥79.00 (7.5折) 电子书:¥39.99
借助多年的实践经验,采用大量示例和易于理解的框架,W.H. Inmon和Daniel Linstedt准确解释了数据架构的重要意义,研究了如何使用它在已有系统中高效驾驭大数据。 探讨了大数据中经常被忽视的价值,研究了非重复型数据,并且阐述了为什么它的使用会带来显著的业务价值 展示了如何将文本信息转换成标准工具可以分析的形式 解释了如何使大数据适用于已有系统环境 介绍了大数据的出现所带来的新机遇 澄清了大数据中重复型数据和非重复型数据的不明确之处
¥51.70定价:¥69.00 (7.5折)
无论是梦想颠覆某个行业的创业者,还是试图从企业内部激发变革的创新者,你面临的**挑战就是创造人们真正需要的产品。本书将引导你走上正确的道路。 精益丛书由精益思想创始人埃里克 莱斯为您呈现。该丛书旨在透过实际案例,为创业团队开发人员、经理和其他成员介绍精益创业方法的精髓。在领悟这个方法的过程中,你会掌握各种工具,让你步步为营,迅速做出明智的决策。
¥62.40定价:¥79.00 (7.9折)
推荐组合购买: 大数据分析:用互联网思维创造惊人价值(大数据时代必看图书,互联网思维助你洞察取巨大商机,世界**专家20年丰富经验大起底,打通大数据理论与实践的通路) 大数据分析:决胜互联网金融时代(大数据落地实践之作,汇集世界**数据专家思想精华,*高级专家团队精心译著,O'Reilly总经理作序,IBM首席科学家等6位专家联袂推荐) ★ 风靡日本、韩国的超级畅销书 ★ 独家披露野村综研的**手资料 ★ eBay、麦当劳等美国、日本标杆企业的实践案例 ★ 野村综研大数据专家权威解析 大数据的冲击是日本*畅销的大数据商业应用指南。书中结合野村综合研究独家披露的调查数据,网罗了美国、日本标杆企业与政府的应用案例,总结了大数据的商业模式,以及在大数据应用中需要注意的隐私问题,并就如何为大
¥33.80定价:¥49.00 (6.9折)
数据挖掘导论(完整版) 数据挖掘导论(完整版) 新版 点击查看
推荐购买套装: 大数据:互联网大规模数据挖掘与分布式处理 数据挖掘导论(完整版)(套装共2册)(超值附赠《码农》光盘1张) 本书全面介绍了数据挖掘,涵盖了五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都有两章。前一章涵盖基本概念、代表性算法和评估技术,而后一章讨论高级概念和算法。这样读者在透彻地理解数据挖掘的基础的同时,还能够了解更多重要的高级主题。 《数据挖掘导论(完整版)》是明尼苏达大学和密歇根州立大学数据挖掘课程的教材,由于独具特色,正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。《数据挖掘导论(完整版)》特色与许多其他同类图书不同,《数据挖掘导论(完整版)》将重点放在如何用数据挖掘知识解决各种实际问题。 只要求具备很少的
¥54.50定价:¥69.00 (7.9折)
不知道大数据?你OUT了,还在看泡沫般的大数据书吗?一遍遍反复咀嚼基本概念?看的时候激动人心,看完之后两眼茫然。要真正掌握大数据技术,你需要干货!大数据:互联网大规模数据挖掘与分布式处理+数据挖掘导论(完整版)(套装共2册)给你重磅干货!提示:量大货干,请自备大量饮用水! 大数据时代的及时雨 ,全球著名数据库技术专家**力作 ,理论与实际算法实现并重 。本套书将重点放在如何用数据挖掘知识解决各种实际问题。只要求具备很少的预备知识——不需要数据库背景,只需要很少的统计学或数学背景知识。书中包含大量的图表、综合示例和丰富的习题,并且使用示例、关键算法的简洁描述和习题,尽可能直接地聚焦于数据挖掘的主要概念。 本书附赠超火热码农电子杂志光盘,让你一步找到自己的精神家园。
¥88.30定价:¥128.00 (6.9折)
洞悉数据 用可视化方法发掘数据真义 洞悉数据挖掘概念与技术 多学科 多维度 清晰全面地理解数据和数据可视化
对于可视化能够如何帮助我们更加清晰、全面地理解数据,本书提供了发人深省的见解。本书提供了不同背景下人们的各种视角,其中包括数据科学家、统计学家、画家和作家,等等。如果我们不了解数据真正的意义,那么所有数据就都只是无用的或误导性的。本书共分为7章,探讨了一些能够让数据变得有意义、有用的数据可视化方法。本书还讨论了一些根本思想和基本问题,涉及数据生命周期,数据和展示方法之间的交互,以及数据可视化中基本构建模块的本质、起源和目的。读者可以看到在用户界面的上下文中理解用户的新老方式,沟通是如何被歪曲的,以及数据可视化是如何与计算机联系起来的。结尾,本书评估了数据可视化特性的优缺点。本书包含各种插图、名人名言和现实生活中的例子,以及商业分析、医疗、网络监控、安全和游戏等领域的案例分析。
¥51.70定价:¥69.00 (7.5折)
社会媒体挖掘 掌握互联网数据挖掘基本原理和方法 从火热的社会媒体中挖掘真义
过去十年中,社会媒体蓬勃发展,彻底改变了人们的社交行为和企业的商业模式。人们在社会媒体上交互、分享和阅读内容,进而以空前的速度产生了大量数据。理解和处理这类新型数据,并从中发现有用的模式,对于交叉学科研究、新算法和工具的研发来讲是挑战与机遇并存。 本书整合了社会媒体、社会网络分析以及数据挖掘的相关知识,为学生、从业者、研究人员和项目经理理解社会媒体挖掘的基础知识和潜能,提供了一个方便的平台。本书介绍了社会媒体数据独有的问题,并阐述了网络分析以及数据挖掘中的基本概念、新出现的问题和有效的算法。 本书可作为高年级本科生和低年级硕士生的教材,也可以作为短期专业课程用书。书中涵盖了不同难度的练习题,可以帮助读者在社会媒体数据挖掘的不同场景中理解和应用相关的概念、原理以及方
¥40.70定价:¥59.00 (6.9折)
数据科学入门 介绍数据科学基本知识的重量级读本 Google数据科学家作品
介绍数据科学基本知识的重量级读本,Google数据科学家作品。 数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为 21世纪头号性感职业 。本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识 数学和统计学。 作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。通过阅读本书,你可以:学到一堂Python速成课;学习线性代数、统计和概率论的基本方法,了解它们是怎样应用在数据科学中的;掌握如何收集、探索、清理、转换和操作数据;深入理解机器学习的基础;运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型;探索推荐系统、自然语
¥51.70定价:¥69.00 (7.5折) 电子书:¥27.99
命令行中的数据科学 大数据处理不一定非要写程序,小小命令行工具往往出奇制胜,高效数据分析
大数据时代,数据科学研究与分析日益重要。本书独树一帜,教你利用灵活的命令行工具成为高效多产的数据科学家。 为此,作者开发了数据科学工具箱,一个包含80多个命令行工具的安装简单的虚拟环境,能在Windows、OS X和Linux操作系统上运行。你将学会如何结合使用这些小而强大的命令行工具,快速地获取、清洗、探索和建模数据。 通过阅读本书,你会明白为什么命令行是一种灵活、可伸缩、易扩展的技术。即使你已经能够使用Python或R得心应手地处理数据,利用命令行也将大大改进你的数据科学工作流。 通过本书你将学会: 从网站、API、数据库和电子表格中获取数据 对纯文本、CSV、HTML/XML和JSON格式数据进行清洗 探索数据,计算描述性统计信息,进行可视化呈现 管理数据科学工作流 使用单行命令和已有的Python或R代码创
¥33.80定价:¥49.00 (6.9折) 电子书:¥29.40
季昕华、徐羽作序,连城/胡熠/武泽胜/肖磊/靳志辉联袂推荐 腾讯专家首次分享Spark*实践 基于真实数据,用案例分析全面解读大数据应用设计
¥36.70定价:¥49.00 (7.49折) 电子书:¥23.50
数学菜鸟也能搞懂数据分析! 从零学起:没有深奥的理论和晦涩的知识 实际体验:免费软件RStudio 提供模拟数据 应用R语言轻松学统计: 平均值/直方图/t检验/卡方检验/相关/回归分析/逻辑回归分析/文本挖掘 商家的抽奖促销有猫腻? 面包店的面包缺金少两? 调查问卷的结果该怎么分析? 曾经的热销商品为什么不好卖了? 网络上的匿名中伤者找得出来吗? 坏事的发生是否能预测? 让数据告诉你答案!
¥31.50定价:¥42.00 (7.5折) 电子书:¥20.00
Spark快速大数据分析 机器学习大数据算法参考书 Spark作者及核心成员执笔 精通大数据处理技术
Spark开发者出品! 《Spark快速大数据分析》是一本为Spark初学者准备的书,它没有过多深入实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于Spark的用法,它对Spark的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。 本书介绍了开源集群计算系统Apache Spark,它可以加速数据分析的实现和运行。利用Spark,你可以用Python、Java以及Scala的简易API来快速操控大规模数据集。 本书由Spark开发者编写,可以让数据科学家和工程师即刻上手。你能学到如何使用简短的代码实现复杂的并行作业,还能了解从简单的批处理作业到流处理以及机器学习等应用。
¥40.70定价:¥59.00 (6.9折) 电子书:¥23.99
大数据 互联网大规模数据挖掘与分布式处理(第2版) 大数据权威著作全新升级版,第1版畅销40000册
本书源自作者在斯坦福大学教授的“海量数据挖掘”(CS246: Mining Massive Datasets)课程,第1版上市以来受到读者广泛欢迎和认可。这个新版本在上一版基础上新增三章内容,分别涵盖社会网络图挖掘、降维和大规模机器学习,同时也更新了第1版的部分内容。 众所周知,移动互联网、社交媒体、电子商务和各种传感器的运用产生了超大数据集,挖掘这些数据可以提炼出有用的信息。本书以大数据环境下的数据挖掘和机器学习为重点,全面介绍了实践中行之有效的数据处理算法,是在校学生和相关从业人员的读物。主要内容包括: 分布式文件系统以及MapReduce工具; 相似性搜索; 数据流处理以及针对易丢失数据等特殊情况的专用处理算法; 搜索引擎技术,如谷歌的PageRank; 频繁项集挖掘; 大规模高维数据集的聚类算法; Web应用
¥62.40定价:¥79.00 (7.9折)
走进大数据 组织如何推进大数据战略 大数据专家为一线业务人员讲述*切实可行的分析与应用方法!
大数据 *火热的IT话题之一 大数据分析 *基础的核心法则和原理 大数据应用 *切实可行的项目构建方法 帮助需要引入大数据项目的所有企业解决核心课题,避免运行过程中出现过多失误,实现正确策划和执行
¥29.20定价:¥39.00 (7.49折)