数据清洗是大数据技术不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,把 脏 的数据变为 干净 的数据。本书详细讲解了ETL技术方法和常用工具、常用的数据清洗工具、数据抽取、数据转换与加载、对Web数据的采集、对RDBMS数据的清洗操作。目前市面上此类书还很少,对数据清洗从业人员是一本不可多得的技术参考书,也可以作为应用型院校的课程教材。
¥39.70定价:¥58.00 (6.85折)
本书讲述了数据挖掘概念,数据挖掘的常用算法,包括分类方法、聚类方法和关联规则方法。本书注重实战,给出了综合实战方法和在不同行业的应用案例。
¥32.90定价:¥48.00 (6.86折)
《实战Hadoop——开启通向云计算的捷径》(作者刘鹏)一书深入浅出、生动而详细地讲述Hadoop的基本原理,并配以实际应用案例,相信本书会对推动Hadoop在国内的应用和研究起到极大的作用。《实战Hadoop——开启通向云计算的捷径》包括:HDFS、MapReduce、HBase、Hive、Pig、Cassandra、Chukwa和ZooKeeper等,并给出了3个完整的Hadoop云计算综合应用实例,*后介绍了保障Hadoop平台可靠性的方法。
¥40.70定价:¥59.00 (6.9折)
计算广告:互联网商业变现的市场与技术 新版 计算广告(第2版)
用计算的力量改变世界是每一个程序员的梦想,而本书的主题正是用计算将数据和流量变成财富。这样的后向变现使得许多对用户有价值但直接利润微薄的信息产品,在互联网时代找到了爆发式成长的机会。从这个角度来看,我们希望本书能够成为一本启示录,帮助每一个互联网人真正理解后向变现对于互联网生产力的巨大解放,真正理解数据资产的巨大价值。 对于已经开启商业化进程的企业,洞悉广告市场复杂的交易结构和产品特点,并选择合理高效的产品方案和技术架构,是商业化必须面对的一步。从这个意义上说,我们还希望本书成为一本操作指南,辅助商业化团队更顺利地认知和践行技术驱动的营销与变现。 由于需要综合用到计算机科学、经济学、心理学等多学科的知识,并需要相当的工业实践基础,因此计算广告的人才相当稀缺。从这个目的出发,本
¥47.60定价:¥69.00 (6.9折) 电子书:¥14.49
Python语言 详细的Python语言基础知识,大量的项目实战案例以及与之匹配的上机实验和课堂练习。“ 任务驱动,实战为王”,让你快速掌握Python编程。
本书以 任务驱动,实战为王 为出发点,详细介绍了Python语言的基础知识,同时,书中详细剖析了3个典型的切近生活的实战案例,以培养读者解决问题的能力。项目实战案例包括Python爬虫项目实战、Python数据可视化项目实战和Python数据分析项目实战。另外,本书以 理论和实践两手抓,两手都要硬 为根本,在每章的理论学习之后,都有与之匹配的上机实验和课堂练习。将理论和实践融为一体,让读者真正地将理论和实战合二为一,做到学以致用。
¥40.90定价:¥59.80 (6.84折)
虚拟化与云计算(解释云计算的真的技术细节深度解析IBM云计算解决方案)
¥33.10定价:¥48.00 (6.9折)