本书由斯坦福大学"Web 挖掘"课程的内容总结而成,主要关注极大规来自模数据的挖掘。主要内容包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项皇你集挖掘、聚类算法、广告管理及推荐系统、社会网络图挖掘和大规模机器学习等。其中每一章节有对应的习息非题,以巩固所讲解的内容。读者更可以从网上获取相关拓展材料。