本书是一个导论,介绍什么是数据挖掘,什么是数据库中知识发现。书中的材料从数据库角度提供,特别强调发现隐藏在大型数据集中有趣数据模式的数据挖掘基本概念和技术。所讨论的实现方法主要面向可规模化的、有效的数据挖掘工具开发。本章,你将学习数据挖掘如何成为数据库技术自然进化的一部分,为什么数据挖掘是重要的,以及如何定义数据挖掘。你将学习数据挖掘系统的一般结构,并考察挖掘的数据种类,可以发现的数据类型,以及什么样的模式提供有用的知识。除学习数据挖掘系统的分类之外,你将看到建立未来的数据挖掘工具所面临的挑战性问题
目录
第一章 引言
1.1 什么激发数据挖掘?为什么它是重要的?
1.2 什么是数据挖掘?
1.3 数据挖掘——在何种数据上进行?
1.4 数据挖掘功能——可以挖掘什么类型的模式?
1.5 所有模式都是有趣的吗?
1.6 数据挖掘系统的分类
1.7 数据挖掘的主要问题
1.8 总结
习题
第二章 数据仓库和数据挖掘的 OLAP 技术
2.1 什么是数据仓库?
2.2 多维数据模型
2.3 数据仓库的系统结构
2.4 数据仓库实现
2.5 数据方技术的进一步发展
2.6 由数据仓库到数据挖掘
2.7 总结
习题
第三章 数据预处理
3.1 为什么要预处理数据?
3.2 数据清理
3.3 数据集成和变换
3.4 数据归约
3.5 离散化和概念分层产生
3.6 总结
习题
第四章 数据挖掘原语、语言和系统结构
4.1 数据挖掘原语:什么定义数据挖掘任务?
4.2 一种数据挖掘查询语言
4.3 基于数据挖掘查询语言设计图形用户界面
4.4 数据挖掘系统的结构
4.5 总结
第五章 概念描述:特征与比较
5.1 什么是概念描述?
5.2 数据泛化和基于汇总的特征
5.3 解析特征: 属性相关性分析
5.4 挖掘类比较:区分不同的类
5.5 在大型数据库中挖掘描述统计度量
5.6 讨论
第六章 挖掘大型数据库中的关联规则
6.1 关联规则挖掘
6.2 由事务数据库挖掘单维布尔关联规则
6.3 由事务数据库挖掘多层关联规则
6.4 由数据库和数据仓库挖掘多维关联规则
6.5 由关联挖掘到相关分析
6.6 基于限制的关联挖掘