数据预处理:

聚集、抽样、维度归约、属性选择、属性创建、离散化和二元化、变量变换。

分类和回归:分类和回归是数据挖掘领域的重要技术。分类就是在已有的数据的基础上学习出一个分类函数或构造出一个分类模型,这是通常所说的分类器。分类预测出目标是离散值,回归预测输出连续值。

分类器模型:决策树分类、贝叶斯分类、K-最近邻分类、神经网络分类。

聚类分析:划分的方法、层次的方法、基于密度的方法、基于网格的方法、基于模型的方法。

关联分析:Apriori算法和FP-Growth算法