数据挖掘
数据挖掘是指从大量的数据集提取信息。换句话说,我们可以说,数据挖掘是从数据挖掘领域的知识。此信息可用于任何以下应用程序:
-
市场分析
-
欺诈检测
-
客户保留
-
生产控制
-
科学探索
数据挖掘引擎
数据挖掘引擎是非常必要的数据挖掘系统。它由一组功能模块。这些模块在以下任务:
-
描述
-
关联和相关性分析
-
分类
-
预测
-
聚类分析
-
异常值分析
-
进化分析
知识库
这是领域知识。这方面的知识,用于指导搜索或计算得到的图案的趣味性。
知识发现
有些人把数据挖掘一样的知识发现,而有些人认为在知识发现过程中的数据挖掘必不可少的步骤。以下是参与知识发现过程的步骤列表:
-
数据清理
-
数据集成
-
数据选择
-
数据转换
-
数据挖掘
-
评估模式
-
知识呈列
用户界面
用户界面是数据挖掘系统的模块,可以帮助用户和数据挖掘系统之间的通信。用户接口允许以下功能:
-
通过指定一个数据挖掘查询任务交互与系统。
-
提供信息,以帮助集中搜索。
-
挖掘基于中间数据挖掘结果。
-
浏览数据库和数据仓库模式或数据结构。
-
评估开采模式。
-
可视化的模式以不同的形式。
数据集成
数据集成是合并来自多个异构数据源的数据转换成一个连贯的数据存储中的数据预处理技术。数据集成可能涉及的数据不一致,因此需要数据清理。
数据清理
数据清理是应用于以去除噪声的数据和校正数据中的不一致之处的一种技术。数据清理涉及转换改正错误的数据。数据清洗,同时准备数据的数据仓库进行数据预处理步骤。
数据选择
数据选择是在相关的分析任务数据从数据库中检索的过程。有时,数据转换和合并前的数据选择的过程中进行。
集群
集群是指一组相似的对象的类型的。聚类分析是指形成组非常相似彼此但与在其他簇中的对象高度不同的对象。
数据转换
在这个步骤中的数据是由执行汇总或聚集操作转化或合并成适合挖掘的形式。