数据挖掘任务类型
引言
在大数据时代我们总有许许多的的数据要去挖掘分析。
问题描述
那么数据挖掘任务有哪些类型呢?我们该如何去判断进而去处理它呢?
方法
我们要认识到有以下四种类型:
1.预测建模(predictive modeling)
涉及以说明变量函数的方式为目标变量建立模型。有两类预测建模任务:分类(classification),用于预测离散的目标变量;回归(regression),用于预测连续目标变量。
例如:对一个地区的近几年各月份降雨量做统计,对其建模分析预测未来几年的降雨量,从而进行一些事情的开展。
2.关联分析(association analysis)
用来发现描述数据中强关联特征的模式。所发现的模式通常蕴含规则或特征子集的形式表示。(由于搜索空间是指数规模的,关联分析的目标是以有效的方式提取最有趣的模式。)
例如:对顾客购物篮所装物品的分析。对顾客的购物习惯进行分析,可以针对进行商品营销策略。最经典的就是啤酒与尿布的故事。
3.异常检测(anomaly detection)
是识别其特征显著不懂与其他数据的观测值。这样的观测值称为异常点(anomaly)或离群点(outlier)。异常检测算法的目标时发现真正的异常点,
而避免错误地将正常的对象标注为异常点。
例如:对于地震波的检测就属于异常点检测。
4.聚类分析(cluster analysis)
旨在发现紧密相关的观测值组群,使得与属于不同簇的观测值相比,属于同一簇的观测值相互之间尽可能类似。
例如:对于多个单位的不同属性分析时就可以对相同的属性进行。
最简单的就是对去年我国不同城市的消费能力的分析。
结语
在这个数据复杂的时代我们可以掌握更多的技能,正所谓技多不压身嘛!
实习编辑:李欣容
稿件来源:深度学习与文旅应用实验室(DLETA)
赞 (0)