盘点数据挖掘包括哪些部分?

大数据的时代我们人人身处其中,那么对于大数据的挖掘就是十分有价值的了,数据挖掘包括以下三点:

数据预处理

之所以有这样一个步骤,是因为通常的数据挖掘需要涉及相对较大的数据量,这些数据可能来源不一导致格式不同,也许有的数据还存在一些缺失值或者无效值,如果不经处理直接将这些'脏’数据放到我们的模型中去跑,非常容易导致模型计算的失败或者可用性很差,所以数据预处理是我们所有数据挖掘过程中都不可或缺的一步。不客气地讲,预处理这一步通常占用了我们数据挖掘过程中的很大部分时间,但的确值得我们去做,关于它的详细内容我们在下面会讲。

数据挖掘

我们通常进行的特征的构造然后放到特定的模型中去计算,利用某种标准去评判不同模型或组合模型的表现,最后确定一个最合适的模型用于我们的后处理。

后处理

相当于我们已经发现了那个我们想要找到的模式,我们会去应用它或者用合适的方式将其表示出来。

(0)

相关推荐