数据挖掘与分析的六种经典方法论

数据挖掘与分析的六种经典方法论

运营增长2021-03-07 14:33:18

最近梳理了一下数据挖掘与分析的常用方法论,这里简要介绍6种模型。

1、CRISP-DM 模型

CRISP-DM是CrossIndustry Standard Process for Data Mining(跨行业数据挖掘标准流程)的字母缩写。CRISP-DM是由一家欧洲财团(时称SIG组织)在20世纪90年代中后期提出来的,是一套用于开放的数据挖掘项目的标准化方法,也是业内公认的数据挖掘与分析的通用方法论。

2SEMMA模型

SEMMA是抽样(Sample)、探索(Explore)、修订(Modify)、建模(Model)和评估(Assess)的英文首字母缩写,它是由SAS研究院开发的一款非常著名的数据挖掘与分析方法。SEMMA的基本思想是从样本数据开始,通过统计分析与可视化技术,发现并转换最有价值的预测变量,根据变量进行构建模型,并检验模型的可用性和准确性。

3、DMAIC方法

六西格玛(Six Sigma,6 Sigma)是一种项以数据为基础,追求“零缺陷”的质量管理方法。六西格玛在商业中应用是DMAIC,包括五个步骤:定义(Define)、度量(Measure)、分析(Analyze)、改进(Improve)和控制(Control)。DMAIC方法在商业领域和环境中已得到了成功应用,它在数据挖掘项目中也能寻得一席之地。

4、AOSP-SM模型

AOSP-SM是ApplicationOriented StandardProcess for Smart Mining 的首字母缩写,翻译成中文是应用为导向的敏捷挖掘标准流程,它是思迈特公司(SMARTBI)基于跨行业数据挖掘过程标准(CRISP-DM)和SAS的数据挖掘方法(SEMMA)两种方法论总结而来的一种面向应用的用于指导数据挖掘工作的方法。

5、5A模型

SPSS公司(后被IBM收购)曾提出过5A模型,即将数据挖掘过程分为五个A:Assess、Access、Analyze、Act、Automate,分别对应五个阶段:评估需求、存取数据、完备分析、模型演示、结果展现。

6、数据挖掘与分析的“七步法”

“七步法”分为七个步骤,分别是:业务理解、数据获取、数据探索、模型构建、模型评估、策略输出、应用部署。“七步法”更侧重从乙方的视角来完成用数据挖掘及其应用的闭环。

作者: jesse huang76 分享数据产品设计的心得,记录数据跨界运营的经验和感悟。连接数据、创新价值!

收藏
举报
1 条评论
(0)

相关推荐

  • 人员数据分析的CRISP-DM模型

    如何证明人力资源实践的有效性是重要且有价值,传统上,研究人员通过使用调查,访谈或观察收集数据来产生此类证据.借助这些数据,他们获得了对劳动力的洞察力,并制定了切实可行的干预措施以改善结果. 技术进步导 ...

  • 清理数据的重要性

    介绍 在精神上和卫生上进行清洁的概念在任何健康的生活方式中都是非常有价值的. 数据集有些是相同的.如果没有在数据科学生命周期中进行清理或作为日常活动进行清理,那么出于任何目的的代码将根本无法工作. 在 ...

  • Excel应用大全 | 什么是CRISP-DM 模型

    一本书教会你分分钟搞定数据分析! 什么是CRISP-DM 模型呢?你听说过吗?来让小编给你解答吧! CRISP-DM模型的起源 CRISP-DM(跨行业的数据挖掘标准流程,其全称为 Cross-Ind ...

  • 上升趋势的六种经典形态:一.平台突破

    上升趋势的六种经典形态: 一.平台突破--继续上涨 二.五弯十(5日线弯十日线)---继续看涨 三.回调---不改变上升趋势 四.回档 五.短暂整理 六.稍长整理

  • 揭秘金融市场分析流派:技术分析中的哲学方法论

    揭秘金融市场分析流派:技术分析中的哲学方法论

  • 三十六种经典情节模式

    十九世纪戏剧家乔治.普罗蒂提出了一个叫做"三十六种戏剧模式"的理论,他把戏剧和小说中的情节归纳总结为三十六种经典模式,到现在为止,这一理论仍然有很强的指导意义. 阅读示例: 种类 ...

  • 性能测试、分析、优化的方法论 | 运维进阶

    [导读]本文主要介绍相关性能测试.分析.优化的方法论.希望通过方法论的学习,可以帮助工程师在复杂纷乱的环境下明确性能目标,制定合理可行的性能测试计划,有针对性的进行性能分析,发现系统真正的性能瓶颈,并 ...

  • 中国经典方法论:道、法、术、器、势

    道.法.术.器.势. 道是根本性的规律: 法是一般性的原则: 术是具体的实践方法: 器是工具: 势是当前所处的客观条件和形势. 韩非子说,抱法处势而用术. 道是天道,是自然的:法是人定的.比喻饮食男女 ...

  • 中国古代经典方法论:道、法、术、器、势

    道.法.术.器.势. 道是根本性的规律: 法是一般性的原则: 术是具体的实践方法: 器是工具: 势是当前的客观条件和形势. 韩非子说,抱法处势而用术. 道是天道,是自然的:法是人定的.比喻饮食男女这两 ...

  • 数据挖掘技术分析抑郁症的现代针刺治疗用穴特点和腧穴配伍规律

    数据挖掘技术分析抑郁症的现代针刺治疗用穴特点和腧穴配伍规律.方法检索中国期刊全文数据库(CNKI).中文科技期刊数据库(维普网).中国学术期刊数据库(万方数据).中国生物医学文献数据库(CBM).Pu ...

  • 数据挖掘技术,分析现代文献研究中运用中医药治疗早泄疾病的用药规律。

    数据挖掘技术,分析现代文献研究中运用中医药治疗早泄疾病的用药规律.方法:收集中国知网.万方.维普.中国生物医学文献数据库.Pubmed 5个数据库中选用中医方剂治疗早泄的文献,借用中医传承辅助软件进行 ...

  • 数据挖掘技术分析毛德西教授治疗胸痹心痛用药规律。

    于数据挖掘技术分析毛德西教授治疗胸痹心痛用药规律.方法收集整理2018年2月-2020年1月毛德西教授在河南省中医院名医堂治疗胸痹心痛的门诊医案,运用中医传承辅助系统(V2.5)通过频数分析.关联规则 ...