大数据平台任务监控

写在前面

监控的概念

监控是收集和分析数据以确定业务应用程序的性能,运行状况和可用性及其依赖的资源的行为。 有效的监控策略可帮助用户了解应用程序组件的详细进程,还可以通过主动通知关键问题来避免错误发生,以便在问题发生之前解决问题。

宏观上看,监控的内容可以总结为下图:

Ref: https://www.digitalocean.com/community/tutorials/an-introduction-to-metrics-monitoring-and-alerting

大数据平台的开源监控工具

大数据平台的大部分通用的监控内容可以通过以下方式获取:

  1. Yarn、Cloudera Manager 等集成组件的监控页面。

  2. 开源组件的REST API

  • MapReduce REST APIs: MapReduce Application Master REST API’sMapReduce History Server REST API’s
  • YARN REST APIs:ResourceManager REST API’sNodeManager REST API’s
  • Spark REST APIs
    Spark REST APIs踩坑说明Spark REST APIs文档中有如下说明,For the history server, they would typically be accessible at http://<server-url>:18080/api/v1, and for a running application, at http://localhost:4040/api/v1.意为历史任务的REST API在Spark History Server上http://server-url:18080/api/v1 接入, 正在运行的任务的REST API在Spark Drive 节点上http://localhost:4040/api/v1 接入。 实际操作过程中有以下几点需要注意:
    a.历史任务监控端口: CDH会对默认的端口进行修改,其中就包括Spark History Server端口,由18080改为18088,需要注意。
    b. 正在运行的任务监控地址和端口:用Yarn提交Spark任务时,Spark Driver是由Yarn决定的,所以要拿到正在运行的任务的REST API需要先从Yarn的日志中找到Driver节点,而且4040端口也会被Yarn配置为随机端口,需要注意。
    通过Yarn的日志拿到了地址和端口组成链接host:port/api/v1/applications,但是通过浏览器查看该链接会发生跳转,跳转后就无法在跳转的链接中输入REST信息,反复修改比较麻烦,可以使用Postman等工具进行监控。

开源监控工具的局限

  1. 权限管理困难。
    不同业务部门对不同的业务内容进行监控、进行不同级别的监控是大型平台系统监控的需求,依靠开源的组件难以实现。虽然一些第三方提供了一些权限管理的产品,但其力度难以满足大多数大型企业的要求。使用开源产品的商业发行版,也是一种办法,不过始终是不如企业原生系统在这方面的支持。(参考企业数据分析工作的任务、工具及挑战
  2. 具体业务的状态监控,需要对开源监控工具的功能进行补充。
    下图是我列举的一些具体的监控内容。以其中交互式进度获取为例,Hive执行查询任务时,如果查询引擎是MapReduce且查询任务比较复杂时,一个查询任务会被划分成多个application(具体划分方法与hive任务划分stage有关,可以用Hive Explain命令查看),此时查看单个application的进度是没有意义的,因为用户希望获取的是整个查询任务的进度。因此需要在开源工具的基础上做二次开发。

开发监控组件例子

考虑到上述局限,个性化的监控组件是大数据平台常见的需求,开发监控组件是大数据平台软件开发的一个重要环节。不同的应用场景有不同的需求,需要对监控组件的开发思路也各有不同。这里提供些个获取REST API内容并消费的经典样例(Spring REST Client with RestTemplate: Consume RESTful Web Service Example for XML and JSONHow to read XML file in Java – (DOM Parser)),读者可根据需求对REST API上的内容进行组装或二次开发。

来源:https://www.icode9.com/content-4-795801.html

(0)

相关推荐

  • 爱奇艺机器学习平台建设实践

    文章作者:i技术会 内容来源:爱奇艺技术产品团队 在建设机器学习平台之前,爱奇艺已经拥有比较成熟的深度学习平台Javis,但是Javis面向的用户比较高阶.专业的算法工程师,需要通过提交代码到专用计算 ...

  • 一篇文章带你看懂Yarn的基本架构

    YARN的基本思想 YARN的基本思想是将资源管理和作业调度以及监控的功能拆分为单独的守护进程.这种架构思想是拥有一个全局的ResourceManager(RM)和每个应用程序的Application ...

  • 大数据平台常见开源工具集锦(强烈推荐收藏)

    引言 大数据平台是对海量结构化.非结构化.半机构化数据进行采集.存储.计算.统计.分析处理的一系列技术平台.大数据平台处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据仓库工具无法处理完 ...

  • 数据中台与传统大数据平台有什么区别?终于有人讲明白了

    大数据DT 提供大数据.AI等领域干货学习资源的「宝藏号」,跟50万技术人共同成长,一起玩转大数据.Python.数据分析.数据科学.人工智能!还会有各种好玩又奇葩的数据解读,边学习边吃瓜! 542篇 ...

  • 案例分享丨疫情大数据平台的设计

    南航疫情大数据平台采用敏捷开发模型.协同开发模式,在微服务架构的支持下,多项开发工作并行开展.通过正确的技术选型.合理的模块划分,最大程度发挥微服务优势. 2020年初新冠肺炎(COVID-19)疫情 ...

  • 智慧金融大数据平台总体架构方案

    大数据分析平台综述 大数据分析平台总体架构 大数据分析平台演进路线 大数据分析平台实施重点 数据治理管理平台 里面设计的详细的架构方案设计,甚至还有网络拓扑和服务器配置,大家收藏呀!

  • 孟庆国:组建大数据平台,这两个问题一定要找准!(可参考)

    主 讲 人 : 孟庆国,清华大学公共管理学院教授.博士生导师,现任清华大学国家治理研究院执行院长.中央党校(国家行政学院)兼职教授.主要研究领域包括政府治理.电子政务.数字政府.政务数据治理等. 除了 ...

  • 趋势洞察|产业大数据平台,让产业数字化大有可为

    继2017年.2019.2020年被写入政府工作报告之后,"数字经济"在2021年的政府报告中再次被写入. 政府工作报告中提到,十四五时期,将加快数字化发展,打造数字经济新优势,协 ...

  • 文旅巨华侨城无霸上线“旅游大数据平台”,中国联通匠心打造!资源100%全整合!

    2019年10月30日,由中国联通为华侨城集团规划建设的"华侨城数字云图--旅游大数据平台"上线启动. 华侨城旅游大数据平台上线仪式 华侨城集团多年位居全球主题公园集团四强,累计接 ...

  • 企业大数据平台仓库架构建设思路

    本文根据阿里云高级技术专家李金波在首届阿里巴巴在线峰会的<企业大数据平台仓库架构建设思路>的分享整理而成.随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化.半结构化.非结构化数据 ...

  • 国产大数据平台何以引领国产基础软件崛起

    导读 随着大数据蕴涵价值的逐步释放,大数据正以一种革命风暴的姿态闯入人们视野,其技术和市场的快速发展,使其成为IT信息产业中最具潜力的蓝海. 来源:融资中国  作者:张莹 融中传媒:thecapita ...