下载丨云和恩墨技术通讯:OCR无法正常读取导致节点宕机

墨墨导读:为了及时共享行业案例,通知共性问题,达成共享和提前预防,我们整理和编辑了《云和恩墨技术通讯》,通过对过去一段时间的知识回顾,故障归纳,以期提供有价值的信息供大家参考。同时,我们也希望能够将热点事件、新的产品特性及其他有价值的信息聚集起来,为您提供具有前瞻性的支持信息,保持对于当前最新的数据库新闻和事件的了解,其中包括重要数据库产品发布、警报、更新、新版本、补丁等。墨天轮文档:《云和恩墨技术通讯(11月刊)》:https://www.modb.pro/doc/6950(复制到浏览器中打开或者点击文末左下角“阅读原文”立即下载)

这里推荐一个常见的问题,希望对大家有借鉴作用。故障:OCR无法正常读取导致节点宕机-陆发圣“OCR存储了所有与集群,RAC数据库相关的配置信息。并且这种配置信息都是多个节点进行共享。所以OCR会存放在共享磁盘上。OCR包含了节点成员信息,数据库实例,节点,以及其他映射关系,资源配置信息等。本文主要介绍的是OCR磁盘异常,导致节点宕机。1. 问题概述数据库系统节点1集群资源突然故障,在通过重启集群资源也未能恢复(无法找到表决磁盘)。2. 过程分析2.1 故障根源通过与主机工程师的交流和日志分析,由于hba光纤口断掉,而且由于主机上只配了一块HBA卡,没有冗余,从而导致主机无法与存储磁盘正常通信。因此节点1无法读取OCR表决盘,导致节点1集群资源宕机,从而引发数据库意外宕机。Nov  16 10:04:33 gzfpdb1 kernel: rport-1:0-2: blocked FC remote port time out:  removing target and saving bindingNov 16 10:04:33 gzfpdb1 kernel: lpfc 0000:0e:00.0: 0:(0):0203 Devloss  timeout on WWPN 50:00:00:e0:d4:6f:2d:80 NPort x010500 Data: x0 x8 x03. 日志分析3.1 数据库日志在16日10点04分33秒数据库无法正常对磁盘组GROUP 1的DISK 0正常进行读操作:Mon  Nov 16 10:04:33  2020WARNING: Read Failed. group:1 disk:0 AU:4247  offset:0 size:1048576WARNING: Read Failed. group:1 disk:0 AU:40598 offset:0  size:1048576随后也出现大量IO报错:ORA-27061:  waiting for async I/Os failedLinux-x86_64 Error: 5: Input/output errorAdditional information: -1Additional information: 8192Errors in file  /u01/app/oracle/diag/rdbms/gzfpdb/gzfpdb1/trace/gzfpdb1_dbw6_22402.trc:ORA-15080: synchronous I/O operation to a disk failedORA-27061: waiting for async I/Os failedLinux-x86_64 Error: 5: Input/output errorAdditional information: -1Additional information: 8192Errors in file  /u01/app/oracle/diag/rdbms/gzfpdb/gzfpdb1/trace/gzfpdb1_dbw2_22394.trc:ORA-15080: synchronous I/O operation to a disk failedORA-27061: waiting for async I/Os failedLinux-x86_64 Error: 5: Input/output errorAdditional information: -1Additional information: 8192Errors in file  /u01/app/oracle/diag/rdbms/gzfpdb/gzfpdb1/trace/gzfpdb1_dbw0_22390.trc:ORA-15080: synchronous I/O operation to a disk failedORA-27061: waiting for async I/Os failedLinux-x86_64 Error: 5: Input/output errorAdditional information: -1Additional information: 8192于16日10点04分34秒基于自我保护机制,集群自行杀掉了DBWR进程,因此数据库宕机:Mon  Nov 16 10:04:34 2020ORA-1092 : opitsk aborting processInstance  terminated by DBW7, pid = 224043.2 系统日志同样是10点04分33秒,磁盘:sdc、sdd、sde存在大量I/O错误:

3.3 集群告警日志无法找到表决磁盘,导致集群无法正常启动:

3.4 故障处置确认了数据库已经异常宕机的前提下,于10点57分左右进行了主机重启,主机启动完毕之后11点00分集群随主机启动,之后数据库于11点00分37秒恢复正常:Mon  Nov 16 11:00:37 2020QMNC started with pid=51, OS id=7015Completed: ALTER DATABASE OPEN /* db agent *//* {1:41562:2} */4. 根本解决方案故障根本原因为:节点1表决磁盘无法正常读写导致节点1集群异常宕机;临时解决方法:重启1节点主机,集群、数据库恢复正常;建议:重要系统应配置双HBA卡、双网卡、双电源等冗余配置,避免这些组件成为单点故障来源。

(0)

相关推荐

  • 数据库容灾技术

    数据库容灾技术与数据库的容灾架构紧密相关,在设计数据库容灾技术时,除了要考虑数据库容灾架构还要对数据的备份.恢复.传输等具体操作的实现细节.一套完整的数据库容灾技术既要有采用数据备份保护和恢复数据的功 ...

  • 微服务架构下的高可用和高性能设计

    今天再谈下微服务架构下的高可用性设计. 对于高可用性实际应该包括了高可靠性,高性能和高扩展性.因此谈微服务架构的高可用性,首先需要梳理三者之间的关系. 高可用性三个维度和相互关系 对于业务系统的高可用 ...

  • 企业容灾架构选型解析(三):脑裂问题探讨

    [摘要]随着全球IT产业的飞速发展,企业的IT建设逐步成为主导业务发展的核心驱动力,基于企业IT架构容灾建设的各种行业标准以及监管标准也相应提高.提高企业整体容灾体系标准是摆在企业面前的挑战,但是面对 ...

  • 下载丨10月数据库技术通讯:HAIP在两个私网网卡上发生互换,导致ASM实例启动失败

    墨墨导读:为了及时共享行业案例,通知共性问题,达成共享和提前预防,我们整理和编辑了<云和恩墨技术通讯>,通过对过去一段时间的知识回顾,故障归纳,以期提供有价值的信息供大家参考.同时,我们也 ...

  • 云和恩墨:2020是国产数据库崛起的发轫之年

    这是DBA最好的时代 过去十年,是中国经济与互联网实现腾飞的黄金时代.而数据库作为最核心的基础软件之一,对IT信息产业发展更是起着至关重要的作用.近年来,随着云计算.大数据和人工智能等新兴技术的飞速发 ...

  • 深圳论坛丨引进日本先进理念技术,解决50万+中国老人互联网生活痛点

    中国日益严峻的老龄化形势下,通过提高养老服务信息化水平,为老年人提供更方便.更丰富.更安全.更放心的养老环境成了主流.老年智能产品市场在不断开拓中,老年智能终端作为信息化的核心工具,也面临着越来越高的 ...

  • 参与者说丨李恩正:遵循法典编纂规律 精心设计制度规范

    参与者说丨李恩正:遵循法典编纂规律 精心设计制度规范 全国人大3月3日 · 全国人大常委会官方账号 编辑:李倩文.王博勋 制图:李洪兴 责编:舒 颖

  • 下载丨2021菏泽二模【语文】试题及参考答案

    2021菏泽二模于4月28日开考,由于本次考试的试题有很大的参考价值,齐鲁家长圈团队特为大家收集整理本次考试的试题及参考答案,供广大考生下载练习.本文为菏泽二模语文试题及参考答案. 齐鲁家长圈 每天读 ...

  • 下载丨2021菏泽二模【生物、地理】试题及参考答案

    2021菏泽二模于4月28日开考,由于本次考试的试题有很大的参考价值,齐鲁家长圈团队特为大家收集整理本次考试的试题及参考答案,供广大考生下载练习.本文为菏泽二模生物.地理试题. 齐鲁家长圈 每天读一读 ...

  • 工程成就丨甲醇制烯烃技术

    本文选自中国工程院院刊<Engineering>2021年第1期 作者:叶茂,田鹏,刘中民 来源:DMTO: A Sustainable Methanol-to-Olefins Techn ...

  • 山水本色微展丨祁恩进——我本好奇

    编者按: 2020年,不平凡的一年,一场席卷全球的新冠病毒拖住了每个人的脚步.这段时间,对于艺术家而言可能是一段弥足珍贵的休闲与思考时光,他们重新思考新时代新局面随之而来的变化,并始终秉持对传统文化的 ...

  • 下载丨2021年九师联盟高三4月联考试题及答案

    导读 ,规划 2021年九师联盟高三4月联考于今明两日举行,由于本次考试试题及答案参考价值较高,自主选拔在线团队(ID:zizzsw)整理本次考试试题及答案,供广大考生下载练习. 语文试题 温馨提示