案例:控制文件序列号满故障处理和分析

墨墨导读:本文来自墨天轮用户罗海鸥的投稿,墨天轮主页:https://www.modb.pro/u/366206,分享 Oracle 11.2.0.4 版本的单机数据库无法启动处理的整个过程。

首先启动数据库
sqlplus / as sysdbastartup
数据库mount时出现报错,当时报错内容记不清了,应该是无法锁定控制文件。
随即我打开了告警日志,在告警日志中我发现了一些蛛丝马迹:
告警日志告诉我们控制文件序列号满了

这时猜测,问题可能是控制文件。然后便登录rman准备恢复控制文件,但是rman没有任何备份。
没有备份那就重建控制文件吧。
在nomount阶段,我尝试备份控制文件到trace

可惜nomount阶段无法备份控制文件,那就只能手工编辑然后重建控制文件了。
慎重起见,将现在的控制文件改名了(此步骤省略)
如下是根据日志文件,数据文件等信息编辑的。
CREATE CONTROLFILE REUSE DATABASE “ORCL” RESETLOGS ARCHIVELOGMAXLOGFILES 16MAXLOGMEMBERS 3MAXDATAFILES 100MAXINSTANCES 8MAXLOGHISTORY 292LOGFILEGROUP 1 ‘/data/orcl/redo01.log’ SIZE 50M BLOCKSIZE 512,GROUP 2 ‘/data/orcl/redo02.log’ SIZE 50M BLOCKSIZE 512,GROUP 3 ‘/data/orcl/redo03.log’ SIZE 50M BLOCKSIZE 512– STANDBY LOGFILEDATAFILE‘/data/orcl/system01.dbf’,‘/data/orcl/sysaux01.dbf’,‘/data/orcl/undotbs01.dbf’,‘/data/orcl/users01.dbf’,‘/data/orcl/assp.dbf’,‘/data/orcl/gap.dbf’,‘/data/orcl/estamp.dbf’CHARACTER SET ZHS16GBK;
控制文件创建好了,执行如下步骤打开了数据库。
RECOVER DATABASE;ALTER DATABASE OPEN RESETLOGS;ALTER TABLESPACE TEMP ADD TEMPFILE ‘/data/orcl/temp01.dbf’ SIZE 52428800 REUSE AUTOEXTEND ON NEXT 8192 MAXSIZE 32767M;
因为重建了控制文件,所以现在的序列号很小。

至此,问题已解决,数据库继续运行。

但为什么控制文件序列号会异常增长呢?
带着这个问题继续翻阅告警日志,发现控制文件序列号满是一个多月前开始报错的,这个报错前是快速恢复区满的报错,这个报错也持续了很长时间大概一个月。
快速恢复区满和控制文件序列号有关系吗?我做了一个实验。
查询控制文件当前序列号:序列号为12233
select CONTROLFILE_CREATED, CONTROLFILE_SEQUENCE#,CONTROLFILE_CHANGE#, CURRENT_SCN from v$database
修改快速恢复区大小,目的是让db_recovery_file_dest_size   is 100.00% used。
alter system set db_recovery_file_dest_size=200M; (对于这个数据已经足够小了)
告警日志立马打印如下信息
ORA-19815: WARNING: db_recovery_file_dest_size of 209715200 bytes is 100.00% used, and has 0 remaining bytes available.
手工切换一下日志,往快速恢复区存归档,触发一下;
alter system switch logfile;
继续查询控制文件序列号,发现序列号以大约200/s的速度异常增长,这样持续下去控制文件序列号很快会被用完。
select CONTROLFILE_CREATED, CONTROLFILE_SEQUENCE#,CONTROLFILE_CHANGE#, CURRENT_SCN from v$database
修改快速恢复区大小后,控制文件序列号不再异常增长。


总结

快速恢复区满会导致控制文件序列号异常增长,快速恢复区满应当及时处理。

作者

罗海鸥:中国DBA联盟(ACDU)成员,北京银信DBA工程师,Oracle 11g OCM,长期研究Oracle技术,擅长备份恢复和性能调优。

(0)

相关推荐

  • 数据库备份与恢复测试-李济宏

    [1] 控制文件损坏(rman和常规恢复)     [1.1] 有老的备份数据备份和控制文件trace           [测试1] --使用trace恢复 shutdown abort       ...

  • 案例 | 投标文件里的“冒名顶替”该如何分析与处理?

    --一起用"企业所得税汇算清缴纳税调整报告"替代"财务审计报告"投标案的启示 日常生活中,我们明确知晓,考试严禁名不符实者参与.其实,在政府采购中,投标文件也不 ...

  • 附案例:高炉炉缸堆积的四大原因分析

    高炉解剖研究表明,炉内软熔带以下主要由固体焦炭和滴落的渣铁组成,因主要处于炉缸中心区,通常称为炉芯带或滴落带.图1是炉缸工作的示意图.风口前端是回旋区,焦炭及喷吹燃料在这里燃烧,大量焦炭从回旋区上方进 ...

  • 案例分享:自锁螺母振动失效原因分析及预防

    版权信息 作者:徐家强,付建建等 单位:河南航天精工制造有限公司研究所.河南省紧固连接技术重点实验室 来源:<金属加工(热加工)>杂志 在航空发动机的设计.制造.使用及维护过程中,螺纹联接 ...

  • 案例分享:45钢盖板裂纹分析

    版权信息 作者:孟凡涛,刘爱龙,张海洋,王晓庆 单位:山东常林机械集团股份有限公司节能液压元件及系统国家重点实验室 来源:<金属加工(热加工)>杂志 我公司新进一批45钢制盖板(见图1), ...

  • 实战案例:如何使用 Hive 进行 OLAP 分析?

    写在前面 大家好,我是小挖哥. 在线分析处理(OLAP,Online Analytical Processing)是通过带层次的维度和跨维度进行多维分析的,简单理解为一种多维数据分析的方式,通过OLA ...

  • 科创板上市否决案例汇总,这些被否原因分析必须看

    导读: 科创板虽有政策红利,但也并非是想上就能上,自2019年6月5日,到2020年11月27日,上交所科创板上市委共否决5家,我们先来看看被否原因: 1.科创属性不足 上海泰坦科技股份有限公司 长沙 ...

  • LVDT在线故障处理与分析

    摘要:通过我厂发生的多次LVDT故障分析得出,安装不合理.就地接线松动.环境温度高.LVDT内部损坏等问题.阀门传动固定架无松动:改善安装环境:接线端子确保固定接线可靠:停机时,进行外观和端子接线检查 ...

  • 【案例研究】表见代理的构成要件分析——河北某公司诉北京某租赁站建筑设备租赁合同案

    编者案:外观主义是为保护交易安全设置的例外规定,一般适用于因合理信赖权利外观或意思表示外观的交易行为.本案讨论表见代理的构成要件适用边界.现予以刊发,供研究交流.   一.基本信息 终审裁判文书:(2 ...

  • 事故案例 | 一起分子筛受冲击事故的分析及处理

    某钢铁集团公司氧气厂的6000m3/h空分设 备由杭氧生产,为微机控制分子筛吸附流程.此设 备自1997年7月投产以来,运转稳定,产品氧. 氮.氩的产量.质量等指标均达到或超过设计指 标.但在同年的1 ...