数据库文件损坏与坏块处理作者徐聪
目录
控制文件损坏处理. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
一对于在非归档模式下的数据库. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
二对于在归档模式下的数据库. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
Redo文件损坏处理. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
一非curre ntredo损坏. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
二 current redo损坏. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
Undo文件损坏处理. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
方法一使用syst em segment. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
方法二跳过损坏的segment. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
DATAF IL E坏块处理. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
一什么是数据库的坏块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
二坏块对数据库产生的影响. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
三坏块产生的原因. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
四坏块的处理方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
五坏块的预先发现的方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .错误未定义书签。
在数据库日常使用中我们经常会遇到各种各样的坏块。在不同文件中或不同对象中的损坏或坏块有着不同的处理方式。
控制文件损坏处理
控制文件遇到坏块时基本现象就是控制文件的损坏数据库无法启动到MOUN T当然一般数据库都有多个控制文件组成。
如果遇到其中的一个或者几个控制文件损坏不是全部控制文件损坏 那么我们可以通过修改pf ile中的c ontrol file初始化参数去除损坏的控制文件或者复制未损坏的控制文件来覆盖损坏的控制文件来达到修复控制文件的目的。
如果遇到所有的控制文件损坏没有做任何备份的情况下那么就要我们手工来创建控制文件。
手工创建控制文件脚本列子如下需要数据库在nomoun t下
CREATE CONTROLFILE REUSE DATABA SE "orcl" RESETLOGS NOARCH IVELOG
MAXLOGFILES 16
MAXLOGMEMBERS 3
MAXDATAFILES 100
MAXINSTANCES 8
MAXLOGHISTORY 292
LOGFILE
GROUP 1 '/oradata/orcl/redo01 .log' SIZE 256M,
GROUP 2 '/oradata/orcl/redo02 .log' SIZE 256M,
GROUP 3 '/oradata/orcl/redo03.log' SIZE 256M
DATAFI LE
'/oradata/orcl/SUPHISV3.dbf' ,
'/oradata/orcl/SUPHISV301.dbf' ,
'/oradata/orcl/SUPHISV302.dbf' ,
'/oradata/orcl/SUPHISV303.dbf' ,
'/oradata/orcl/SUPHISV304.dbf' ,
'/oradata/orcl/SUPHISV305.dbf' ,
'/oradata/orcl/SUPHISV3CJ.dbf' ,
'/oradata/orcl/SUPHISV3CJ01 .dbf' ,
'/oradata/orcl/SUPHISV3CJ02 .dbf' ,
'/oradata/orcl/SUPHISV3CJ03.dbf' ,
'/oradata/orcl/SUPNCI S.dbf' ,
'/oradata/orcl/SUPNCI S2011.dbf' ,
'/oradata/orcl/supnci s01.dbf' ,
'/oradata/orcl/supnci s02.dbf' ,
'/oradata/orcl/supnci s03.dbf' ,
'/oradata/orcl/supncis04.dbf' ,
'/oradata/orcl/supnci s05.dbf' ,
'/oradata/orcl/supnci s06.dbf' ,
'/oradata/orcl/supnci s07.dbf' ,
'/oradata/orcl/supnci s08.dbf' ,
'/oradata/orcl/sysaux01.dbf' ,
'/oradata/orcl/system01.dbf' ,
'/oradata/orcl/undotbs01.dbf' ,
'/oradata/orcl/users01.dbf'
CHARACTER SET ZHS 16GBK;
注意上面脚本中标红的位置需要重点关注来进行修改。orcl为数据库的SID
NORESE TLOGS/RESETL OGS为是否要重置red olog文件
NOARCH IVELOG/ARCHIV ELOG为数据库是否在归档模式
CHARAC TER SET ZHS16G BK为数据库的字符集
关于是否要重置redo需要根据具体情况进行判断
一对于在非归档模式下的数据库
1) 当redo log文件为未损坏时使用nore setlog snoarch ivelog
此时 当完成控制文件的创建后直接使用alter databa se mount;alter databa se open;
可以直接打开数据库。
2) 当redo log文件也同样损坏使用rese tlogs noarch ivelogalter databa se mount;alter system set "_allow_resetlogs_corruption"=truescope=spfile; --这个参数是关键可以允许Oracle重置REDO日志recover database until cancel ; --使用CANCEL退出运行后才可以使用resetlogs去open数据库alter database open resetlogs;
二对于在归档模式下的数据库
1)所有的onl ine logs好的情况下使用nore setlog sarchve logalter database mount;alter system switch log all;alter databa se open;
2) 如果onl i nelogs损坏使用rese tlogs archiv elog
对于至少有一个有效归档存在的环境RAC必须每个节点都有至少一个归档recove r databa se using backup contro lfile until cancle ; --根据提示输入所需的归档文件的全路径alter databa se open resetl ogs;
对于没有归档存在的环境下alter databa se mount;alter system set "_allow_resetlogs_corruption"=truescope=spfile; --这个参数是关键可以允许Oracle重置REDO日志recover database until cancel ; --使用CANCEL退出运行后才可以使用resetlogs去open数据库alter database open resetlogs;
在上述各个情况下做完打开数据操作后不要忘记添加te mp表空间和做一次数据库全备。
当然可能还会遇到一些其他的报错信息那么久需要对具体问题具体分析了。
Redo文件损坏处理
使用命令查看损坏的red olog是不是当前的red olog使用如下命令select group#,sequence#,archived,status from v$log;
一非curre ntredo损坏
可进行删除和重新添加的操作注意至少有2组redo log文件 如:
ALTER DATABASE DROP LOGFIL E GROUP 3;
Alter databa se add logfil e thread 1 group 3 ( ‘/oradat a/orcl/redo03
.log’ ) size 256M;
二 curren tredo损坏
1 如果有归档和备份可以用不完全恢复startu p mount;recove r databa se until cancel ; --先选择aut o尽量恢复可以利用的归档日志然后重新执行recove r databa se until cancel ; --这次输入cancel完成不完全恢复,用reset logs打开数据alter databa se open resetl ogs --打开数据库
2强制恢复这种方法可能会导致数据不一致startu p mount;alter system set "_allow_reset logs_corrupt ion"=true scope=spfile ;recove r databa se until cancel ; --使用命令cancelalter databa se open resetl ogs;
一般强制恢复恢复后会有u ndo segmen t的问题。
一般操作为重建undo表空间该步骤可在u ndo损坏中看到。
Undo文件损坏处理
Oracle的undo有两种管理方式通过参数un do_man agement来设置auto和manual。
1 当undo_manage ment被设置成MENU AL时使用系统回滚段,即将undo records记录到SYS TEM表空间下的S YSTEM段。
SQL> select segmen t_name,tables pace_n ame,bytes,next_e xtent fromdba_se gments where segmen t_type='ROLLBA CK' ;
SEGMEN T_NA TABLES PACE_NAME BYTES NEXT_E XTENT
SYSTEM SYSTEM 393216 104857 6
通过上面的这条语句我们查到了这个用于rol lback的syste msegmen t存在与sys tem表空间。 默认情况下只有一个se gment并且它还比较小所以如果使用system段来存储undo record s。肯定会影响数据库的性能。所以Oracle是建议使用U ndotables pace来管理und orecord s。
2 当undo_manage ment设置成AUTO时使用UNDO tables pace来管理回滚段。这个时候我们将有多个undosegmen t并且这些se gment是存放在UN DO表空间里的。 这样对DB的性能就会提高。
SQL> select segmen t_name,tables pace_n ame,bytes,next_e xtent fromdba_se gments where segmen t_type='TYPE2 UNDO' ;
SEGMEN T_NAME TABLES PACE_N AME BYTES NEXT_E XTENT
_SYSSM U1$ UNDOTB S1 117964 8 65536_SYSSM U2$ UNDOTB S1 117964 8 65536
_SYSSM U3$ UNDOTB S1 222822 4 65536
_SYSSM U4$ UNDOTB S1 117964 8 65536_SYSSM U5$ UNDOTB S1 262144 65536
_SYSSM U6$ UNDOTB S1 117964 8 65536_SYSSM U7$ UNDOTB S1 117964 8 65536
_SYSSM U8$ UNDOTB S1 117964 8 65536
_SYSSM U9$ UNDOTB S1 117964 8 65536
_SYSSM U10$ UNDOTB S1 117964 8 65536
通过以上SQ L的查询结果我们可以看出有10个un do segmen t来存放un do records。
以上我们是通过dba_s egment表查看的结果。也可以通过v$rol lst at和v$rol lname两个视图来查看信息。 这2个视图会显示所有ro llback段的信息。 包括syst em段和undo段。
SQL> col name format a15
SQL> select s.usn,n.name,s.extent s,s.hwmsiz e,s.status fromv$rollstat s, v$rollname n where s.usn=n.usn;
USN NAME EXTENT S HWMSIZE STATUS
---------- --------------- ---------- ---------- ---------------
0 SYSTEM 6 385024 ONLINE
1 _SYSSM U1$ 3 765952 0 ONLINE
2 _SYSSM U2$ 3 969113 6 ONLINE
3 _SYSSM U3$ 4 746291 2 ONLINE
4 _SYSSM U4$ 3 766689 28 ONLINE
5 _SYSSM U5$ 4 851148 8 ONLINE
6 _SYSSM U6$ 3 746291 2 ONLINE
7 _SYSSM U7$ 3 334807 04 ONLINE
8 _SYSSM U8$ 3 857702 4 ONLINE
9 _SYSSM U9$ 3 746291 2 ONLINE
10 _SYSSM U10$ 3 137543 68 ONLINE
11 rows select ed.
3 UNDO损坏的情况
出现这种情况大多数是因为异常宕机在启动的时候报的错误。 DB不能启动。
比如 ORA-00600: intern al error code,argume nts: [4194],
对于Undo损坏的情况能用备份恢复最好如果不能就只能通过一些特殊的方法来恢复。
方法一使用syst emsegmen t
步骤如下
1 用spfi l e创建pfi l e然后修改参数
#*.undo_t ablesp ace='UNDOTB S1'
#*.undo_m anagem ent='AUTO'
#*.undo_t ablesp ace
#*.undo_r etenti on
undo_m anagem ent='MANUAL 'rollba ck_segments='SYSTEM'
2用修改之后的pfile重启DB
SQL> STARTU P MOUNT pfile=' /oracle /produc t/10.2.0/dbs/initorcl.ora' ;
3删除原来的表空间创建新的UNDO表空间
SQL> drop tables pace undotb s;
SQL> create undo tables pace undotb s1 datafi le '/u01/oradat a/undotbs1.dbf' size 10M;
4关闭数据库修改pfi l e参数然后用新的p file创建spfi le在正常启动数据库。
*.undo_t ablesp ace='UNDOTB S1'
*.undo_m anagem ent='AUTO'
#undo_m anagem ent='MANUAL '
#rollba ck_segments='SYSTEM '
方法二跳过损坏的s egment
在方法一里面使用了systemsegmen t。 undosegmen t一般有多个我们可以通过alert log来查看正在使用的是哪些s egment这些段有可能损坏了。那么只需要把这些损坏的s egment跳过先正常启动D B在创建新的U NDO表空间在切换一下。
1 修改pfi l e添加参数
*._corru pted_r ollbac k_segments='_SYSSM U11$' , '_SYSSM U12$' , '_SYSSM
U13$'
这些字段的值我们通过al ert log查看。 也可以通过如下命令查看
#string s system01.dbf | grep _SYSSM U | cut -d $ -f 1 | sort -u
justhost怎么样?justhost是一家俄罗斯主机商,2006年成立,提供各种主机服务,vps基于kvm,有HDD和SSD硬盘两种,特色是200Mbps不限流量(之前是100Mbps,现在升级为200Mbps)。下面是HDD硬盘的KVM VPS,性价比最高,此外还有SSD硬盘的KVM VPS,价格略高。支持Paypal付款。国内建议选择新西伯利亚或者莫斯科DataLine。支持Paypal付...
Friendhosting发布了今年黑色星期五促销活动,针对全场VDS主机提供45折优惠码,虚拟主机4折,老用户续费可获9折加送1个月使用时长,优惠后VDS最低仅€14.53/年起,商家支持PayPal、信用卡、支付宝等付款方式。这是一家成立于2009年的老牌保加利亚主机商,提供的产品包括虚拟主机、VPS/VDS和独立服务器租用等,数据中心可选美国、保加利亚、乌克兰、荷兰、拉脱维亚、捷克、瑞士和波...
Webhosting24宣布自7月1日起开始对日本机房的VPS进行NVMe和流量大升级,几乎是翻倍了硬盘和流量,价格依旧不变。目前来看,日本VPS国内过去走的是NTT直连,服务器托管机房应该是CDN77*(也就是datapacket.com),加上高性能平台(AMD Ryzen 9 3900X+NVMe),还是有相当大的性价比的。此外在6月30日,又新增了洛杉矶机房,CPU为AMD Ryzen 9...