ORA-01102: cannot mount database in EXCLUSIVE mode

今天在STARTUP一数据库时,发生如下错误:

 1SQL> conn /as sysdba
 2Connected to an idle instance.
 3
 4SQL> startup
 5ORACLE instance started.
 6Total System Global Area 276824064 bytes
 7Fixed Size                   778736 bytes
 8Variable Size             137371152 bytes
 9Database Buffers          138412032 bytes
10Redo Buffers                 262144 bytes
11ORA-01102: cannot mount database in EXCLUSIVE mode
12
13SQL> shutdown immediate
14ORA-01507: database not mounted
15ORACLE instance shut down.

网上找了一下,发现日志:http://nitar.blog.163.com/blog/static/28638792009116355706/ ,处理方法如下(通过下面的方面,问题成功解决):

发现是lk文件造成的,该文件位于ORALCE_HOME下的dbs目录下,马上检查该文件:

1[root@qa-oracle dbs]# fuser -u lkNDMSQA
2lkNDMSQA:             6666(oracle) 6668(oracle) 6670(oracle) 6672(oracle) 6674(oracle) 6676(oracle) 6678(oracle) 6680(oracle) 6690(oracle) 6692(oracle) 6694(oracle) 6696(oracle) 6737(oracle) 6830(oracle)
3
4果然该文件没释放,用fuser命令kill掉
5[root@qa-oracle dbs]# fuser -k lkNDMSQA
6lkNDMSQA:             6666 6668 6670 6672 6674 6676 6678 6680 6690 6692 6694 6696 6737 6830
7
8[root@qa-oracle dbs]# fuser -u lkNDMSQA

然后:

 1SQL> startup
 2ORACLE instance started.</span></div>
 3<div><span style="color: #0000ff;">Total System Global Area 276824064 bytes
 4Fixed Size                   778736 bytes
 5Variable Size             137371152 bytes
 6Database Buffers          138412032 bytes
 7Redo Buffers                 262144 bytes
 8Database mounted.
 9Database opened.
10SQL>
11数据库成功OPEN

关于该错误更详细的介绍如下:原文链接:http://www.hellodba.com/cases/case-unexception_down.htm

数据库异常关闭后无法启动问题处理一例

某系统突然掉电,系统启动后发现Oracle无法启动。启动时报如下错误:ORA-01102 cannot mount database in EXCLUSIVE mode,出现1102错误可能有以下几种可能:

一、在HA系统中,已经有其他节点启动了实例,将双机共享的资源(如磁盘阵列上的裸设备)占用了;
二、说明Oracle被异常关闭时,有资源没有被释放,一般有以下几种可能,

1、 Oracle的共享内存段或信号量没有被释放;
2、 Oracle的后台进程(如SMON、PMON、DBWn等)没有被关闭;
3、 用于锁内存的文件lk和sgadef.dbf文件没有被删除。

首先,虽然我们的系统是HA系统,但是备节点的实例始终处在关闭状态,这点通过在备节点上查数据库状态可以证实。
其次、是因系统掉电引起数据库宕机的,系统在接电后被重启,因此我们排除了第二种可能种的1、2点。最可疑的就是第3点了。

查$ORACLE_HOME/dbs目录:

1$ cd $ORACLE_HOME/dbs
2$ ls sgadef*
3sgadef* not found
4$ ls lk*
5lkORA92

果然,lk文件没有被删除。将它删除掉

1$ rm lk*

再启动数据库,成功。

如果怀疑是共享内存没有被释放,可以用以下命令查看:

 1$ipcs -mop
 2IPC status from /dev/kmem as of Thu Jul 6 14:41:43 2006
 3T      ID     KEY        MODE        OWNER     GROUP NATTCH CPID LPID
 4Shared Memory:
 5m       0 0x411c29d6 --rw-rw-rw-      root      root      0   899   899
 6m       1 0x4e0c0002 --rw-rw-rw-      root      root      2   899   901
 7m       2 0x4120007a --rw-rw-rw-      root      root      2   899   901
 8m 458755 0x0c6629c9 --rw-r-----      root       sys      2 9113 17065
 9m       4 0x06347849 --rw-rw-rw-      root      root      1 1661 9150
10m   65541 0xffffffff --rw-r--r--      root      root      0 1659 1659
11m 524294 0x5e100011 --rw-------      root      root      1 1811 1811
12m 851975 0x5fe48aa4 --rw-r-----    oracle oinstall     66 2017 25076
13
14然后它ID号清除共享内存段:
15$ipcrm –m 851975
16
17对于信号量,可以用以下命令查看:
18$ ipcs -sop
19IPC status from /dev/kmem as of Thu Jul 6 14:44:16 2006
20T      ID     KEY        MODE        OWNER     GROUP
21Semaphores:
22s       0 0x4f1c0139 --ra-------      root      root
23... ...
24s      14 0x6c200ad8 --ra-ra-ra-      root      root
25s      15 0x6d200ad8 --ra-ra-ra-      root      root
26s      16 0x6f200ad8 --ra-ra-ra-      root      root
27s      17 0xffffffff --ra-r--r--      root      root
28s      18 0x410c05c7 --ra-ra-ra-      root      root
29s      19 0x00446f6e --ra-r--r--      root      root
30s      20 0x00446f6d --ra-r--r--      root      root
31s      21 0x00000001 --ra-ra-ra-      root      root
32s   45078 0x67e72b58 --ra-r-----    oracle oinstall
33
34根据信号量ID,用以下命令清除信号量:
35$ipcrm -s 45078
36
37如果是Oracle进程没有关闭,用以下命令查出存在的oracle进程:
38$ ps -ef|grep ora
39oracle 29976     1 0 Jun 22 ?         0:52 ora_dbw0_ora92
40oracle 29978     1 0 Jun 22 ?         0:51 ora_dbw1_ora92
41oracle 5128     1 0 Jul 5 ?         0:00 oracleora92 (LOCAL=NO)
42... ...

然后用kill -9命令杀掉进程 $kill -9

总结:当发生1102错误时,可以按照以下流程检查、排错:

1.如果是HA系统,检查其他节点是否已经启动实例;
2.检查Oracle进程是否存在,如果存在则杀掉进程;
3.检查信号量是否存在,如果存在,则清除信号量;
4.检查共享内存段是否存在,如果存在,则清除共享内存段;
5.检查锁内存文件lk和sgadef.dbf是否存在,如果存在,则删除。