Ho un banco di prova a 2 nodi che esegue Oracle RAC 11.2.0.4 su OL6. Praticamente tutto è nel disco di sistema. Dopotutto, questo è solo un banco di prova. La partizione di root si è riempita. Ho ricevuto un avviso da EM sul problema dello spazio su disco e sono entrato e ho ripulito alcuni file di registro. Mentre stavo ripulendo i vecchi file di registro, il mio cervello mi diceva che l'utilizzo dello spazio dei file di registro non era fuori controllo e che doveva esserci un altro problema di fondo. Abbastanza sicuro, tre giorni dopo ho ricevuto l'avviso che il disco si stava riempiendo di nuovo. Sapevo che dovevo approfondire questo aspetto. Ci devono essere un altro o due file che monopolizzano lo spazio. Dopo un po' di ricerche, sono arrivato a questa directory nella mia installazione di Grid Infrastructure:
[oracle@host01 host01]$ pwd /u01/app/crs11.2.0.4/crf/db/host01 [oracle@host01 host01]$ ls -l total 10945448 -rw-r--r-- 1 root root 1773999 Jul 2 13:54 02-JUL-2014-13:54:50.txt -rw-r--r-- 1 root root 1120665 Jul 2 14:00 02-JUL-2014-14:00:06.txt -rw-r--r-- 1 root root 16953 Mar 25 2014 25-MAR-2014-19:51:58.txt -rw-r----- 1 root root 280764416 Nov 13 16:15 crfalert.bdb -rw-r----- 1 root root 9850126336 Nov 13 16:14 crfclust.bdb -rw-r----- 1 root root 8192 Jul 2 13:59 crfconn.bdb -rw-r----- 1 root root 352174080 Nov 13 16:15 crfcpu.bdb -rw-r----- 1 root root 249356288 Nov 13 16:15 crfhosts.bdb -rw-r----- 1 root root 265261056 Nov 13 16:14 crfloclts.bdb -rw-r----- 1 root root 172232704 Nov 13 16:14 crfts.bdb -rw-r----- 1 root root 24576 Jul 2 13:54 __db.001 -rw-r----- 1 root root 401408 Nov 13 16:15 __db.002 -rw-r----- 1 root root 2629632 Nov 13 16:15 __db.003 -rw-r----- 1 root root 2162688 Nov 13 16:15 __db.004 -rw-r----- 1 root root 1187840 Nov 13 16:15 __db.005 -rw-r----- 1 root root 57344 Nov 13 16:15 __db.006 -rw-r----- 1 root root 16777216 Nov 13 16:06 log.0000008765 -rw-r----- 1 root root 16777216 Nov 13 16:15 log.0000008766 -rw-r--r-- 1 root root 120000000 Jul 2 13:55 host01.ldb -rw-r----- 1 root root 8192 Jul 2 13:54 repdhosts.bdb
Il file crfclust.bdb è di circa 9,8 GB. Il mio disco di sistema è solo 30 GB, quindi questo file occupa il 33% dell'intero spazio. E continua a crescere. Per risolvere il problema, ho eseguito questi passaggi:
[oracle@host01 host01]$ /u01/app/crs11.2.0.4/bin/crsctl stop risorsa ora.crf -init
CRS-2673:tentativo di arresto di 'ora.crf' su 'host01'
CRS-2677:arresto di 'ora.crf' su 'host01' riuscito
[oracle@host01 host01] $ su
Password:
[root@host01 host01]# rm -rf *
[oracle@host01 host01]$ /u01/app/crs11.2.0.4/bin/crsctl risorsa di avvio ora.crf -init
CRS-2672:Tentativo di avviare "ora.crf" su "host01"
CRS-2676:Avvio di "ora.crf" su "host01" riuscito
Perché ha funzionato? Questi file sono il database Berkeley utilizzato per Cluster Health Monitor (CHM). Uno dei file dovrebbe avere una dimensione di circa 1 GB ed eliminare regolarmente i dati più vecchi. Ma la fase di spurgo non funziona. Rimuovendo manualmente i file, perderò i dati storici sulle prestazioni, ma a questo punto è accettabile per me. All'avvio, CHM creerà nuovamente i file se mancano.
Dopo aver risolto il problema, ho trovato Metalink Note 1343105.1 che descrive il problema. Non sono ancora riuscito a trovare un numero di Bug specifico, ma è chiaro che esiste un bug.