66160
Goto Top

BrightStor Arcserve Backup 11.5 (Linux) fuehrt kein Backups mehr durch

Hallo!

Ich bin seit kurzem in dieser Firma als Unterstützung für einen Administrator eingestellt worden. Mein Vorgänger hat die Backupsoftware von CA (Arcserve 11.5) installiert und konfiguriert, niemand kennt sich mit dieser Software aus.
Vor ca. einer Woche sind wir draufgekommen dass schon lange keine Backups mehr durchgeführt wurden, anschließend haben wir uns etwas mit den Logfiles beschäftigt ... nur finde ich keine wirklich brauchbare Hilfe (zur Bedeutung der Fehlermeldungen, bzw dazu passender Lösungen?). Wenn mich jemand an ein gutes Howto verweisen könnte wäre ich sehr dankbar, der Administrator Guide hat mich bisher nicht weitergebracht.

Darum erbitte ich eure Hilfe

Das gesamte Programm läuft bei uns auf einem Red Hat Server und holt von einem Mailserver (ebenfalls Red Hat) und einem Windowsserver Backups ab.

Ich bin bisher nur draufgekommen, dass der Mediendienst (camediad) nicht gestartet war.
Anschließend hab ich mit den Befehlen

/opt/CA/BrightStorARCserve/sbin/cstop
/opt/CA/BrightStorARCserve/sbin/cstart

neu gestartet, danach war der camediad 3x in der Prozessliste (gehört das so?), sowie alle anderen Dienste die laut Admin Guide notwendig sind.

Nun hab ich aber noch das Problem dass das Logfile Brightstor.log lediglich folgendes meldet:

cat /opt/CA/BrightStorARCserve/logs/BrightStor.log | tail
[06/11/2008-23:00:00 ,3,591,0,0,-1,11,18,0,0]CABAB_I_10: Backup job "WEDNESDAY Backup Job" status has changed to Active on 06/11/2008 at 11:00:00 PM; jobid=591[06/11/2008-23:00:00 ,3,591,0,0,-1,11,18,0,0]CABAB_I_10: Backup job "WEDNESDAY Backup Job" status has changed to Failed on 06/11/2008 at 11:00:00 PM; jobid=591[06/12/2008-00:05:47 ,-1,0,0,0,-1,0,3,0,0]Attempting prune operation.

Der caqd-Dienst führt laut Logfile permanent Staging-Operationen durch und ist laut Logfile des Mediadienstes (camediad.log) nicht erreichbar:

cat /opt/CA/BrightStorARCserve/logs/caqd.log | tail
[06/12/2008-10:33:21 ,-1,0,0,0,-1,2,0,0,0]staging PID = 4858[06/12/2008-10:33:21 ,-1,0,0,0,-1,2,0,0,0]staging PID = 4859[06/12/2008-10:33:21 ,-1,0,0,0,-1,2,0,0,0]staging PID = 4860

wird permanent ausgeführt, sobald ich das Startskript aufrufe, daher nur die letzten 3 Einträge. Das läuft mich allen PID durch ...

cat /opt/CA/BrightStorARCserve/logs/staging.log | tail
[06/10/2008-09:26:47 ,-1,0,0,0,-1,2,18,0,0] staging Starting...[06/10/2008-09:26:47 ,-1,0,0,0,-1,2,18,0,0][connectService] Failed on connecting caqd[06/11/2008-12:50:20 ,-1,0,0,0,-1,2,18,0,0][connectService] Failed on connecting caqd

Das war gestern nach einem erneuten Start des Backupservices, danach keine Einträge mehr.


Dann füg ich noch die camediad.log an, falls da interessante Information für euch drin ist (vom Neustart bis heute).

cat /opt/CA/BrightStorARCserve/logs/camediad.log
[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0][06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] ################################################################################[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [Legend] Note: Job ID appears with the Group Daemon when a job is running[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] "[Date/Time]" "[Dameon Name Daemon PID]" "Message"[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] Main -Main Daemon [Main-<PID>][06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] CBck -Callback Daemon [CBck-<PID>][06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] Grp -Group Daemon [Grp -<PID> Grp(Groupname)][06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] Grp -Group Daemon [Grp -<PID> Grp(Groupname) JobID-<Job ID>][06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] Read -Read Daemon [Read-<PID> Grp(Groupname) JobID-<Job ID>][06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] Write -Write Daemon [Wrt -<PID> Grp(Groupname) JobID-<Job ID>][06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0][06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [ea=0x...] - Element Address =0x(Element Address in hex)[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] ################################################################################[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0][06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [Main-12677] OS Name: Linux fileserver.top-sportbets.com 2.6.9-22.ELsmp #1 SMP Mon Sep 19 18:32:14 EDT 2005 i686[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [Main-12677] Device file /opt/CA/BrightStorARCserve/config/.devlist.dat found.[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [Main-12677] Device list built on Thu Jan 19 00:00:00 2006. (compatibility level 2).[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [Main-12677] Device Info:[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [Main-12677] Vendor ID = [HP ][06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [Main-12677] Product ID = [ULTRIUM460 DRV ][06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [Main-12677] Revision = [F5CD][06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [Main-12677] [HP ULTRIUM460 DRV ] device NOT found in external support list, Checking internal support list.[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [Main-12677] Successfully added device.[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [Main-12677] No filesystem devices found.[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [CBck-12761] Callback daemon started. pid = 12761[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Group daemon started. pid = 12762[06/10/2008-09:28:07 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] (12762): Group GROUP0: program number = 395652[06/10/2008-09:49:25 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 09:49:25==>Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] CDB.6: 00 00 00 00 00 00 00 00 00 00 00 00[06/10/2008-09:49:25 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] Request Sense Data: 70 00 02 00 00 00 00 0e 00 00 00 00 04 00[06/10/2008-09:49:25 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00[06/10/2008-09:49:25 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Not Ready [02][06/10/2008-09:49:25 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Logical Unit Not Ready, Cause Not Reportable [04, 00][06/10/2008-09:49:30 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 09:49:30==>Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] CDB.6: 00 00 00 00 00 00 00 00 00 00 00 00[06/10/2008-09:49:30 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] Request Sense Data: 70 00 02 00 00 00 00 0e 00 00 00 00 04 00[06/10/2008-09:49:30 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00[06/10/2008-09:49:30 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Not Ready [02][06/10/2008-09:49:30 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Logical Unit Not Ready, Cause Not Reportable [04, 00][06/10/2008-09:49:35 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 09:49:35==>Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] CDB.6: 00 00 00 00 00 00 00 00 00 00 00 00[06/10/2008-09:49:35 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] Request Sense Data: 70 00 02 00 00 00 00 0e 00 00 00 00 04 00[06/10/2008-09:49:35 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00[06/10/2008-09:49:35 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Not Ready [02][06/10/2008-09:49:35 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Logical Unit Not Ready, Cause Not Reportable [04, 00][06/11/2008-11:21:15 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 11:21:15==>Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] CDB.6: 00 00 00 00 00 00 00 00 00 00 00 00[06/11/2008-11:21:15 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] Request Sense Data: 70 00 02 00 00 00 00 0e 00 00 00 00 04 00[06/11/2008-11:21:15 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00[06/11/2008-11:21:15 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Not Ready [02][06/11/2008-11:21:15 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Logical Unit Not Ready, Cause Not Reportable [04, 00][06/11/2008-11:21:20 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 11:21:20==>Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] CDB.6: 00 00 00 00 00 00 00 00 00 00 00 00[06/11/2008-11:21:20 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] Request Sense Data: 70 00 02 00 00 00 00 0e 00 00 00 00 04 00[06/11/2008-11:21:20 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00[06/11/2008-11:21:20 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Not Ready [02][06/11/2008-11:21:20 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Logical Unit Not Ready, Cause Not Reportable [04, 00][06/11/2008-11:21:25 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 11:21:25==>Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] CDB.6: 00 00 00 00 00 00 00 00 00 00 00 00[06/11/2008-11:21:25 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] Request Sense Data: 70 00 02 00 00 00 00 0e 00 00 00 00 04 00[06/11/2008-11:21:25 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00[06/11/2008-11:21:25 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Not Ready [02][06/11/2008-11:21:25 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Logical Unit Not Ready, Cause Not Reportable [04, 00][06/11/2008-11:21:30 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 11:21:30==>Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] CDB.6: 00 00 00 00 00 00 00 00 00 00 00 00[06/11/2008-11:21:30 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] Request Sense Data: 70 00 02 00 00 00 00 0e 00 00 00 00 04 00[06/11/2008-11:21:30 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00[06/11/2008-11:21:30 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Not Ready [02][06/11/2008-11:21:30 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] Logical Unit Not Ready, Cause Not Reportable [04, 00][06/11/2008-12:50:13 ,-1,0,0,0,-1,2,3,0,0] [Main-12677] (0): Shutdown request received.[06/11/2008-12:50:13 ,-1,0,0,0,-1,2,3,0,0] [Main-12677] (0): Primary handler: caught signal 15[06/11/2008-12:50:17 ,-1,0,0,0,-1,2,3,0,0] [CBck-12761] (0): Callback daemon requested to shut down.[06/11/2008-12:50:17 ,-1,0,0,0,-1,2,3,0,0] [CBck-12761] (0): Callback daemon exiting...[06/11/2008-12:50:18 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] (0): Group daemon requested to shut down.[06/11/2008-12:50:18 ,-1,0,0,0,-1,2,3,0,0] [Grp -12762(GROUP0)] (12762): Group daemon exiting...[06/11/2008-12:50:19 ,-1,0,0,0,-1,2,3,0,0] [Main-12677] Media Server terminated.[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0][06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] ################################################################################[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [Legend] Note: Job ID appears with the Group Daemon when a job is running[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] "[Date/Time]" "[Dameon Name Daemon PID]" "Message"[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] Main -Main Daemon [Main-<PID>][06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] CBck -Callback Daemon [CBck-<PID>][06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] Grp -Group Daemon [Grp -<PID> Grp(Groupname)][06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] Grp -Group Daemon [Grp -<PID> Grp(Groupname) JobID-<Job ID>][06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] Read -Read Daemon [Read-<PID> Grp(Groupname) JobID-<Job ID>][06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] Write -Write Daemon [Wrt -<PID> Grp(Groupname) JobID-<Job ID>][06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0][06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [ea=0x...] - Element Address =0x(Element Address in hex)[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] ################################################################################[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0][06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [Main-7110] OS Name: Linux fileserver.top-sportbets.com 2.6.9-22.ELsmp #1 SMP Mon Sep 19 18:32:14 EDT 2005 i686[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [Main-7110] Device file /opt/CA/BrightStorARCserve/config/.devlist.dat found.[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [Main-7110] Device list built on Thu Jan 19 00:00:00 2006. (compatibility level 2).[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [Main-7110] Device Info:[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [Main-7110] Vendor ID = [HP ][06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [Main-7110] Product ID = [ULTRIUM460 DRV ][06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [Main-7110] Revision = [F5CD][06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [Main-7110] [HP ULTRIUM460 DRV ] device NOT found in external support list, Checking internal support list.[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [Main-7110] Successfully added device.[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [Main-7110] No filesystem devices found.[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [CBck-7196] Callback daemon started. pid = 7196[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] Group daemon started. pid = 7197[06/11/2008-14:10:49 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] (7197): Group GROUP0: program number = 395652[06/12/2008-09:03:56 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] 09:03:56==>Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] CDB.6: 00 00 00 00 00 00 00 00 00 00 00 00[06/12/2008-09:03:56 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] Request Sense Data: 70 00 02 00 00 00 00 0e 00 00 00 00 04 00[06/12/2008-09:03:56 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00[06/12/2008-09:03:56 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] Not Ready [02][06/12/2008-09:03:56 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] Logical Unit Not Ready, Cause Not Reportable [04, 00][06/12/2008-09:04:01 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] 09:04:01==>Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] CDB.6: 00 00 00 00 00 00 00 00 00 00 00 00[06/12/2008-09:04:01 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] Request Sense Data: 70 00 02 00 00 00 00 0e 00 00 00 00 04 00[06/12/2008-09:04:01 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00[06/12/2008-09:04:01 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] Not Ready [02][06/12/2008-09:04:01 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] Logical Unit Not Ready, Cause Not Reportable [04, 00][06/12/2008-09:04:06 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] 09:04:06==>Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] CDB.6: 00 00 00 00 00 00 00 00 00 00 00 00[06/12/2008-09:04:06 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] Request Sense Data: 70 00 02 00 00 00 00 0e 00 00 00 00 04 00[06/12/2008-09:04:06 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00[06/12/2008-09:04:06 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] Not Ready [02][06/12/2008-09:04:06 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] Logical Unit Not Ready, Cause Not Reportable [04, 00][06/12/2008-09:04:11 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] 09:04:11==>Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] CDB.6: 00 00 00 00 00 00 00 00 00 00 00 00[06/12/2008-09:04:11 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] Drive SerNo<HUL5J07273> (0,0,0) Cmd=[TEST UNIT READY] Request Sense Data: 70 00 02 00 00 00 00 0e 00 00 00 00 04 00[06/12/2008-09:04:11 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00[06/12/2008-09:04:11 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] Not Ready [02][06/12/2008-09:04:11 ,-1,0,0,0,-1,2,3,0,0] [Grp -7197(GROUP0)] Logical Unit Not Ready, Cause Not Reportable [04, 00]

Ich hoff dass ich alles wichtige angefügt habe.
Ist echt ganz und garnicht gut wenn das Backup nicht funktioniert face-sad
Und sowas auch noch im Probemonat, wo ich mit dem gesamten Netzwerk noch nicht per DU bin ... Naja, Murphys Lebensweisheiten haben es doch immer schon prophezeit ;)

Danke schon im Voraus für eure Hilfe!

MfG Podder

Content-Key: 89682

Url: https://administrator.de/contentid/89682

Printed on: April 18, 2024 at 19:04 o'clock

Member: ratzla
ratzla Jun 12, 2008 at 11:01:19 (UTC)
Goto Top
Hallo,
ich habe die Details nicht gelesen, aber es würde mich nicht wundern wenn die Arcserver DB kaputt ist (war bei uns regelmäßig der Fall).

Ich kann dir nur Empfehlen schnellstmöglich auf eine andere Software umzusteigen.
Wir sind vor gut 3 jahre auf bacula umgestiegen - das geht ohne die ständigen Probleme von Arcserve und gibt's als open source.
Mitglied: 66160
66160 Jun 12, 2008 at 11:15:01 (UTC)
Goto Top
hm ... das klingt garnicht gut.
Kann Bacula auch die Backups vom Windowsserver und einem andren Linuxserver abholen?
Eigentlich wärs ja am einfachsten (denk ich mal) eine eigene Lösung zu stricken, mit rsync ... nur man kann ja nicht so einfach auf das Bandlaufwerk schreiben oder? Das wird der schwerste Teil.
Das Problem ist halt dass sich mit dieser Backupsoftware niemand im Haus auskennt, der alte Admin ist einfach sang- und klanglos verschwunden wie ich gehört habe. Kümmert sich ja auch jetzt um nix mehr (ok, verständlich, schließlich arbeitet er nicht mehr in dieser Firma) ...

Aber gibts da keine aussagekräftige Fehlermeldung dass die Datenbank hin ist? In meinen augen könnten die Logeinträge kryptischer kaum sein ...

Danke jedenfalls für die Hilfe!
Muss jetzt eh schnell gehen, ohen Backup das geht garnicht. Und die alten auf den Bändern kann man dann auch nicht mehr wirklich zurückspielen ohne zugehöriger Software.
Member: ratzla
ratzla Jul 17, 2008 at 07:21:55 (UTC)
Goto Top
Sorry hatte den Thread nicht verfolgt... ;-(

Bacula sicher auch Windows Server (und clients) problemlos. Sogar VSS-Snapshots werden da ausgenutzt.

Mit rsync geht auch was, ich hab das aber noch nie mit Windows probiert.
Bei uns wird in erster Stufe (tagessicherung) mit rsync gesichert. Dabei werden mit Hilfe von Hardlinks auch problemlos mehrere Generationen verwaltet ohne den mehrfachen Speicherplatz zu brauchen. (Hier kann ich das Buch: "Datensicherung unter Linux" von Wolfgang Bath empfehlen).
Eine zusätzliche tägliche incrementelle Sicherung läuft mit bacula, wöchentlich, bzw. monatlich (je nach Server) dann noch eine Vollsicherung auf Band.

Grüße
Christian
Mitglied: 66160
66160 Jul 17, 2008 at 18:14:48 (UTC)
Goto Top
Danke für die Antwort.

Ich habe inzwischen Bacula eingerichtet. Derzeit nur auf einem Linuxserver, läuft sehr gut, nur dass er manchmal ein Tape nicht akzeptiert.

Haben je ein Tape von DI bis SO. Diese werden jede Woche überschrieben. Zusätzlich gibt es 4 Tapes für Montag, sodass wir immer eine Wochensicherung haben und 4 Wochen zurück können.
Als dritte Stufe gibt es 4 weitere Tapes welche alle 3 Monate einmal überschrieben werden.

Jedoch war es zu Beginn so dass wenn ich z.b. am Mittwoch nachmittag das Tape Mittwoch eingelegt habe, bacula unbedingt das freitagsband wollte (keine ahnung warum) und dann das samstag, sonntag band probiert hat usw ... diese waren jedoch alle nicht im tapedrive, somit wurden sie als error markiert. und dann hat er das mittwochband aber nicht mehr probiert und oft keine backups durchgeführt.
inzwischen funktioniert das, dass nach jeder benutzung das tape als used markiert wurde und erst nach frühestens 6 tagen wieder überschrieben wird. leider war es letzten SA wieder so, dass er das tape welches im laufwerk war nicht akzeptierte. und ich komme nicht dahinter wieso.

vielleicht jemand eine idee?
Member: ratzla
ratzla Jul 21, 2008 at 07:41:48 (UTC)
Goto Top
Schau dir mal die verschiedenen wartezeit parameter an.
Max Wait time, retention time, Max Start Delay, max delay time
sowie max jobs

Wir hatten anfangs damit auch ein wenig Schwierigkeiten. In der Regel war das Band durch eine der Wartezeiten noch immer gesperrt. Die Philosophie von bacula ist da völlig anders als die von Arcserve. Die Idee von Kern ist, das Band einfach drinzulassen bis es voll ist. Die Messsage resource schickt dann eine nachricht an den Admin "bitte band wechseln". Tägliches regelmäßiges wechseln geht zwar auch (wir machen das so), die Grundidee von bacula ist aber etwas anders aufgefasst.
Mitglied: 66160
66160 Jul 21, 2008 at 18:09:59 (UTC)
Goto Top
danke für die tipps, werd mir das morgen nochmal genau ansehen.
habe vor 2 wochen die pools geändert, und seit diesem samstag hat er auf jedes tape einmal geschrieben.
Also derzeit läufts. Heute ist wieder eine wochensicherung mit einem "neuen" band dran, mal sehen obs klappt.

hab das mal versucht wenn er wegen einem tape gemault hat. da hab ich einen manuellen unmount durchgeführt, anschließend wieder gemountet. und siehe da, auf einmal hat er das tape angenommen. habs nichtmal ausgeworfen, wie gesagt nur in der bconsole ein unmount und mount. das verwundert mich so. wenn es gesperrt wäre dann würde er es doch danach auch nicht annehmen?

naja hauptsach es funktioniert ;)

danke auch nochmal für den hinweis mit der anderen philosophie. Hab mir schon gedacht dass bacula eher gedacht ist ein vollbackup/tape zu machen und anschließend solange inkrementelle bis es voll ist, anschließend wechseln. Da unser backupjob jedoch in der nacht läuft und niemand im haus ist wird es mit dem tape wechseln etwas schwierig.

danke nochmal!