westberliner
Goto Top

Exchange 2010 Datenbanken ständig defekt

Hallo zusammen,

ich habe hier einen Exchange 2010, virtualisiert laufen.

Die VMWare Hosts sowie EMC Storage wurden vorletztes Jahr angeschafft, ebenso Backbone-Switch.

So - alles läuft an sich top, bis im März die Exchange-Datenbank kaputt war - warum auch mmer. Also Datenbank mit ESEUTIL zum laufen gebracht, alles schick.

Hat dann wieder angefangen Fehler zu werfen. Also neue Datenbanken erstellt und User gesplittet. War eine Zeit lang ok - nun vor etwa einer Woche - wieder die zwei neuen Datenbanken kaputt. Die neuen DB lagen bereits auf einer andere Partition.

Also gleiches Spiel - nun neue LUN, neue Datenbank, dort einen Teil User hin verschoben.
Dazu den ESX-Host gewechselt.

Nun ist die Datenbank schon wieder schrott. Ich krieg das kotzen langsam. Das kann ja wohl nicht sein.

Keine Fehler auf den ESX-Hosts, keine Fehler auf dem EMC-Storage. Angebunden sind die zwei über Fibre-Channel per Glas.


Auf anderen VM´s habe ich auch keinelei Fehler. Ideen?


Protokollname: Application
Quelle:        ESE
Datum:         8/5/2017 5:20:20 PM
Ereignis-ID:   530
Aufgabenkategorie:Datenbank-Seitencache
Ebene:         Fehler
Schlüsselwörter:Klassisch
Benutzer:      Nicht zutreffend
Computer:      vm-exchange.ns-k.local
Beschreibung:
Information Store (12576) DB-4: Fehler bei der Überprüfung der Datenbankseite, die aus der Datei "D:\Mailbox\DB-4\DBt-4.edb" mit dem Offset 11435606016 (0x00000002a99d8000) (Datenbankseite 348986 (0x5533A)) mit 32768 (0x00008000) Bytes gelesen wurde. Ursache: keine Übereinstimmung des Zeitstempels für verlorene Leerungserkennung. Der Lesevorgang wird mit dem Fehler '-1119 (0xfffffba1)' beendet. Wenn dieser Zustand andauert, stellen Sie die Datenbank mithilfe einer früheren Sicherung wieder her. Der Grund für dieses Problem ist wahrscheinlich defekte Hardware. Wenden Sie sich an den Hardwarehersteller, um Hilfe bei der Problemdiagnose zu erhalten.   

Wenn Sie weitere Informationen wünschen, klicken Sie auf http://www.microsoft.com/contentredirect.asp.
Ereignis-XML:
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">  
  <System>
    <Provider Name="ESE" />  
    <EventID Qualifiers="0">530</EventID>  
    <Level>2</Level>
    <Task>2</Task>
    <Keywords>0x80000000000000</Keywords>
    <TimeCreated SystemTime="2017-08-05T15:20:20.000000000Z" />  
    <EventRecordID>208089078</EventRecordID>
    <Channel>Application</Channel>
    <Computer>vm-exchange.domain.local</Computer>
    <Security />
  </System>
  <EventData>
    <Data>Information Store</Data>
    <Data>12576</Data>
    <Data>DB-4: </Data>
    <Data>D:\Mailbox\DB-4\DB-4.edb</Data>
    <Data>11435606016 (0x00000002a99d8000)</Data>
    <Data>32768 (0x00008000)</Data>
    <Data>-1119 (0xfffffba1)</Data>
    <Data>348986 (0x5533A)</Data>
  </EventData>
</Event>

Protokollname: Application
Quelle:        ExchangeStoreDB
Datum:         8/5/2017 5:20:21 PM
Ereignis-ID:   234
Aufgabenkategorie:Database recovery
Ebene:         Fehler
Schlüsselwörter:Klassisch
Benutzer:      Nicht zutreffend
Computer:      vm-exchange.ns-k.local
Beschreibung:
'05.08.2017 17:20:20': Für die Kopie von Datenbank 'DB-4' ist auf diesem Server ein schwerwiegender E/A-Fehler aufgetreten, der sich möglicherweise auf alle Kopien der Datenbank ausgewirkt hat. Überprüfen Sie das Ereignisprotokoll auf dem Server hinsichtlich der 'ExchangeStoreDb'- und 'MSExchangeRepl'-Ereignisse, um Informationen zum Fehler zu erhalten. Alle Daten sollten umgehend aus dieser Datenbank in eine neue Datenbank verschoben werden.  
Ereignis-XML:
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">  
  <System>
    <Provider Name="ExchangeStoreDB" />  
    <EventID Qualifiers="49156">234</EventID>  
    <Level>2</Level>
    <Task>1</Task>
    <Keywords>0x80000000000000</Keywords>
    <TimeCreated SystemTime="2017-08-05T15:20:21.000000000Z" />  
    <EventRecordID>208089080</EventRecordID>
    <Channel>Application</Channel>
    <Computer>vm-exchange.domain.local</Computer>
    <Security />
  </System>
  <EventData>
    <Data>DB-4</Data>
    <Data>af0d04d4-39e9-4d55-904a-a7eb68e584bb</Data>
    <Data>Ese</Data>
    <Data>LostFlushDetected</Data>
    <Data>DB-4</Data>
    <Data>
    </Data>
    <Data>Es ist nur eine Kopie der Postfachdatenbank (Sonnplast-4) vorhanden. Es ist keine automatische Wiederherstellung verfügbar.</Data>
    <Data>05.08.2017 17:20:20</Data>
    <Data>None</Data>
    <Data>D:\Mailbox\DB-4\DB-4.edb</Data>
    <Data>11435606016</Data>
    <Data>32768</Data>
  </EventData>
</Event>


Protokollname: Application
Quelle:        ExchangeStoreDB
Datum:         8/5/2017 5:20:21 PM
Ereignis-ID:   233
Aufgabenkategorie:Database recovery
Ebene:         Fehler
Schlüsselwörter:Klassisch
Benutzer:      Nicht zutreffend
Computer:      vm-exchange.domain.local
Beschreibung:
'05.08.2017 17:20:20': Für die Datenbankkopie 'DB-4' auf diesem Server ist ein Fehler aufgetreten. Überprüfen Sie das Ereignisprotokoll für 'ExchangeStoreDb'- oder 'MSExchangeRepl'-Ereignisse, um weitere Informationen zu erhalten.  
Ereignis-XML:
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">  
  <System>
    <Provider Name="ExchangeStoreDB" />  
    <EventID Qualifiers="49156">233</EventID>  
    <Level>2</Level>
    <Task>1</Task>
    <Keywords>0x80000000000000</Keywords>
    <TimeCreated SystemTime="2017-08-05T15:20:21.000000000Z" />  
    <EventRecordID>208089081</EventRecordID>
    <Channel>Application</Channel>
    <Computer>vm-exchange.domain.local</Computer>
    <Security />
  </System>
  <EventData>
    <Data>Sonnplast-4</Data>
    <Data>af0d04d4-39e9-4d55-904a-a7eb68e584bb</Data>
    <Data>Ese</Data>
    <Data>PagePatchRequested</Data>
    <Data>DB-4</Data>
    <Data>
    </Data>
    <Data>Es ist nur eine Kopie der Postfachdatenbank (DB-4) vorhanden. Es ist keine automatische Wiederherstellung verfügbar.</Data>
    <Data>05.08.2017 17:20:20</Data>
    <Data>Read</Data>
    <Data>D:\Mailbox\DB-4\DB-4.edb</Data>
    <Data>11435606016</Data>
    <Data>32768</Data>
  </EventData>
</Event>

Content-Key: 345532

Url: https://administrator.de/contentid/345532

Ausgedruckt am: 28.03.2024 um 13:03 Uhr

Mitglied: Vision2015
Vision2015 05.08.2017 um 18:27:50 Uhr
Goto Top
Zitat von @westberliner:

Hallo zusammen,
Moin...

ich habe hier einen Exchange 2010, virtualisiert laufen.
ok.. werde mal etwas genauer!
worauf läuft er ? VMware, Hyper-V etc.. ?
sp ? rollup ?
wie groß sind die DB´s ?
hast du datensicherungen mit protokoll abschnitt?
Umlaufprotokoliereung an ?
es ist aber kein SBS2011.. oder ?

Die VMWare Hosts sowie EMC Storage wurden vorletztes Jahr angeschafft, ebenso Backbone-Switch.
nun ja...

So - alles läuft an sich top, bis im März die Exchange-Datenbank kaputt war - warum auch mmer. Also Datenbank mit ESEUTIL zum laufen gebracht, alles schick.
hm...

Hat dann wieder angefangen Fehler zu werfen. Also neue Datenbanken erstellt und User gesplittet. War eine Zeit lang ok - nun vor etwa einer Woche - wieder die zwei neuen Datenbanken kaputt. Die neuen DB lagen bereits auf einer andere Partition.
aber das gleiche storage?

Also gleiches Spiel - nun neue LUN, neue Datenbank, dort einen Teil User hin verschoben.
nur einen teil?
Dazu den ESX-Host gewechselt.
ok..

Nun ist die Datenbank schon wieder schrott. Ich krieg das kotzen langsam. Das kann ja wohl nicht sein.

Keine Fehler auf den ESX-Hosts, keine Fehler auf dem EMC-Storage. Angebunden sind die zwei über Fibre-Channel per Glas.
hm.. 8GB 10GB 40GB... ?


Auf anderen VM´s habe ich auch keinelei Fehler. Ideen?
müsen sie ja auch nicht!


du hast E/A-Fehler...
hast du mal ein checkdisk auf der partition gemacht, nachdem der Fehler aufgetreten ist?

Frank
Mitglied: westberliner
westberliner 06.08.2017 aktualisiert um 12:37:08 Uhr
Goto Top
worauf läuft er ? VMware, Hyper-V etc.. ?
VMware - ESXi 6
sp ? rollup ?
Version: 14.03.0319.002
Update Rollup 15 for Exchange Server 2010 SP3

Werde den jetzt aber hoch patchen - auch wenn ich hier nicht viel Glauben hab, das davon das Problem weg ist.


wie groß sind die DB´s ?

Ich habe etwa 700GB Gesamtdatenbank gehabt.
Danach wurde diese in etwa 3 Teile aufgeteilt.

Aktuell hat eine 500 GB, die anderen zwei etwa 60-80. Und eben eine kleinere davon ist wieder kaputt.

hast du datensicherungen mit protokoll abschnitt?
verstehe leider die Frage nicht ganz?

Umlaufprotokoliereung an ?
ja

es ist aber kein SBS2011.. oder ?
nein, SRV2008R2sp1

Hat dann wieder angefangen Fehler zu werfen. Also neue Datenbanken erstellt und User gesplittet. War eine Zeit lang ok - nun vor etwa einer Woche - wieder die zwei neuen Datenbanken kaputt. Die neuen DB lagen bereits auf einer andere Partition.
aber das gleiche storage?
ja - ich habe nur ein Storage.

Also gleiches Spiel - nun neue LUN, neue Datenbank, dort einen Teil User hin verschoben.
nur einen teil?

Ja - ich mache das immer nach und nach.


Keine Fehler auf den ESX-Hosts, keine Fehler auf dem EMC-Storage. Angebunden sind die zwei über Fibre-Channel per Glas.
hm.. 8GB 10GB 40GB... ?
8GB


du hast E/A-Fehler...
hast du mal ein checkdisk auf der partition gemacht, nachdem der Fehler aufgetreten ist?

Bei der allerletzten defekten DB diesmal keine Fehler.

Bei der vorletzten DB hatte Checkdisk beim Reboot Fehler behoben.
Mitglied: Vision2015
Vision2015 06.08.2017 um 14:38:53 Uhr
Goto Top
Zitat von @westberliner:

worauf läuft er ? VMware, Hyper-V etc.. ?
VMware - ESXi 6
sp ? rollup ?
Version: 14.03.0319.002
Update Rollup 15 for Exchange Server 2010 SP3

Werde den jetzt aber hoch patchen - auch wenn ich hier nicht viel Glauben hab, das davon das Problem weg ist.


wie groß sind die DB´s ?

Ich habe etwa 700GB Gesamtdatenbank gehabt.
Danach wurde diese in etwa 3 Teile aufgeteilt.
700 GB finde ich je nach storage nicht viel...

Aktuell hat eine 500 GB, die anderen zwei etwa 60-80. Und eben eine kleinere davon ist wieder kaputt.

hast du datensicherungen mit protokoll abschnitt?
verstehe leider die Frage nicht ganz?
transaktionslogs werden nach einem bzw. bei einem backup gelöscht, bzw abgeschnitten!

Umlaufprotokoliereung an ?
ja

es ist aber kein SBS2011.. oder ?
nein, SRV2008R2sp1
ok..

Hat dann wieder angefangen Fehler zu werfen. Also neue Datenbanken erstellt und User gesplittet. War eine Zeit lang ok - nun vor etwa einer Woche - wieder die zwei neuen Datenbanken kaputt. Die neuen DB lagen bereits auf einer andere Partition.
aber das gleiche storage?
ja - ich habe nur ein Storage.

Also gleiches Spiel - nun neue LUN, neue Datenbank, dort einen Teil User hin verschoben.
nur einen teil?

Ja - ich mache das immer nach und nach.


Keine Fehler auf den ESX-Hosts, keine Fehler auf dem EMC-Storage. Angebunden sind die zwei über Fibre-Channel per Glas.
hm.. 8GB 10GB 40GB... ?
8GB


du hast E/A-Fehler...
hast du mal ein checkdisk auf der partition gemacht, nachdem der Fehler aufgetreten ist?

Bei der allerletzten defekten DB diesmal keine Fehler.
sondern?

Bei der vorletzten DB hatte Checkdisk beim Reboot Fehler behoben.
hm.. kann es sein das du latenzen auf dem glas hast? wenn dein storage IO ist, und du aber lesefehler hast, klemmt es im bus..
die exchange DB ist etwas empfindlich.. und du hast in der regel immer lese fehler...
ich würde jetzt mal als Final Test 2 SSD´s in einen Host als Raid 1 schrauben, und sehen was passiert!

Frank
Mitglied: westberliner
westberliner 07.08.2017 um 11:17:04 Uhr
Goto Top
So - ich habe es gestern mit diversen ESEUTIL´s etc hinbekommen.

Lief - bis Nachts. Danach fing die Store.exe immer wieder wegzukrachen.

Datenbank 4 war schuld. Habe diese wieder repariert - nun läufts wieder. Jedoch bekomme ich einige Warnungen wegen Ordneransichten. Hier muss ich wohl die Postfächer verschieben, Reparatur von den Postfächern läuft zwar erfolgreich durch, repariert auch was, aber der Fehler kommt wieer.

Ich frage mich nur, wie lange der Zustand anhält.
Mitglied: Vision2015
Vision2015 07.08.2017 um 13:07:31 Uhr
Goto Top
Zitat von @westberliner:

So - ich habe es gestern mit diversen ESEUTIL´s etc hinbekommen.
ok..
Datensicherung hast du aber? wenn ja was für eine?

Lief - bis Nachts. Danach fing die Store.exe immer wieder wegzukrachen.
mit Lese Fehlern?

Datenbank 4 war schuld. Habe diese wieder repariert - nun läufts wieder. Jedoch bekomme ich einige Warnungen wegen Ordneransichten. Hier muss ich wohl die Postfächer verschieben, Reparatur von den Postfächern läuft zwar erfolgreich durch, repariert auch was, aber der Fehler kommt wieer.
die Warnungen haben doch bestimmt eine ID ?

Ich frage mich nur, wie lange der Zustand anhält.
also für ich hast du ein Storage Problem!

Frank