114260
Goto Top

Hyper-V Netzwerkadapter Ausfall

Hallo Admingemeinde

Seit geraumer Zeit habe ich ein Problem mit einem Hyper-V Host. Ich hoffe Ihr habt noch eine Idee.

Also kurz zum Überblick:

Server: Dell PowerEdge R720
OS: Windows Server 2012 R2
Netzwerkadapter: 4x Broadcom Gigabit Ethernet

1x Netzwerkadapter für Host
3x für Hyper-V (NIC-Teaming über Windows Server)

Jetzt zum Problem:

Meine Virtuellen Maschinen verlieren immer wieder die Verbindung zum Netzwerk.
Also der Betrieb läuft ganz normal und immer zwischen 19 und 21 Uhr am Abend, verlieren Sie die Verbindung zum Netzwerk. Danach muss ich den Netzwerkadapter neu starten damit es wieder funktioniert.

Das NIC-Teaming habe ich zum test aufgehoben und alles auf einen Adapter gelegt. => das gleiche Problem..... (nicht so häufig, aber immer noch)
Die Treiber habe ich auch neue installiert und bin sogar mit dem Driver Booster 2 darüber (obwohl ich nicht so Fan bin von diesen Tools).

Habt Ihr noch eine Idee?


LG Gadlae

Content-Key: 258310

Url: https://administrator.de/contentid/258310

Printed on: April 19, 2024 at 10:04 o'clock

Member: DerWoWusste
DerWoWusste Dec 22, 2014 updated at 12:43:43 (UTC)
Goto Top
Hi.

Was passiert denn zwischen 19 und 21 Uhr? Hoher Traffic durch Backups zufällig? Die Ursache sollte sich doch finden.
Welchen Treiber hast Du aktualisiert, den vom Host?
Mitglied: 114260
114260 Dec 22, 2014 at 12:41:51 (UTC)
Goto Top
Hi

Zwischen 19 und 21 Uhr verlieren die Virtuellen Maschinen die Verbindung zum Netzwerk.
Nein keine Backups und auch sonst nichts spezielles. Ich habe das auch schon geprüft mit der Netzwerklast und Test angestellt außerhalb der Zeit und innerhalb dieser Zeit, bei beiden ist nichts passiert.
Die Treiber vom Host (Netzwerkadapter) habe ich aktualisiert. In den VMs ist auch die neuste Version von den Integrations Tools installiert.
Member: DerWoWusste
DerWoWusste Dec 22, 2014 at 12:46:58 (UTC)
Goto Top
Nun musst Du wohl oder über genauer hinsehen. Es wird einen kausalen Zusammenhang geben, der in diesen Zeitraum fällt.
Stelle also fest, wann genau es passiert (Überwache von außen per ping), dann hast Du eine sekundengenaue Zeit und kannst nachsehen, was da für Tasks liefen, was für Events geschrieben wurden usw.

Als weiteren Test würde ich eine VM mit einem anderen OS installieren (Linux zum Beispiel) und sehen, wie es der ergeht.
Mitglied: 114260
114260 Dec 22, 2014 at 12:56:44 (UTC)
Goto Top
Okay
ich dachte vielleicht hat jemand noch eine Idee.

Den virtuellen Linux geht es genau so....

Oder ist ein Windows Bug bekannt?
Member: DerWoWusste
DerWoWusste Dec 22, 2014 updated at 13:12:08 (UTC)
Goto Top
Den virtuellen Linux geht es genau so
Das macht die Sache doch interessant. Dann sieht es eindeutig nach einem hostseitigen Problem aus.
Weitere Fragen:
-was loggt Linux währenddessen?
-was bedeutet "Adapter neu starten" für Dich genau (bei Windows/bei Linux)?
-welchen Zustand zeigen die Netzwerkkarten denn vor dem Neustart an (Win/Lin)?
-Laufen auf dem Host geplante Tasks?
-Läuft auf dem Host irgendeine Software außer dem Hypervisor?
Mitglied: 114260
114260 Dec 22, 2014 at 13:22:35 (UTC)
Goto Top
Das macht die Sache doch interessant. Dann sieht es eindeutig nach einem hostseitigen Problem aus.

Ja das Denke ich auch.

-was loggt Linux währenddessen?

kann ich leider nicht sagen da inzwischen kein Linux mehr darauf läuft. Aber ich weis das es auch dort das gleiche Problem war.

-was bedeutet "Adapter neu starten" für Dich genau (bei Windows/bei Linux)?

Rechtsklick auf den Adapter => deaktivieren
Rechtsklick auf den Adapter => aktivieren

Das ganze auf dem Host (Windows Server 2012 R2)

-welchen Zustand zeigen die Netzwerkkarten denn vor dem Neustart an (Win/Lin)?

ganz Normal, keine Fehlermeldungen im Eventlog

-Laufen auf dem Host geplante Tasks?

Nein um diese Zeit nicht erst um 1:00 Uhr

Dazu noch kurz: Es taucht zu 90% um diese Zeit auf(19-21Uhr). Also nicht immer.

-Läuft auf dem Host irgendeine Software außer dem Hypervisor?

Nur noch das Windows Server Backup aber erst um 1:00 Uhr
Member: DerWoWusste
DerWoWusste Dec 22, 2014 at 13:30:10 (UTC)
Goto Top
Ok, ein paar Fragen hat Columbo noch:
-was zeigen die NICs der Gäste an? Bringt ein Neustart der Gast-NIC nichts, und deswegen wurde die Host-NIC neu gestartet, oder wurde das mit der Gast-NIC nie probiert?
-wann suchen die Gäste nach Updates, wann der Host? Schau mal ins Windowsupdate.log
-ist der Host gepatcht?
-das Eventlog des Hosts gibt nichts her zu der Zeit? Mag ich nicht ganz glauben.

Und auf dem Host laufen ganz sicher geplante Tasks - nur nicht welche, die Du erstellt hast, sondern eingebaute. Taste Dich mal über das Eventlog an die Zeiten ran, da sollte genau stehen, wann die NIC wieder aktiviert wurde und im Taskplaner ist auch ein Verlauf/ein Eventlog zur Hand.
Mitglied: 114260
114260 Dec 22, 2014 at 13:39:07 (UTC)
Goto Top
Dann beantworte ich Colombo doch gerne die Fragen

-was zeigen die NICs der Gäste an? Bringt ein Neustart der Gast-NIC nichts, und deswegen wurde die Host-NIC neu gestartet,
oder wurde das mit der Gast-NIC nie probiert?

Die gäste haben einfach keine Verbindung zum Netzwerk das nach dem Adapter kommt. Also untereinander können sie kommunizieren.
Der neustart der Gäste NICs bringt nichts...

-wann suchen die Gäste nach Updates, wann der Host? Schau mal ins Windowsupdate.log

Standard mäßig habe ich das über die GPO auf 3 Uhr morgens gelegt.

-ist der Host gepatcht?

Host auf dem neusten stand mit den Updates

-das Eventlog des Hosts gibt nichts her zu der Zeit? Mag ich nicht ganz glauben.

So habe gerade gemerkt das ich einen komischen Filter drin hatte.
Jetzt spuckt er was aus:

Error

NetBT

A duplicate name has been detected on the TCP network. The IP address of the computer that sent the message is in the data. Use nbtstat -n in a command window to see which name is in the Conflict state.
Member: DerWoWusste
DerWoWusste Dec 22, 2014 updated at 13:43:13 (UTC)
Goto Top
Na bitte, das ist doch schon die Ursache. Ein weiterer Rechner mit dem selnen Namen wie der Host ist im Netzwerk unterwegs. IP siehe Event.
Mitglied: 114260
114260 Dec 22, 2014 at 13:45:10 (UTC)
Goto Top
Kann das von mehreren Netzwerkadaptern kommen?
Da sonst kein weiterer Rechner mit dem Namen unterwegs ist
Member: DerWoWusste
DerWoWusste Dec 22, 2014 at 13:47:32 (UTC)
Goto Top
Hast Du die IP angeschaut? Damit sollte das doch zu finden sein.
Mitglied: 114260
114260 Dec 22, 2014 at 13:49:26 (UTC)
Goto Top
Ja es zeigen 4 verschiedene IPs auf den gleichen Namen.
Aber das sollte ja klar sein da ich 4 Adapter habe
Mitglied: 114260
114260 Dec 22, 2014 at 13:56:34 (UTC)
Goto Top
Ich habe eher eine Meldung gefunden die passt.

Und das auch immer in der zeit 19-21Uhr

Warning
Broadcom NetXtreme Gigabit Ethernet #3: The network link is down. Check to make sure the network cable is properly connected.


Und dies immer wieder auf einem anderen Adapter außer auf dem der nichts mit dem Hyper-V zu tun hat
Member: DerWoWusste
DerWoWusste Dec 22, 2014 at 13:57:03 (UTC)
Goto Top
"zeigen auf den gleichen Namen"? Die anderen 3 IPs sind was, virtuelle Switches?
Mein 12er R2 hat auch 4 Karten, alle 4 sind virtuelle Switches, keine Probleme.

Es ist schwer zu glauben, dass der Fehler wirklich von alleine kommt.
Mitglied: 114260
114260 Dec 22, 2014 at 14:00:03 (UTC)
Goto Top
Sind alles Physische Adapter die dann an einem Virtuellen Switch hängen.

Aber eben wie oben genannt habe ich noch eine neue Meldung gefunden, was ja darauf hinweist das sie die Verbindung verlieren.
Member: jsysde
jsysde Dec 22, 2014 at 14:02:49 (UTC)
Goto Top
Moin.

Hast du die BACS installiert? Machst du das Teaming darüber?
Oder über die integrierte Teaming-Funktion von 2012R2?

Cheers,
jsysde
Mitglied: 114260
114260 Dec 22, 2014 at 14:07:36 (UTC)
Goto Top
Moin

Das Teaming lief über die 2012R2 Funktion. Aber ich habe sie deaktiviert um heraus zu finden ob es daran liegt.
Aber Fehlanzeige
Und seit ich das Teaming deaktiviert habe habe ich den Fehler mit NetBT
Member: jsysde
Solution jsysde Dec 22, 2014, updated at Jan 19, 2015 at 15:29:27 (UTC)
Goto Top
Moin.
Zitat von @114260:
Das Teaming lief über die 2012R2 Funktion. Aber ich habe sie deaktiviert um heraus zu finden ob es daran liegt.
Aber Fehlanzeige
Und seit ich das Teaming deaktiviert habe habe ich den Fehler mit NetBT

Und BACS installiert?
Ich hatte unschöne Effekte bei installierter BACS und Verwendung der 2012R2-Teamingfunktion.

Wenn installiert, tät' ich BACS mal runterwerfen.

Und btw. bei den DELL-Kistchen gibt es doch auch regelmässig Firmware-Updates für alle möglichen Komponenten, sind die auch aktuell? Nicht nur die Treiber?

Cheers,
jsysde
Member: aqui
aqui Dec 22, 2014 at 14:15:17 (UTC)
Goto Top
Machst du das Teaming darüber?
Vermutlich das faslche "Teaming" und nichts was 802.3ad basierend ist mit LACP. Das einzige was Switches verstehen.
MS ist da etwas verwiirend.
Lesenswert dazu ist das:
Windows NIC Teaming
Oder entsprechende Threads hier zu dem Thema:
Grunsatzfrage LAG
Link Aggregation zur Speederhöhung zwischen 2 Switches herstellen
Motherboard mit 2 Onboard LAN Anschlüssen
Traffic am Server auf 2 NICs verteilen
Kann man einen Server zur Performacesteigerung mit 2 Netzwerkkarten parallel an einem Switch betreiben? Wenn ja mit welcher Konfiguration ?
Bonding mit Broadcom - SLB
Ist das nicht sauber umgesetzt kann sowas passieren wie das obige...
Member: psannz
Solution psannz Dec 22, 2014, updated at Jan 19, 2015 at 15:29:09 (UTC)
Goto Top
Sers,

NIC Firmwares sind auch aktuell? Vor nem Jahr gab es mit u.a. bei den R720ern mit Broadcom NICs über mehrere Monate massiv Probleme wenn VMQ von den VMs genutzt wurde. Unabhängig davon ob irgend ein Teaming statt findet.

Grüße,
Philip
Mitglied: 114260
114260 Dec 22, 2014 at 14:20:18 (UTC)
Goto Top
Jetzt wo du es sagst. Das Management von Broadcom habe ich etwa 1 Woche bevor es angefangen hat installiert.
Ich schmeiße das definitiv einmal runter.
Mitglied: 114260
114260 Dec 22, 2014 at 14:24:53 (UTC)
Goto Top
Die Links werde ich mir mal durchsehen.

Die Firmware habe ich nie aktualisiert aber das ganze hat 3 Monate funktioniert und die einzige Änderung war das ich diese Managementkonsole installiert habe.
Deinstallieren, Reboot und ein paar Tage warten.

Danke für die Kommentare, ich meld mich dann nachdem ich es getestet habe.

LG Gadlae
Mitglied: 114260
114260 Jan 19, 2015 at 15:28:55 (UTC)
Goto Top
Also nach der Aktualisierung von der Firmware und der Neuinstallation von den Netzwerkadaptern läuft alles ohne Probleme.
mal sehen wie es weitergeht.

Danke für die Hilfe face-smile

LG Gadlae