hesch84
Goto Top

TP-Link TL-SG2008 und LACP Probleme

Hallo zusammen,

ich brauche etwas Hilfe bei meinem Switch.

Ich hab mir einen TP-Link TL-SG2008 gekauft um damit zwei 2-Port LACP Trunks für meinen Server und meine Qnap TS421 NAS zu machen um die Bandbreite zu erhöhen.
Aber das klappt nicht wie gewollt face-sad

Switch Details:
TP-Link TL-SG2008
Firmware Version: 1.0.1 Build 20150203 Rel.51147
Hardware Version: TL-SG2008 1.0

Server Details:
Server hat Windows Server 2012R2 als OS
Hardware ist ein Asus Mainboard Asus P8H67-V und TP-Link TG-3468 PCIe x1 LAN Adapter.
Ich nutze die Onboard Nic und den TP-Link TG-3468 PCIe x1 in einem Nic Team konfiguriert als LACP Trunk

Qnap Details:
Qnap NAS TS421 with OS QTS 4.1.3


Konfiguration 1:
Beides (Qnap und Server) sind mit einem LACP Trunk konfiguriert und je ein Trunk für sie im Switch.
Der Trunk vom Server funktioniert super bis ich die Qnap in den Switch stecke ... danach dauert es ca. zwei Minuten und der Switch schaltet alle Ports ab.
Außer zwei ... der eine ist der Port auf dem der TP-Link TG-3468 PCIe x1 Adapter ist, aber er ist reduziert auf 10Mbit/s und der zweite ist der erste Port der Qnap welcher aber immer noch mit 1000MBit/s angezeigt wird.
Einziger Weg den Switch wieder ans arbeiten zu bringen ist den TP-Link Adapter und die zweite Nic der Qnap zu ziehen und den Switch kurz vom Strom zu trennen.

Zum testen hab ich folgendes gemacht

Konfiguration 2:
Kein LACP mehr.
Nur eine Nic der Qnap ist mit Switch verbunden und auf dem Server ist ein Switch unabhängiges Teaming eingeschaltet
Vom Server sind beide Karten an den Switch angeschlossen, die Onboard und der zusätzliche TP-Link Adapter.
Aber immer noch das gleiche ... der Switch schaltet wieder nach kurzer Zeit alle Ports ab bis auf die beiden oben beschriebenen.

Konfiguration 3:
LACP Trunk auf der Qnap
Beide Ports auf der Qnap sind am Switch angeschlossen.
Switch unabhängiges Teaming ist auf dem Server eingeschaltet
Aber nur die Onboard Karte ist mit dem Switch verbunden.
Der Switch schaltet nun alle Ports bis auf den Trunk der Qnap ab.

Die einzige lauffähige Version im Moment ist die Onboard Karte des Server zu nehmen und die erste Nic der Qnap.

Ich hab da nun keine Idee mehr und hoffe ihr könnt mir weiter helfen.

Content-Key: 267808

Url: https://administrator.de/contentid/267808

Printed on: April 25, 2024 at 19:04 o'clock

Member: aqui
aqui Mar 29, 2015 updated at 18:36:27 (UTC)
Goto Top
danach dauert es ca. zwei Minuten und der Switch schaltet alle Ports ab.
Das ist natürlich Unsinn, denn das kann der Switch ja gar nicht, es sei denn der supportet sowas wie einen Error Disable Mode was solche billigen China Böller aber nicht können.
Letztlich zeigt es aber das das mit der LAG (Link Aggregation) Konfig im QNAP etwas nicht stimmt. Vermutlich loopt der QNAP zwischen den beiden Ports und der Netzwerk Loop legt dann dein Netz lahm ?!
Das wäre eine sinnvollere Erklärung.
Du solltest sicherstellen das du einen IEEE 802.3ad konformen LAG mit LACP erstellst.
Genau das gleiche giltnatürlich für den Server.
Windows hat eine Menge LAG und Backup Szenarien mit mehreren NICs aber auch hier ist mit einem Switch ausschliesslich nur die IEEE 802.3ad Variante mit LACP nutzbar mit einem Switch.
Dieses Dokument aus der MS Knowledgebase beschreibt das recht genau:
http://www.microsoft.com/en-us/download/details.aspx?id=40319

Aber du sagtest ja auch beim Server klappt das und der LAG wird gebildet. Ob das wirklich so ist solltest du immer im Status GUI des Switches wasserdicht überprüfen, denn sonst kan es zu bösen Effekten im Netz kommen mit Loops oder Teilloops wie beim QNAP.
Dazu ein wichtiger Tip: So ein managebarer Switch supportet Spanning Tree !
Du solltest immer beim Einsatz von LACP LAGs zwingend Spanning Tree aktivieren und wenn supportet immer die RSTP Variante ! (Rapid Spanning Tree)
Damit wirkst du schlamping programmierten Treibern und fehlerhaften LAG Verhalten mit Looping entgegen und schützt dein Netzwerk davor.

Fazit:
Du hast vermutlich gar kein LACP Teaming aktiviert sondern irgendeins der zahllosen Failover Konfigurationen mit Mehrfach LAGs.
Dabai kommt es dann immer zu Netzwerk Loops mit dem Verhalten was du siehst.
Überprüfe also insbesondere die LAG Konfiguration des Servers und des QNAPs.
Auf dem QNAP 421 kann man das wasserdicht über einen Shell Zugriff machen z.B. SSH im NAS aktivieren und PuTTY nutzen für den Zugang:
[~] # ifconfig | grep bond
bond0 Link encap:Ethernet HWaddr xx:xx:xx:BD:91:EA


...und dann den Status checken: :

[~] # cat /proc/net/bonding/bond0
Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)

Bonding Mode: IEEE 802.3ad Dynamic link aggregation
Transmit Hash Policy: layer2 (0)
MII Status: up
MII Polling Interval (ms): 100
Up Delay (ms): 0
Down Delay (ms): 0

802.3ad info
LACP rate: slow
Min links: 0
Aggregator selection policy (ad_select): stable
Active Aggregator Info:
Aggregator ID: 1
Number of ports: 2
Actor Key: 17
Partner Key: 5
Partner Mac Address: xx:xx:xx:6c:99:bf

Slave Interface: eth0
MII Status: up
Speed: 1000 Mbps
Duplex: full
Link Failure Count: 1
Permanent HW addr: xx:xx:xx:bd:91:ea
Aggregator ID: 1
Slave queue ID: 0

Slave Interface: eth1
MII Status: up
Speed: 1000 Mbps
Duplex: full
Link Failure Count: 1
Permanent HW addr: 00:08:9b:bd:91:eb
Aggregator ID: 1
Slave queue ID: 0


Erst wenn du sowas siehst ist es wirklich ein LACP Link ! Details kannst du dazu auch noch hier nachlesen:
Netzwerk Management Server mit Raspberry Pi
(Im QNAP werkelt ein Linux)

Die Windows spezifischen Setup To Dos erklärt das obige MS Dokument.

Auf dem Switch kann man nicht viel faslch machen. Seite 28 ff. des Handbuchs erklärt das:
http://www.tp-link.com.de/resources/document/TL-SG2008_V1_CLI.pdf
Willst du also die Ports 4 und 5 für den LAG aktivieren dann ist das schnell und einfach gemacht. Kommando ist so ein bischen wie bei Cisco:
TL-SG2008(config)# interface range gigabitEthernet 1/0/4-5
TL-SG2008(config-if-range)# channel-group 1 mode on

Fertig !

Mehr ist nicht zu tun.
Ganz wichtig:
  • Bei angeschlossenen Endgeräten WAS sagt ein show etherchannel oder show etherchannel 1 detail ? UND
  • was sagt ein show lacp oder schow lacp 1 detail ?
Wenn du diese Outputs hier mal postest wäre das sehr hilfreiche fürs Troubleshooting !!

Ist das alles richtig eingestellt sollte es dann auf Anhieb klappen.
Member: Hesch84
Hesch84 Mar 29, 2015 at 21:32:13 (UTC)
Goto Top
Hab noch etwas getestet

Im Moment eingerichtet auf dem Switch ist nur ein LACP Trunk für den Server
Details siehe hier:

TL-SG2008#show etherchannel 2 detail
Group state = L2
Ports: 2 MaxPorts = 8
Protocol: LACP
Ports in the group:
-------------------
Flags: S - Device is sending Slow LACPDUs F - Device is sending fast LACPDUs.
A - Device is in active mode. P - Device is in passive mode.

Local information:
LACP port Admin Oper Port
Port Flags State Priority Key Key State
Gi1/0/5 SA Up 32768 0x2 0xb96 0x3d
Gi1/0/6 SA Up 32768 0x2 0xb96 0x3d

TL-SG2008#show lacp internal
Flags: S - Device is requesting Slow LACPDUs
F - Device is requesting Fast LACPDUs
A - Device is in active mode P - Device is in passive mode

Channel group 2
LACP port Admin Oper Port Port
Port Flags State Priority Key Key Number State
Gi1/0/5 SA Up 32768 0x2 0xb96 0x5 0x3d
Gi1/0/6 SA Up 32768 0x2 0xb96 0x6 0x3d


TL-SG2008#show lacp neighbor
Flags: S - Device is requesting Slow LACPDUs
F - Device is requesting Fast LACPDUs
A - Device is in active mode P - Device is in passive mode

Channel group 2
LACP port Admin Oper Port Port
Port Flags Priority Dev ID Key Key Number State
Gi1/0/5 FA 0 e894.f602.52a1 0 0 0x2 0x3f
Gi1/0/6 FA 0 e894.f602.52a1 0 0 0x1 0x3f


Für die Qnap hab ich keinen Trunk eingerichtet
Sie hat auch keinen Trunk konfiguriert sonder nur single NICs.

Was ich nun festgestellt habe ist der Switch stürzt aber auch ab wenn ich neben dem LACP Trunk des Servers nur eine Netzwerkkarte der Qnap mit dem Switch verbinde.
Es sind dann wieder alle Ports "aus" als wäre kein Netzwerkkabel angeschlossen obwohl die Kabel stecken.
Außer eben die beiden wie schon beschrieben die bleiben aktiv.
Member: aqui
aqui Mar 30, 2015 updated at 07:45:01 (UTC)
Goto Top
Für die Qnap hab ich keinen Trunk eingerichtet
Sie hat auch keinen Trunk konfiguriert sonder nur single NICs.
Das ist natürlich klar das du das machen musst !
OHNE einen Trunk darfst du nur EINEN Port auf den Switch verbinden, klar !

Die show Anzeigen des Switches sind irgendwie sinnfrei...sorry. Da kannst du sicher nichts für aber da steht "L2". Was soll das heissen ?ß 2 OK, 2 Ports aber L ?
Hast du jetzt einen sauber konfigurierten LACP Trunk vom Server dran der funktioniert ?
Was sagt das Server Log ? Zeigt der an das der LACP Trunk geformt ist ?

In den Flags wird alles erklärt aber nicht was L ist... Vermutlich LACP
Genau das gleiche Drama bei den anderen Ports. Der Output hilft keinem und man weiss nun nicht wirklich ob die LACP LAGs aktiv sind.
OK, es steht zwar "Up" da aber was ist das nun ?? Physischer Link ist up oder LACP Trunk ist up ?

Das ist alles Schrott, frustrierend und wundert auch nicht wenn man solch billigen China Mist kauft.
Hättest du besser einen Cisco SG-200-8 gekauft da kann man eindeutig den Status sehen und das auch sauber konfigurieren.
Mit dem China Schrott ist das nur Mist face-sad
Bewahrheitet sich mal wieder der Spruch: Wer billig kauft kauft zweimal.

Bevor du den tauschst checke mal wasserdicht das der Switch wirklich die aktuellste Firmware geflasht hast !!
http://www.tp-link.com.de/support/download/?model=TL-SG2008&version ...

Wenn nicht flashen, und den ganzen Kram nochmal testen !
Member: Hesch84
Hesch84 Mar 30, 2015 at 19:30:16 (UTC)
Goto Top
So wieder etwas ausprobiert.
Ich glaube nun das der Server dieses Chaos verursacht.
Meine Vermutung ist das die beiden Netzwerkkarten doch nicht richtig Teamfähig sind.
Aktuell ist die Qnap mit einem LACP Trunk am Switch angeschlossen und der Server hat beide Karten als Single NICs eingestellt und mit dem Switch verbunden.
Der Switch läuft so nun seit über drei Stunden stabil.
Member: aqui
Solution aqui Mar 31, 2015, updated at Apr 06, 2015 at 10:10:46 (UTC)
Goto Top
Meine Vermutung ist das die beiden Netzwerkkarten doch nicht richtig Teamfähig sind.
Das könnte sein wäre aber sehr unwahrscheinlich, da die 802.3ad und LACP Funktion von Windows direkt kommt.
Es mag aber sein das der Treiber da Kinken macht.
Sinnvoll ist es hier immer die aktuellsten Treiber vom Chipsatzhersteller zu nehmen. Wenn es also Intel, Broadcom oder Realtek usw. ist dann lade dir dort die aktuellsten Treiber runter und update die Kiste.
Sehr wichtig ist aber auch das du bei Windows den korrekten Teaming Modus einstellst, sonst geht das schief !
Im o.a. zitierten MS Knowledgebase Dokument steht auf Seite 33 ff., Kapitel 4.3 Creating a team ganz genau wie das geht.
Wichtig ist hier:
  • Switch dependant
  • Hash based (Alternativ kannst du hier mal "Dynamic" testen)
  • Load Distribution Mac Adress
  • KEIN Standby (all active)
Ebenfalls wichtig ist es den Team zu checken ob er sauber gebildet wurde ! Kapitel 4.6 Checking the status of a team

Am QNAP kannst du ja sehen das es funktioniert.
Aktuell ist die Qnap mit einem LACP Trunk am Switch angeschlossen und der Server hat beide Karten als Single NICs eingestellt
Diese Aussage ist allerdings recht verwirrend face-sad
WAS ist hier mit "Server" gemeint ?
Der QNAP oder der Winblows Server ? Du sagst ja das du den Winblows gar nicht mit Teaming nageschlossen hast. In so fern ist das unverständlich was du mit der Aussage technisch meinst.
Member: Hesch84
Hesch84 Apr 05, 2015 at 10:29:54 (UTC)
Goto Top
Entschuldige das ich mich erst jetzt melde, aber hatte vorher nicht so recht die Zeit.

So, nun läuft das ganze.
Es waren doch die Treiber der Netzwerkkarten im Server.
Nachdem ich beide Karten mit neuen Treibern versorgt und neugestartet hatte, konnte ich den den LACP Trunk einrichten und alles läuft stabil.

Ich danke dir für deine Tipps. face-smile

Wünsche Frohe Ostertage.
Member: aqui
aqui Apr 06, 2015 updated at 09:52:26 (UTC)
Goto Top
Es waren doch die Treiber der Netzwerkkarten im Server.
Wie immer bei Microsoft face-wink

Klasse wenns nun rennt wie es soll !!

Bitte dann auch
How can I mark a post as solved?
nicht vergessen !