TeamSpeak Server laggt in unregelmäßigen Abständen

  • Hallo,


    seit geraumer Zeit bin ich hier bereits stiller Mitleser und möchte mich für die zahlreichen und hilfreichen Ratschläge bedanken. Leider komme ich mit einem Problem partout nicht weiter und benötige deshalb Rat und Erfahrungen anderer.


    Für unser Projekt hatten wir lange Zeit einen Linux vserver (mit mir leider unbekannten Spezifikationen). Da ich Linux für unkomfortabel zu verwalten (ja steinigt mich alle :D ) halte, war klar, dass wir da unser Admin aus dem Projekt ausgestiegen ist einen Windows vserver nehmen werden.
    Angestrebt ist ein einzelner TeamSpeak Server mit derzeit maximal 256 Slot (AAL). Die durchschnittliche Auslastung zu Spitzenzeiten beträgt ca. 130-160 Clients.


    Gesagt getan, der Server ist auch ausschließlich für TeamSpeak geplant und verwendet worden. Es läuft nichts anderes nebenbei abgesehen von den Windowsdiensten, die für den Betrieb essentiell notwendig sind, kein Webserver, kein sql Server usw.



    Maschine 1 auf dem der Server seit 19.12.2016 lief, hatte folgende Kernspezifikationen:
    4 vCores (Intel Xeon v3 mit 2,7Ghz)
    6GB RAM
    200GB SSD
    Virtualisierung: Virtuozzo
    Betriebssystem :Windows Server 2012 R2 Datacenter (aktiviert)
    Anbindung: 100 Mbit


    Da in der Weihnachtszeit bekanntlich wenig los war, bewegten sich die Nutzerzahlen in geringen Rahmen, es gab keine oder für uns nicht auffällige Lags. Was sich dann jedoch in der zweiten Januarwoche und steigenden Nutzerzahlen änderte.
    Die Lags äußern sich in einem mehr oder weniger hohen (teilweise bis 500 ms) Anstieg der Latenz sämtlicher Clients auf dem Server.
    Nach endloser sowie ergebnisloser Ursachensuche und einigen Tickets mit dem Support entschieden wir uns, zu einen anderen Anbieter mit deutlich mehr Leistung zu wechseln.



    Maschine 2 auf dem der Server seit 25.01.2017 läuft, hatte folgende Kernspezifikationen:
    16 vCores (Intel Xeon v3 mit 2,7Ghz)
    24 GB RAM
    1000 GB HDD SSD boosted
    Virtualisierung: Virtuozzo
    Betriebssystem : Windows Server 2012 R2 Datacenter (nicht aktiviert)
    Anbindung: 300 Mbit


    Nach dem zweiten Umzug stellte sich leider ebenfalls schnell wieder Laggs ein, eine erneute Ursachensuche brachte keine Ergebnisse. Es gibt einfach zu viele Einflussfaktoren, die eine Rolle spielen könnten ...


    Von mir wurde auf beiden Server der Remoteport verändert und TeamSpeak entsprechend in der jeweils aktivierten Firewall freigegeben. Mehr habe ich nicht unternommen.


    Dem Protokoll konnte ich die letzten paar Lags entnehmen, dass vermutlich immer Icons von Usern heruntergeladen wurden (wir haben über 70 verschiedene Icons), dies hätte jedoch auf dem ersten Server mit SSD funktionieren müssen ...


    Wie auch immer, hat irgendjemand ähnliche Erfahrungen mit unerklärlichen Lags gemacht und kennt eine Lösung?


    Ich kann natürlich noch wesentlich detailliertere Ausführungen machen, aber möchte die Leute nicht gleich mit einem riesigen Erstbeitrag erschrecken :D

    Mit freundlichen Grüßen


    Nanum

    Einmal editiert, zuletzt von Nanum ()

    • Offizieller Beitrag

    Hallo,
    herzlich Willkommen und kein Problem! Dafür ist das Forum doch da - um zu helfen. ;)

    Die durchschnittliche Auslastung zu Spitzenzeiten beträgt ca. 130-160 Clients.


    16 vCores (Intel Xeon v3 mit 2,7Ghz)
    24 GB RAM
    1000 GB HDD SSD boosted
    Virtualisierung: Virtuozzo
    Betriebssystem : Windows Server 2012 R2 Datacenter (nicht aktiviert)
    Anbindung: 300 Mbit


    der Server ist auch ausschließlich für TeamSpeak geplant und verwendet worden.


    Das ist dann aber schon leicht übertrieben, oder? :D


    Für einen Windows Server 2012 R2 würde ich nur einen Dual-Core Prozessor und 4 GB bis höchstens 8 GB RAM verplanen. Eine 100 Mbit/s Leitung hätte wahrscheinlich auch gereicht, aber das ist denke


    Wie auch immer... Nun zum eigentlichen Problem: Derartige Probleme zu debuggen ist immer etwas schwierig, weil das alles mögliche sein kann. Angefangen vom Betriebssystem, über den Kernel, bis hin zur Firewall, DDoS Protection und Software.


    Da du es extra hingeschrieben hast: Verschwinden die Probleme, sobald Windows aktiviert ist und du den Server mal neugestartet hast? Windows macht einige seltsame Sachen, wenn es nicht aktiviert ist. Bei einem Kunden hatte ich z.B. das Problem, dass sich deren Windows Server immer einfach mal neugestartet hat, nur weil er nicht aktiviert war.


    Virtualisierung: Virtuozzo


    Von der Virtualisierung Virtuozzo - Containers, VMs, Storage Virtualization habe ich z.B. noch nie etwas gehört. Ich kann dir daher z.B. nicht sagen, ob es wie bei VMware spezielle Treiber gibt, die die Performance optimieren oder ob man irgendwelche Einstellmöglichkeiten hat, die es entsprechend optimieren. Unter die Einstellungen fallen z.B. bestimmte Typen von "virtuellen Disks" oder auch Hardwarenahe Einstellungen wie Limitierungen von irgendwelchen Bandbreiten (CPU, RAM, Storage, Netzwerk,...).


    Xen z.B. fährt standardmäßig mit "angezogener Handbremse". Hier muss man erst einige Einstellungen vornehmen, um eine entsprechend vernünftige Performance zu erhalten. Ich hatte hier auch mal diverse Performance Probleme aufgrund von einem falsch verwendeten Kernel, dem die Xen Treiber fehlten.


    Bei Proxmox - Open-Source Server-Software habe ich z.B. noch nie irgendwas verändert. Der Hypervisor läuft von Anfang an ohne Probleme.


    Nachdem man diese Probleme ausschließen kann oder auch will: Hat der Server eine DDoS Protection? Hat diese vielleicht Probleme bei der Erkennung der Angriffsmuster und reagiert zu spät?


    Ein anderes Problem können auch die Routen zum Server sein. Hat ein Router einen Engpass und droppt Pakete? Am besten einfach über eine längere Zeit an die Leitung messen und prüfen, ob und wo es dann entsprechende Verbindungsprobleme gibt. Das kannst du mit WinMTR Download machen. Beachte hierbei bitte, dass du einmal vom Client zum Server und gleichzeitig auch anders rum messen musst, um entsprechende Werte auswerten zu können.

  • Hallo @Sebbo,


    herzlich Willkommen und kein Problem! Dafür ist das Forum doch da - um zu helfen.


    herzlichen Dank für die freundliche Antwort :thumbup: . Habe schon nahezu alle deine Guides hier (auch die, die Linux betreffen) einfach aus Interesse gelesen. Ich kenne TS3 schon seit der Alpha und wir hatten bei diversen Projekten eigentlich nie Probleme (sowohl mit Linux als auch Windows vservern)
    Back to Topic:

    Das ist dann aber schon leicht übertrieben, oder?


    Da hast du völlig Recht ;(;( Aber wir waren derart verzweifelt, weil sich einfach die Leute (zu Recht) über die Lags beschweren.


    weil das alles mögliche sein kann.


    Das sehe ich genauso, doch kann ich vieles ausschließen. Die TS Instanz habe ich komplett neu installiert. Querry Port und der Datenport sind auch custom und in der Firewall erlaubt. Ebenso die wichtigen Voice und der andere komische Port (Name ist mir gerade leider entfallen)
    Die Datenbank hatten wir auch mal kurz als mariadb, hat keine Besserung gebracht. Auf dem aktuellen Server läuft wieder eine sqlite.


    Der Server steht in Düsseldorf, Anbindung und Routing waren bisher fehlerfrei. Die Nutzer haben auch (sofern es nicht gerade laggt) sehr gute Pings.


    Zusätzliche Software wurde von uns nicht installiert. Also kein Plesk oder Verwaltungstools, wie ich auch im Ausgangspost schon beschrieben hatte.


    Da ich keine Windows Server 2012 R2 Datacenter Lizenz besitze kann ich Windows auch nicht aktivieren. Der Anbieter weißt auch an keiner Stelle darauf hin, das man den vserver ohne Windows Lizenz erhalten wird ... .
    Grundlose Neustarts oder sonstige Fehler gab es bisher auf Grund der fehlenden Aktivierung nicht.


    Neu gestartet haben wir den Server schon sehr oft, bringt keine Verbesserung. Stand heute, 31.01.2017: Es gab sowohl Lags mit sehr wenigen Nutzern online, später dann 1-4 größere aber deutlich weniger schlimme Lags als in den vergangenen Tagen.


    Meine Vermutung ist schlicht, andere Container auf der selben dedizierten Maschine reißen unseren armen TS3 Server durch Überlastung der CPU oder Verursachung der CPU Spitzern mit runter bevor die Virtualisierung denen die Leistung kürzt bzw. einfach eine Nebenwirkung der Virtualisierung, das konnte der Support auf Anfrage auch nicht ausschließen.


    VMware


    Haben wir schon von gelesen, funktioniert anders als Virtuozoo. Zu den genauen Details der Virtualisierung kann ich auch nichts sagen, da das nicht von uns durchgeführt wurde.


    Nachdem man diese Probleme ausschließen kann oder auch will: Hat der Server eine DDoS Protection? Hat diese vielleicht Probleme bei der Erkennung der Angriffsmuster und reagiert zu spät?


    Eine DDOS Protection ist im Preis enthalten. Nach Auskunft des Anbieters unterlag oder unterliegt weder unser Server noch ein anderer auf der Maschine befindlicher Server einem DOS, DDOS. Kein flooding, gar nichts.


    Ein anderes Problem können auch die Routen zum Server sein. Hat ein Router einen Engpass und droppt Pakete? Am besten einfach über eine längere Zeit an die Leitung messen und prüfen, ob und wo es dann entsprechende Verbindungsprobleme gibt. Das kannst du mit WinMTR Download machen. Beachte hierbei bitte, dass du einmal vom Client zum Server und gleichzeitig auch anders rum messen musst, um entsprechende Werte auswerten zu können.


    Auch das haben wir bereits getan bevor ich mich hier gemeldet habe. Sämtliche Tracerts waren ohne Packet Loss und äußerst positiv ohne Auffälligkeiten. Durchgeführt von mehreren Usern (Admins).
    Wie gesagt ich will hier keinem zur Last fallen, aber da man auch im Internet kaum etwas zu dieser Art von Problem findet, war das leider die letzte Möglichkeit. ;(;(


    Meine Vermutung geht inzwischen dahin, dass es einfach, wie schon beim ersten Server (der Support von HE ist auch einfach nur noch schlecht) die vermutliche Ursache gewesen ist, liegt. Aber das kann man ja letztendlich nie ohne entsprechende Daten, an die man nicht herankommt wissen.
    Es kann doch nicht sein,dass ich für einen TS3 Server inzwischen einen dedizierten Server mieten oder kaufen muss ...


    Edit 1 01.02.2017: Im Anhang mal ein Auszug aus dem tskmanager zum Zeitpunkt des Lags, möge mir jemand sagen was er will, aber das ist nicht von TeamSpeak verursacht.

    Mit freundlichen Grüßen


    Nanum

    4 Mal editiert, zuletzt von Nanum ()

    • Offizieller Beitrag

    Querry Port und der Datenport sind auch custom


    Ebenso die wichtigen Voice und der andere komische Port (Name ist mir gerade leider entfallen)


    Das würde ich nicht unbedingt machen, weil einige DDoS Protections schützen nur die Standardports. Voxility z.B. schützt nur die Standard-Voiceports 9000 bis 9999. Alles andere würden die nicht filtern.


    Da aber bereits gesagt wurde, dass keine Angriffe erfolgten, ist das erstmal irrelevant, denn das scheint ja dann nicht die Ursache zu sein.


    Zu deinen Screenshots: 542 Threads klingen finde ich übertrieben viel, wenn da nur Windows + TeamSpeak drauf läuft. Dennoch wirkt die Auslastung minimal.


    Wenn ich es richtig verstanden habe, hostest du den Hypervisor selbst, richtig? Somit hast du also vollen Zugriff auf das Host-System und kannst dir dessen Werte (CPU, RAM, Performance,...) anschauen. Ich vermute ein Problem zwischen Host und Gast selbst.


    Machbar ist es auf jeden Fall, dass alles auf dem selben Host läuft.

  • Huhu,

    Standard-Voiceports


    die Voice-Ports sind auch nicht verändert worden, das habe ich oben falsch beschrieben.


    Zu deinen Screenshots: 542 Threads klingen finde ich übertrieben viel, wenn da nur Windows + TeamSpeak drauf läuft.


    Nach Auskunft des Betreibers funktioniet auf Grund der Virtualisierung der Task- und Ressourcenmanager nicht korrekt bzw. zeigt einfach falsche Werte an. Fakt ist, das es wenn, wie auf den Bildern ersichtlich, eine extreme CPU Spitze war, gelaggt hat.


    Wenn ich es richtig verstanden habe, hostest du den Hypervisor selbst, richtig?


    Da ich nicht wirklich verstehe was du hiermit meinst würde ich das negieren, der vserver ist gemietet, wie bereits gesagt sind Werte wie CPU, RAM, Performance, usw. für mich somit nicht eindeutig ablesbar.


    Ich vermute ein Problem zwischen Host und Gast selbst.


    Was bedeutet das?


    Ansonsten haben wir nun eine KVM gemietet und dort scheint auf den ersten Blick alles wesentlich seriöser zu sein. Die dort angebotene Leistung scheint wohl auch der realen zu entsprechen.
    Mein Fazit des Ganzen: Die Hostinganbieter schienen ihren Kunden den Himmel auf Erden anzubieten, ohne dann im entferntesten performante Leistung zu erbringen. Wir haben unseren Server nie wirklich belastet und haben Lags ...


    Sollten sich die Probleme ohne weitere Änderung verflüchtigen, werde ich dies hier berichten. Dann wissen wir zumindest, dass ein paar vserver Anbieter einfach nichts taugen.


    Edit 1 02.02.2017: Der Umzug ist nun komplett.

    Mit freundlichen Grüßen


    Nanum

    Einmal editiert, zuletzt von Nanum ()

  • Dieses Thema enthält 3 weitere Beiträge, die nur für registrierte Benutzer sichtbar sind, bitte registrieren Sie sich oder melden Sie sich an um diese lesen zu können.