BLOG | NGINX

HTTP-Keepalive-Verbindungen und Web-Performance

Owen Garrett

Veröffentlicht am 14. März 2014

Haben Sie einen Server im Labor gemessen und dann im Echtbetrieb eingesetzt, nur um festzustellen, dass die Leistung lange nicht an das Testergebnis heranreicht? Die CPU-Auslastung bleibt niedrig, es gibt viele freie Ressourcen, dennoch klagen die Nutzer über langsame Reaktionszeiten – und Sie finden keinen Weg, die Serverauslastung zu steigern.

Was Sie beobachten, ist ein Effekt dessen, was wir „HTTP Heavy Lifting“ nennen können. In diesem Blogbeitrag untersuchen wir, wie HTTP funktioniert und wie gängige HTTP-Server HTTP-Transaktionen verarbeiten. Wir sehen uns einige der Leistungsprobleme an, die auftreten können, und sehen, wie das ereignisgesteuerte Modell von NGINX es zu einem sehr effektiven Beschleunigungsproxy für diese HTTP-Server macht. Mit NGINX können Sie Ihre tatsächliche Leistung steigern, sodass sie wieder das Niveau Ihrer lokalen Benchmarks erreicht.

Hinweise zum Optimieren von Linux und NGINX zur Verbesserung der Geschwindigkeit und Skalierbarkeit Ihrer Anwendungen finden Sie unter „Tuning von NGINX für die Leistung“ in unserem Blog.

Eine Einführung in HTTP und Keepalive-Verbindungen

HTTP-Keepalive-Verbindungen sind eine notwendige Leistungsfunktion, die die Latenz reduziert und ein schnelleres Laden von Webseiten ermöglicht.

HTTP ist ein einfaches, textbasiertes Protokoll. Wenn Sie dies noch nicht getan haben, werfen Sie einen Blick auf die Ausgabe eines HTTP-Debugging-Tools, beispielsweise des Tools in Ihrem Webbrowser, und sehen Sie sich die Standardstruktur für Anfragen und Antworten an:

Ein HTTP-Client stellt in der einfachsten Form eine neue TCP-Verbindung zum Zielserver her, sendet die Anfrage und empfängt die Antwort. Anschließend schließt der Server die TCP-Verbindung, um die Serverressourcen freizugeben.

Insbesondere bei komplexen Webseiten mit vielen Elementen oder langsamen Netzwerkverbindungen kann diese Vorgehensweise sehr ineffizient sein. Zum Erstellen einer neuen TCP-Verbindung ist ein „Drei-Wege-Handshake“ erforderlich, und zum Trennen der Verbindung ist zusätzlich ein Zwei-Wege-Shutdown-Verfahren erforderlich. Das wiederholte Erstellen und Schließen von TCP-Verbindungen, jeweils eine für jede Nachricht, ist vergleichbar mit dem Auflegen und erneuten Wählen nach jeder gesprochenen Person in einem Telefongespräch.

HTTP verwendet einen Mechanismus namens Keepalive-Verbindungen, um die TCP-Verbindung zwischen dem Client und dem Server nach Abschluss einer HTTP-Transaktion offen zu halten. Wenn der Client eine weitere HTTP-Transaktion durchführen muss, kann er die inaktive Keepalive-Verbindung verwenden, anstatt eine neue TCP-Verbindung herzustellen.

Clients öffnen im Allgemeinen mehrere gleichzeitige TCP-Verbindungen zu einem Server und führen über alle diese Verbindungen Keepalive-Transaktionen durch. Diese Verbindungen bleiben offen, bis entweder der Client oder der Server entscheidet, dass sie nicht mehr benötigt werden. Dies ist im Allgemeinen auf ein Leerlauf-Timeout zurückzuführen.

Moderne Webbrowser öffnen normalerweise sechs bis acht Keepalive-Verbindungen und halten sie mehrere Minuten lang offen, bevor sie ablaufen. Webserver können so konfiguriert werden, dass für diese Verbindungen eine Zeitüberschreitung auftritt und sie früher geschlossen werden.

Welchen Effekt haben Keepalives auf den HTTP-Server?

Wenn viele Clients HTTP-Keepalives verwenden und beim Webserver ein Parallelitätslimit oder ein Skalierbarkeitsproblem vorliegt, sinkt die Leistung rapide, sobald dieses Limit erreicht ist.

Der oben beschriebene Ansatz zielt darauf ab, einem einzelnen Kunden die bestmögliche Leistung zu bieten. Wenn in einem Szenario wie dem der „ Tragödie der Allmende “ alle Clients auf diese Weise arbeiten, kann sich dies leider nachteilig auf die Leistung vieler gängiger Webserver und Webanwendungen auswirken.

Der Grund dafür ist, dass viele Server ein festes Parallelitätslimit haben. Beispielsweise kann der Apache-HTTP-Server in gängigen Konfigurationen nur eine begrenzte Anzahl gleichzeitiger TCP-Verbindungen verarbeiten: 150 mit dem Worker Multiprocessing Module (MPM) und 256 mit dem Prefork MPM. Jede inaktive HTTP-Keepalive-Verbindung verbraucht einen dieser Parallelitätsslots, und wenn alle Slots belegt sind, kann der Server keine weiteren HTTP-Verbindungen annehmen.

Die allgemeine Meinung besagt, dass Keepalives auf dem Webserver deaktiviert oder auf eine sehr kurze Lebensdauer begrenzt werden sollten. Sie bieten einen sehr einfachen Vektor für die Denial-of-Service- Angriffe SlowHTTPTest und Slowloris (eine schnelle Lösung finden Sie unter „Schutz vor Keep-Dead-Denial-of-Service“ auf serverfault.com).

Darüber hinaus weisen diese Web- und Anwendungsserver normalerweise jeder Verbindung einen Thread oder Prozess des Betriebssystems zu. Eine TCP-Verbindung ist ein sehr leichtes Betriebssystemobjekt, ein Thread oder Prozess hingegen ist sehr schwergewichtig. Threads und Prozesse benötigen Speicher, sie müssen aktiv vom Betriebssystem verwaltet werden und der „Kontextwechsel“ zwischen Threads oder Prozessen verbraucht CPU. Es ist äußerst ineffizient, jeder Verbindung einen eigenen Thread oder Prozess zuzuweisen.

Die große Anzahl gleichzeitiger Clientverbindungen und die Zuweisung eines Threads oder Prozesses zu jeder Verbindung führt zu dem als „HTTP Heavy Lifting“ bekannten Phänomen, bei dem für die Verarbeitung einer einfachen HTTP-Transaktion ein unverhältnismäßig großer Aufwand erforderlich ist.

Was bedeutet das in der Praxis?

Es sind nicht viele Clients erforderlich, um das Parallelitätslimit vieler moderner Web- und Anwendungsserver auszuschöpfen.

Wenn ein Client 8 TCP-Verbindungen öffnet und jede 15 Sekunden lang nach der letzten Verwendung aufrechterhält, verbraucht der Client 15 Sekunden lang 8 Parallelitätsslots. Wenn Clients Ihre Website mit einer Geschwindigkeit von 1 pro Sekunde besuchen, sind 120 Parallelitätsslots ständig durch inaktive Keepalive-Verbindungen belegt. Wenn die Rate 2 Clients pro Sekunde beträgt, werden 240 Parallelitätsslots belegt. Wenn die Slots erschöpft sind, können neue Clients keine Verbindung mehr herstellen, bis die bestehenden Verbindungen abgelaufen sind.

Dies kann zu sehr ungleichmäßigen Serviceniveaus führen. Clients, die erfolgreich eine Keepalive-Verbindung herstellen, können Ihren Dienst nach Belieben durchsuchen. Clients, die eine Verbindung herstellen möchten, wenn alle Parallelitätsslots belegt sind, werden gesperrt und müssen in einer Warteschlange warten.

Warum sehen Sie diese Effekte beim Benchmarktest nicht?

Diese Probleme treten nur in langsamen Netzwerken mit vielen Clients auf. Sie treten nicht beim Benchmarking mit einem einzelnen Client über ein schnelles lokales Netzwerk auf.

Es gibt mehrere Gründe, warum diese Effekte in einem Benchmark möglicherweise nicht sichtbar sind.

Wenn Sie Keepalives während des Benchmarks nicht aktivieren , erstellt der Client für jede Transaktion eine neue TCP-Verbindung (und die Verbindung wird nach Abschluss der Transaktion getrennt). Da Sie den Benchmark höchstwahrscheinlich über ein schnelles, lokales Netzwerk ausführen, ist der Benchmark erfolgreich und Sie bemerken nicht die Leistungsprobleme, die durch die Nichtverwendung von Keepalives entstehen.
Wenn Sie Keepalives aktivieren , können Sie höchstwahrscheinlich weniger gleichzeitige Verbindungen ausführen als Ihr Serverlimit zulässt, und Ihr Benchmark-Client sättigt jede Verbindung (verwendet sie wiederholt), wodurch Ihr Server an seine maximale Kapazität gelangt. Dies ähnelt jedoch nicht dem realen Profil für Verbindungen.

Beachten Sie, dass die meisten Benchmark-Tools nur erfolgreiche Transaktionen erfassen. Verbindungen, die durch Erschöpfung der Serverressourcen blockiert sind, meldet man oft nicht oder sie erscheinen nur als ein winziger Teil der erfolgreichen Verbindungen. So verdecken Sie die tatsächliche Problematik im realen Datenverkehr.

Wie häufig tritt das Problem auf?

Jeder thread- oder prozessbasierte Web- oder Anwendungsserver ist anfällig für Parallelitätsbeschränkungen.

Dieses Problem ist jeder Web- oder Anwendungsplattform inhärent, die jeder Verbindung einen Thread oder Prozess zuweist. Dies lässt sich in einer optimierten Benchmarkumgebung nicht leicht erkennen, äußert sich jedoch in einer schlechten Leistung und übermäßigen CPU-Auslastung in einer realen Umgebung.

Sie können dieses Problem mit verschiedenen Maßnahmen beheben:

Erhöhen Sie die Anzahl der Threads oder Prozesse – Dies ist eine sehr kurzfristige Maßnahme. Threads und Prozesse sind schwere Betriebssystemobjekte und verursachen einen schnell steigenden Verwaltungsaufwand, wenn immer mehr davon erzeugt werden.
Deaktivieren oder begrenzen Sie die Verwendung von HTTP-Keepalives. Hierdurch wird das Parallelitätslimit verschoben, die Leistung der einzelnen Clients ist jedoch deutlich schlechter.
Verwenden Sie eine spezielle Keepalive-Verarbeitung – Der Apache HTTP-Server (Webserver) verfügt über ein relativ neues Ereignis- MPM, das Verbindungen zwischen Arbeitsthreads und einem dedizierten Ereignisthread verschiebt, wenn sie zwischen den Zuständen „aktiv“ und „inaktiv“ wechseln. Dies kann eine Option sein, wenn die anderen von Ihnen verwendeten Module dieses MPM unterstützen. Beachten Sie, dass SSL/TLS-Verbindungen weiterhin vollständig in dedizierten Threads verarbeitet werden.
Verwenden Sie ein effizienteres Verarbeitungsmodell – Die bei weitem einfachste und effektivste Maßnahme, die Sie ergreifen können, ist, einen effizienten HTTP-Proxy vor Ihren Web- oder Anwendungsservern zu platzieren. Ein ereignisgesteuerter Proxy wie NGINX unterliegt nicht den oben beschriebenen Parallelitätsbeschränkungen. Es lacht über langsame Verbindungen und inaktive Keepalives. Darüber hinaus konvertiert es langsame clientseitige Verbindungen mit mehreren inaktiven Keepalive-Verbindungen effektiv in schnelle, lokale und hocheffiziente Verbindungen im Benchmark-Stil, die die bestmögliche Leistung aus Ihren Web- und Anwendungsservern herausholen.

Verwenden Sie NGINX als beschleunigenden HTTP-Proxy

NGINX verwendet eine andere Architektur, die nicht unter den oben beschriebenen Parallelitätsproblemen leidet. Es wandelt langsame Client-Verbindungen in optimierte, Benchmark-ähnliche Verbindungen um, um die beste Leistung aus Ihren Servern herauszuholen.

NGINX verwendet ein hocheffizientes ereignisgesteuertes Modell zur Verwaltung von Verbindungen.

Jeder NGINX-Prozess kann mehrere Verbindungen gleichzeitig verarbeiten. Wenn eine neue Verbindung akzeptiert wird, ist der Overhead sehr gering (bestehend aus einem neuen Dateideskriptor und einem neuen abzufragenden Ereignis), anders als beim oben beschriebenen Pro-Prozess- oder Pro-Thread-Modell. NGINX verfügt über eine sehr effektive Ereignisschleife:

Dadurch kann jeder NGINX-Prozess problemlos auf Zehntausende oder Hunderttausende Verbindungen gleichzeitig skaliert werden.

NGINX leitet die Anforderungen dann unter Verwendung eines lokalen Pools von Keepalive-Verbindungen per Proxy an den Upstream-Server weiter. Es entsteht kein Overhead durch das Öffnen und Schließen von TCP-Verbindungen und die TCP-Stapel passen sich schnell an die optimale Fenstergröße und die Wiederholungsparameter an. Das Schreiben von Anfragen und Lesen von Antworten erfolgt über das lokale, optimierte Netzwerk wesentlich schneller:

Der Nettoeffekt besteht darin, dass der Upstream-Server über ein schnelles Netzwerk mit einem einzigen lokalen Client (NGINX) kommuniziert. Dabei handelt es sich um einen Client, der HTTP-Keepalive-Verbindungen optimal nutzt, um den Verbindungsaufbau zu minimieren, ohne Verbindungen unnötig offen zu halten. Dadurch wird der Server wieder in seine optimale, Benchmark-ähnliche Umgebung versetzt.

Wenn NGINX als HTTP-Proxy fungiert, sehen Sie:

Bessere Nutzung vorhandener Ressourcen. Ihre Web- und Anwendungsserver verarbeiten mehr Transaktionen pro Sekunde, weil sie keine schwerfälligen HTTP-Aufgaben mehr übernehmen müssen.
Reduzierte Fehlerquote. HTTP-Timeouts sind viel unwahrscheinlicher, da NGINX als zentraler Scheduler für alle Clients fungiert.
Bessere Endbenutzerleistung. Server laufen effizienter und Verbindungen werden schneller hergestellt.

Weitere Möglichkeiten, wie NGINX Dienste beschleunigen kann

Die Beseitigung der Last schwerer HTTP-Aufgaben ist nur eine der leistungssteigernden Maßnahmen, die NGINX für Ihre überlastete Anwendungsinfrastruktur ergreifen kann.

Die HTTP-Caching-Funktion von NGINX speichert Antworten der Upstream-Server nach Standard-Cache-Regeln und bestimmt so, was wie lange zwischengespeichert wird. Wenn mehrere Clients dieselbe Ressource anfragen, liefert NGINX die Antwort direkt aus seinem Cache und entlastet so die Upstream-Server von mehrfachen Anfragen.

NGINX kann den Upstream-Server auch von anderen Vorgängen entlasten. Sie können die Datenkomprimierungsvorgänge auslagern, um die Bandbreitennutzung zu reduzieren, die SSL/TLS-Verschlüsselung und -Entschlüsselung zentralisieren, eine anfängliche Client-Authentifizierung durchführen (z. B. mit einer HTTP-Basisauthentifizierung , Unteranforderungen an externe Authentifizierungsserver und JSON-Web-Tokens ) und alle möglichen Regeln anwenden, um bei Bedarf die Datenverkehrsrate zu begrenzen .

Kein typischer Load Balancer oder ADC

Vergessen Sie schließlich nicht, dass NGINX im Gegensatz zu anderen beschleunigenden Proxys, Lastverteilern oder Anwendungsbereitstellungscontrollern (ADCs) auch ein vollwertiger Webserver ist. Sie können NGINX verwenden, um statische Inhalte bereitzustellen , Datenverkehr an Anwendungsserver für Java, PHP, Python, Ruby und andere Sprachen weiterzuleiten, Medien (Audio und Video) bereitzustellen , die Integration mit Authentifizierungs- und Sicherheitssystemen durchzuführen und sogar direkt auf Transaktionen zu reagieren, indem Sie in die NGINX-Konfiguration eingebettete Regeln verwenden.

Da es keine integrierten Leistungseinschränkungen gibt, können NGINX und NGINX Plus die Hardware, auf der Sie sie einsetzen, jetzt und in Zukunft voll ausnutzen.

Um NGINX Plus auszuprobieren, starten Sie noch heute Ihre kostenlose 30-Tage-Testversion oder kontaktieren Sie uns, um Ihre Anwendungsfälle zu besprechen .

Weitere Blogbeiträge zu F5 NGINX lesen ›

„Dieser Blogbeitrag kann auf Produkte verweisen, die nicht mehr verfügbar und/oder nicht mehr unterstützt werden. Die aktuellsten Informationen zu verfügbaren F5 NGINX-Produkten und -Lösungen finden Sie in unserer NGINX-Produktfamilie . NGINX ist jetzt Teil von F5. Alle vorherigen NGINX.com-Links werden auf ähnliche NGINX-Inhalte auf F5.com umgeleitet."

Vorgeschlagene Suchanfragen

HTTP-Keepalive-Verbindungen und Web-Performance

Eine Einführung in HTTP und Keepalive-Verbindungen

Welchen Effekt haben Keepalives auf den HTTP-Server?

Was bedeutet das in der Praxis?

Warum sehen Sie diese Effekte beim Benchmarktest nicht?

Wie häufig tritt das Problem auf?

Verwenden Sie NGINX als beschleunigenden HTTP-Proxy

Weitere Möglichkeiten, wie NGINX Dienste beschleunigen kann

Kein typischer Load Balancer oder ADC

Jede Anwendung bereitstellen und absichern

HTTP-Keepalive-Verbindungen und Web-Performance

Eine Einführung in HTTP und Keepalive-Verbindungen

Welchen Effekt haben Keepalives auf den HTTP-Server?

Was bedeutet das in der Praxis?

Warum sehen Sie diese Effekte beim Benchmarktest nicht?

Wie häufig tritt das Problem auf?

Verwenden Sie NGINX als beschleunigenden HTTP-Proxy

Weitere Möglichkeiten, wie NGINX Dienste beschleunigen kann

Kein typischer Load Balancer oder ADC

Jede Anwendung bereitstellen und absichern

KONTAKT AUFNEHMEN