BLOG | NGINX

Connexions HTTP Keepalive et performances Web

Owen Garrett

Publié le 14 mars 2014

Avez-vous déjà testé un serveur en laboratoire, puis déployé en conditions réelles, pour constater qu'il ne tient pas la performance promise ? La charge CPU reste faible, les ressources sont abondantes, pourtant vos clients se plaignent de lenteurs, et vous ne parvenez pas à mieux exploiter le serveur.

Ce que vous observez est l’un des effets de ce que nous pouvons appeler « le levage lourd du HTTP ». Dans cet article de blog, nous étudions le fonctionnement de HTTP et la manière dont les serveurs HTTP courants traitent les transactions HTTP. Nous examinons certains des problèmes de performances qui peuvent survenir et voyons comment le modèle piloté par les événements de NGINX en fait un proxy accélérateur très efficace pour ces serveurs HTTP. Avec NGINX, vous pouvez transformer vos performances réelles afin qu’elles reviennent au niveau de vos références locales.

Pour obtenir des conseils sur le réglage de Linux et NGINX pour améliorer la vitesse et l'évolutivité de vos applications, consultez Tuning NGINX for Performance sur notre blog.

Introduction aux connexions HTTP et Keepalive

Les connexions HTTP keepalive sont une fonctionnalité de performance nécessaire qui réduit la latence et permet aux pages Web de se charger plus rapidement.

HTTP est un protocole simple basé sur du texte. Si vous ne l’avez pas encore fait, jetez un œil à la sortie d’un outil de débogage HTTP tel que celui de votre navigateur Web et vérifiez la structure standard de la requête et de la réponse :

Un client HTTP établit une connexion TCP au serveur de destination, envoie la requête et reçoit la réponse. Le serveur ferme ensuite la connexion TCP pour libérer ses ressources.

Ce mode de fonctionnement peut s'avérer très inefficace, notamment pour les pages Web complexes comportant un grand nombre d'éléments ou lorsque les liaisons réseau sont lentes. La création d’une nouvelle connexion TCP nécessite une « négociation à trois », et sa suppression implique également une procédure d’arrêt à deux voies. Créer et fermer à plusieurs reprises des connexions TCP, une pour chaque message, revient à raccrocher et à recomposer le numéro après que chaque personne a parlé lors d'une conversation téléphonique.

HTTP utilise un mécanisme appelé connexions keepalive pour maintenir ouverte la connexion TCP entre le client et le serveur une fois une transaction HTTP terminée. Si le client doit effectuer une autre transaction HTTP, il peut utiliser la connexion keepalive inactive plutôt que de créer une nouvelle connexion TCP.

Les clients ouvrent généralement un certain nombre de connexions TCP simultanées à un serveur et effectuent des transactions de maintien en activité sur chacune d'entre elles. Ces connexions restent ouvertes jusqu'à ce que le client ou le serveur décide qu'elles ne sont plus nécessaires, généralement en raison d'un délai d'inactivité.

Les navigateurs Web modernes ouvrent généralement 6 à 8 connexions keepalive et les maintiennent ouvertes pendant plusieurs minutes avant de les expirer. Les serveurs Web peuvent être configurés pour expirer ces connexions et les fermer plus tôt.

Quel est l’effet des Keepalives sur le serveur HTTP ?

Si de nombreux clients utilisent des keepalives HTTP et que le serveur Web présente une limite de concurrence ou un problème d'évolutivité, les performances chutent une fois cette limite atteinte.

L’approche ci-dessus est conçue pour offrir les meilleures performances possibles à un client individuel. Malheureusement, dans un scénario de type « tragédie des biens communs », si tous les clients fonctionnent de cette manière, cela peut avoir un effet néfaste sur les performances de nombreux serveurs Web et applications Web courants.

La raison est que de nombreux serveurs ont une limite de concurrence fixe. Par exemple, dans les configurations courantes, le serveur HTTP Apache ne peut traiter qu'un nombre limité de connexions TCP simultanées : 150 avec le module multitraitement des travailleurs (MPM) et 256 avec le MPM prefork . Chaque connexion HTTP keepalive inactive consomme l'un de ces emplacements de concurrence, et une fois que tous les emplacements sont occupés, le serveur ne peut plus accepter de connexions HTTP.

La sagesse conventionnelle dit de désactiver les keepalives sur le serveur Web ou de les limiter à une durée de vie très courte. Ils fournissent un vecteur très simple pour les attaques par déni de service SlowHTTPTest et Slowloris (pour une solution rapide, voir Protection contre le déni de service Keep-Dead sur serverfault.com).

De plus, ces serveurs Web et d’applications allouent généralement un thread ou un processus du système d’exploitation pour chaque connexion. Une connexion TCP est un objet de système d’exploitation très léger, mais un thread ou un processus est très lourd. Les threads et les processus nécessitent de la mémoire, ils doivent être gérés activement par le système d'exploitation et le « changement de contexte » entre les threads ou les processus consomme du CPU. Attribuer à chaque connexion son propre thread ou processus est extrêmement inefficace.

Le grand nombre de connexions client simultanées et l'affectation d'un thread ou d'un processus à chaque connexion produisent le phénomène connu sous le nom de « HTTP Heavy Lifting », où un effort disproportionné est nécessaire pour traiter une transaction HTTP légère.

Qu'est-ce que cela signifie en pratique ?

Il ne faut pas beaucoup de clients pour épuiser la limite de concurrence dans de nombreux serveurs Web et d’applications contemporains.

Si un client ouvre 8 connexions TCP et maintient chacune d'elles active pendant 15 secondes après la dernière utilisation, le client consomme 8 emplacements de concurrence pendant 15 secondes. Si les clients arrivent sur votre site Web au rythme de 1 par seconde, 120 emplacements de concurrence sont continuellement occupés par des connexions keepalive inactives. Si le débit est de 2 clients par seconde, 240 emplacements de simultanéité sont occupés. Une fois les créneaux épuisés, les nouveaux clients ne peuvent pas se connecter tant que les connexions existantes n'ont pas expiré.

Cela peut entraîner des niveaux de service très inégaux. Les clients qui acquièrent avec succès une connexion Keepalive peuvent parcourir votre service à volonté. Les clients qui tentent de se connecter alors que tous les créneaux de simultanéité sont occupés sont bloqués et doivent attendre dans une file d'attente.

Pourquoi ne voyez-vous pas ces effets lors des tests d’évaluation comparative ?

Ces problèmes ne se manifestent que dans les réseaux lents avec de nombreux clients. Ils n’apparaissent pas lors d’une analyse comparative avec un seul client sur un réseau local rapide.

Il existe plusieurs raisons pour lesquelles vous ne verrez peut-être pas ces effets dans un benchmark.

Si vous n'activez pas les keepalives pendant le test, le client crée une nouvelle connexion TCP pour chaque transaction (et la connexion est interrompue une fois la transaction terminée). Étant donné que vous exécutez probablement le test sur un réseau local rapide, le test réussit et vous ne voyez pas les problèmes de performances créés par la non-utilisation de keepalives.
Si vous activez les keepalives , vous pourrez probablement exécuter moins de connexions simultanées que la limite de votre serveur, et votre client de référence saturera chaque connexion (l'utilisera de manière répétée), poussant votre serveur à sa capacité maximale. Cependant, cela ne ressemble pas au profil réel des connexions.

Sachez que la plupart des outils de benchmark ne rapportent que les transactions réussies. Les connexions interrompues par épuisement des ressources risquent de ne pas être comptabilisées, ou de sembler ne représenter qu'une infime partie des connexions réussies. Cela dissimule la réalité du problème face au trafic réel.

Quelle est la fréquence du problème ?

Tout serveur Web ou d’application basé sur un thread ou un processus est vulnérable aux limitations de concurrence.

Ce problème est inhérent à toute plate-forme Web ou applicative qui attribue un thread ou un processus à chaque connexion. Ce n’est pas facile à détecter dans un environnement de référence optimisé, mais cela se manifeste par de mauvaises performances et une utilisation excessive du processeur dans un environnement réel.

Il existe plusieurs mesures que vous pouvez prendre pour résoudre ce problème :

Augmenter le nombre de threads ou de processus – Il s’agit d’une mesure à très court terme. Les threads et les processus sont des objets lourds du système d'exploitation et entraînent une charge de gestion qui augmente rapidement à mesure qu'ils sont générés.
Désactivez ou limitez l'utilisation des keepalives HTTP – Cela retarde la limite de concurrence, mais entraîne des performances bien inférieures pour chaque client.
Utiliser un traitement keepalive spécialisé – Le serveur HTTP Apache (serveur Web) dispose d'un MPM d'événements relativement nouveau qui déplace les connexions entre les threads de travail et un thread d'événements dédié lorsqu'ils se déplacent entre les états « actif » et « inactif ». Cela peut être une option si les autres modules que vous utilisez prennent en charge ce MPM ; notez que les connexions SSL/TLS sont toujours entièrement traitées dans des threads dédiés.
Utilisez un modèle de traitement plus efficace – La mesure la plus simple et la plus efficace que vous puissiez prendre est de placer un proxy HTTP efficace devant vos serveurs Web ou d’applications. Un proxy piloté par événements comme NGINX ne présente pas les limitations de concurrence décrites ci-dessus. Il se moque des connexions lentes et des keepalives inactifs. De plus, il convertit efficacement les connexions lentes côté client avec plusieurs connexions keepalive inactives en connexions de référence rapides, locales et hautement efficaces qui extraient les meilleures performances possibles de vos serveurs Web et d'applications.

Utilisez NGINX comme proxy HTTP accélérateur

NGINX utilise une architecture différente qui ne souffre pas des problèmes de concurrence décrits ci-dessus. Il transforme les connexions client lentes en connexions optimisées de type benchmark pour extraire les meilleures performances de vos serveurs.

NGINX utilise un modèle piloté par événements hautement efficace pour gérer les connexions.

Chaque processus NGINX peut gérer plusieurs connexions en même temps. Lorsqu'une nouvelle connexion est acceptée, la surcharge est très faible (elle consiste en un nouveau descripteur de fichier et un nouvel événement à interroger), contrairement au modèle par processus ou par thread décrit ci-dessus. NGINX dispose d'une boucle d'événements très efficace :

Cela permet à chaque processus NGINX de s'adapter facilement à des dizaines, des milliers ou des centaines de milliers de connexions simultanément.

NGINX transmet ensuite les requêtes au serveur en amont, en utilisant un pool local de connexions keepalive. Vous ne subissez pas de surcharge liée à l’ouverture et à la fermeture des connexions TCP, et les piles TCP s’adaptent rapidement à la taille de fenêtre optimale et aux paramètres de nouvelle tentative. L'écriture des requêtes et la lecture des réponses sont beaucoup plus rapides sur le réseau local optimisé :

L’effet net est que le serveur en amont se retrouve à communiquer avec un seul client local (NGINX) sur un réseau rapide, et c’est un client qui utilise de manière optimale les connexions HTTP keepalive pour minimiser la configuration de la connexion sans maintenir les connexions ouvertes inutilement. Cela remet le serveur dans son environnement optimal, de type benchmark.

Avec NGINX agissant comme un proxy HTTP, vous voyez :

Optimisez l’utilisation de vos ressources existantes. Vos serveurs web et applicatifs traitent davantage de transactions par seconde, puisqu’ils ne gèrent plus les charges lourdes HTTP.
Taux d'erreur réduits. Les délais d’expiration HTTP sont beaucoup moins probables car NGINX agit comme un planificateur central pour tous les clients.
Meilleures performances pour l’utilisateur final. Les serveurs fonctionnent plus efficacement et les connexions de service sont plus rapides.

Autres façons dont NGINX peut accélérer les services

La suppression du fardeau du HTTP n’est qu’une des mesures de transformation des performances que NGINX peut apporter à votre infrastructure d’application surchargée.

La fonction HTTP‑caching de NGINX met en cache les réponses des serveurs amont, en respectant les règles standards pour contrôler ce qui est conservé et sa durée. Quand plusieurs clients demandent la même ressource, NGINX répond directement depuis son cache, préservant ainsi les serveurs amont des requêtes en double.

NGINX peut également décharger d’autres opérations du serveur en amont. Vous pouvez décharger les opérations de compression de données pour réduire l'utilisation de la bande passante, centraliser le chiffrement et le déchiffrement SSL/TLS , effectuer l'authentification initiale du client (par exemple, avec l'authentification de base HTTP , les sous-requêtes vers des serveurs d'authentification externes et les jetons Web JSON ) et appliquer toutes sortes de règles pour limiter le trafic lorsque cela est nécessaire.

Pas votre équilibreur de charge ou ADC typique

Enfin, n'oubliez pas que contrairement à d'autres proxys accélérateurs, équilibreurs de charge ou contrôleurs de distribution d'applications (ADC), NGINX est également un serveur Web complet . Vous pouvez utiliser NGINX pour diffuser du contenu statique , transférer le trafic vers des serveurs d'applications pour Java, PHP, Python, Ruby et d'autres langages, diffuser des médias (audio et vidéo) , intégrer des systèmes d'authentification et de sécurité et même répondre directement aux transactions à l'aide de règles intégrées dans la configuration NGINX.

Sans limitations de performances intégrées, NGINX et NGINX Plus tirent pleinement parti du matériel sur lequel vous les déployez, maintenant et à l’avenir.

Pour essayer NGINX Plus, démarrez votre essai gratuit de 30 jours dès aujourd'hui ou contactez-nous pour discuter de vos cas d'utilisation .

Lire plus d'articles de blog sur F5 NGINX ›

« Cet article de blog peut faire référence à des produits qui ne sont plus disponibles et/ou qui ne sont plus pris en charge. Pour obtenir les informations les plus récentes sur les produits et solutions F5 NGINX disponibles, explorez notre famille de produits NGINX . NGINX fait désormais partie de F5. Tous les liens NGINX.com précédents redirigeront vers un contenu NGINX similaire sur F5.com."

Recherches suggérées

Connexions HTTP Keepalive et performances Web

Introduction aux connexions HTTP et Keepalive

Quel est l’effet des Keepalives sur le serveur HTTP ?

Qu'est-ce que cela signifie en pratique ?

Pourquoi ne voyez-vous pas ces effets lors des tests d’évaluation comparative ?

Quelle est la fréquence du problème ?

Utilisez NGINX comme proxy HTTP accélérateur

Autres façons dont NGINX peut accélérer les services

Pas votre équilibreur de charge ou ADC typique

Assurez la livraison et la sécurité de chaque application

Connexions HTTP Keepalive et performances Web

Introduction aux connexions HTTP et Keepalive

Quel est l’effet des Keepalives sur le serveur HTTP ?

Qu'est-ce que cela signifie en pratique ?

Pourquoi ne voyez-vous pas ces effets lors des tests d’évaluation comparative ?

Quelle est la fréquence du problème ?

Utilisez NGINX comme proxy HTTP accélérateur

Autres façons dont NGINX peut accélérer les services

Pas votre équilibreur de charge ou ADC typique

Assurez la livraison et la sécurité de chaque application

RESTER EN CONTACT AVEC NOUS