Nous serons les premiers à l’admettre, la plupart d’entre nous chez Kinsta sont des drogués de données. Nous aimons regarder de grands ensembles de données pour voir si nous pouvons repérer une nouvelle tendance, ou obtenir des informations supplémentaires sur les changements qui pourraient avoir un impact sur l’industrie de l’hébergement ou notre entreprise. Héberger des milliers de sites nous permet d’avoir une source de données presque illimitée pour suivre et extraire des requêtes en continu.

Nos équipes d’administrateur système et de développement creusent régulièrement dans les fichiers logs pour voir si nous pouvons améliorer certains aspects de nos outils et services MyKinsta pour nos clients. Par exemple, une façon d’utiliser ces données est d’implémenter de meilleurs filtres contre le mauvais trafic des robots et des crawlers. Ce que nous apprenons va directement dans notre outil MyKinsta Analytics. Par conséquent, ces données peuvent réellement vous aider à économiser de l’argent sur votre plan d’hébergement car nous améliorons la qualité et la précision de nos mesures de filtrage et de visites.

Nous avons analysé 13 milliards d’entrées de logs, et cette fois-ci, nous avons décidé de partager tous nos résultats avec vous ! Nous avons divisé les statistiques en trois sections différentes : logs d’accès, performances du cache et moteurs PHP.

Les données ci-dessous sont compilées à partir de milliers de sites WordPress hébergés sur des serveurs Kinsta. La plupart des pourcentages des graphiques sont arrondis au point le plus proche. Aucune des données partagées n’est une PII.

Statistiques des logs d’accès

Sur un total de 13 milliards d’entrées (lignes dans un fichier log), nous avons analysé 8 milliards de logs d’accès.

Les entrées du journal contiennent ce que nous appelons des « requêtes ». C’est différent des visites, car nos logs d’accès bruts suivent les adresses IP qui demandent des ressources à partir d’un site Web. Par exemple, Google Analytics filtre automatiquement un grand nombre de mauvais trafic, en essayant de vous montrer la meilleure estimation des visites humaines réelles sur votre site Web. Les statistiques du journal incluent tous les types de requêtes qui frappent directement le serveur, depuis les requêtes des navigateurs jusqu’aux robots malveillants et aux robots des moteurs de recherche.

Ordinateur de bureau vs mobile vs tout le reste

Nous avons d’abord analysé toutes les requêtes provenant des navigateurs de bureau, des navigateurs mobiles et de tout le reste. Pour ce faire, nous avons examiné l’en-tête HTTP connu sous le nom d’user-agent. Un user-agent est essentiellement une chaîne de texte qui identifie le navigateur et/ou le système d’exploitation lorsqu’il se connecte au serveur web.

Il ressemblera typiquement à quelque chose comme ceci : user-agent : Mozilla/5.0 (Macintosh ; Intel Mac OS X 10_14_3) AppleWebKit/537.36 (KHTML, comme Gecko) Chrome/72.0.3626.109 Safari/537.36. Vous pouvez voir l’user-agent dans l’en-tête de réponse dans un outil comme Pingdom ou Chrome DevTools.

user-agent
user-agent

Le seul inconvénient en ce qui concerne l’user-agent dans les fichiers logs est qu’il peut facilement être spoofé. C’est une des raisons pour lesquelles vous pouvez voir « Autre » dans certaines des statistiques ci-dessous.

Tout comme avec Google Analytics, où vous ne voyez probablement pas toutes vos données à cause des bloqueurs d’annonces et des cookies GDPR (certains ont rapporté ne pas pouvoir voir jusqu’à 60% !), vous devez simplement utiliser les données que vous pouvez voir et prendre des décisions stratégiques basées dessus.

Dans nos registres, nous avons vu la quantité suivante de requêtes :

  • 3 395 000 000 requêtes provenant de navigateurs de bureau
  • 3 100 000 000 requêtes provenant de navigateurs mobiles
  • 1 505 000 000 requêtes provenant de tout le reste (appels API, moteurs de recherche, crawlers, bots, uptime bots, etc. Il est important de noter que pour les clients de Kinsta, ces types de requêtes sont exclus des visites facturables. Nous excluons tout type de bot où nous pouvons identifier qu’il a le nom « bot » dans son nom. Ou si nous identifions quelque chose essayant de forcer par force brute « wp-login.php », nous l’interdisons de notre infrastructure.)
Bureau vs Mobile vs Tout le reste
Bureau vs Mobile vs Tout le reste (cliquez pour agrandir)

Il est intéressant de voir que le bureau est toujours numéro un en termes de nombre de requêtes sur les sites hébergés chez Kinsta. Bien que le mobile connaisse une croissance rapide, cela varie toujours en fonction de l’industrie dans laquelle vous évoluez.

Par exemple, plus de 80 % des visites sur notre site Kinsta se font depuis des ordinateurs de bureau. Notre site est entièrement responsive et rapide sur mobile, mais quand il s’agit de rechercher une application, une base de données et un hébergement WordPress infogéré, les gens ne veulent pas le faire sur leur téléphone. L’hébergement est l’un de ces engagements pour lesquels la plupart des gens préfèrent rester assis devant leur ordinateur de bureau.

Vous pouvez donc bien sûr prendre le train en marche, mais n’oubliez pas de tenir compte de la façon dont vos clients achètent réellement votre produit.

Bureau : 🖥️

Ensuite, nous avons examiné les 3,3 milliards et plus de requêtes de l’user-agent en fonction du type de navigateur de bureau.

  • 1 790 430 230 requêtes de Chrome
  • 473 229 236 requêtes de Firefox
  • 444 729 025 requêtes provenant d’autres sources
  • 251 692 300 requêtes d’IE
  • 218 604 777 requêtes de Safari
  • 169 840 696 requêtes de Edge
  • 41 819 852 requêtes de Opera

Vous pouvez voir que Chrome est en tête du peloton avec 53% de toutes les requêtes. Ce n’est pas une grande surprise puisque d’autres sources, telles que statcounter et NetMarketshare, montrent que Chrome détient plus de 60% du marché. Une étude plus récente, réalisée en octobre 2020, a montré une nouvelle adoption de Chrome, avec une part de marché de 73 % pour le navigateur.

Firefox, bien sûr, est arrivé deuxième. Mais celui qui nous a vraiment surpris, c’est Microsoft Edge à 5%. Au moins parmi les sites hébergés chez Kinsta, Microsoft Edge semble gagner lentement des parts de marché. Microsoft a également annoncé en décembre 2018 qu’il est en train de reconstruire son navigateur Edge sur Chromium et de l’amener sur Mac.

User-agent utilisateur de bureau
User-agent utilisateur de bureau (cliquez pour agrandir)

Mobile 📱

Nous avons ensuite examiné les plus de 3,1 milliards de requêtes de l’user-agent en fonction du type de navigateur mobile.

  • 1 190 404 881 requêtes de Mobile Safari
  • 945 589 763 requêtes de Chrome Mobile
  • 391 674 959 requêtes de Facebook
  • 135 877 704 requêtes de Samsung Internet
  • 108 858 301 requêtes de Chrome Mobile WebView
  • 97 946 458 requêtes de Instagram
  • 87 992 534 requêtes de Pinterest
  • 61 027 970 requêtes de Chrome Mobile iOS
  • 75 186 662 requêtes provenant d’autres sources

Ceci nous a surpris. Pour les sites WordPress hébergés chez Kinsta, la version mobile de Safari est la plus utilisée avec plus de 1 milliard de requêtes. Si Chrome est tout près, ce n’est pas encore très souvent que l’on voit Safari dominer le peloton. Cela signifie simplement que beaucoup de gens naviguent sur les sites hébergés de Kinsta sur leurs iPhones.

User-agent mobile
User-agent mobile (cliquez pour agrandir)

Système d’exploitation

Ensuite, nous avons analysé toutes les requêtes provenant de différents systèmes d’exploitation : ordinateurs de bureau ou mobiles.

Bureau : 🖥️

Nous avons examiné les plus de 3,3 milliards de requêtes provenant de l’user-agent en fonction du type de système d’exploitation du bureau.

  • 2 143 021 069 requêtes provenant de Windows
  • 634 841 151 requêtes provenant de Mac OS X
  • 363 719 866 requêtes provenant d’autres sources
  • 175 998 693 requêtes provenant de Linux
  • 37 769 563 requêtes de Chrome OS
  • 34 683 021 requêtes d’Ubuntu
  • 2 865 221 requêtes de Windows 98
  • 2 101 416 $ requêtes de Fedora

Windows est le système d’exploitation le plus utilisé pour la navigation des sites hébergés chez Kinsta (avec plus de 2 milliards de requêtes). Et ce n’est pas surprenant, Mac OS X est arrivé deuxième.

Système d'exploitation de bureau
Système d’exploitation de bureau (cliquez pour agrandir)

L’étrange, c’est que nous voyons encore des requêtes de Windows 98. 😳 Rappelez-vous cependant que vous devez prendre les données de l’user-agent avec des pincettes car elles peuvent être spoofées. Mais c’est aussi un rappel important que de nombreux pays en développement et de nombreuses entreprises utilisent encore des systèmes d’exploitation plus anciens. Tout le monde n’a pas un MacBook Pro flambant neuf.

Mobile 📱

Ensuite, nous avons examiné les 3,1 milliards et plus de requêtes de l’user-agent en fonction du type de système d’exploitation mobile.

  • 1 610 093 701 requêtes de IOS
  • 1 440 006 814 requêtes de Android
  • 25 356 278 requêtes provenant d’autres sources
  • 15 936 471 requêtes provenant de Windows
  • 4 982 630 requêtes provenant de Linux
  • 1 887 653 requêtes provenant du système d’exploitation Firefox
  • 851 237 requêtes de Tizen
  • 552 422 requêtes du système d’exploitation BlackBerry
  • 250 183 requêtes de Symbian OS
  • 82 611 requêtes de Kindle

Alors que Windows est en train de gagner la guerre des systèmes d’exploitation de bureau, iOS est le plus utilisé pour les sites mobiles hébergés chez Kinsta. Avec Android qui arrive à la seconde place. Les gens adorent leurs iPhones. 😉

Système d'exploitation mobile
Système d’exploitation mobile (cliquez pour agrandir)

HTTP vs HTTPS 🔒

Nous avons ensuite cherché à savoir combien de sites Web répondaient aux requêtes par HTTP plutôt que par HTTPS.

  • 835 157 594 requêtes provenant de HTTP
  • 5 659 842 406 requêtes provenant de HTTPS

Comme vous pouvez le constater, 87% de toutes les requêtes provenant des sites hébergés chez Kinsta tournent sur HTTPS. Selon W3Techs, seulement 48,2% de tous les sites web utilisent le protocole HTTPS. Nous sommes heureux de constater que le ratio chez Kinsta est beaucoup plus élevé que la moyenne ! 👏 Ceci, bien sûr, est en partie grâce à Let’s Encrypt, car les certificats SSL sont maintenant gratuits. Les clients Kinsta peuvent installer des certificats SSL en quelques clics (voici comment installer un certificat SSL sur WooCommerce) !

HTTP vs HTTPS
HTTP vs HTTPS (cliquez pour agrandir)

www vs non-www

Nous étions curieux de voir combien de sites fonctionnaient sur www vs non-www, donc nous avons regardé les données.

  • 2 764 257 683 requêtes provenant de www
  • 3 730 742 317 requêtes provenant de non-www

Comme vous pouvez le constater, 57% des sites chez Kinsta n’utilisent pas www.

L’utilisation de www comme partie de votre domaine était la norme à l’époque. Mais ce n’est plus nécessairement vrai. Même nous n’utilisons pas www ici chez Kinsta. Une des raisons pour lesquelles vous pouvez encore voir www être beaucoup utilisé est simplement que le changer après l’avoir utilisé pendant des années peut être complexe et causer des problèmes. Ainsi, beaucoup de marques plus anciennes continuent tout simplement à l’utiliser.

www vs non-www
www vs non-www (cliquez pour agrandir)

Une autre raison pour laquelle les grandes entreprises avec beaucoup de trafic pourraient vouloir utiliser www est due aux DNS. Les domaines nus (non-www) ne peuvent techniquement pas avoir d’enregistrement CNAME utilisé pour rediriger le trafic vers le basculement. Cependant, il y a des solutions de rechange à cette question.

Donc quand il s’agit de www vs non-www, c’est plus une question de préférence personnelle. Vous préférez peut-être des URLs plus courtes, auquel cas vous pouvez utiliser le non-www. N’oubliez pas, quelle que soit la version que vous choisissez, vous pouvez configurer des redirections pour que chacune soit accessible. Par exemple, si vous visitez www.kinsta.com, cela vous redirige simplement vers kinsta.com.

Trafic sur les médias sociaux

Nous avons ensuite cherché à savoir quels réseaux sociaux envoyaient le plus de trafic. Note : Ce ne sont que les 7 premiers.

  • 45 358 077 requêtes provenant de Facebook
  • 7 789 013 requêtes provenant de Pinterest
  • 1 971 578 requêtes provenant de l’Instagram
  • 986 708 requêtes provenant de YouTube
  • 434 462 requêtes provenant de LinkedIn
  • 379 516 requêtes provenant de Reddit
  • 113 885 requêtes provenant de Twitter

Comme vous pouvez le constater, Facebook a dominé le jeu des médias sociaux avec 79,5 % des requêtes envoyées. Pinterest vient au deuxième rang avec 13,7 %. Si vous n’avez pas encore essayé Pinterest et que vous avez une entreprise qui pourrait bien fonctionner là-bas, c’est quelque chose à vérifier.

Trafic sur les médias sociaux
Trafic sur les médias sociaux (cliquez pour agrandir)

Codes de réponse

Les codes d’état HTTP, aussi connus sous le nom de codes de réponse, sont comme une courte note du serveur Web qui est placée en haut d’une page Web. Ça ne fait pas partie de la page web. Il s’agit plutôt d’un message du serveur vous informant de l’évolution de la situation lorsque le serveur a reçu la demande de consultation de la page.

Si vous êtes un client Kinsta, vous pouvez consulter toutes sortes de graphiques et de données dans MyKinsta Analytics concernant les codes de réponse pour vos sites.

Codes de réponse dans MyKinsta Analytics
Codes de réponse dans MyKinsta Analytics

Nous étions curieux de savoir quels codes de réponse nous étaient le plus retournés, alors nous avons examiné les données.

Codes de réponse 200

Les codes 2xx sont retournés lorsque la requête du navigateur a été reçue, comprise et traitée avec succès par le serveur. Sur les 5,6 milliards et plus de codes de réponse 2xx, voici la distribution.

  • 5 612 645 073 requêtes ont retourné une 200
  • 464 366 requêtes ont retourné une 201
  • 176 325 requêtes ont retourné une 202
  • 6 891 596 requêtes ont retourné une 204
  • 13 840 463 requêtes ont retourné une 206
  • 428 requêtes ont retourné une 278

Vous pouvez voir qu’un code de réponse de 200 a été retourné le plus souvent. Cela signifie que « Tout va bien. » C’est le code qui est délivré lorsqu’une page Web ou une ressource agit exactement comme on s’y attend.

Codes de réponse HTTP 2xx (cliquez pour agrandir)
Codes de réponse HTTP 2xx (cliquez pour agrandir)

Codes de réponse 300

Les codes de redirection 3xx sont retournés lorsqu’une nouvelle ressource a été substituée à la ressource demandée. Sur les 3,6 milliards et plus de codes de réponse 3xx, voici la distribution.

  • 239 992 263 requêtes ont retourné une 301
  • 30 003 302 requêtes ont retourné une 302
  • 39 154 requêtes ont retourné une 303
  • 91 379 063 requêtes ont retourné une 304
  • 1 212 079 requêtes ont retourné une 307
  • 5 076 requêtes ont retourné une 308

Vous pouvez voir qu’un code de réponse 301 a été renvoyé le plus souvent. Cela signifie que « La ressource demandée a été déplacée définitivement ». Ce code est délivré lorsqu’une page Web ou une ressource a été définitivement remplacée par une autre ressource.

Codes de réponse HTTP 3xx
Codes de réponse HTTP 3xx (cliquez pour agrandir)

Il n’est pas surprenant que sur les codes de réponse 3xx, le code 301 est le plus largement vu, car il est utilisé pour la redirection permanente d’URLs pour le SEO.

Si vous êtes un client Kinsta, vous pouvez utiliser l’outil de redirection de MyKinsta pour ajouter facilement autant de redirections que nécessaire. Il supporte le regex et est plus performant, car les redirections sont ajoutées au niveau du serveur, et vous n’avez plus besoin d’un plugin de redirection WordPress.

Outil de redirection WordPress
Outil de redirection WordPress

Codes de réponse 400

Les codes 4xx sont des codes d’erreur client indiquant qu’il y a eu un problème avec la demande. Sur les 4,8 milliards et plus de codes de réponse 4xx, voici la distribution.

  • 14 783 009 requêtes ont retourné une 400
  • 1 311 362 requêtes ont retourné une 401
  • 10 095 requêtes ont retourné une 402
  • 2 8139 689 requêtes ont retourné une 403
  • 407 692 910 requêtes ont retourné une 404
  • 5 301 730 requêtes ont retourné une 405
  • 8 946 requêtes ont retourné une 406
  • 90 330 requêtes ont retourné une 409
  • 319 074 requêtes ont retourné une 410
  • 375 309 requêtes ont retourné une 412
  • 84 requêtes ont retourné une 413
  • 15 506 requêtes ont retourné une 414
  • 1 190 requêtes ont retourné une 415
  • 1 824 requêtes ont retourné une 416
  • 134 requêtes ont retourné une 418
  • 2 requêtes ont retourné une 419
  • 32 976 requêtes ont retourné une 422
  • 2 requêtes ont retourné une 423
  • 23 467 660 requêtes ont retourné une 429
  • 529 requêtes ont retourné une 444
  • 4 391 165 requêtes ont retourné une 499

Vous pouvez voir qu’un code de réponse 404 a été retourné le plus souvent. Cela signifie que « La ressource demandée n’a pas été trouvée ». Le message d’erreur le plus courant de tous. Ce code signifie que la ressource demandée n’existe pas et que le serveur ne sait pas si elle a déjà existé.

Codes de réponse http 4xx (cliquez pour agrandir)
Codes de réponse http 4xx (cliquez pour agrandir)

Nous n’avons pas été surpris de voir le code de réponse 404 comme étant le plus élevé. Ceci est simplement dû au fait que beaucoup de sites WordPress ont des liens cassés. Souvent, les propriétaires de sites WordPress ne peuvent tout simplement pas suivre les changements ou ne savent pas comment les vérifier et les corriger correctement. Consultez notre tutoriel détaillé sur la façon de corriger les erreurs 404.

Page 404 Kinsta
Page 404 Kinsta

Outre la facilité d’utilisation, une autre raison pour laquelle ces erreurs sont mauvaises est que de nombreuses pages 404 sont très gourmandes en ressources, ce qui a un impact sur les performances. Pour les grands sites, il est préférable d’éviter une page 404 lourde. Créez un modèle 404 simple qui évite si possible d’interroger la base de données.

Code de réponse 500

Un code d’erreur du serveur 500 indique que la requête a été acceptée, mais qu’une erreur sur le serveur a empêché l’exécution de la requête. Sur les 8 milliards de demandes, voici la répartition.

  • 3 521 528 requêtes ont retourné une 500, ce qui représente 0,04 % de toutes les requêtes.

Cela signifie que « Il y a eu une erreur sur le serveur et la requête n’a pas pu être complétée ». Un code générique qui signifie simplement « erreur interne du serveur ». Quelque chose a mal tourné sur le serveur et la ressource demandée n’a pas été livrée.

Ce code est typiquement généré par des plugins tiers, un PHP défectueux, ou même la rupture de connexion à la base de données. Consultez nos tutoriels sur la façon de corriger l’erreur de connexion à une base de données et d’autres moyens de résoudre une erreur de serveur interne 500.

Codes de réponse http 5xx
Codes de réponse http 5xx (cliquez pour agrandir)

Une chose que nous aimons chez WordPress, c’est qu’il y a des milliers de plugins incroyables. Cependant, ils sont aussi généralement l’une des choses qui causent le plus grand nombre d’erreurs (500).

Les crawlers de moteurs de recherche

Rappelez-vous les « 1,5 milliard et plus de demandes de tout le reste » que nous avons examinées au début de cet article ? Nous avons ensuite examiné la répartition des robots d’exploration des moteurs de recherche.

  • 296 138 088 requêtes de Google (Googlebot)
  • 202 089 312 requêtes de Bing (Bingbot)
  • 5 147 672 requêtes de Yahoo (Slurp)
  • 32 607 911 requêtes de Yandex (yandex.ru, yandex.net ou yandex.com)
  • 4 096 169 requêtes de DuckDuckGo (DuckDuckGo)
  • 14 685 230 requêtes de Baidu (Baiduspider)

Comme vous pouvez le voir, Google est le moteur de recherche numéro un des sites hébergés chez Kinsta. Ce n’est pas vraiment surprenant car Google est de loin le plus grand moteur de recherche sur le web. Selon Statcounter, Bing ne détient que 2,4 % du marché des moteurs de recherche.

Le fait que 36% et ou plus de 200 millions de requêtes proviennent de Bing, signifie qu’ils indexent encore beaucoup de données et peut-être même crawlent à un rythme plus fréquent. En d’autres termes, ce n’est pas parce que Bing n’est pas aussi populaire qu’il n’indexe pas et ne parcourt pas une grande quantité de données !

Crawl des moteurs de recherche
Crawl des moteurs de recherche (cliquez pour agrandir)

Fichiers statiques

Nous étions curieux de voir quels types de fichiers étaient les plus demandés par les sites WordPress hébergés par Kinsta. Voici les résultats.

  • 677,593,186 requêtes pour les fichiers .css
  • 14,994,575 requêtes pour les fichiers .json
  • 14,481,137 requêtes pour les fichiers .pac
  • 13,407,382 requêtes pour les fichiers .xml
  • 12,601,551 requêtes pour les fichiers .html
  • 6,502,068 requêtes pour les fichiers .htm
  • 5,726,959 requêtes pour les fichiers .pdf
  • 4,475,057 requêtes pour les fichiers .txt
  • 1,526,141 requêtes pour les fichiers .webmanifest
  • 1,383,469 requêtes pour les fichiers .conf
  • 1,070,029,306 requêtes pour les fichiers .jpg
  • 718,437,582 requêtes pour les fichiers .png
  • 114,168,603 requêtes pour les fichiers .svg
  • 89,211,616 requêtes pour les fichiers .ico
  • 39,439,970 requêtes pour les fichiers .gif
  • 21,371,010 requêtes pour les fichiers .jpeg
  • 2,100,825 requêtes pour les fichiers .webp
  • 1,088,319 requêtes pour les fichiers .cur
  • 8,221,104 requêtes pour les fichiers .mp4
  • 2,623,488 requêtes pour les fichiers .mp3
  • 49,086,037 requêtes pour les fichiers .woff2
  • 44,395,929 requêtes pour les fichiers .woff
  • 16,045,404 requêtes pour les fichiers .ttf
  • 6,395,202 requêtes pour les fichiers .eot
  • 3,438,946 requêtes pour les fichiers .otf

Les fichiers JavaScript (.js) sont le type de fichier le plus demandé par les sites hébergés chez Kinsta. Bien que la plupart de ces résultats n’aient pas été trop surprenants, il était intéressant de voir plus de 2 millions de requêtes pour les fichiers .webp (le nouveau format d’image plus petit de Google) et comment le .jpg a dépassé le .jpeg avec plus d’un milliard de requêtes alors que le second dépasse les 21 millions seulement (lisez pourquoi ici : jpg vs jpeg). Kinsta soutient le WebP et nous aurons bientôt plus d’informations à ce sujet ! 😉

Fichiers statiques
Fichiers statiques (cliquez pour agrandir)

Outils de référencement (Crawlers et Bots)

Ensuite, nous voulions jeter un coup d’oeil aux requêtes des 2,4 milliards et plus de robots et crawlers SEO. Ces outils sont continuellement sur les sites WordPress comme ils recueillent des données de backlink pour leurs bases de données, ainsi que l’exécution des outils d’audit SEO.

  • 26 691 247 requêtes provenant de Moz
  • 86 049 707 requêtes provenant d’Ahrefs
  • 2 690 306 requêtes provenant de la Screaming Frog
  • 98 014 939 requêtes provenant de la part de SEMrush
  • 51 550 801 requêtes provenant de Majestic
  • 54 046 requêtes provenant de cognitiveSEO

SEMrush a eu le plus grand nombre de requêtes sur les sites hébergés par Kinsta avec plus de 98 millions. Ahrefs s’est classé au deuxième rang avec plus de 86 millions de requêtes. La statistique qui nous a le plus surpris ici est la faiblesse de Moz. Nous aurions supposé qu’il y en aurait eu beaucoup plus. Cependant, n’oubliez pas que cela ne concerne pas la taille de leur index. Il se pourrait qu’ils crawlent simplement plus efficacement.

Beaucoup ne réalisent pas à quel point ces types d’outils de référencement frappent leurs sites. La réponse est, beaucoup ! Rappelez-vous que si vous êtes un client Kinsta, nous ne les comptons pas dans le calcul de vos visites facturables.

Outils de référencement
Outils de référencement (cliquez pour agrandir)

Ahrefs est l’un de nos outils de référencement préférés ! Découvrez comment nous avons nettoyé une attaque de Negative SEO avec lui.

Statistiques IP Geolocation

Ensuite, nous étions curieux de savoir d’où provenaient la plupart des requêtes sur le plan géographique, alors nous avons extrait les données.

  • 3 009 603 588 requêtes provenant des États-Unis
  • 338 547 518 requêtes provenant du Royaume-Uni
  • 272 523 573 requêtes provenant du Canada
  • 229 216 018 requêtes provenant de l’Inde
  • 187 608 219 requêtes provenant de l’Allemagne
  • 183 092 752 requêtes provenant de l’Australie
  • 136 572 768 requêtes provenant de l’Indonésie
  • 133 160 302 requêtes provenant de la France
  • 122 017 186 requêtes provenant de la Suède
  • 107 672 467 requêtes provenant de l’Irlande
  • 95 056 260 requêtes provenant des Pays-Bas
  • 81 944 390 requêtes provenant du Brésil
  • 79 022 194 requêtes provenant de la Grèce
  • 67 619 795 requêtes provenant de la Belgique
  • 60 189 992 requêtes provenant de l’Argentine
  • 5 790 0871 requêtes provenant du Mexique
  • 57 405 068 requêtes provenant de l’Espagne
  • 55 546 628 requêtes provenant de la Chine
  • 52 991 930 requêtes provenant de l’Italie
  • 48 076 976 requêtes provenant de Singapour

Probablement pas à la surprise de tout le monde, la plupart des requêtes des sites hébergés par Kinsta provenaient des États-Unis, avec plus de 3 milliards !

Bien que nous ayons des clients dans le monde entier, nous avons été surpris de constater à quel point les requêtes des 19 meilleurs clients étaient également réparties.

Top 20 IP Geolocation

Statistiques des logs de performances du cache

Sur un total de 13 milliards d’entrées de logs, nous avons analysé 5 milliards de logs de performances du cache. Ces statistiques donnent un aperçu de la façon dont les sites WordPress sont réellement la performance en termes de savoir si un site est servi à partir du cache ou non. Rappelez-vous qu’en général, vous voulez que votre site serve le plus de contenu possible à partir du cache. C’est ce qui vous assurera des temps de chargement rapides comme l’éclair !

Les sites d’adhésion et de ecommerce sont connus pour avoir beaucoup de contenu non cachable, et c’est exactement pourquoi vous ne pouvez pas traiter ces types de sites de la même façon qu’avec un blog avec beaucoup de contenu statique. Consultez notre article détaillé sur les choses à faire et à ne pas faire pour héberger des sites d’adhésion WordPress.

Statistiques de cache

Chaque fois qu’un site de Kinsta est livré à un navigateur, il contient un en-tête x-kinsta-cache pour afficher le statut de la façon dont le cache a été livré. Vous pouvez le voir avec un outil comme Pingdom ou Chrome DevTools. Un « HIT » signifie que la requête est servie à partir du cache WordPress. C’est exactement ce que vous voulez voir.

En-tête de réponse Cache HIT
En-tête de réponse Cache HIT

Nous avons donc rassemblé toutes les données pour connaître l’état d’avancement de la livraison du cache à tous les niveaux.

  • 1,795,217,266 des requêtes de bureau avaient un en-tête de réponse HIT
  • 1 070 119 048 des requêtes de bureau avaient un en-tête de réponse BYPASS
  • 457 393 894 des requêtes de bureau avaient un en-tête de réponse MISS
  • 118 778 823 des requêtes de bureau avaient un en-tête de réponse EXPIRED
  • 522 774 des requêtes de bureau avaient un en-tête de réponse STALE
  • 404 497 162 des requêtes de mobile avaient un en-tête de réponse HIT
  • 128 540 590 des requêtes de mobile avaient un en-tête de réponse BYPASS
  • 120 687 202 des requêtes de mobile avaient un en-tête de réponse MISS
  • 41 951 398 des requêtes de mobile avaient un en-tête de réponse EXPIRED
  • 93 680 des requêtes de mobile avaient un en-tête de réponse STALE

Les résultats ont été exactement ce que nous voulions qu’ils soient et ce qu’ils devraient être. Le plus grand nombre de requêtes a été traité à partir du cache (réponse HIT), avec plus de 1,7 milliard. C’est génial ! Le deuxième plus élevé était BYPASS. Ces demandes comprennent généralement une page de connexion WordPress, une page de vérification sur un site de ecommerce, etc. Il y a certaines zones des sites WordPress qui ne sont pas mises en cache exprès pour en assurer la fonctionnalité.

Statistiques du cache
Statistiques du cache (cliquez pour agrandir)

Un MISS signifie que le cache n’est tout simplement pas encore là. Par exemple, lorsque vous videz votre cache sur votre site, le cache doit être reconstruit. Cela se produit lorsqu’un visiteur accède à la page ou à l’article à nouveau pour la première fois. Les visites suivantes sont ensuite servies à partir du cache, en enregistrant un HIT.

La version mobile a à peu près suivi exactement le même schéma dans tous les domaines.

Catégories de cookies

Vous êtes-vous déjà demandé comment un hébergeur détermine quelles zones d’un site ne devraient pas être mises en cache ? Dans de nombreux cas, la réponse est les cookies. 🍪

Par exemple, sur les sites WooCommerce et Easy Digital Download, les cookies tels que woocommerce_items_in_cart et edd_items_in_cart sont placés dans le navigateur de l’utilisateur quand il ajoute un article à son panier. Lorsque ces cookies sont détectés sur la plateforme Kinsta, la mémoire cache est automatiquement contournée pour assurer un processus de paiement fluide et synchronisé. Il y a différents types de cookies qui sont utilisés pour contourner le cache, ci-dessous voici quelques-uns que nous avons interrogés.

  • 3 953 049 476 requêtes sur ordinateur contenant des cookies divers
  • 117 848 189 requêtes sur ordinateur contenant des cookies EDD ou WC dans le panier
  • 34,179,376 requêtes sur ordinateur contenant un cookie enregistré par WP
  • 1 353 672 requêtes sur ordinateur contenant des cookies de commentaires auteur / wp-postpass
  • 862 200 418 requêtes sur mobile contenant des cookies divers
  • 13 772 183 requêtes sur mobile contenant des cookies EDD ou WC dans le panier
  • 12 579 820 requêtes sur mobiles contenant un cookie enregistré par WP
  • 274 747 requêtes sur mobiles contenant des cookies de commentaires auteur / wp-postpass

Le type de requête numéro un, avec plus de 3,9 milliards, était celui d’un cookie divers. Qu’est-ce que cela signifie ? Habituellement, il s’agit d’un plugin tiers qui contient son propre cookie pour contourner le cache.

Il est intéressant de noter qu’il y a plus de cookies EDD/WC pour le panier que de cookies réellement enregistrés. Ceci est probablement dû au fait que beaucoup de sites WordPress que nous hébergeons chez Kinsta sont de nature eCommerce. De plus, la plupart d’entre vous ne vous connectez probablement pas souvent à votre site WordPress (vous êtes probablement déjà connecté la majeure partie de la journée). Mais il y a toujours des clients qui commandent !

Catégories de cookies
Catégories de cookies (cliquez pour agrandir)

Moteur PHP

Selon la page officielle de WordPress Stats, plus de 57% des utilisateurs de WordPress sont toujours en PHP 5.6 ou moins. C’est effrayant ! Non seulement c’est mauvais du point de vue de la sécurité, mais aussi parce qu’une grande partie des sites WordPress ne profitent toujours pas des améliorations de performances supplémentaires apportées par PHP 7.

Nous avons pensé qu’il serait également intéressant de voir la distribution des versions de PHP qui sont utilisées chez Kinsta. Voilà ce qu’on a trouvé.

Si nous regardons les sites fonctionnant chez Kinsta, plus de 75% des sites WordPress utilisent PHP 7.2 ou supérieur. Ce sont les statistiques qu’on adore voir. 👏

Moteur PHP
Moteur PHP (cliquez pour agrandir)

D’après nos résultats (voir nos benchmarks PHP), PHP 7.3 est en moyenne 9% plus rapide que PHP 7.2. Et si vous comparez PHP 7.3 à PHP 5.6, il peut traiter presque 3x plus de requêtes (transactions) par seconde !

Si vous êtes un client Kinsta, vous pouvez facilement changer les versions de PHP depuis le tableau de bord MyKinsta, sous Outils, en un seul clic.

Changement à PHP 7.3
Changement à PHP 7.3

Résumé

A partir des données ci-dessus, nous pouvons conclure quelques choses intéressantes sur les sites hébergés chez Kinsta :

  • Les navigateurs de bureau par rapport aux téléphones mobiles sont encore très utilisés. Même si vous pouvez lire en ligne que le mobile prend le relais (ce qui est le cas dans beaucoup d’endroits), il est important de se rappeler que cela peut varier selon l’industrie ou la niche. Regardez les données, ne supposez pas simplement que le mobile est l’endroit où se trouvent tous vos clients. Nous vous recommandons de consulter les données de votre appareil mobile Google Analytics pour savoir où se déroulent vos transactions eCommerce et quels sont vos objectifs.
  • Les robots, les API et les crawlers des moteurs de recherche représentent 19% de toutes les requêtes. Le nombre de robots et de crawlers qui visitent vos sites WordPress tous les jours est effrayant ! 1,5 milliard de requêtes, ce n’est pas peu. La bonne nouvelle, c’est que si vous êtes un client Kinsta, nous faisons de notre mieux pour les filtrer et nous assurer qu’ils ne sont pas pris en compte dans vos visites facturables.
  • Le navigateur Microsoft Edge est plus utilisé que nous le pensions. Et comme ils le font passer sur Chromium et qu’ils vont proposer une version Mac, vous pouvez probablement vous attendre à ce que la part de marché sur ce navigateur augmente.
  • Beaucoup de gens utilisent des iPhones ! La version mobile de Safari était le navigateur le plus utilisé parmi les appareils mobiles.
  • Windows 98 est toujours aussi fort quelque part. Bien que l’user-agent puisse être spoofé, il peut être difficile de savoir avec certitude à quel point cela est exact. Mais il est fort probable que certaines entreprises ou pays en développement utilisent encore Windows 98.
  • La force est forte avec HTTPS à Kinsta ! Nous étions plus qu’excités de voir que 87% de tous les sites Kinsta fonctionnent sur HTTPS. Allez, cryptons ! 👏
  • Nous sommes en 2019, plus besoin de www. Bien qu’il y ait quelques avantages à avoir www, la plupart d’entre eux ne s’appliqueront pas pour l’utilisateur général ou les entreprises. Passons donc à des URLs plus courtes !
  • Le trafic Facebook est un monstre. Cependant, si vous avez une entreprise qui pourrait travailler sur Pinterest, c’est certainement un réseau à vérifier.
  • Les redirections 301 et les erreurs 404 (liens cassés) sont partout. Ce n’est pas vraiment surprenant, mais c’est un rappel important pour réparer vos liens cassés et n’oubliez pas d’utiliser les redirections 301 à des fins de SEO.
  • Des erreurs 500 se produiront, ce sont les joies de l’utilisation de WordPress. Souvent, il s’agit d’un mauvais plugin, d’un PHP défectueux ou d’une connexion à la base de données cassée.
  • Alors que Google est le roi, Bing est le roi du crawl. Bing crawl probablement votre site beaucoup plus que vous ne le pensez.
  • JavaScript est le fichier le plus servi, mais c’est génial de voir WebP se développer lentement.
  • Les outils SEO parcourent vos sites quotidiennement. Comment pensez-vous que SEMrush et Ahrefs obtiennent toutes ces données de backlink fantaisistes ? Ils le font en parcourant continuellement vos sites.
  • Il y a beaucoup de contenu non cachable. Beaucoup de sites WordPress ont des requêtes qui contournent le cache pour assurer une bonne fonctionnalité. Il est important que vous ayez une application de qualité, une base de données et un hébergeur WordPress infogéré (comme Kinsta) qui est équipé pour gérer ces types de requêtes. Les sites eCommerce, d’adhésion et de LMS doivent être traités de manière totalement différente de celle d’un blog statique.
  • Plus de 75% des clients de Kinsta utilisent PHP 7.2 et PHP 7.3. L’utilisation d’une nouvelle version de PHP est l’une des optimisations de performance les plus simples que vous puissiez faire !

Nous espérons que vous avez apprécié toutes ces statistiques ! Nous l’avons fait, c’est sûr. Si vous êtes curieux, nous avons utilisé Microsoft Excel pour générer tous les graphiques ci-dessus.

Y a-t-il des statistiques que vous aimeriez voir que nous n’avons peut-être pas incluses ? Si c’est le cas, faites-le nous savoir ci-dessous dans les commentaires et nous verrons ce que nous pouvons faire.

Brian Jackson

Brian a une grande passion pour WordPress, l'utilise depuis plus de dix ans et développe même quelques plugins de qualité. Brian aime les blogs, les films et les randonnées. Connectez avec Brian sur Twitter.