Projet

Général

Profil

Actions

Bug #283

fermé

Augmentation de l'usage CPU du site

Ajouté par ggallais il y a plus de 2 ans. Mis à jour il y a plus de 2 ans.

Statut:
Closed
Priorité:
Immediate
Assigné à:
-
Catégorie:
exploitation
Début:
02/05/2023
Echéance:
12/05/2023
% réalisé:

100%

Temps estimé:
Découvert le:
26/04/2023
Affecte:
Desktop, Mobile
Opquast:
Lot:
2023_S18
Avis équipe:
Passage recette / prod:
à discuter ED:
Environnement:

Description

Depuis mardi 25 OU le mercredi 26 avril 2025, on a des problèmes sur le site :

  • Uusage CPU du site anormalement élevé (toujours pas réglé)
  • Indisponibilités aléatoires (erreur connexion DB)

Mardi 25 avril 2023 :

  • 12h29 Guillaume installe Really Simple SSL via un script lancé depuis le site web de RS SSL (fonctionnalité d'installation automatique)
  • Immédiatement, on perd l'accès au BO du site, mais le front reste fonctionnel
  • 13h01 (selon Slack) Guillaume prévient l'équipe fonctionnelle
  • 14h13 (selon Teams) Guillaume prévient l'équipe ATOS
  • 14h48 (selon Teams) Medhy annonce avoir désactivé le plugin et reseté le .htaccess (source Teams).
  • Tout revient à la normale

Simple History a logué en BO une partie des actions, mais l'heure du site est décalée. Ça dit que le plugin a été installé à 11h29 et désintallé à 13h40, au lieu de 12h29 et 14h40. Grafana monte bien l'impact CPU, Apache, Apache CNX, Load entre 12h30 et 15h voir PJ.

Mercredi 26 avril 2023 (selon Teams) :

  • 9h30 annonce de la fin de MEP du #275
  • 10h28 annonce de la perte de la connexion à la BDD en front
  • On envisage que ça soit une panne Google (incident ce jour), mais le site de la presse lui est OK
  • 12h04 Eddy envoie des infos qui montrent que notre serveur Google n'est PAS affecté par la panne Google
  • 15h50 on a encore des erreurs bdd ne prod

Grafana montre que le site décroche à partir de 9h20, on retrouve aussi un problème vers 16h et un pendant la nuit (voir PJ). Le load montre que l'incident n'a aucune mesure avec la veille : on est à 250 le 26 avril alors qu'on était à 8 au pic du problème du 25 avril.

Jeudi 27 avril 2023 :

  • 10h18 Patrice constate que le site va toujours mal (selon grafana)
  • 11h07 Medhy annonce avoir rollbacké la MEP de la veille
  • 12h36 reboot OP1 OP2 et BDD

Dans Grafana, on voit le CPU, Apache, Apache CNX, et le load réagir au moment du reboot

Vendredi 28 avril 2023 :

  • On constate que le CPU continue de prendr plus cher qu'avant.
  • Le.htaccess semble hors de cause
  • Un pic Apache/ load vers 16h

Depuis :

  • le CPU est toujours pas revenu à la normale
  • l'usage disque du CPU n'est pas descendu à son niveau d'avant le 26 avril
  • l'usage disque de la BDD est tombé depuis le 26 avril sans remonter
  • pour le reste ça semble OK
  • 5 mai RE-un pic avec effondrement RPS Apache, explosion CPU et RPS Apache CNX, et load
  • 9 mai RE-indispo du site
  • 9 mai 10h15 Patrice va dans Site Health en BO WP, lance l'action pour corriger un problème SSL
  • plus de problème depuis

Fichiers

SGP_SimpleHistory_Logs_25avril2025.png (227 ko) SGP_SimpleHistory_Logs_25avril2025.png Les logs mal horodatés de Simple History ggallais, 02/05/2023 07:56
SGP_prod_25avril2023_11h-16h_cpu.png (340 ko) SGP_prod_25avril2023_11h-16h_cpu.png CPU de 11h à 16h le 25 avril ggallais, 02/05/2023 08:03
SGP_prod_25avril2023_11h-16h_apache.png (277 ko) SGP_prod_25avril2023_11h-16h_apache.png Apache de 11h à 16h le 25 avril ggallais, 02/05/2023 08:03
SGP_prod_25avril2023_11h-16h_apacheCNX.png (245 ko) SGP_prod_25avril2023_11h-16h_apacheCNX.png Apache CNX de 11h à 16h le 25 avril ggallais, 02/05/2023 08:03
SGP_prod_25avril2023_11h-16h_load.png (54 ko) SGP_prod_25avril2023_11h-16h_load.png Load de 11h à 16h le 25 avril ggallais, 02/05/2023 08:03
SGP_prod_26avril2023_00-24h_cpu.png (496 ko) SGP_prod_26avril2023_00-24h_cpu.png CPU le 26 avril ggallais, 02/05/2023 08:43
SGP_prod_26avril2023_00-24h_apache.png (233 ko) SGP_prod_26avril2023_00-24h_apache.png Apache le 26 avril ggallais, 02/05/2023 08:43
SGP_prod_26avril2023_00-24h_ApacheCNX.png (178 ko) SGP_prod_26avril2023_00-24h_ApacheCNX.png Apache CNX le 26 avril ggallais, 02/05/2023 08:43
SGP_prod_26avril2023_00-24h_load.png (44,8 ko) SGP_prod_26avril2023_00-24h_load.png Load le 26 avril ggallais, 02/05/2023 08:44
SGP_prod_27avril2023_00-24h_cpu.png (516 ko) SGP_prod_27avril2023_00-24h_cpu.png CPU le 27 avril ggallais, 02/05/2023 09:13
SGP_prod_27avril2023_00-24h_apache.png (277 ko) SGP_prod_27avril2023_00-24h_apache.png Apache le 27 avril ggallais, 02/05/2023 09:14
SGP_prod_27avril2023_00-24h_apacheCNX.png (131 ko) SGP_prod_27avril2023_00-24h_apacheCNX.png Apache CNX le 27 avril ggallais, 02/05/2023 09:14
SGP_prod_27avril2023_00-24h_apache.png (277 ko) SGP_prod_27avril2023_00-24h_apache.png Load le 27 avril ggallais, 02/05/2023 09:14
SGP_prod_20avril-2mai_cpu.png (159 ko) SGP_prod_20avril-2mai_cpu.png le CPU du 20 avril au 2 mai ggallais, 02/05/2023 09:25
SGP_prod_20avril-2mai_diskUsage.png (58,6 ko) SGP_prod_20avril-2mai_diskUsage.png Usage disque du 20 avril au 2 mai ggallais, 02/05/2023 09:34
Screenshot 2023-05-05 at 16-26-20 Erreur de la base de données.png (11,2 ko) Screenshot 2023-05-05 at 16-26-20 Erreur de la base de données.png 5 mai vers 16h ggallais, 05/05/2023 14:27

Demandes liées 1 (0 ouverte1 fermée)

Bloque [GP] Anomalies & Évolutions - Bug #275: Les liens ancrés génèrent du blanc sur les pagesClosedatos13/04/202317/05/2023

Actions
Actions

Formats disponibles : Atom PDF