AIO APEX

La panne CrowdStrike bloque les vols et paralyse des entreprises dans le monde entier

Partager:
La panne CrowdStrike bloque les vols et paralyse des entreprises dans le monde entier

La cause racine

Le 19 juillet 2024, une mise à jour de configuration de routine du pilote noyau du capteur CrowdStrike Falcon a déclenché la plus grande perturbation IT de l'histoire. Poussée à 04h09 UTC, cette mise à jour a introduit une erreur logique dans le pilote CSAgent.sys, provoquant l'affichage d'un écran bleu (BSOD) sur les systèmes Windows 10 et 11 immédiatement après le démarrage. CrowdStrike a ensuite confirmé que la mise à jour avait passé leurs pipelines de validation automatisée car le chemin de code défectueux ne s'exécutait que dans des conditions mémoire spécifiques non incluses dans leur suite de tests. En 90 minutes, on estime que 8,5 millions de terminaux Windows ont été rendus inopérants dans le monde.

Impact sur l'aviation

Les compagnies aériennes ont été parmi les plus touchées. Delta Air Lines a cloué au sol toute sa flotte pendant plus de 12 heures, annulant 4 700 vols — plus que tout autre transporteur. United Airlines a suspendu ses départs dans le monde entier, annulant 3 200 vols. American Airlines a signalé 1 800 annulations. La FAA a imposé une interdiction de décollage pour tous les vols américains de 06h15 à 09h45 EDT, mais les retards résiduels se sont prolongés tout le week-end. Les aéroports de Londres Heathrow, Singapour Changi et Tokyo Narita ont connu un chaos dans les terminaux, les bornes d'enregistrement, les scanners à bagages et les systèmes de planning des équipages fonctionnant sous Falcon étant tombés hors ligne. Dimanche 21 juillet, les annulations de vols mondiales dépassaient 15 000, selon la société d'analyse aéronautique Cirium.

Perturbations commerciales plus larges

La panne ne s'est pas limitée à l'aviation. JPMorgan Chase a vu les opérations de ses agences ralenties lorsque les postes de travail des employés sont tombés en panne. Le service d'agrégation de nouvelles de la Bourse de Londres, un flux de données de marché critique, s'est arrêté pendant trois heures. En Grande-Bretagne, des pharmacies majeures comme Boots et LloydsPharmacy n'ont pas pu traiter les ordonnances. Dans le secteur de la santé, trois hôpitaux allemands ont déclaré un « incident majeur » et suspendu les chirurgies non urgentes. Les services d'urgence dans plusieurs États américains — dont le système 911 de l'Alaska — ont signalé des retards dans le traitement des appels, car les terminaux des répartiteurs étaient inopérants. Le réseau de lutte contre les crimes financiers du département du Trésor américain (FinCEN) a été contraint de prolonger les délais de déclaration des rapports d'activité suspecte en raison de l'indisponibilité des agents.

Réponse et remédiation de CrowdStrike

Le PDG de CrowdStrike, George Kurtz, a publié une déclaration publique à 08h45 UTC reconnaissant la mise à jour défectueuse. L'entreprise a retiré le fichier de canal (C-00000291.sys) dans les 30 minutes suivant la détection, mais les dégâts étaient faits : les systèmes affectés nécessitaient une intervention manuelle — démarrer en mode sans échec, supprimer le fichier pilote et redémarrer. Pour les organisations disposant de terminaux gérés, l'outil RTR (Real Time Response) de CrowdStrike pouvait automatiser la suppression sur les rares machines qui démarraient encore. Cependant, pour les appareils chiffrés avec BitLocker, la saisie de la clé de récupération était nécessaire, ajoutant des heures à la résolution. CrowdStrike a déployé une seconde mise à jour le 20 juillet qui empêchait le pilote défectueux de se charger, mais n'a pas inversé l'état d'écran bleu sur les machines déjà plantées.

Implications pour la sécurité des terminaux

L'incident a exposé un risque architectural fondamental : des agents de sécurité au niveau du noyau avec des privilèges de mise à jour automatique. CrowdStrike détient 17,5 % du marché mondial de la détection et réponse des terminaux (EDR), et la panne a forcé les entreprises à reconsidérer leur dépendance à un seul fournisseur. Dans la semaine suivante, Microsoft a signalé une augmentation de 30 % des demandes concernant son propre Defender for Endpoint, qui utilise un noyau de sécurité virtualisé (VBS) pour réduire la surface d'attaque des mises à jour de pilotes. Les régulateurs de l'UE et du Royaume-Uni ont annoncé des enquêtes formelles sur la « résilience de la chaîne d'approvisionnement des mises à jour ». CrowdStrike a promis de mettre en place des tests canaris, des déploiements échelonnés et un nouvel outil de validation des fichiers de canal — mais l'événement a déjà accéléré les discussions internes dans les entreprises du Fortune 500 sur l'adoption d'architectures de capteurs multicouches et moins intrusives qui ne s'intègrent pas directement dans le noyau Windows.

Partager:
La panne CrowdStrike bloque les vols et paralyse des entreprises dans le monde entier | AIO APEX