Saltar al contenido
kerneldigest

Post-Mortems

78 · p.5/6

AWS (Amazon Key Team) — Amazon Key Suite: De monolito acoplado a arquitectura event-driven resiliente con EventBridge

cascading-failure ~mar 2026

Cloudflare — Cloudflare BYOIP Outage: Unintentional BGP Route Withdrawals Due to Buggy API Query in Automated Cleanup Task

human-error feb 2026 367min

Vercel — Vercel Breach: OAuth Supply Chain Attack Exposes Hidden Risk in Platform Environment Variables

dependency-failure feb 2026 87840min

Cloudflare — Múltiples vulnerabilidades de HTTP/1.x Request Smuggling y Cache Poisoning en Pingora (CVE-2026-2833, CVE-2026-2835, CVE-2026-2836)

configuration-drift dic 2025

Sistema Eléctrico Europeo (ENTSO-E) — Blackout masivo en la Península Ibérica del 28 de abril de 2025: Falla en cascada por oscilaciones y control de voltaje deficiente

cascading-failure abr 2025

Cloudflare — Cloudflare: Cómo una migración de esquema de ClickHouse expuso un cuello de botella oculto de contención de locks y escalado de partes

resource-exhaustion mar 2025

Múltiples organizaciones y millones de desarrolladores afectados globalmente — Ataque a la cadena de suministro de software a través de dependencias comprometidas, mitigado accidentalmente por un worm de criptominería

supply-chain-attack Invalid Date 4380min 4.000.000 usuarios

CrowdStrike — CrowdStrike — Crash en Kernel-Mode por Validador de Contenido Defectuoso

cascading-failure jul 2024 8.500.000 usuarios

Kanjideck — Fallo en el servicio de descarga de archivos debido a agotamiento de disco por buffering de Nginx y configuración incorrecta

configuration-drift mar 2024 140min

Múltiples organizaciones y millones de desarrolladores — Ataque a la cadena de suministro de software a través de dependencias comprometidas, mitigado accidentalmente por un gusano de criptominería

supply-chain-attack ene 2024 4380min 4.000.000 usuarios

Cloudflare — Análisis de la gestión de errores: el 'unwrap' de Cloudflare y la importancia de la propiedad global del sistema

human-error nov 2023

Facebook (Meta) — Facebook — Apagón Global por Retirada de Rutas BGP

configuration-drift oct 2021 360min 3.500.000.000 usuarios

Cloudflare — Cloudflare — CPU Exhaustion por Regex Catastrófica en WAF

resource-exhaustion jul 2019 27min

Amazon Web Services — AWS S3 — Caída de us-east-1 por Error Tipográfico en Comando de Mantenimiento

human-error feb 2017

Meta (WhatsApp) — WhatsApp fortalece la seguridad de manejo de medios con la adopción de Rust a escala global para mitigar vulnerabilidades de OS

dependency-failure ago 2015