Cuál fue la curiosa explicación oficial de Fastly del corte mundial masivo en Internet
El problema se originó en un despliegue de software que contenía un error y que se activó cuando un cliente hizo un cambio de configuración en su servicio
La caída, que se produjo el martes y que duró aproximadamente una hora, hizo inaccesibles las páginas de medios de comunicación como The New York Times, The Guardian, CNN y de plataformas como Twitch o Reddit.
En el centro de la caída está Fastly y su CDN (content delivery network), o red de distribución de contenidos, una herramienta que actúa como agente de movilidad y permite el acceso a webs en todo el mundo y sin esperas. Esto es posible gracias a sus nodos, que optimizan la conexión sin importar en qué país estén sus servidores.
Fastly tiene una amplia cartera de clientes y se especializa en ofrecer, principalmente, servicios que apuntan a optimizar el funcionamiento de las páginas web. Aquí entran en juego las CDN o redes de distribución de contenido que fue el eje del problema que afectó varios sitios.
La red de distribución de contenidos permite, como ellos mismos explican en su página, “distribuir aplicaciones y sitios más rápidos, difundir vídeos de la mejor calidad y gozar de visibilidad en tiempo real con una plataforma ágil que da prioridad a las API”.
El vicepresidente sénior de Ingeniería e Infraestructura de Fastly, Nick Rockwell, publicó un comunicado en el que proporcionó más detalles sobre el problema de servicio del 8 de junio.
Rockwell explica que la compañía detectó el error en solo un minuto, y procedió a identificar la causa y deshabilitar la configuración que generó los problemas. Según la empresa, el problema se originó en un despliegue de software que llevó a cabo la empresa en el 12 de mayo, que contenía un error que podía activarse “por una configuración de cliente específica en circunstancias específicas”.
Este martes, un cliente de Fastly llevó a cabo un cambio de configuración que, aunque la compañía asegura que fue válido, provocó el error en el código vulnerable introducido casi un mes antes. Como resultado, el 85 por ciento de la red de Fastly devolvía errores a los internautas que intentaban usar los servicios.
En poco tiempo, tras la identificación del incidente, Fastly lanzó una solución permanente para el problema de software, y la compañía se comprometió a desplegar este parche “de la manera más rápida y segura posible”, según Rockwell.
Fastly llevará a cabo también una investigación completa sobre las prácticas que se realizaron durante el incidente, así como para determinar por qué no detectó en sus procesos de revisión el error que ocasionó la caída global. También evaluará formas de mejorar su tiempo de solución de problemas.