16 de abril de 2026 3 min lectura

La Ciberseguridad como Prueba de Trabajo: Implicaciones de los LLMs en la Detección de Vulnerabilidades

Lecciones clave

→ Evaluar la seguridad como una función de la inversión computacional, no solo de la complejidad del sistema.
→ Considerar la integración de LLMs en el ciclo de vida del desarrollo de software para fases de hardening automatizado.
→ Reevaluar la dependencia de librerías externas; la capacidad de los LLMs para 'yoink' funcionalidad podría reducir la superficie de ataque de la cadena de suministro.
→ Priorizar el software de código abierto, ya que una mayor inversión colectiva en tokens para su hardening podría mejorar su seguridad general.
→ Anticipar un modelo de seguridad donde el costo de hardening se fije por el valor de mercado de un exploit, no por la complejidad intrínseca del sistema.
→ Diseñar sistemas con interfaces y APIs que faciliten la interacción programática y la auditoría automatizada por agentes de IA.
→ Reconocer que la seguridad ya no es un evento discreto, sino un proceso continuo y presupuestado de 'gasto de tokens'.

El problema fundamental que aborda la ciberseguridad, la asimetría de información y recursos entre atacantes y defensores, está siendo fundamentalmente alterado por la capacidad de los Large Language Models (LLMs) para automatizar la búsqueda de exploits. Tradicionalmente, la detección de vulnerabilidades ha dependido en gran medida de la experiencia humana, la heurística y herramientas estáticas o dinámicas que operan bajo reglas predefinidas. Sin embargo, la capacidad de los LLMs para "razonar" sobre sistemas complejos y generar vectores de ataque novedosos, como se observa en modelos como Anthropic Mythos, introduce una nueva dimensión.

Este cambio sugiere una economía de seguridad donde la protección de un sistema se asemeja a un sistema de "Proof of Work" (PoW) criptográfico: la seguridad se logra invirtiendo una cantidad de trabajo computacional (medido en tokens) mayor que la que un atacante estaría dispuesto a invertir para comprometerlo. La relevancia actual de este fenómeno radica en la creciente sofisticación de los ataques y la necesidad de escalar las capacidades de defensa más allá de las limitaciones humanas, empujando hacia soluciones automatizadas que puedan explorar espacios de ataque de manera más exhaustiva y eficiente.

Arquitectura del Sistema

Aunque el artículo no detalla la arquitectura interna de Mythos, describe su rol como un componente de análisis de seguridad en un flujo de trabajo de desarrollo de software. En este contexto, Mythos (o modelos similares) actuaría como un agente autónomo o semi-autónomo capaz de interactuar con un entorno de red simulado o real. La interacción implica la generación de acciones de ataque, la observación de las respuestas del sistema y la iteración sobre estas acciones para identificar rutas de explotación. Esto sugiere un ciclo de "percepción-acción-recompensa" similar al de los agentes de Reinforcement Learning.

Las decisiones de diseño clave en un sistema que integra un LLM para hardening incluyen la gestión del presupuesto de tokens, la orquestación de las simulaciones de ataque, la interpretación de los resultados y la retroalimentación al proceso de desarrollo. La capacidad de los LLMs para procesar y generar texto permite la interacción con interfaces de línea de comandos, APIs y documentación, simulando el comportamiento de un atacante humano. La eficacia del sistema dependería de la calidad del modelo base, la fine-tuning para tareas de seguridad, y la infraestructura subyacente para ejecutar las simulaciones de manera aislada y controlada.

Ciclo de Desarrollo de Software con Hardening por LLM

1 Desarrollo Implementación de funcionalidades guiada por intuición humana y feedback.
2 Revisión de Código Documentación, refactorización, aplicación de mejores prácticas con LLMs.
3 Hardening (LLM) Identificación autónoma de exploits por LLM hasta agotar presupuesto de tokens.
4 Reporte/Mitigación Generación de informes de vulnerabilidades y aplicación de parches.

Trade-offs

Ganancias

▲ Capacidad de detección de exploits
▲ Automatización del proceso de hardening
▲▲ Frecuencia de auditorías de seguridad

Costes

▲ Costo computacional (tokens)
▲ Dependencia de modelos propietarios

Fundamentos Teóricos

La idea de que la seguridad puede ser modelada como un juego de suma cero donde la inversión de recursos computacionales determina el éxito o fracaso tiene raíces en la teoría de juegos y la criptografía. El concepto de "Proof of Work" fue formalizado por Cynthia Dwork y Moni Naor en 1993 como una técnica para combatir el spam, y popularizado por Bitcoin como un mecanismo de consenso distribuido. En ambos casos, se requiere que una parte invierta una cantidad significativa de cómputo para lograr un objetivo, haciendo costosos los ataques o el abuso del sistema.

Desde una perspectiva más amplia, la capacidad de los LLMs para explorar espacios de búsqueda complejos y encontrar soluciones óptimas o subóptimas se relaciona con la investigación en inteligencia artificial y optimización combinatoria. La idea de que "dado suficientes ojos, todos los bugs son superficiales" (Linus's Law) se extiende ahora a "dado suficientes tokens", sugiriendo una conexión con la hipótesis de la eficiencia del mercado en la economía, donde la información se incorpora rápidamente a los precios, o en este caso, a la seguridad de un sistema.

Fuente original: https://www.dbreunig.com/2026/04/14/cybersecurity-is-proof-of-work-now.html

compartir: X / Twitter LinkedIn WhatsApp

¿Te ha gustado este análisis? Recibe los 5 mejores de la semana →

Suscribirme al digest