14 de abril de 2026 3 min lectura

Control de Egresos en Sandboxes con Workers: Proxy Programable para Agentes LLM

Lecciones clave

→ Implementar un modelo de seguridad 'zero-trust' en entornos de ejecución no confiables mediante la mediación de todas las interacciones de red.
→ Utilizar proxies programables en el perímetro de aislamiento para inyectar credenciales y aplicar políticas de autorización sin exponer secretos a la carga de trabajo.
→ Considerar la intercepción transparente de TLS (MITM) para un control granular del tráfico HTTPS en entornos de alta seguridad, gestionando cuidadosamente la generación y rotación de certificados efímeros.
→ Diseñar sistemas con capacidad de aplicar políticas de red dinámicas y contextuales, permitiendo ajustar los permisos de egreso en diferentes etapas del ciclo de vida de una tarea.
→ Priorizar la observabilidad en los puntos de egreso para auditar y monitorear las interacciones de los componentes no confiables con servicios externos.
→ Evaluar el impacto en la latencia de los proxies de egreso, optando por soluciones que se ejecuten lo más cerca posible de la carga de trabajo (ej. en el mismo host) para minimizar el overhead.
→ Aprovechar las capacidades de plataformas serverless o edge computing para implementar lógica de proxy de manera eficiente y escalable.

El problema fundamental que aborda esta innovación es la gestión segura y flexible del egreso de red para cargas de trabajo no confiables, como los agentes de IA en entornos sandboxed. A medida que los Large Language Models (LLMs) se integran en flujos de trabajo automatizados, la necesidad de controlar estrictamente sus interacciones con servicios externos se vuelve crítica. Los métodos tradicionales de autenticación (tokens API, OIDC) presentan limitaciones en seguridad, flexibilidad o complejidad de integración, especialmente en escenarios donde la granularidad de permisos es vital y la confianza en el workload es mínima.

La solución propuesta, 'Outbound Workers', resuelve esto al interponer un proxy programable en el camino de cada solicitud de egreso. Este proxy, ejecutándose en el mismo host que el sandbox, permite interceptar, modificar, denegar o registrar el tráfico HTTP/S de manera transparente para la aplicación. Esto habilita un modelo de seguridad 'zero-trust' donde las credenciales sensibles nunca son expuestas al agente, y las políticas de acceso pueden ser dinámicas y adaptadas a cada contexto, mitigando riesgos de exfiltración de datos o acciones no autorizadas.

Arquitectura del Sistema

La arquitectura se basa en la intercepción del tráfico de red saliente de un entorno sandboxed (microVM o contenedor) a través de un 'Outbound Worker'. Este Worker es una función JavaScript que se ejecuta en el runtime de Cloudflare (workerd) en la misma máquina que el sandbox. La intercepción se logra mediante la configuración de reglas de red (ej. nftables con TPROXY en entornos de desarrollo local) que redirigen el tráfico HTTP/S coincidente hacia el Worker.

Para el tráfico HTTPS, se implementa un proxy 'Man-in-the-Middle' (MITM) transparente. Se genera una Autoridad de Certificación (CA) efímera y una clave privada únicas para cada instancia de Sandbox, y esta CA se instala y confía dentro del sandbox. El proceso de red aislado de Cloudflare realiza el handshake TLS, crea un certificado hoja usando la CA efímera y el SNI del ClientHello, y luego invoca al Worker configurado para manejar la solicitud HTTPS descifrada. Las credenciales sensibles (como tokens de autenticación) se inyectan en las cabeceras de la solicitud dentro del Worker, sin que el código del sandbox tenga acceso directo a ellas. La API ctx.container expone métodos como interceptOutboundHttp y interceptOutboundHttps para configurar dinámicamente qué tráfico interceptar y qué Worker usar, permitiendo reglas basadas en hostnames, rangos IP o patrones glob. La comunicación entre el contenedor y el Worker es 'authless' pero segura, ya que ocurre localmente en la misma máquina.

Flujo de Solicitud de Egreso con Outbound Worker

1 Sandbox Agente LLM o aplicación en sandbox inicia solicitud HTTP/S a servicio externo.
2 Sistema de Red (Host) Reglas de red (ej. nftables) interceptan el tráfico saliente del sandbox.
3 Proceso de Red Aislado Para HTTPS: realiza handshake TLS, genera certificado efímero, descifra tráfico.
4 Outbound Worker (workerd) Recibe solicitud (descifrada si es HTTPS). Aplica lógica programada: inyecció...
5 Servicio Externo Worker reenvía la solicitud modificada (o no) al destino original.
6 Outbound Worker (workerd) Recibe respuesta del servicio externo.
7 Proceso de Red Aislado Para HTTPS: vuelve a cifrar la respuesta.
8 Sandbox Sandbox recibe la respuesta como si fuera del servicio externo directamente.

Capa	Tecnología	Justificación
security	Cloudflare Sandboxes/Containers	Entorno de ejecución aislado para cargas de trabajo no confiables (ej. agentes LLM). vs Docker containers (sin aislamiento de microVM), Máquinas virtuales tradicionales
networking	Outbound Workers (Cloudflare Workers)	Proxy programable de egreso que intercepta, modifica y controla el tráfico de red saliente del sandbox. vs Proxies HTTP/S tradicionales (ej. Nginx, Envoy), Servicios de token-exchange personalizados
compute	workerd	Runtime JavaScript open-source de Cloudflare que ejecuta los Outbound Workers localmente en el mismo host que el sandbox. vs Node.js runtime, WebAssembly runtimes
security	TLS MITM Proxying (Ephemeral CA)	Permite la inspección y modificación del tráfico HTTPS saliente del sandbox, manteniendo la seguridad de la comunicación. vs No interceptar HTTPS (limita funcionalidad), Inyección de certificados estáticos (menos seguro) `Generación de CA y clave privada únicas y efímeras por instancia de sandbox.`
networking	nftables (con TPROXY)	Mecanismo de bajo nivel para redirigir el tráfico de red saliente del sandbox hacia el Outbound Worker en el entorno de desarrollo local. vs iptables, eBPF (para redirección de tráfico)

Trade-offs

Ganancias

▲ Seguridad (Zero Trust)
▲ Flexibilidad de Autenticación y Autorización
▲ Observabilidad del Tráfico de Egreso
△ Latencia Adicional
▲ Simplicidad de Desarrollo (para el agente)

Costes

△ Complejidad de la Infraestructura de Proxy
△ Overhead de Procesamiento (para el proxy)
△ Requerimiento de MITM para HTTPS

class OpenCodeInABox extends Sandbox {
  static outboundByHost = {
    "my-internal-vcs.dev": (request, env, ctx) => {
      const headersWithAuth = new Headers(request.headers);
      headersWithAuth.set("x-auth-token", env.SECRET);
      return fetch(request, { headers: headersWithAuth });
    }
  }
}

Define un Outbound Worker que inyecta un token de autenticación en las cabeceras de las solicitudes a un host específico, sin exponer el token al sandbox.

class MySandboxedApp extends Sandbox {
  static outbound = (req, env, ctx) => {
    if (req.method !== 'GET') {
      console.log(`Container making ${req.method} request to: ${req.url}`);
      return new Response('Not Allowed', { status: 405, statusText: 'Method Not Allowed'});
    }
    return fetch(req);
  };
}

Un Outbound Worker que intercepta todas las solicitudes, deniega métodos HTTP que no sean GET y registra las acciones denegadas.

class MySandboxedApp extends Sandbox {
  static outboundHandlers = {
    async allowHosts(req, env, { params }) {
      const url = new URL(request.url);
      const allowedHostname = params.allowedHostnames.includes(url.hostname);
      if (allowedHostname) {
        return await fetch(newRequest);
      } else {
        return new Response(null, { status: 403, statusText: "Forbidden" });
      }
    },
    async noHttp(req) {
      return new Response(null, { status: 403, statusText: "Forbidden" });
    }
  }
}

async function setUpSandboxes(req, env) {
  const sandbox = await env.SANDBOX.getByName(userId);
  await sandbox.setOutboundHandler("allowHosts", {
    allowedHostnames: ["github.com", "npmjs.org"]
  });
  await sandbox.gitClone(userRepoURL);
  await sandbox.exec("npm install");
  await sandbox.setOutboundHandler("noHttp");
}

Define handlers de egreso que pueden ser aplicados programáticamente para cambiar las políticas de red de un sandbox en tiempo de ejecución, por ejemplo, para permitir dependencias y luego bloquear el egreso.

Fundamentos Teóricos

Este enfoque se alinea con principios de seguridad de red y aislamiento de procesos que tienen raíces profundas en la investigación de sistemas operativos y seguridad. La idea de interponer un componente de confianza para mediar las interacciones de un proceso no confiable se remonta a conceptos como los 'reference monitors' de Anderson (1972) y el modelo Bell-LaPadula (1973), que buscan asegurar que todas las operaciones de acceso a recursos sean mediadas, a prueba de manipulaciones y verificables.

La implementación de un proxy de egreso programable también resuena con los principios de 'least privilege' y 'zero trust' en la seguridad de sistemas distribuidos. El 'least privilege' (Saltzer y Schroeder, 1975) dicta que cada entidad debe tener solo los permisos necesarios para realizar su tarea. Al no otorgar tokens directamente al agente y en su lugar inyectarlos en el proxy, se minimiza la superficie de ataque. El modelo 'zero trust' (Forrester Research, 2010s) postula que ninguna entidad, interna o externa, debe ser confiada por defecto, requiriendo verificación continua. El Outbound Worker actúa como un punto de aplicación de políticas 'zero trust' en el perímetro del sandbox, validando y autorizando cada solicitud de egreso.

Fuente original: https://blog.cloudflare.com/sandbox-auth/

Publicado originalmente: 13 de abril de 2026

compartir: X / Twitter LinkedIn WhatsApp

¿Te ha gustado este análisis? Recibe los 5 mejores de la semana →

Suscribirme al digest

El Núcleo de Hierro: Cómo la Infraestructura de Reservas Aéreas de los 60 Sigue Volando

La 'idoneidad para el propósito' (fitness for purpose) puede superar a la arquitectura de moda. Un diseño estrecho y optimizado para una carga de trabajo específica, con décadas de ajuste operacional, puede ser insustituible.

Databases Performance Profiling Distributed Tracing

12 abr 2026

Superando el Límite de 2 VMs en macOS Apple Silicon: Un Deep Dive en XNU

Las políticas de licencia pueden traducirse en restricciones técnicas a nivel de kernel, impactando la flexibilidad del sistema.

Linux Scheduler CPU Architecture

12 abr 2026

Surelock: Prevención de Deadlocks en Rust mediante Tipos y Ordenamiento Estricto

La prevención de deadlocks puede ser una propiedad en tiempo de compilación, no solo en tiempo de ejecución, utilizando sistemas de tipos avanzados.

Consensus Replication Rust