15 de mayo de 2026 3 min lectura

Elaboradores Bidireccionales Tolerantes a Errores para Herramientas de Desarrollo

Lecciones clave

→ Diseñar herramientas de desarrollo requiere que los sistemas de tipos sean tolerantes a errores y proporcionen retroalimentación continua, no solo validación binaria.
→ La abstracción de 'patrones' (como `TpView`) puede simplificar drásticamente la lógica de los typecheckers, haciendo el código más legible y mantenible al encapsular la deconstrucción de tipos.
→ Adoptar principios de tipado gradual, como el tipo 'desconocido', permite que los elaboradores continúen procesando ASTs incompletos o incorrectos, lo cual es vital para la experiencia de usuario en IDEs.
→ La propagación de tipos opcionales (`tp option`) es una técnica efectiva para manejar la incertidumbre de tipos sin detener el proceso de elaboración.
→ Considerar la estructura de los datos para consultas futuras: aunque las anotaciones en el AST son útiles, un formato tabular con IDs únicos puede facilitar consultas complejas (ej. Datalog) para servicios de IDE avanzados.
→ La elección del lenguaje de implementación (ej. OCaml con sus ADTs y pattern matching) puede influir significativamente en la facilidad de traducir reglas formales a código ejecutable.
→ Menos mónadas no siempre es peor: si la lógica de fallo se maneja de forma transparente (ej. con `Option`s que se propagan), la eliminación de la sintaxis monádica puede mejorar la claridad del código.

El problema fundamental que aborda este artículo es cómo los sistemas de tipos, tradicionalmente diseñados para validar la corrección de programas, pueden adaptarse para proporcionar retroalimentación útil en entornos de desarrollo interactivos, incluso cuando el código es incorrecto o incompleto. Los typecheckers bidireccionales, que distinguen entre inferencia (synth) y verificación (check) de tipos, son una base sólida para esta tarea. Sin embargo, su implementación directa a menudo falla estrepitosamente al encontrar un error, dejando al desarrollador sin información contextual crítica. La tesis es que, al adoptar principios de tipado gradual y una abstracción explícita de 'patrones' para la deconstrucción de tipos, se puede construir un elaborador bidireccional que siempre produce un Árbol de Sintaxis Abstracta (AST) anotado, incluso con errores, mejorando drásticamente la experiencia de usuario en IDEs y Language Servers.

Históricamente, los sistemas de tipos han evolucionado desde verificadores batch hasta herramientas más interactivas. La necesidad de retroalimentación continua y rica en errores es un desafío persistente en el diseño de compiladores y herramientas de lenguaje. La integración de la teoría de tipos con la ingeniería de herramientas de desarrollo es un área activa de investigación, con trabajos como los de Cyrus Omar y su equipo en el lenguaje Hazel, que buscan cerrar la brecha entre la corrección formal y la usabilidad práctica.

Arquitectura del Sistema

La arquitectura propuesta se basa en un elaborador bidireccional implementado en OCaml, que utiliza tipos de datos mutuamente recursivos para representar expresiones y tipos. La innovación central es la abstracción de 'patrones' (Get module en la versión con errores, TpView module en la versión tolerante a errores) que encapsula la lógica de deconstrucción y reconstrucción de tipos. Estos patrones permiten que las reglas de tipado se traduzcan a un código más lineal y legible, reduciendo el branching del control de flujo.

En la versión tolerante a errores (ElabNonstop), el sistema utiliza tp option para representar tipos que pueden ser conocidos (Some tp) o desconocidos (None). El módulo TpView proporciona funciones get y put para deconstruir y reconstruir tipos opcionales, respectivamente. Por ejemplo, TpView.arrow.get tp_option siempre devuelve un par de tp option (incluso (None, None) si el tipo de entrada no es una flecha), y TpView.arrow.put (tp1_option, tp2_option) intenta reconstruir un tipo flecha si ambos componentes son conocidos. Esto permite que el elaborador continúe procesando el AST, anotando subexpresiones con None cuando el tipo es irrecuperable, en lugar de detenerse con un error. La función is de TpView se utiliza para verificar explícitamente la forma de un tipo, actuando como un filtro que devuelve None si el tipo no coincide con el patrón esperado. El contexto de tipado (ctx) también se adapta para almacenar tp options, permitiendo la inclusión de variables con tipos desconocidos.

Flujo de Elaboración Bidireccional (Con Errores)

1 Inicio (check/synth) El elaborador recibe un contexto (ctx), expresión (e) y, opcionalmente, un ti...
2 Análisis de Forma Se analiza la forma de la expresión (shape e) para aplicar la regla de tipado...
3 Aplicación de Patrones Se usan funciones de patrón (Get.bool, Get.arrow) para deconstruir tipos. Si ...
4 Recursión (check/synth) Se llama recursivamente a check o synth para subexpresiones, extendiendo el c...
5 Construcción de AST Anotado Si todas las subexpresiones tipan correctamente, se construye un AST con tipo...
6 Fallo de Tipado Si alguna regla de patrón o verificación falla, el proceso se detiene y devue...

Flujo de Elaboración Bidireccional (Tolerante a Errores)

1 Inicio (check/synth) El elaborador recibe un contexto (ctx), expresión (e) y, opcionalmente, un ti...
2 Análisis de Forma Se analiza la forma de la expresión (shape e) para aplicar la regla de tipado...
3 Aplicación de TpView Se usan funciones de TpView (arrow.get, (tuple n).get) para deconstruir tipos...
4 Recursión (check/synth) Se llama recursivamente a check o synth para subexpresiones, propagando tp op...
5 Construcción de AST Anotado Se construye un AST con tipos anotados (tp option), incluso si algunos son None.
6 Propagación de Errores Los tipos desconocidos (None) se propagan a través del AST, permitiendo que e...

Capa	Tecnología	Justificación
compute	OCaml	Lenguaje de implementación para el typechecker, elegido por su fuerte sistema de tipos, soporte para tipos de datos algebraicos y pattern matching, que facilitan la traducción directa de reglas de inferencia. vs Haskell, F#, Rust
data-processing	Bidirectional Typechecking	Algoritmo central para la inferencia y verificación de tipos, que permite un control más granular sobre el flujo de información de tipos. vs Hindley-Milner, Substructural Type Systems
data-processing	Gradual Typing	Principio teórico adaptado para permitir la coexistencia de tipos conocidos y desconocidos, fundamental para la tolerancia a errores en el typechecker. vs Dynamic Typing, Static Typing

type tp = Bool | Arrow of tp * tp | Tuple of tp list

module Exp = struct
  type var = string
  type 'info exp' =
    | BLit of bool
    | If of 'info t * 'info t * 'info t
    | Lam of var * 'info t
    | App of 'info t * 'info t
    | Annot of 'info t * tp
    | Var of var
    | Let of var * 'info t * 'info t
    | Tuple of 'info t list
    | LetTuple of var list * 'info t * 'info t
  and 'info t = In of ('info * 'info exp')
end

Definición de tipos de datos mutuamente recursivos para representar tipos (tp) y expresiones (exp), donde las expresiones pueden llevar información adicional ('info) en cada nodo.

module TpView : sig
  type 'a t = { get : tp option -> 'a; put : 'a -> tp option; }
  val bool : unit option t
  val arrow : (tp option * tp option) t
  val tuple : int -> tp option list t
  val eq : tp option -> unit option t
  val is : 'a t -> tp option -> tp option
end = struct
  type 'a t = { get : tp option -> 'a; put : 'a -> tp option }

  let bool =
    let get tp' = match tp' with Some Bool -> Some () | _ -> None in
    let put tp' = match tp' with Some () -> Some Bool | _ -> None in
    {get; put}

  let arrow =
    let get tp' = match tp' with Some (Arrow(tp1, tp2)) -> (Some tp1, Some tp2) | _ -> (None, None) in
    let put (tp1', tp2') = match tp1', tp2' with Some tp1, Some tp2 -> Some (Arrow(tp1, tp2)) | _ -> None in
    {get; put}

  (* ... other views ... *)

  let is view tp = view.put (view.get tp)
end

Módulo `TpView` que define un tipo `'a t` con funciones `get` y `put` para deconstruir y reconstruir tipos opcionales (`tp option`), permitiendo un manejo estructurado de la forma de los tipos y la propagación de `None`.

Fundamentos Teóricos

La idea de un elaborador que no se detiene ante errores se inspira directamente en el trabajo de Cyrus Omar y sus colaboradores, especialmente en su paper "Total Type Error Localization and Recovery with Holes" (Zhao et al.). Este trabajo adapta el concepto de tipos graduales, introduciendo un tipo 'desconocido' (representado como ?) que es compatible con cualquier otro tipo. Esta 'compatibilidad' es la clave para permitir que el typechecker continúe su ejecución, incluso en presencia de inconsistencias de tipo. El artículo conecta esta compatibilidad con la noción de 'patrones' de Conor McBride, donde la deconstrucción de tipos se convierte en un juicio de compatibilidad en lugar de una igualdad estricta. La teoría de tipos graduales, que combina tipado estático y dinámico, proporciona el marco teórico para manejar la incertidumbre de tipos de manera controlada.

Fuente original: https://semantic-domain.blogspot.com/2026/05/bidirectional-typechecking-that-does.html

Publicado originalmente: 15 de mayo de 2026

compartir: X / Twitter LinkedIn WhatsApp

¿Te ha gustado este análisis? Recibe los 5 mejores de la semana →

Suscribirme al digest

Optimizando la Latencia Percibida en GitHub Issues con Caching Cliente y Service Workers

Priorizar la latencia percibida sobre la latencia de backend pura en aplicaciones interactivas, especialmente en herramientas de productividad.

Performance Profiling

14 may 2026

NTSYNC: Sincronización Nativa de Primitivas de Windows en el Kernel de Linux para Gaming

La compatibilidad a nivel de sistema operativo es más robusta que la emulación a nivel de aplicación para cargas de trabajo críticas.

Linux Scheduler Performance Profiling

14 may 2026

Streaming Métricas de CloudWatch a OpenTelemetry en VPC con AWS Lambda

Priorizar arquitecturas push-based para observabilidad a escala para reducir costos y latencia, especialmente en entornos de nube elásticos.

Distributed Tracing Performance Profiling