Saltar al contenido
kerneldigest

Señales

389 señales · página 10 de 20 · GitHub trending, HN, noticias del ecosistema

forrestchang/andrej-karpathy-skills

13 abr 2026

Este repositorio ofrece una guía concisa para mejorar el comportamiento de modelos de lenguaje grandes (LLMs) como Claude en tareas de codificación, basándose en las observaciones de Andrej Karpathy. Es relevante para ingenieros Staff+ que buscan optimizar la interacción con LLMs para desarrollo de software, mejorando la calidad y eficiencia del código generado.

GH·⭐19k ML Training LLM Inference

Provenance del Razonamiento en Agentes de IA Autónomos: Analítica Estructurada del Comportamiento

13 abr 2026

Este artículo propone un nuevo enfoque para analizar el comportamiento de razonamiento de agentes de IA autónomos, yendo más allá de los checkpoints de estado y los rastros de ejecución. Es crucial para ingenieros Staff+ que diseñan y operan infraestructuras de IA complejas, ya que aborda la necesidad de comprender y depurar el comportamiento de los agentes a escala.

arxiv

EdgeFlow: Arranque en frío rápido para LLMs en dispositivos móviles

13 abr 2026

Este artículo presenta EdgeFlow, un framework que aborda la alta latencia de arranque en frío de LLMs en dispositivos móviles. Identifica el cuello de botella clave en el uso ineficiente del ancho de banda de la memoria flash para parámetros no esenciales del modelo, ofreciendo una solución para optimizar la inferencia de LLMs en el edge.

arxiv LLM Inference Edge Computing

Diseño Experimental Bayesiano para la Optimización de Redes de Sensores de Alerta Temprana de Tsunamis

13 abr 2026

Este artículo presenta un marco escalable para optimizar la colocación de sensores en sistemas de alerta temprana de tsunamis. Aborda el desafío de las ecuaciones diferenciales parciales hiperbólicas, transformando el problema inverso en selección de subconjuntos de matrices densas, relevante para ingenieros que diseñan sistemas distribuidos críticos con restricciones de datos y rendimiento.

arxiv

Memoria a escala atómica en fluorografano: 447 TB/cm² con energía de retención cero

12 abr 2026

Este avance propone una arquitectura de memoria post-transistor que utiliza fluorografano para almacenar datos a escala atómica. Ofrece una densidad de 447 TB/cm² y aborda la 'memory wall', un cuello de botella crítico para la IA y la escasez de NAND flash.

arxiv CPU Architecture

FSMOUNT_NAMESPACE: Nueva Característica de VFS en Linux 7.1 para Aislamiento de Contenedores

12 abr 2026

Linux 7.1 introduce FSMOUNT_NAMESPACE, una nueva característica VFS que simplifica la creación de namespaces de montaje con un sistema de archivos adjunto. Esto optimiza el aislamiento para runtimes de contenedores y otras técnicas de sandboxing, reduciendo la complejidad de las operaciones de montaje.

phoronix

Etsy migra su arquitectura de sharding MySQL de 1000 shards y 425 TB a Vitess

12 abr 2026

Etsy detalla la migración de su infraestructura de sharding MySQL a Vitess, un sistema de clustering de código abierto para escalar MySQL. Este cambio permite a los ingenieros de Staff+ aprovechar capacidades avanzadas como el resharding de datos y el sharding de tablas previamente no sharded, mejorando la escalabilidad y gestión de bases de datos distribuidas.

infoq Databases Replication

HKUDS/DeepTutor

11 abr 2026

DeepTutor es un asistente de aprendizaje personalizado basado en agentes que utiliza IA para ofrecer tutorías adaptativas. Es relevante para ingenieros Staff+ interesados en la aplicación de modelos de lenguaje grandes (LLMs) y arquitecturas de agentes para sistemas educativos inteligentes, o en la construcción de plataformas de IA conversacional con personalización profunda.

GH·⭐16k ML Training LLM Inference

Edge Python: Compilador de Python 3.13 con GC Mark-Sweep y VM optimizada (menos de 200KB)

11 abr 2026

Este proyecto presenta un compilador de Python 3.13 de menos de 200KB, con un recolector de basura mark-sweep, VM adaptativa con NaN-boxing y optimizaciones como inline caching. Es relevante para Staff+ engineers interesados en la ejecución de Python en entornos de recursos limitados, como edge computing o WebAssembly, y en la optimización de runtimes.

Reddit Edge Computing WebAssembly

Linux 7.0: Novedades y Cambios Clave en la Próxima Versión del Kernel

11 abr 2026

La versión 7.0 del kernel de Linux está lista para su lanzamiento, introduciendo una serie de nuevas características y mejoras. Es crucial para los ingenieros Staff+ comprender estas actualizaciones para evaluar su impacto en la infraestructura y el rendimiento de sistemas críticos.

phoronix Linux Scheduler CPU Architecture

El nuevo compilador de shaders 'Jay' de Intel se fusiona con Mesa 26.1

11 abr 2026

Intel ha fusionado su nuevo compilador de shaders 'Jay' en Mesa 26.1. Este reemplazo moderno para el compilador BRW, basado en SSA, promete mejoras para GPUs Intel Gen9 y posteriores en Linux, aunque aún está en fase experimental.

phoronix GPU Architecture

Optimización de strnlen para RISC-V en Linux 7.1: Mejoras significativas de rendimiento

10 abr 2026

La implementación optimizada de `strnlen` para RISC-V en Linux 7.1, con mejoras de hasta 427.5%, demuestra cómo las optimizaciones a bajo nivel pueden impactar drásticamente el rendimiento del kernel. Esto es relevante para ingenieros Staff+ que trabajan con arquitecturas específicas o en el desarrollo de sistemas operativos.

phoronix CPU Architecture Performance Profiling

AWS considera vender sus chips personalizados por rack, con alta demanda de capacidad de IA

10 abr 2026

AWS evalúa la venta de sus chips Graviton y Trainium/Inferentia a terceros, dada la enorme demanda interna y externa. Esto podría transformar el mercado de hardware de IA y computación en la nube, ofreciendo nuevas opciones de infraestructura a gran escala.

theregiste CPU Architecture GPU Architecture

MCP Dev Summit 2026: Avances en Gateways, gRPC y Observabilidad para el Protocolo de Contexto de Modelos (MCP)

10 abr 2026

El Model Context Protocol (MCP) ha madurado más allá de sus orígenes experimentales. Este resumen del Dev Summit destaca su evolución hacia servidores remotos, autorización y primitivas para comunicación de agentes de larga duración, con un enfoque en la robustez de la señal de observabilidad.

infoq

google-ai-edge/gallery

9 abr 2026

Este repositorio de Kotlin presenta una galería de casos de uso de Machine Learning y GenAI ejecutándose on-device. Es relevante para ingenieros Staff+ interesados en la inferencia de modelos localmente y la optimización para edge computing, ofreciendo ejemplos prácticos de cómo desplegar y utilizar modelos de IA directamente en dispositivos.

GH·⭐20k Edge Computing LLM Inference

DynLP: Actualización Dinámica Paralela por Lotes para Propagación de Etiquetas en Aprendizaje Semi-Supervisado

9 abr 2026

Este artículo presenta DynLP, un nuevo algoritmo para actualizar eficientemente la propagación de etiquetas en aprendizaje semi-supervisado cuando los datos llegan incrementalmente. Su enfoque en la actualización dinámica por lotes y el uso de GPU es clave para ingenieros Staff+ que buscan optimizar sistemas de ML con datos en streaming.

arxiv GPU Architecture ML Training

Contextual Chain: Diseño de Ledger de Estado Único para Redes Móviles/IoT con Particiones Frecuentes

9 abr 2026

Este artículo propone un protocolo de ledger ligero para redes intermitentes y ruidosas, ideal para entornos IoT y móviles con particiones frecuentes. Su enfoque en autenticación contextual y recuperación eficiente tras particiones es clave para ingenieros que diseñan sistemas distribuidos en entornos de baja conectividad.

arxiv Replication

ForkKV: Escalando el servicio de agentes multi-LoRA con caché KV desagregada Copy-on-Write

9 abr 2026

Este artículo propone ForkKV, una solución para el cuello de botella de memoria en el servicio de LLMs multi-agente con LoRA. Aborda la divergencia de caché KV entre agentes mediante una caché desagregada Copy-on-Write, mejorando la eficiencia y escalabilidad.

arxiv LLM Inference

google-research/timesfm: Modelo fundacional de Google para forecasting de series temporales

8 abr 2026

TimesFM es un modelo fundacional preentrenado de Google Research para la predicción de series temporales. Su relevancia radica en ofrecer una solución de forecasting de alta precisión y escalabilidad, crucial para ingenieros Staff+ que gestionan sistemas con grandes volúmenes de datos temporales en Python, como métricas de infraestructura o proyecciones de negocio.

GH·⭐15k

La función RISC-V XIP de Linux será eliminada tras repetidos fallos

8 abr 2026

La funcionalidad eXecute In Place (XIP) para RISC-V, que permitía ejecutar el kernel de Linux directamente desde ROM para reducir el uso de RAM, será eliminada. Esta decisión se toma debido a su persistente inestabilidad y a los largos períodos en los que ha permanecido inoperable en el kernel principal.

phoronix CPU Architecture