Newsletter para devsEntra

Tokens y ventana de contexto: la economía de los LLM

Un token es la unidad mínima de texto que un modelo tokeniza (no equivale a una palabra: el español suele partirse en más tokens que el inglés por su morfología, un sesgo lingüístico que penaliza a quienes escribimos en castellano). La facturación de cualquier LLM se factura por separado en tokens de entrada (input, lo que envías) y de salida (output, lo que genera), y el coste por output es típicamente varias veces el de input. Sobre ese presupuesto se monta la ventana de contexto: el número máximo de tokens que el modelo puede mantener simultáneamente en memoria por petición. Cuanto más se llena —mensajes previos, herramientas, resultados de MCP, ficheros adjuntos— peor razona: pasada ~80% de ocupación aparecen alucinaciones, olvidos y cambios de idioma o de stack. Por eso la economía del LLM ya no se gestiona solo con prompts, sino con context engineering: cachear respuestas, recortar contexto irrelevante, repartir trabajo entre subagentes, fijar quality gates deterministas (linters, tests) y delegar lo rutinario a modelos open-source más baratos; herramientas como Headroom (SmartCrusher, CacheAligner, ContentRouter, IntelligentContext) prometen recortar hasta un 95% de tokens envolviendo al agente en un proxy que filtra y reutiliza contexto antes de llegar al modelo.

Prompt para tu agente
Estima el consumo de tokens de <esta tarea o prompt>: cuántos de entrada y de
salida, qué parte del contexto es prescindible, y dame 3 recortes concretos para
bajar el coste sin perder la información que el modelo necesita.

Fuentes en Web Reactiva

Momentos

la ventana de contexto se consume con cada mensaje, tool y resultado; al pasar del 80% llegan alucinaciones, olvidos y cambios de idioma o stack · topics: ventana de contexto, límite de tokens, autocompactación

00:44:55Cómo empezar con la IA para crear proyectos de software

enchufar un MCP ya cuesta ~7% del contexto solo para que el modelo sepa que existe; varios MCP a la vez vacían la ventana y disparan alucinaciones · topics: MCPs, tokens de contexto, ventana de contexto

01:54:2411 casos de uso de la IA para developers

SuperMaven ofrece un millón de tokens (4M de caracteres) de ventana de contexto para autocompletado, suficiente para meter un framework entero · topics: ventana de contexto, autocompletado de IA, GitHub Copilot

00:32:56WRP 319: Probamos Claude AI, Supermaven
Daniel Primo

Artículo creado por Daniel Primo con ayuda de la IA en base a lo compartido en el podcast, vídeos y textos de Web Reactiva.

12 recursos para developers cada domingo en tu bandeja de entrada

Además de una skill práctica bien explicada, trucos para mejorar tu futuro profesional y una pizquita de humor útil para el resto de la semana. Gratis.