Newsletter para devsEntra

Tokens de entrada y de salida

Cada petición a un proveedor de LLM factura dos contadores distintos: tokens de entrada (lo que el harness manda al modelo — system prompt, contexto, historial, tool results) y tokens de salida (lo que el modelo genera). Los de salida son más caros porque cuestan más cómputo por token. La distinción explica por qué compactar el historial o usar prefix cache ahorra en el contador de entrada, mientras que limitar el esfuerzo ahorra en el de salida. Entender la factura token a token es la base del ahorro real con IA.

Prompt para tu agente
Desglósame el gasto de tokens de <esta petición o flujo> en entrada y salida: qué
infla cada contador, y dame acciones separadas para bajar entrada (compactar,
prefix cache) y salida (menos esfuerzo, respuestas más cortas).

Fuentes en Web Reactiva

Momentos

distinción entre tokens de entrada y de salida, y la memoria de contexto · memoria de contexto, tokens de entrada, tokens de salida, api de servicios

00:14:41Estado de la IA para programadores

buenas prácticas contra el precio creciente de los tokens · gpt 5.5, modelos de copilot, modelo sonnet

01:22:31Buenas prácticas contra los tokens caros

formato de mensajes y tokens mandados al proveedor · grok chat completions, librería ollama, librería gemini

Daniel Primo

Artículo creado por Daniel Primo con ayuda de la IA en base a lo compartido en el podcast, vídeos y textos de Web Reactiva.

12 recursos para developers cada domingo en tu bandeja de entrada

Además de una skill práctica bien explicada, trucos para mejorar tu futuro profesional y una pizquita de humor útil para el resto de la semana. Gratis.