Newsletter para devsEntra

Prefix cache

El prefix cache es el almacén del lado del proveedor que permite saltarse el reproceso de un prefijo compartido entre peticiones consecutivas, facturando esos tokens a una tarifa mucho menor. Si el system prompt y el inicio del contexto son estables a lo largo de la sesión, el caché golpea y el coste de entrada cae. Por eso mudar el system prompt a mitad de sesión o reordenar el contexto invalida el caché y encarece. Es la palanca de ahorro más invisible y la que más interactúa con el diseño del harness.

Prompt para tu agente
Ayúdame a aprovechar el prefix cache en <mi agente>: qué poner al principio del
contexto para que sea estable (system prompt, reglas), qué NO reordenar a mitad de
sesión, y cómo estimar el ahorro en tokens de entrada si el caché golpea.

Fuentes en Web Reactiva

Momentos

buenas prácticas de coste contra tokens caros · gpt 5.5, modelos de copilot, modelo sonnet

01:22:31Buenas prácticas contra los tokens caros
Daniel Primo

Artículo creado por Daniel Primo con ayuda de la IA en base a lo compartido en el podcast, vídeos y textos de Web Reactiva.

12 recursos para developers cada domingo en tu bandeja de entrada

Además de una skill práctica bien explicada, trucos para mejorar tu futuro profesional y una pizquita de humor útil para el resto de la semana. Gratis.