Cómo enchufar modelos LLM a una app web: las peticiones a la API del modelo se hacen siempre desde el backend (en el frontend no hay secretos), ahí se guardan las API keys y se gestiona el coste por tokens. Cada proveedor (OpenAI, Groq, OpenRouter, modelos locales) expone una API REST similar y casi siempre se paga por consumo, así que conviene meter rate limits y cuotas por usuario. El function-calling / tool use deja que el propio modelo decida invocar tus funciones, y la elección de stack (Laravel+Inertia, Next.js, Astro con SSE) es decisión de arquitectura más que de la propia IA.
Ayúdame a integrar un LLM en <mi webapp y stack>: dónde poner la llamada a la API (backend), cómo guardar las keys, cómo controlar el coste por tokens con rate limits y cuotas, y cuándo usar function-calling. Dame el esqueleto del endpoint.
Fuentes en Web Reactiva
- Primeros pasos para crear una webapp enchufada a la IAwr2025-02-02
- Integrando IA en proyectos web: Taller con GroqPremium2024-11-22
- Crea una webapp con conexión a IA con Next.jsPremium2023-01-27
- Aprende Laravel AI SDK para crear un asistente personal con RAGpost2026-02-10
- Buenas prácticas contra los tokens cada vez más caroswr2026-05-10
Momentos
las peticiones a la API del LLM van del backend; ahí viven las API keys, el coste por tokens y los micropagos · laravel+inertia · api keys
function-calling / tool use: la IA decide si invoca tu función (getWeather → OpenMeteo) descrita como JSON · groq · tools
control de costes: firewall con rate limit por país, observar consumo y separar peticiones caras (open graph)
Artículo creado por Daniel Primo con ayuda de la IA en base a lo compartido en el podcast, vídeos y textos de Web Reactiva.