Un LLM es no determinista (non-determinism): dale exactamente la misma entrada dos veces y puede darte dos respuestas diferentes. No es un fallo, es cómo funciona —genera muestreando token a token, con azar controlado—, y tiene consecuencias prácticas incómodas. No puedes tratar a la IA como una función pura: lo que funcionó ayer puede no reproducirse hoy, un prompt que salió redondo una vez no garantiza el mismo resultado, y depurar «por qué esta vez lo hizo mal» es escurridizo. Además, el modelo siempre responde, nunca se calla ni se cansa; cuando se queda sin conocimiento o se le agota la ventana de contexto no dice «no sé», sino que entra en modo alucinación. La respuesta de ingeniería no es esperar reproducibilidad, sino blindarse con verificación determinista (tests, linters, revisión) y no fiarse de una sola tirada.
Trata este resultado de IA como no determinista: dame 3 comprobaciones deterministas (tests, linters o asserts) que pueda ejecutar para validar <lo que ha generado> sin depender de que la próxima tirada salga igual.
Fuentes en Web Reactiva
Momentos
la IA siempre te responde y nunca se cansa; el chat solo «se agota» si se acaba la ventana de contexto, y aun así no se calla: entra en modo alucinación, por eso cada vez más sistemas compactan la conversación · topics: ventana de contexto, modo de alucinación
Artículo creado por Daniel Primo con ayuda de la IA en base a lo compartido en el podcast, vídeos y textos de Web Reactiva.