La generación aumentada con recuperación (RAG) enseña a un LLM a responder apoyándose en documento propio: se indexan textos convirtiéndolos en embeddings (vectores), se almacenan en una base de datos vectorial (Pinecone, Supabase, SQLite vectorial) y, al consultar, se busca semánticamente el fragmento más relevante antes de generar la respuesta. Frameworks como LangChain o LLPhant orquestan la ingesta, el troceado y el SearchKnowledgeBase, de modo que sin desplegar infra pesada puedes montar un asistente que “conoce” tus transcripciones, posts o cursos.
Diseña un RAG mínimo para que un LLM responda sobre <mi corpus: docs, posts, transcripciones>: cómo trocear y generar embeddings, qué base vectorial usar y cómo recuperar solo el fragmento relevante para no malgastar contexto.
Fuentes en Web Reactiva
- Aprende Laravel AI SDK para crear un asistente personal con RAGpost2026-02-10
- WR 260: Así estoy usando la IA para ser más productivo e ingeniosowr2023-03-31
- WR 263: Developers impostores: ¡Ya no estás solo!wr2023-05-19
- Crea una webapp con ChatGPT para integrar una IA gratuita de detección de objetosPremium2024-01-25
Momentos
scraping de cursos, proceso de embedding y base de datos vectorial para alimentar un buscador semántico · rag · embeddings vectoriales
Robotito usa representaciones vectoriales para encontrar relaciones que un buscador por tags no puede · búsqueda semántica · embeddings
qué es un RAG: convertir texto a vectores y compararlos para responder solo con tu contenido · simple vector store · embeddings de texto
Artículo creado por Daniel Primo con ayuda de la IA en base a lo compartido en el podcast, vídeos y textos de Web Reactiva.