Whisper y servicios de transcripción convierten audio y vídeo en texto, punto de partida para generar resúmenes, artículos, subtítulos e índices buscables. La cadena habitual va del fichero .srt al troceado por ventanas, al modelo de lenguaje (GPT-3.5/4, Groq) y al contenido publicado. Se puede correr en local (Whisper open source) o vía API, integrándolo en bots de Telegram, pipelines de indexación de podcasts y flujos de SEO.
Diseña un pipeline de transcripción para <audio o vídeo>: de la voz al .srt con Whisper (local o API), troceado, y un LLM que saque resumen, subtítulos e índice buscable. Dime qué correr en local y qué por API, y por qué.
Fuentes en Web Reactiva
- Crea una webapp con ChatGPT para integrar una IA gratuita de detección de objetosPremium2024-01-25
- WR 260: Así estoy usando la IA para ser más productivo e ingeniosowr2023-03-31
- WRP 251. Evaristo, fíate de la Inteligencia ArtificialPremium2023-06-19
- Crea de forma fácil bots de telegramPremium2025-02-12
- Integrando IA en proyectos web: Taller con GroqPremium2024-11-22
Momentos
Whisper de OpenAI para transcribir audio a texto, export a `.srt` y troceado para pasar a GPT-4 · Whisper, SRT, GPT-4
"Transcripción party": scripts que trocean el SRT y generan resúmenes automáticos con la API de OpenAI · transcripción party, resúmenes automáticos
Whisper-large-v3-turbo vía Groq para transcribir y traducir audio desde el navegador · Whisper-large-v3-turbo, Groq
Artículo creado por Daniel Primo con ayuda de la IA en base a lo compartido en el podcast, vídeos y textos de Web Reactiva.