Newsletter para devsEntra

Transcripción de audio con IA: de voz a texto y a contenido

Whisper y servicios de transcripción convierten audio y vídeo en texto, punto de partida para generar resúmenes, artículos, subtítulos e índices buscables. La cadena habitual va del fichero .srt al troceado por ventanas, al modelo de lenguaje (GPT-3.5/4, Groq) y al contenido publicado. Se puede correr en local (Whisper open source) o vía API, integrándolo en bots de Telegram, pipelines de indexación de podcasts y flujos de SEO.

Prompt para tu agente
Diseña un pipeline de transcripción para <audio o vídeo>: de la voz al .srt con
Whisper (local o API), troceado, y un LLM que saque resumen, subtítulos e índice
buscable. Dime qué correr en local y qué por API, y por qué.

Fuentes en Web Reactiva

Momentos

Whisper de OpenAI para transcribir audio a texto, export a `.srt` y troceado para pasar a GPT-4 · Whisper, SRT, GPT-4

00:06:41Crea una webapp con ChatGPT para integrar una IA gratuita

"Transcripción party": scripts que trocean el SRT y generan resúmenes automáticos con la API de OpenAI · transcripción party, resúmenes automáticos

00:14:57WRP 251. Evaristo, fíate de la IA

Whisper-large-v3-turbo vía Groq para transcribir y traducir audio desde el navegador · Whisper-large-v3-turbo, Groq

00:47:06Integrando IA en proyectos web: Taller con Groq
Daniel Primo

Artículo creado por Daniel Primo con ayuda de la IA en base a lo compartido en el podcast, vídeos y textos de Web Reactiva.

12 recursos para developers cada domingo en tu bandeja de entrada

Además de una skill práctica bien explicada, trucos para mejorar tu futuro profesional y una pizquita de humor útil para el resto de la semana. Gratis.