Groq

Plataforma para ejecutar modelos LLM ultrarrápidos con un generoso tier gratuito

Groq es una plataforma para ejecutar modelos de lenguaje, audio y visión con una velocidad asombrosa. Está centrada en ofrecer tiempos de respuesta mínimos gracias a su propia infraestructura especializada, y permite trabajar con modelos como LLaMA 3 y Gemma sin fricciones. Además, tiene un plan gratuito generoso para empezar a experimentar sin necesidad de tarjeta.

🧡 Recomendamos Groq Cloud ¶

Usamos Groq Cloud para integrar en una aplicación un extra de funcionalidad para que el usuario pueda responder preguntas, leer imágenes y transcribir audio con la API de Groq.

⭐️ Accede a la masterclass completa.

Ficha ¶

Distribución:
Freemium (plan gratuito amplio, sin tarjeta de crédito)

🔑 Características clave ¶

Ejecuta modelos de última generación como LLaMA 3, Gemma o Whisper
Bajísima latencia en generación de texto, audio y procesamiento de imágenes
Incluye tooling para agentes, batch processing y moderación de contenido

💡 Ideas para usar Groq ¶

Chatbots y asistentes contextuales ultrarrápidos
Gracias a su bajísima latencia y soporte para modelos con ventanas contextuales de hasta 128K tokens, es ideal para construir experiencias conversacionales fluidas sin la típica espera en la respuesta.
Procesamiento masivo de contenido con batch o flex
Sus opciones avanzadas para batch y flex processing permiten analizar grandes volúmenes de texto o audio en paralelo, lo que lo hace muy potente para empresas que trabajan con muchos datos.
Sistemas de voz a texto o texto a voz con calidad premium
El soporte para modelos Whisper y TTS lo hace útil para subtitulado automático, asistentes por voz o análisis de llamadas, sin necesidad de infra propia.
Desarrollo de herramientas internas inteligentes
Desde generación de documentación técnica hasta agentes que actúan como copilotos en tareas internas, el uso de Groq como backend de IA permite incorporar inteligencia sin complicarse con infra.
Experimentación con agentes y reasoning complejo
Groq ofrece tooling específico para construir agentes capaces de razonar, ejecutar herramientas o buscar en tiempo real, lo que abre la puerta a desarrollar soluciones más allá del típico prompt-respuesta.

Ejemplo de uso ¶

Instalación con Node.js:

npm install groq-sdk

Configura tu clave:

# En tu terminal
export GROQ_API_KEY="tu_clave_aquí"

Código básico para hacer una llamada a un modelo LLaMA 3:

// chat.js
import Groq from "groq-sdk";

const groq = new Groq({ apiKey: process.env.GROQ_API_KEY });

export async function main() {
  const response = await groq.chat.completions.create({
    messages: [
      { role: "user", content: "¿Qué ventajas tiene LLaMA 3 frente a GPT-3.5?" }
    ],
    model: "llama-3.3-70b-versatile"
  });

  console.log(response.choices[0]?.message?.content || "");
}

main();

Este código llama al modelo llama-3.3-70b-versatile, que ofrece una mezcla excelente de velocidad y comprensión. Ideal para empezar a construir tu propio asistente personalizado en tiempo real.