Ir al contenido

Proveedores en la Nube

FloWords se integra con proveedores de IA en la nube líderes para transcripción profesional. Ideal cuando necesitas la mayor precisión o maneja grabaciones largas.


OpenAI Whisper API

Versión alojada del modelo Whisper de OpenAI.

Precio: ~$0.006/minuto

Groq

Inferencia ultrarrápida con hardware especializado.

Precio: Nivel gratuito, luego pago por uso

Deepgram

Modelos de discurso especializados con diarización.

Precio: Créditos gratuitos + pago por uso

Google Gemini

IA multimodal de Google con transcripción.

Precio: Nivel gratuito, luego pago por uso

ElevenLabs

Reconocimiento de voz de alta calidad (Scribe).

Precio: Ver sitio del proveedor

Mistral

Proveedor europeo con enfoque en privacidad (Voxtral).

Precio: Ver sitio del proveedor

Soniox

Transcripción multilingüe asíncrona.

Precio: Ver sitio del proveedor


Versión alojada del modelo Whisper con procesamiento más rápido que modelos locales grandes.

  • Precisión: Nivel profesional sin la carga computacional
  • Velocidad: Más rápido que ejecutar Large localmente
  • Idiomas: Soporte para 99+ idiomas
  • Límite de archivo: Hasta 25 MB por archivo
  1. Obtén una clave API de platform.openai.com
  2. Abre Configuración de FloWords (⌘,)
  3. Ve a Proveedor de Transcripción
  4. Selecciona OpenAI
  5. Ingresa tu Clave API
  6. Haz clic en Probar Conexión
  7. Ajusta configuraciones (idioma, modelo)
  • Modelo: Whisper API
  • Costo: $0.006 por minuto
  • Ejemplo: 10 minutos = $0.06

Inferencia ultrarrápida usando Unidades de Procesamiento de Lenguaje (LPUs) personalizadas de Groq.

  • Velocidad: Extremadamente rápido (real-time+)
  • Precisión: Alta calidad
  • Nivel Gratuito: Uso generoso incluido
  • Idiomas: Multilingüe
  1. Regístrate en console.groq.com
  2. Genera una clave API
  3. Abre Configuración de FloWords
  4. Selecciona Groq como proveedor
  5. Ingresa tu Clave API
  6. Prueba la conexión
  • Nivel Gratuito: Incluido
  • Pago: Basado en uso después del nivel gratuito
  • Velocidad: Más rápido que la mayoría de proveedores

Proveedor de IA de discurso especializado con características profesionales.

  • Diarización: Detecta quién habló cuándo
  • Puntación Inteligente: Agrega puntuación automáticamente
  • Detección de Idioma: Identifica idiomas automáticamente
  • Precisión de Acento: Excelente con acentos diversos
  1. Crea cuenta en deepgram.com
  2. Obtén tu clave API desde el panel de control
  3. Abre Configuración de FloWords
  4. Selecciona Deepgram
  5. Ingresa Clave API
  6. Configura opciones (modelo, idioma, etc.)
  7. Prueba la conexión

Diarización de Hablantes:

  • Identifica múltiples hablantes
  • Separa transcripciones por hablante
  • Ideal para transcripción de reuniones

Detección de Idioma:

  • Detecta idioma automáticamente
  • Maneja contenido multilingüe
  • Sin configuración de idioma necesaria

Puntación:

  • Agrega puntuación automáticamente
  • Capitalización inteligente
  • Salida más legible
  • Créditos Gratuitos: $200 para nuevos usuarios
  • Pago Por Uso: Después de créditos gratuitos
  • Revisa deepgram.com/pricing

La IA multimodal de Google con capacidades de transcripción.

  • Multimodal: comprensión de audio y contexto
  • Modelos: Gemini 2.5 Pro y 2.5 Flash
  • Idiomas: amplio soporte multilingüe
  • Nivel Gratuito: disponible
  1. Crea una cuenta en aistudio.google.com
  2. Genera una clave API
  3. Abre Configuración de FloWords
  4. Selecciona Gemini
  5. Ingresa tu Clave API
  6. Prueba la conexión

Conocido por su síntesis de voz, también ofrece reconocimiento de voz de alta calidad con el modelo Scribe.

  • Alta Calidad: reconocimiento de voz preciso
  • Modelos: Scribe v2 y Scribe v1
  • Idiomas: multilingüe
  1. Crea una cuenta en elevenlabs.io
  2. Copia tu clave API
  3. Abre Configuración de FloWords
  4. Selecciona ElevenLabs
  5. Ingresa tu Clave API
  6. Prueba la conexión

Proveedor europeo de IA con enfoque en privacidad. Usa el modelo Voxtral.

  • Datos en Europa: procesamiento en la UE
  • Multilingüe: fuerte soporte de idiomas
  • GDPR: conformidad europea
  • Modelo: Voxtral Mini
  1. Crea una cuenta en console.mistral.ai
  2. Genera una clave API
  3. Abre Configuración de FloWords
  4. Selecciona Mistral
  5. Ingresa tu Clave API
  6. Prueba la conexión

Transcripción multilingüe de voz a texto con el modelo asíncrono stt-async-v3.

  • Multilingüe: buena precisión en varios idiomas
  • Asíncrono: procesamiento de transcripción
  • Grabaciones largas: ideal para audio extenso
  1. Crea una cuenta en soniox.com
  2. Genera una clave API
  3. Abre Configuración de FloWords
  4. Selecciona Soniox
  5. Ingresa tu Clave API
  6. Prueba la conexión

ProveedorVelocidadPrecisiónNivel GratuitoMejor Para
OpenAIRápidoExcelenteNoUso general, multilingüe
GroqMuy rápidoAltaVelocidad, tiempo real
DeepgramRápidoExcelenteCréditosReuniones, diarización
GeminiRápidoExcelenteMultimodal, contexto
ElevenLabsMedioBuenaVaríaFlujos centrados en voz
MistralMedioAltaVaríaMultilingüe, datos en Europa
SonioxRápidoAltaVaríaGrabaciones largas, multilingüe

  • Grabaciones largas (30+ minutos)
  • Audio difícil (ruido de fondo, acentos)
  • Trabajo profesional (necesitas máxima precisión)
  • Múltiples hablantes (reuniones, entrevistas)
  • Necesitas velocidad (archivos grandes procesados rápidamente)
  • Privacidad es crítica (información sensible)
  • Sin conexión a internet disponible
  • Presupuesto limitado (sin costos recurrentes)
  • Dictado breve (modelos locales suficientemente rápidos)

  1. Usa modelos locales para dictado diario

    • Reserva proveedores en la nube para transcripción importante
  2. Edita audio antes de transcribir

    • Recorta silencio al inicio/final
    • Remueve partes innecesarias
  3. Aprovecha niveles gratuitos

    • Groq y Gemini ofrecen uso gratuito
    • Deepgram ofrece créditos iniciales
  4. Monitorea tu uso

    • Revisa paneles de control de proveedores
    • Establece alertas de presupuesto si está disponible

Ejemplo: Reunión de 1 hora

ProveedorCosto Estimado
OpenAI~$0.36
GroqGratis (nivel gratuito)
DeepgramVaría (~$0.40)
GeminiVaría
ElevenLabsVaría
MistralVaría
SonioxVaría

Cuando usas proveedores en la nube:

  • Audio enviado a servidor: Tu grabación se envía a la API del proveedor
  • Procesado en la nube: La transcripción ocurre en sus servidores
  • Retención de datos: Revisa la política de cada proveedor
  • Encriptación: Datos encriptados en tránsito (HTTPS)
  1. Nunca compartas claves API con nadie
  2. Almacena de forma segura en tu Llavero de macOS
  3. Rota claves periódicamente
  4. Revoca claves antiguas si están comprometidas
  5. Usa claves de solo lectura cuando sea posible

Para trabajo sensible, revisa:

  • Certificación GDPR del proveedor
  • Conformidad HIPAA (si aplica)
  • Ubicación de procesamiento de datos
  • Políticas de retención de datos

  1. Verifica que copiaste la clave completa
  2. Revisa si hay espacios extra al inicio/final
  3. Confirma que la clave no expiró
  4. Genera una nueva clave si es necesario
  • Verifica tu conexión a internet
  • Revisa estado del proveedor (downtime)
  • Intenta con un archivo más pequeño
  • Verifica configuración de firewall
  • Revisa uso en panel del proveedor
  • Actualiza plan si es necesario
  • Espera reinicio del límite de tasa
  • Cambia a proveedor diferente temporalmente
  • Comprimir archivo de audio
  • Dividir en segmentos más pequeños
  • Usar menor tasa de bits
  • Algunas APIs tienen límite de 25 MB