FloWords se integra con proveedores de IA en la nube líderes para transcripción profesional. Ideal cuando necesitas la mayor precisión o maneja grabaciones largas.
OpenAI Whisper API
Versión alojada del modelo Whisper de OpenAI.
Precio : ~$0.006/minuto
Groq
Inferencia ultrarrápida con hardware especializado.
Precio : Nivel gratuito, luego pago por uso
Deepgram
Modelos de discurso especializados con diarización.
Precio : Créditos gratuitos + pago por uso
Google Gemini
IA multimodal de Google con transcripción.
Precio : Nivel gratuito, luego pago por uso
ElevenLabs
Reconocimiento de voz de alta calidad (Scribe).
Precio : Ver sitio del proveedor
Mistral
Proveedor europeo con enfoque en privacidad (Voxtral).
Precio : Ver sitio del proveedor
Soniox
Transcripción multilingüe asíncrona.
Precio : Ver sitio del proveedor
Versión alojada del modelo Whisper con procesamiento más rápido que modelos locales grandes.
Precisión : Nivel profesional sin la carga computacional
Velocidad : Más rápido que ejecutar Large localmente
Idiomas : Soporte para 99+ idiomas
Límite de archivo : Hasta 25 MB por archivo
Obtén una clave API de platform.openai.com
Abre Configuración de FloWords (⌘,)
Ve a Proveedor de Transcripción
Selecciona OpenAI
Ingresa tu Clave API
Haz clic en Probar Conexión
Ajusta configuraciones (idioma, modelo)
Modelo : Whisper API
Costo : $0.006 por minuto
Ejemplo : 10 minutos = $0.06
Inferencia ultrarrápida usando Unidades de Procesamiento de Lenguaje (LPUs) personalizadas de Groq.
Velocidad : Extremadamente rápido (real-time+)
Precisión : Alta calidad
Nivel Gratuito : Uso generoso incluido
Idiomas : Multilingüe
Regístrate en console.groq.com
Genera una clave API
Abre Configuración de FloWords
Selecciona Groq como proveedor
Ingresa tu Clave API
Prueba la conexión
Nivel Gratuito : Incluido
Pago : Basado en uso después del nivel gratuito
Velocidad : Más rápido que la mayoría de proveedores
Proveedor de IA de discurso especializado con características profesionales.
Diarización : Detecta quién habló cuándo
Puntación Inteligente : Agrega puntuación automáticamente
Detección de Idioma : Identifica idiomas automáticamente
Precisión de Acento : Excelente con acentos diversos
Crea cuenta en deepgram.com
Obtén tu clave API desde el panel de control
Abre Configuración de FloWords
Selecciona Deepgram
Ingresa Clave API
Configura opciones (modelo, idioma, etc.)
Prueba la conexión
Diarización de Hablantes :
Identifica múltiples hablantes
Separa transcripciones por hablante
Ideal para transcripción de reuniones
Detección de Idioma :
Detecta idioma automáticamente
Maneja contenido multilingüe
Sin configuración de idioma necesaria
Puntación :
Agrega puntuación automáticamente
Capitalización inteligente
Salida más legible
Créditos Gratuitos : $200 para nuevos usuarios
Pago Por Uso : Después de créditos gratuitos
Revisa deepgram.com/pricing
La IA multimodal de Google con capacidades de transcripción.
Multimodal : comprensión de audio y contexto
Modelos : Gemini 2.5 Pro y 2.5 Flash
Idiomas : amplio soporte multilingüe
Nivel Gratuito : disponible
Crea una cuenta en aistudio.google.com
Genera una clave API
Abre Configuración de FloWords
Selecciona Gemini
Ingresa tu Clave API
Prueba la conexión
Conocido por su síntesis de voz, también ofrece reconocimiento de voz de alta calidad con el modelo Scribe.
Alta Calidad : reconocimiento de voz preciso
Modelos : Scribe v2 y Scribe v1
Idiomas : multilingüe
Crea una cuenta en elevenlabs.io
Copia tu clave API
Abre Configuración de FloWords
Selecciona ElevenLabs
Ingresa tu Clave API
Prueba la conexión
Proveedor europeo de IA con enfoque en privacidad. Usa el modelo Voxtral.
Datos en Europa : procesamiento en la UE
Multilingüe : fuerte soporte de idiomas
GDPR : conformidad europea
Modelo : Voxtral Mini
Crea una cuenta en console.mistral.ai
Genera una clave API
Abre Configuración de FloWords
Selecciona Mistral
Ingresa tu Clave API
Prueba la conexión
Transcripción multilingüe de voz a texto con el modelo asíncrono stt-async-v3.
Multilingüe : buena precisión en varios idiomas
Asíncrono : procesamiento de transcripción
Grabaciones largas : ideal para audio extenso
Crea una cuenta en soniox.com
Genera una clave API
Abre Configuración de FloWords
Selecciona Soniox
Ingresa tu Clave API
Prueba la conexión
Proveedor Velocidad Precisión Nivel Gratuito Mejor Para OpenAI Rápido Excelente No Uso general, multilingüe Groq Muy rápido Alta Sí Velocidad, tiempo real Deepgram Rápido Excelente Créditos Reuniones, diarización Gemini Rápido Excelente Sí Multimodal, contexto ElevenLabs Medio Buena Varía Flujos centrados en voz Mistral Medio Alta Varía Multilingüe, datos en Europa Soniox Rápido Alta Varía Grabaciones largas, multilingüe
Grabaciones largas (30+ minutos)
Audio difícil (ruido de fondo, acentos)
Trabajo profesional (necesitas máxima precisión)
Múltiples hablantes (reuniones, entrevistas)
Necesitas velocidad (archivos grandes procesados rápidamente)
Privacidad es crítica (información sensible)
Sin conexión a internet disponible
Presupuesto limitado (sin costos recurrentes)
Dictado breve (modelos locales suficientemente rápidos)
Usa modelos locales para dictado diario
Reserva proveedores en la nube para transcripción importante
Edita audio antes de transcribir
Recorta silencio al inicio/final
Remueve partes innecesarias
Aprovecha niveles gratuitos
Groq y Gemini ofrecen uso gratuito
Deepgram ofrece créditos iniciales
Monitorea tu uso
Revisa paneles de control de proveedores
Establece alertas de presupuesto si está disponible
Ejemplo: Reunión de 1 hora
Proveedor Costo Estimado OpenAI ~$0.36 Groq Gratis (nivel gratuito) Deepgram Varía (~$0.40) Gemini Varía ElevenLabs Varía Mistral Varía Soniox Varía
Cuando usas proveedores en la nube:
Audio enviado a servidor : Tu grabación se envía a la API del proveedor
Procesado en la nube : La transcripción ocurre en sus servidores
Retención de datos : Revisa la política de cada proveedor
Encriptación : Datos encriptados en tránsito (HTTPS)
Nunca compartas claves API con nadie
Almacena de forma segura en tu Llavero de macOS
Rota claves periódicamente
Revoca claves antiguas si están comprometidas
Usa claves de solo lectura cuando sea posible
Para trabajo sensible, revisa:
Certificación GDPR del proveedor
Conformidad HIPAA (si aplica)
Ubicación de procesamiento de datos
Políticas de retención de datos
Verifica que copiaste la clave completa
Revisa si hay espacios extra al inicio/final
Confirma que la clave no expiró
Genera una nueva clave si es necesario
Verifica tu conexión a internet
Revisa estado del proveedor (downtime)
Intenta con un archivo más pequeño
Verifica configuración de firewall
Revisa uso en panel del proveedor
Actualiza plan si es necesario
Espera reinicio del límite de tasa
Cambia a proveedor diferente temporalmente
Comprimir archivo de audio
Dividir en segmentos más pequeños
Usar menor tasa de bits
Algunas APIs tienen límite de 25 MB