Ir al contenido

Proveedores en la Nube

FloWords se integra con proveedores de IA en la nube líderes para transcripción profesional. Ideal cuando necesitas la mayor precisión o maneja grabaciones largas.


OpenAI Whisper API

Versión alojada del modelo Whisper de OpenAI.

Precio: ~$0.006/minuto

Groq

Inferencia ultrarrápida con hardware especializado.

Precio: Nivel gratuito, luego pago por uso

Deepgram

Modelos de discurso especializados con características avanzadas.

Precio: Créditos gratuitos + pago por uso

AssemblyAI

IA de discurso avanzada con análisis.

Precio: Nivel gratuito para empezar


Versión alojada del modelo Whisper con procesamiento más rápido que modelos locales grandes.

  • Precisión: Nivel de modelo Large sin la carga computacional
  • Velocidad: Más rápido que ejecutar Large localmente
  • Idiomas: Soporte para 99+ idiomas
  • Límite de archivo: Hasta 25 MB por archivo
  1. Obtén una clave API de platform.openai.com
  2. Abre Configuración de FloWords (⌘,)
  3. Ve a Proveedor de Transcripción
  4. Selecciona OpenAI
  5. Ingresa tu Clave API
  6. Haz clic en Probar Conexión
  7. Ajusta configuraciones (idioma, modelo)
  • Modelo: Whisper API
  • Costo: $0.006 por minuto
  • Ejemplo: 10 minutos = $0.06

Inferencia ultrarrápida usando Unidades de Procesamiento de Lenguaje (LPUs) personalizadas de Groq.

  • Velocidad: Extremadamente rápido (real-time+)
  • Precisión: Alta calidad
  • Nivel Gratuito: Uso generoso incluido
  • Idiomas: Multilingüe
  1. Regístrate en console.groq.com
  2. Genera una clave API
  3. Abre Configuración de FloWords
  4. Selecciona Groq como proveedor
  5. Ingresa tu Clave API
  6. Prueba la conexión
  • Nivel Gratuito: Incluido
  • Pago: Basado en uso después del nivel gratuito
  • Velocidad: Más rápido que la mayoría de proveedores

Proveedor de IA de discurso especializado con características profesionales.

  • Diarización: Detecta quién habló cuándo
  • Puntación Inteligente: Agrega puntuación automáticamente
  • Detección de Idioma: Identifica idiomas automáticamente
  • Precisión de Acento: Excelente con acentos diversos
  1. Crea cuenta en deepgram.com
  2. Obtén tu clave API desde el panel de control
  3. Abre Configuración de FloWords
  4. Selecciona Deepgram
  5. Ingresa Clave API
  6. Configura opciones (modelo, idioma, etc.)
  7. Prueba la conexión

Diarización de Hablantes:

  • Identifica múltiples hablantes
  • Separa transcripciones por hablante
  • Ideal para transcripción de reuniones

Detección de Idioma:

  • Detecta idioma automáticamente
  • Maneja contenido multilingüe
  • Sin configuración de idioma necesaria

Puntación:

  • Agrega puntuación automáticamente
  • Capitalización inteligente
  • Salida más legible
  • Créditos Gratuitos: $200 para nuevos usuarios
  • Pago Por Uso: Después de créditos gratuitos
  • Revisa deepgram.com/pricing

Plataforma de IA de discurso con características de análisis y resumen.

  • Alta Precisión: Excelente en audio difícil
  • Resumen: Resumen automático de contenido
  • Detección de Temas: Identifica temas principales
  • Moderación de Contenido: Detecta contenido sensible
  1. Regístrate en assemblyai.com
  2. Copia tu clave API
  3. Abre Configuración de FloWords
  4. Selecciona AssemblyAI
  5. Pega tu Clave API
  6. Habilita características deseadas
  7. Prueba la configuración

Resumen Automático:

  • Genera resúmenes de transcripciones
  • Extrae puntos clave
  • Ahorra tiempo de revisión

Detección de Temas:

  • Identifica temas principales
  • Categoriza contenido
  • Útil para reuniones largas

Moderación de Contenido:

  • Marca contenido sensible
  • Filtrado PII (información personal)
  • Características de cumplimiento

ProveedorVelocidadPrecisiónNivel GratuitoMejor Para
OpenAIRápidoExcelenteNoUso general, multilingüe
GroqMuy rápidoAltaVelocidad, tiempo real
DeepgramRápidoExcelenteCréditosReuniones, diarización
AssemblyAIMedioMuy altaAnálisis, resúmenes

  • Grabaciones largas (30+ minutos)
  • Audio difícil (ruido de fondo, acentos)
  • Trabajo profesional (necesitas máxima precisión)
  • Múltiples hablantes (reuniones, entrevistas)
  • Necesitas velocidad (archivos grandes procesados rápidamente)
  • Privacidad es crítica (información sensible)
  • Sin conexión a internet disponible
  • Presupuesto limitado (sin costos recurrentes)
  • Dictado breve (modelos locales suficientemente rápidos)

  1. Usa modelos locales para dictado diario

    • Reserva proveedores en la nube para transcripción importante
  2. Edita audio antes de transcribir

    • Recorta silencio al inicio/final
    • Remueve partes innecesarias
  3. Aprovecha niveles gratuitos

    • Groq, AssemblyAI ofrecen uso gratuito
    • Deepgram ofrece créditos iniciales
  4. Monitorea tu uso

    • Revisa paneles de control de proveedores
    • Establece alertas de presupuesto si está disponible

Ejemplo: Reunión de 1 hora

ProveedorCosto Estimado
OpenAI~$0.36
GroqGratis (nivel gratuito)
DeepgramVaría (~$0.40)
AssemblyAI~$0.37

Cuando usas proveedores en la nube:

  • Audio enviado a servidor: Tu grabación se envía a la API del proveedor
  • Procesado en la nube: La transcripción ocurre en sus servidores
  • Retención de datos: Revisa la política de cada proveedor
  • Encriptación: Datos encriptados en tránsito (HTTPS)
  1. Nunca compartas claves API con nadie
  2. Almacena de forma segura en tu Llavero de macOS
  3. Rota claves periódicamente
  4. Revoca claves antiguas si están comprometidas
  5. Usa claves de solo lectura cuando sea posible

Para trabajo sensible, revisa:

  • Certificación GDPR del proveedor
  • Conformidad HIPAA (si aplica)
  • Ubicación de procesamiento de datos
  • Políticas de retención de datos

  1. Verifica que copiaste la clave completa
  2. Revisa si hay espacios extra al inicio/final
  3. Confirma que la clave no expiró
  4. Genera una nueva clave si es necesario
  • Verifica tu conexión a internet
  • Revisa estado del proveedor (downtime)
  • Intenta con un archivo más pequeño
  • Verifica configuración de firewall
  • Revisa uso en panel del proveedor
  • Actualiza plan si es necesario
  • Espera reinicio del límite de tasa
  • Cambia a proveedor diferente temporalmente
  • Comprimir archivo de audio
  • Dividir en segmentos más pequeños
  • Usar menor tasa de bits
  • Algunas APIs tienen límite de 25 MB