Especificaciones de Modelos
Especificaciones técnicas detalladas de los modelos de transcripción incluidos en FloWords.
Resumen de Modelos Locales
Sección titulada «Resumen de Modelos Locales»FloWords incluye tres motores de transcripción locales. Todos se ejecutan completamente en tu Mac y son multilingües.
| Modelo | Motor | Descarga | RAM | WER | Latencia |
|---|---|---|---|---|---|
| Whisper Turbo (por defecto) | OpenAI • Q5_0 | ~547 MB | ~2 GB | ~7-8% | ~200-800 ms |
| Parakeet V3 | NVIDIA • INT8 | ~640 MB | ~2 GB | ~6.34% | ~50-200 ms |
| Apple Speech | macOS nativo | Ninguna | Mínima | ~8% | ~100-500 ms |
Detalles de los Modelos
Sección titulada «Detalles de los Modelos»Whisper Turbo
Sección titulada «Whisper Turbo»Nombre: Whisper TurboMotor: OpenAI Whisper (Large v3 Turbo, Q5_0)Backend: whisper.cpp (optimizado para Apple Silicon)Descarga: ~547 MBUso de Memoria: ~2 GBPrecisión: ~7-8% WERLatencia: ~200-800 msIdiomas: MultilingüeMejor para:
- Uso diario general
- Mejor balance entre precisión y velocidad
- Motor recomendado por defecto
Parakeet V3
Sección titulada «Parakeet V3»Nombre: Parakeet V3Motor: NVIDIA Parakeet (vía FluidAudio)Cuantización: INT8Descarga: ~640 MBUso de Memoria: ~2 GBPrecisión: ~6.34% WERLatencia: ~50-200 msIdiomas: Multilingüe (inglés + europeos)Mejor para:
- Dictado rápido y de baja latencia
- Cuando la velocidad es prioridad
- Buen rendimiento con recursos moderados
Apple Speech
Sección titulada «Apple Speech»Nombre: Apple SpeechMotor: Voz nativa de macOS (SFSpeechRecognizer)Descarga: Ninguna (incluido en macOS)Procesamiento: En el dispositivoPrecisión: ~8% WER (menor que Whisper)Latencia: ~100-500 msIdiomas: MultilingüeMejor para:
- Borradores rápidos
- Sin necesidad de descargar nada
- Velocidad y privacidad sobre precisión
Soporte de Idiomas
Sección titulada «Soporte de Idiomas»- Whisper Turbo - multilingüe, soporta 99+ idiomas con detección automática
- Parakeet V3 - inglés e idiomas europeos
- Apple Speech - multilingüe (árabe, alemán, inglés, español, francés, italiano, japonés, coreano, portugués, chino, entre otros)
Rendimiento de Modelo por Hardware
Sección titulada «Rendimiento de Modelo por Hardware»Apple Silicon (Recomendado)
Sección titulada «Apple Silicon (Recomendado)»- Aceleración por hardware para los tres modelos
- ~2-3x más rápido que Intel
- Mínimo impacto en batería
- Los tres modelos funcionan genial
Macs Intel
Sección titulada «Macs Intel»- Más lento que Apple Silicon, mayor uso de CPU
- Se recomienda Parakeet V3 o Apple Speech para mejor velocidad
Especificaciones de Audio
Sección titulada «Especificaciones de Audio»Requisitos de Entrada
Sección titulada «Requisitos de Entrada»| Especificación | Valor |
|---|---|
| Tasa de Muestreo | 16000 Hz |
| Profundidad de Bits | 16-bit |
| Canales | Mono |
| Formato | PCM |
FloWords convierte automáticamente el audio a estas especificaciones.
Formatos de Entrada Compatibles
Sección titulada «Formatos de Entrada Compatibles»| Formato | Extensión | Notas |
|---|---|---|
| WAV | .wav | Soporte nativo |
| MP3 | .mp3 | Convertido a WAV |
| M4A | .m4a | Convertido a WAV |
| AAC | .aac | Convertido a WAV |
| FLAC | .flac | Convertido a WAV |
| AIFF | .aiff | Convertido a WAV |
| CAF | .caf | Convertido a WAV |
| MP4 | .mp4 | Audio extraído |
| MOV | .mov | Audio extraído |
Guía de Selección de Modelo
Sección titulada «Guía de Selección de Modelo»Por Caso de Uso
Sección titulada «Por Caso de Uso»| Caso de Uso | Modelo Recomendado |
|---|---|
| Uso diario | Whisper Turbo |
| Máxima velocidad | Parakeet V3 |
| Sin descarga / borradores rápidos | Apple Speech |
| Máxima precisión | Whisper Turbo |
Por Situación
Sección titulada «Por Situación»| Situación | Recomendado |
|---|---|
| Habla clara | Cualquiera |
| Baja latencia | Parakeet V3 |
| Sin conexión, sin configurar | Apple Speech |
| Términos técnicos | Whisper Turbo + diccionario |
Siguientes Pasos
Sección titulada «Siguientes Pasos»- Descargar Modelos para comenzar
- Configurar Ajustes para tus necesidades
- Revisar Mejores Prácticas para uso óptimo