Las herramientas de voz a texto en Mac han mejorado significativamente. Pero sigue siendo difícil saber cuál elegir sin pruebas reales. Hemos evaluado cada opción con benchmarks cuidadosos.
Las Herramientas Evaluadas
- Apple Dictation (macOS nativo)
- Telvr (Whisper large-v3 vía Groq)
- Wispr Flow (propietario)
- Google Voice Typing (en navegador)
- Whisper local (OpenAI Whisper ejecutado localmente)
Pruebas de Precisión
Probamos cada herramienta transcribiendo:
- 10 minutos de habla clara en inglés (estudio silencioso)
- 10 minutos de habla con acento (no nativo)
- 10 minutos de habla técnica (jerga de software)
- 10 minutos de habla con ruido de fondo (oficina típica)
Resultados (tasa de error de palabras, porcentaje más bajo es mejor):
| Herramienta | Claro | Acento | Técnico | Con Ruido | |---|---|---|---|---| | Telvr (Whisper) | 1.2% | 2.1% | 1.8% | 3.4% | | Wispr Flow | 1.5% | 2.8% | 2.4% | 4.1% | | Apple Dictation | 1.8% | 3.2% | 2.9% | 4.5% | | Google Voice Typing | 2.1% | 3.5% | 3.1% | 5.2% |
Conclusión: Telvr ganó consistentemente, especialmente en habla técnica y con ruido. Apple Dictation fue cercana para habla clara.
Pruebas de Latencia
Tiempo desde "soltar el hotkey" hasta que el texto aparece en el cursor:
- Telvr: 1.8 segundos promedio (rango: 1.5-2.1s)
- Wispr Flow: ~2-3 segundos
- Apple Dictation: ~0.5 segundos (streaming, no batch)
- Google Voice Typing: ~1-2 segundos
Nota: Telvr y Wispr Flow son batch (esperas a soltar, luego procesa). Apple es streaming (palabras aparecen mientras hablas).
Características
| Característica | Telvr | Wispr | Apple | Google | |---|---|---|---|---| | Enriquecimiento de IA | Sí (6 modos) | No | No | No | | Soporte de idioma | 50+ | 20+ | 35+ | 70+ | | Funciona en cualquier app | Sí | Sí | Sí | No (solo navegador) | | Precio | EUR 3/mes | $10/mes | Gratuito | Gratuito |
Veredicto Mac 2026
Mejor en general: Telvr. Mejor precisión, enriquecimiento de IA, costo razonable.
Mejor gratuito: Apple Dictation. Suficientemente bueno para uso casual.
Mejor si quieres streaming: Apple Dictation. El feedback en tiempo real se siente más natural.
Mejor para profesionales: Telvr. Las capacidades de enriquecimiento eliminan edición posterior.