Blog

Comparación de Voz a Texto en Mac 2026: Pruebas, Benchmarks, Análisis

Las herramientas de voz a texto en Mac han mejorado significativamente. Pero sigue siendo difícil saber cuál elegir sin pruebas reales. Hemos evaluado cada opción con benchmarks cuidadosos.

Las Herramientas Evaluadas

  • Apple Dictation (macOS nativo)
  • Telvr (Whisper large-v3 vía Groq)
  • Wispr Flow (propietario)
  • Google Voice Typing (en navegador)
  • Whisper local (OpenAI Whisper ejecutado localmente)

Pruebas de Precisión

Probamos cada herramienta transcribiendo:

  • 10 minutos de habla clara en inglés (estudio silencioso)
  • 10 minutos de habla con acento (no nativo)
  • 10 minutos de habla técnica (jerga de software)
  • 10 minutos de habla con ruido de fondo (oficina típica)

Resultados (tasa de error de palabras, porcentaje más bajo es mejor):

| Herramienta | Claro | Acento | Técnico | Con Ruido | |---|---|---|---|---| | Telvr (Whisper) | 1.2% | 2.1% | 1.8% | 3.4% | | Wispr Flow | 1.5% | 2.8% | 2.4% | 4.1% | | Apple Dictation | 1.8% | 3.2% | 2.9% | 4.5% | | Google Voice Typing | 2.1% | 3.5% | 3.1% | 5.2% |

Conclusión: Telvr ganó consistentemente, especialmente en habla técnica y con ruido. Apple Dictation fue cercana para habla clara.

Pruebas de Latencia

Tiempo desde "soltar el hotkey" hasta que el texto aparece en el cursor:

  • Telvr: 1.8 segundos promedio (rango: 1.5-2.1s)
  • Wispr Flow: ~2-3 segundos
  • Apple Dictation: ~0.5 segundos (streaming, no batch)
  • Google Voice Typing: ~1-2 segundos

Nota: Telvr y Wispr Flow son batch (esperas a soltar, luego procesa). Apple es streaming (palabras aparecen mientras hablas).

Características

| Característica | Telvr | Wispr | Apple | Google | |---|---|---|---|---| | Enriquecimiento de IA | Sí (6 modos) | No | No | No | | Soporte de idioma | 50+ | 20+ | 35+ | 70+ | | Funciona en cualquier app | Sí | Sí | Sí | No (solo navegador) | | Precio | EUR 3/mes | $10/mes | Gratuito | Gratuito |

Veredicto Mac 2026

Mejor en general: Telvr. Mejor precisión, enriquecimiento de IA, costo razonable.

Mejor gratuito: Apple Dictation. Suficientemente bueno para uso casual.

Mejor si quieres streaming: Apple Dictation. El feedback en tiempo real se siente más natural.

Mejor para profesionales: Telvr. Las capacidades de enriquecimiento eliminan edición posterior.