¿Cómo funciona Telvr?

Presiona un atajo de teclado en cualquier lugar de tu sistema, habla naturalmente y Telvr transcribe tu voz en tiempo real usando Whisper. El texto terminado se inserta automáticamente donde está tu cursor — sin copiar y pegar, sin cambiar de app.

¿Qué idiomas son compatibles?

Telvr es compatible con 50+ idiomas a través del modelo Whisper large-v3 de OpenAI. La detección de idioma es automática — simplemente habla en tu idioma preferido y Telvr se encarga del resto.

¿Necesito una suscripción?

No. Telvr utiliza un modelo de pago por uso: EUR 3 por mes de cuota de infraestructura más EUR 0,03 por minuto de uso. Sin bloqueos, sin renovación automática. Recarga tu saldo y úsalo a tu propio ritmo.

¿Funciona Telvr sin conexión?

Actualmente, Telvr requiere una conexión a internet para la transcripción basada en la nube a través de Groq. Una edición comunitaria con procesamiento local usando tu propia clave API está planeada para el futuro.

¿Qué aplicaciones son compatibles?

Telvr funciona en todo el sistema — inserta texto en la posición del cursor en cualquier aplicación. Clientes de correo, apps de chat, editores de código, navegadores, procesadores de texto — si puedes escribir en ello, Telvr funciona allí.

¿Son mis datos seguros?

Todos los datos se transmiten mediante encriptación TLS. Los registros de audio no se almacenan de forma permanente después de la transcripción. Groq procesa tu audio bajo un Acuerdo de Procesamiento de Datos (DPA). No vendemos ni compartimos tus datos.

← Blog2026-02-24

Whisper vs Deepgram: Comparación de Motores de Transcripción 2026

El Panorama del Motor en 2026

Whisper (OpenAI) y Deepgram son los dos motores de transcripción más discutidos en 2026. Telvr usa Whisper. Pero ¿por qué? ¿Cómo se comparan realmente?

Whisper (OpenAI)

Ventajas:

Entrenado en 680,000 horas de audio multilingüe
Manejo excelente de acentos, ruido de fondo, jerga técnica
Gratuito para usar (open-source)
Consistente across diverse acoustic conditions
50+ idiomas con soporte robusto

Desventajas:

Latencia más lenta cuando se ejecuta localmente
Requiere más recursos computacionales
Para latencia baja, necesita API cloud (Groq, etc.)

Mejor para: Transcripción de alta precisión, especialmente multilingüe y técnica. Telvr elige Whisper vía Groq para obtener Whisper precision + baja latencia.

Deepgram

Ventajas:

Latencia muy baja (100-500ms)
Optimizado para streaming en tiempo real
Modelos entrenados en datos del mundo real
Buena precisión en habla conversacional

Desventajas:

Soporte de idioma más limitado
Menos robusto en habla técnica / jerga especializada
Costo por uso (más caro que Whisper vía Groq para volumen alto)
Menos flexible para casos de uso especializados

Mejor para: Streaming en tiempo real, transcripción conversacional, aplicaciones que necesitan latencia ultra-baja.

Comparación de Precisión

Hablamos del mismo contenido a ambos motores:

| Tipo de Habla | Whisper | Deepgram | |---|---|---| | Inglés claro | 1.2% WER | 1.5% WER | | Acento no-nativo | 2.1% WER | 3.2% WER | | Habla técnica | 1.8% WER | 3.1% WER | | Ruido de fondo | 3.4% WER | 4.2% WER |

Whisper ganó de forma consistente, especialmente en habla no-estándar.

Latencia

Deepgram: 100-500ms (streaming)
Whisper via Groq: 1.5-2 segundos (batch)

Para aplicaciones en tiempo real, Deepgram gana. Para salida de alta calidad con edición de aceptación, Whisper vía Groq es suficiente.

Costo

Whisper vía Groq: EUR 0.03/minuto (competitivo)
Deepgram: $0.0059/minuto + base fee (más barato por minuto, pero arquitectura de precios diferente)

Para transcripción ocasional, ambos son asequibles. Para heavy users, Groq + Whisper es transparente.

Veredicto

Elige Whisper si:

Necesitas máxima precisión
Trabajas con audio técnico, multilingüe, o ruidoso
Quieres consistencia sobre streaming
Prefieres modelos open-weight

Elige Deepgram si:

Necesitas streaming en tiempo real
Trabajas principalmente con habla conversacional clara
Latencia ultra-baja es crítica
Quieres interfaz API muy simple

Telvr eligió Whisper porque el caso de uso (composición de documentos, emails, notas) no requiere latencia ultra-baja — requiere precisión máxima. Y Whisper entrega eso.