Blog

Voz a Texto en Cualquier App de Mac: Guía Técnica Completa

La razón por la que Telvr funciona en VS Code, Notion, Slack, Mail, Figma, y cada otra app en tu Mac es técnica: inserción de texto a nivel del sistema operativo.

La Técnica

Cuando presionas el hotkey de Telvr:

  1. Telvr abre acceso de micrófono
  2. Registra tu audio
  3. Envía a Groq para transcripción (Whisper large-v3)
  4. Recibe texto transcrito
  5. Inyecta en el campo de entrada enfocado usando APIs de accesibilidad de macOS

La parte crítica: paso 5. Telvr no sabe qué aplicación está en foco. No importa. Simplemente inyecta texto donde está el cursor, como si lo hubieras escrito.

Por Qué Esto Funciona en TODO

Casi todas las aplicaciones de Mac usan el framework de entrada de texto estándar de macOS (NSTextField, NSTextView). Esto significa que la inyección de texto funciona universalmente.

Excepciones raras:

  • Algunos juegos que capturan entrada de bajo nivel
  • Aplicaciones completamente customizadas que no usan campos de texto estándar
  • Algunos sistemas de seguridad alterados

Pero en la práctica: Gmail, Slack, Notion, Discord, VS Code, ChatGPT, Google Docs, Microsoft Teams — todo funciona.

Por Qué Otras Herramientas No Hacen Esto

Google Voice Typing: Solo funciona en navegador, solo en Google Workspace. Técnicamente limitada a JavaScript Web Speech API.

Apple Dictation: Integrado a nivel del OS, pero Apple eligió limitarlo a ciertos campos de entrada. Restricción deliberada.

Wispr Flow: Soporta sistema completo, como Telvr. Pero menos confiable según reportes de usuarios.

Dragon: Comando de voz primera (no solo transcripción), integración profunda con el sistema.

Ventajas de la Inyección a Nivel del Sistema

  • Obras en TODAS las aplicaciones
  • Sin necesidad de plugin o integración especial
  • Ninguna app necesita saber que estás usando Telvr
  • Cambio de aplicación sin configuración adicional
  • Priv asi: Telvr no ve contenido, solo inyecta donde está el cursor

Privacidad Implícita

Cuando Telvr inyecta texto:

  • Telvr no ve el contenido del campo de entrada
  • Telvr no guarda historial de dónde injegta
  • Telvr no sabe qué aplicación está en foco
  • Telvr solo conoce: micrófono (tu audio), Groq (transcripción), cursor (dónde pega)

Esto es más privado que integración directa con cada aplicación.

Por Qué Esto Importa

Una herramienta que funciona en TODAS las aplicaciones es cualitativamente diferente a una que funciona en algunas. Significa:

  • Un hotkey funciona en todos lados
  • Una configuración funciona en todos lados
  • Cambiar entre Gmail, Slack, Notion, Code requiere cero reconfiguración

Esto es lo que hace de Telvr una herramienta "de escritorio" verdadera, no una "herramienta de navegador" o "herramienta de aplicación específica".