Como funciona o Telvr?

Pressione um atalho em qualquer lugar do seu sistema, fale naturalmente, e o Telvr transcreve sua voz em tempo real usando Whisper. O texto finalizado é inserido automaticamente na posição do cursor — sem copiar e colar, sem trocar de app.

Quais idiomas são suportados?

O Telvr suporta mais de 50 idiomas via modelo Whisper large-v3 da OpenAI. A detecção de idioma é automática — basta falar no seu idioma preferido e o Telvr cuida do resto.

Preciso de uma assinatura?

Não. O Telvr usa um modelo de pagamento por uso: EUR 3 por mês de taxa de infraestrutura mais EUR 0,03 por minuto de uso. Sem contrato, sem renovação automática. Você recarrega seu saldo e usa no seu próprio ritmo.

O Telvr funciona offline?

Atualmente, o Telvr requer uma conexão com a internet para transcrição em nuvem via Groq. Uma Community Edition com processamento local usando sua própria chave de API está planejada para o futuro.

Quais apps são suportados?

O Telvr funciona em todo o sistema — insere texto na posição do cursor em qualquer aplicativo. Clientes de email, apps de chat, editores de código, navegadores, processadores de texto — se você pode digitar nele, o Telvr funciona lá.

Meus dados são seguros?

Todos os dados são transmitidos via criptografia TLS. Gravações de áudio não são armazenadas permanentemente após a transcrição. O Groq processa seu áudio sob um Acordo de Processamento de Dados (DPA). Não vendemos nem compartilhamos seus dados.

← Blog2026-02-20

Comparação Voz-para-Texto 2026: Telvr vs Whisper vs Ditação Nativa

O Estado da Voz-para-Texto em 2026

A entrada de voz evoluiu além da simples ditação. As ferramentas modernas de voz-para-texto agora lidam com múltiplos idiomas, removem palavras de preenchimento e formatam a saída de forma inteligente. Mas qual solução realmente funciona em um fluxo de trabalho de produtividade em desktop?

Comparamos três abordagens: Telvr (push-to-talk com enriquecimento de IA), OpenAI Whisper (transcrição de código aberto) e ditação nativa do SO (Dictation do macOS / Voice Typing do Windows).

Precisão

As três soluções entregam uma forte precisão de baseline para inglês em ambientes quietos. As diferenças surgem em condições do mundo real:

Telvr usa Whisper large-v3 via API de inferência do Groq, alcançando precisão praticamente idêntica ao Whisper independente com latência significativamente menor. A camada de enriquecimento de IA corrige gramática e remove preenchedores automaticamente.
Whisper (auto-hospedado) oferece excelente transcrição bruta, mas requer pós-processamento para saída limpa. A execução local exige recursos significativos de GPU.
Ditação nativa funciona bem para frases curtas, mas tem dificuldades com terminologia técnica, entrada em múltiplos idiomas e passagens mais longas.

Velocidade e Latência

A velocidade é importante quando a entrada de voz substitui digitação em fluxos de trabalho em tempo real:

Telvr: Menos de 2 segundos de latência end-to-end. Processamento em nuvem via inferência otimizada do Groq significa nenhum requisito de hardware local.
Whisper (local): Depende inteiramente do seu hardware. Uma GPU moderna entrega 2-5 segundos para passagens típicas. Apenas CPU pode levar 10-30 segundos.
Ditação nativa: Quase instantânea para frases curtas. Passagens mais longas podem introduzir atrasos e quedas de precisão.

Integração

É aqui que as abordagens mais divergem:

Telvr: Atalho de sistema insere texto diretamente na posição do cursor. Funciona em qualquer aplicativo sem trocar janelas. Seis modos de enriquecimento de IA transformam fala bruta em emails, notas de reunião ou texto limpo.
Whisper: Requer um pipeline personalizado. Você precisa gravar áudio, executar transcrição e colar manualmente o resultado. Vários wrappers de código aberto existem, mas nenhum corresponde à integração em todo o sistema.
Ditação nativa: Incorporada no SO, mas limitada a campos de texto suportados. Sem enriquecimento, sem formatação, sem saída em múltiplos modos.

Suporte de Idiomas

Telvr: Mais de 50 idiomas via Whisper large-v3. Detecção automática de idioma.
Whisper: Mesmo modelo, mesmo suporte de idioma. Auto-hospedado oferece controle total.
Ditação nativa: Varia por SO. macOS suporta ~60 idiomas, Windows Voice Typing é mais limitado.

Preços

Telvr: EUR 3/mês infraestrutura + EUR 0,03/minuto de uso. Teste gratuito de 14 dias com EUR 3 de crédito inicial.
Whisper (auto-hospedado): Gratuito (código aberto), mas requer hardware de GPU ou custos de computação em nuvem.
Whisper (API): $0,006/minuto via API OpenAI.
Ditação nativa: Gratuito, incluído no SO.

O Veredicto

Escolha Telvr se você quer entrada de voz que funcione em qualquer lugar do seu desktop sem complexidade de configuração. Os modos de enriquecimento de IA transformam fala bruta em texto formatado e profissional — algo que nem Whisper nem ditação nativa oferece pronto para usar.

Escolha Whisper (auto-hospedado) se você precisa de controle total sobre seus dados, tem hardware capaz e se sente confortável construindo um pipeline personalizado.

Escolha ditação nativa para entrada de voz rápida e casual onde precisão e formatação não são críticas.

O maior diferenciador é a profundidade da integração. Telvr é a única solução que combina transcrição, processamento de IA e inserção de texto em todo o sistema em um único atalho. Para produtividade em desktop, essa integração elimina o atrito que faz outras soluções parecerem um contorno em vez de uma ferramenta.