Telvr는 어떻게 작동하나요?

단축키를 누르고 자연스럽게 말하면, Telvr가 실시간으로 Whisper를 사용해 음성을 전사합니다. 텍스트가 커서 위치에 자동으로 입력되어요 — 복사-붙여넣기, 앱 전환 없이.

어떤 언어를 지원하나요?

Whisper large-v3를 통해 50개 이상의 언어를 지원합니다. 언어는 자동으로 감지돼요.

아니요. 사용량 기반 요금제입니다: EUR 3/월 + EUR 0.03/분.

현재는 클라우드 기반입니다. Community Edition이 계획 중이에요.

시스템 전체, 모든 애플리케이션에서 사용 가능해요.

TLS 암호화, 음성 데이터 영구 저장 없음, Groq DPA 준수.

음성 입력은 단순 받아쓰기를 넘어 진화했어요. 현대적인 음성 텍스트 변환 도구는 이제 여러 언어를 처리하고, 불필요한 말을 제거하며, 지능적으로 텍스트를 형식화할 수 있습니다. 그런데 실제로 데스크톱 생산성 워크플로우에 어떤 솔루션이 가장 잘 맞을까요?

저희는 세 가지 방식을 비교해봤어요: Telvr (단축키 방식 + AI 다듬기), OpenAI Whisper (오픈소스 전사), OS 기본 받아쓰기 (macOS 받아쓰기 / Windows 음성 입력).

세 솔루션 모두 조용한 환경에서 영어의 강력한 기본 정확도를 제공해요. 차이는 실제 상황에서 드러나죠:

Telvr - Groq의 API를 통해 Whisper large-v3를 사용하며, 독립형 Whisper와 거의 동일한 정확도를 제공하면서 훨씬 낮은 지연시간을 자랑합니다. AI 다듬기 계층이 자동으로 문법을 수정하고 불필요한 말을 제거해요.
Whisper (로컬 실행) - 뛰어난 원본 전사를 제공하지만 깔끔한 출력을 위해 후처리가 필요합니다. 로컬 실행은 상당한 GPU 리소스를 요구합니다.
기본 받아쓰기 - 짧은 문구에는 좋지만 기술 용어, 다국어 입력, 긴 텍스트에는 어려움이 있어요.

음성 입력이 실시간 워크플로우에서 타이핑을 대체할 때 속도가 중요해요:

Telvr: 2초 이내의 엔드-투-엔드 지연시간. Groq의 최적화된 API를 통한 클라우드 처리로 로컬 하드웨어 요구사항이 없어요.
Whisper (로컬): 전적으로 하드웨어에 따라 다릅니다. 최신 GPU는 일반적인 문구에 대해 2-5초를 제공해요. CPU 전용은 10-30초까지 걸릴 수 있습니다.
기본 받아쓰기: 짧은 문구에는 거의 즉시 반응해요. 긴 문구에서는 지연과 정확도 저하가 발생할 수 있습니다.

이곳이 접근 방식들이 가장 많이 차이나는 부분이에요:

Telvr: 시스템 전역 핫키가 커서 위치에 직접 텍스트를 삽입해요. 창 전환 없이 모든 애플리케이션에서 작동합니다. 6가지 AI 다듬기 모드가 원본 음성을 이메일, 회의록, 정제된 텍스트로 변환해줍니다.
Whisper: 커스텀 파이프라인이 필요해요. 음성을 녹음하고, 전사를 실행하고, 수동으로 붙여넣어야 합니다. 여러 오픈소스 래퍼가 있지만 시스템 전역 통합에는 미치지 못해요.
기본 받아쓰기: OS에 내장되어 있지만 지원되는 텍스트 필드로 제한돼요. 다듬기, 형식화, 다중 모드 출력이 없어요.

Telvr를 선택하세요 설정 복잡성 없이 데스크톱 어디서나 작동하는 음성 입력을 원한다면. AI 다듬기 모드가 원본 음성을 형식화된 전문적 텍스트로 변환해줍니다 — Whisper나 기본 받아쓰기는 즉시 제공하지 못하는 것이에요.

Whisper (로컬)를 선택하세요 데이터에 대한 완전한 제어가 필요하고, 충분한 하드웨어가 있으며, 커스텀 파이프라인을 구축해도 괜찮다면.

기본 받아쓰기를 선택하세요 정확도와 형식화가 중요하지 않은 빠르고 간단한 음성 입력이 필요할 때.

가장 큰 차이점은 통합 깊이에요. Telvr는 전사, AI 처리, 시스템 전역 텍스트 삽입을 하나의 핫키에 결합하는 유일한 솔루션입니다. 데스크톱 생산성을 위해서라면, 이 통합이 다른 솔루션들을 우회 방법처럼 느끼게 하는 마찰을 제거해줍니다.