Как работает Telvr?

Нажми горячую клавишу в любом месте системы, говори естественно, Telvr транскрибирует в реальном времени. Готовый текст автоматически вставляется в позицию курсора.

На каких языках работает?

Поддерживает 50+ языков через Whisper large-v3 с автоматическим определением языка.

Нужна подписка?

Нет. Система Pay-as-you-go: EUR 3/месяц (инфраструктура) + EUR 0.03/минуту (использование).

Работает ли без интернета?

Сейчас только облачная обработка. Community Edition для локальной установки находится в разработке.

В каких приложениях работает?

Система-независимо — в любом приложении. Telvr работает на уровне системы, не нужна интеграция с каждым приложением.

Безопасны ли мои данные?

Да. TLS-шифрование передачи, аудиоданные не сохраняются постоянно, заключено соглашение об обработке данных с Groq.

← Блог2026-02-20

Сравнение Speech-to-Text 2026: Telvr vs Whisper vs встроенная диктовка

Состояние технологии распознавания речи в 2026

Голосовой ввод давно вышел за пределы простой диктовки. Современные системы распознавания речи поддерживают десятки языков, удаляют слова-паразиты и интеллектуально форматируют выходные данные. Но какое решение действительно подходит для работы на рабочем столе?

Мы сравнили три подхода: Telvr (push-to-talk с обогащением ИИ), OpenAI Whisper (открытое распознавание) и встроенная диктовка ОС (macOS Dictation / Windows Voice Typing).

Точность

Все три решения обеспечивают хорошую базовую точность для английского языка в тихих помещениях. Различия проявляются в реальных условиях:

Telvr использует Whisper large-v3 через Groq API с инфаренсом, достигая практически идентичной точности встраиваемому Whisper, но с значительно меньшей задержкой. Слой обогащения ИИ автоматически исправляет грамматику и удаляет слова-паразиты.
Whisper (локальный) обеспечивает отличную сырую транскрипцию, но требует постобработки для чистого вывода. Локальный запуск требует значительных ресурсов GPU.
Встроенная диктовка хорошо работает для коротких фраз, но испытывает трудности с технической терминологией, смешанноязычным вводом и длинными отрывками.

Скорость и задержка

Скорость важна, когда голосовой ввод заменяет печать в рабочем процессе в реальном времени:

Telvr: Менее 2 секунд сквозная задержка. Облачная обработка через оптимизированный инферес Groq означает отсутствие требований к локальному оборудованию.
Whisper (локальный): Полностью зависит от вашего оборудования. Современный GPU обеспечивает 2-5 секунд для типичных отрывков. Только CPU может занять 10-30 секунд.
Встроенная диктовка: Почти мгновенно для коротких фраз. Более длинные отрывки могут вызвать задержки и снижение точности.

Интеграция

Здесь подходы различаются больше всего:

Telvr: Горячая клавиша на уровне системы вставляет текст прямо в позицию курсора. Работает в любом приложении без переключения окон. Шесть режимов обогащения ИИ преобразуют сырую речь в письма, заметки встреч или очищенный текст.
Whisper: Требует пользовательского конвейера. Нужно записать аудио, выполнить транскрипцию и вручную вставить результат. Существует несколько открытых оболочек, но ни одна не обеспечивает интеграцию на уровне системы.
Встроенная диктовка: Встроена в ОС, но ограничена поддерживаемыми текстовыми полями. Нет обогащения, форматирования или многорежимного вывода.

Поддержка языков

Telvr: 50+ языков через Whisper large-v3. Автоматическое определение языка.
Whisper: Та же модель, та же поддержка языков. Локальный вариант дает полный контроль.
Встроенная диктовка: Зависит от ОС. macOS поддерживает ~60 языков, Windows Voice Typing более ограничена.

Цены

Telvr: EUR 3/месяц инфраструктура + EUR 0.03/минуту использование. 14-дневный бесплатный пробный период с EUR 3 стартовым кредитом.
Whisper (локальный): Бесплатно (открытый исходный код), но требует GPU или облачные вычисления.
Whisper (API): $0.006/минуту через OpenAI API.
Встроенная диктовка: Бесплатно, включена в ОС.

Итоговый вердикт

Выбери Telvr, если ты хочешь голосовой ввод, работающий везде на рабочем столе без сложной настройки. Режимы обогащения ИИ превращают сырую речь в отформатированный профессиональный текст — чего ни Whisper, ни встроенная диктовка не предлагают из коробки.

Выбери Whisper (локальный), если тебе нужен полный контроль над данными, у тебя есть мощное оборудование и ты комфортно себя чувствуешь при построении пользовательского конвейера.

Выбери встроенную диктовку для быстрого, невинного голосового ввода, где точность и форматирование не критичны.

Самое большое отличие — глубина интеграции. Telvr — единственное решение, которое сочетает транскрипцию, обработку ИИ и вставку текста на уровне системы в одну горячую клавишу. Для производительности рабочего стола эта интеграция устраняет трение, которое заставляет другие решения казаться обходным путем, а не инструментом.