Проблема совместимости приложений
Большинство инструментов голосового ввода на Mac работают только там, где разработчик подумал добавить поддержку. Apple Dictation работает в собственных приложениях Apple и большинстве текстовых полей, но ведёт себя непоследовательно в приложениях третьих сторон. Веб-инструменты голосового ввода работают только в текстовых полях Chrome. Специализированные приложения диктовки часто требуют, чтобы вы диктовали в их собственный интерфейс и затем вставляли результат.
Для того, чтобы привычка голосового ввода действительно прижилась, она должна работать везде — в терминале, в вашей IDE, в приложении Slack для рабочего стола, в Notion, в текстовом поле формы, которую вы заполняете два раза в год. Если вам нужно подумать о том, будет ли голос работать перед тем, как дотянуться до клавиши быстрого доступа, трение убивает привычку.
Системная вставка текста решает это, полностью обходя уровень приложения.
Как работает системная вставка
Стандартные инструменты голосового ввода общаются с приложениями через API доступности или специфичные для приложения интеграции. Вот почему они работают только в «поддерживаемых» приложениях — приложение должно реализовать или поддерживать конкретный интерфейс, который использует инструмент голоса.
Системная вставка работает по-другому. После расшифровки и обработки вашей речи инструмент программно имитирует ввод клавиатуры на уровне операционной системы — так же, как программное обеспечение доступности, например переназначение клавиш или инструменты макросов. Результат появляется в позиции курсора, как если бы он был напечатан, букву за буквой.
Потому что это работает на уровне ввода ОС, а не через API приложения, это работает практически в любом приложении, которое принимает ввод текста:
- Текстовые редакторы и IDE
- Терминал и командная строка
- Текстовые поля браузера (включая веб-приложения)
- Нативные приложения macOS
- Приложения Electron (VS Code, Notion, Slack, Discord)
- Поля формы PDF, которые принимают ввод
- Поля пароля (с надлежащей осторожностью)
Настройка системного голосового ввода на Mac с Telvr
Шаг 1: Установите Telvr
Загрузите Telvr с веб-сайта и установите его. Во время первого запуска macOS запросит разрешения доступности — это разрешение, которое включает системную вставку текста. Предоставьте его в System Settings под Privacy and Security, затем Accessibility.
Без этого разрешения текст можно вставить только в приложения, которые явно поддерживают инструмент. С ним, вставка текста работает везде.
Шаг 2: Настройте клавишу быстрого доступа
Telvr по умолчанию Option + Space. Эта комбинация удобна (большой палец на каждой клавише) и редко конфликтует с ярлыками приложений.
Если вы предпочитаете другую комбинацию клавиш:
- Откройте Telvr из строки меню
- Перейдите в Preferences
- Нажмите поле клавиши быстрого доступа и нажмите вашу предпочтительную комбинацию
Хорошие альтернативы:
- Right Option + Space (если вы используете Left Option для печати)
- Control + Shift + Space
- Специализированная клавиша функции, если ваша клавиатура имеет программируемые клавиши
- Боковая кнопка мыши, если ваша мышь имеет дополнительные кнопки
Избегайте:
- Command + Space (Spotlight)
- Option + Tab (переключатель окна в некоторых приложениях)
- Любая комбинация, которую ваша IDE часто использует
Шаг 3: Выберите режим обогащения
Перед диктовкой выберите режим, который соответствует вашему контексту. Селектор режима находится в значке меню Telvr.
Для системного использования в разных приложениях, режим Clean — это стандартное значение, которое работает везде. Переключайтесь на другие режимы для конкретных контекстов.
Шаг 4: Позиционируйте курсор
Нажмите в текстовое поле, документ, подсказку терминала или любую редактируемую область, где вы хотите, чтобы текст появился. Курсор должен быть расположен — Telvr вставляет текст в позицию курсора, поэтому если никакой курсор не активен, ничего не будет отображаться.
Шаг 5: Диктуйте
Удерживайте клавишу быстрого доступа, говорите естественно, отпустите. В течение 1–2 секунд форматированный текст появляется в вашем курсоре.
Советы по приложению
Терминал
Голосовой ввод в терминале полезен для длинных команд, сообщений git commit и любой подсказки терминала, которая принимает расширенный ввод текста.
Примечание: Текст появляется символ за символом в подсказке терминала. Стандартные команды работают хорошо. Избегайте диктовки паролей прямо — используйте менеджер паролей.
Особенно полезно для: git commit -m "..." (произнесите ваше сообщение коммита), написание shell скриптов в nano или vim (в режиме вставки), составление многострочного содержания heredoc.
VS Code
Все текстовые поля принимают диктовку: редактор сам, интегрированный терминал, поля поиска и замены, поле сообщения коммита git и поле комментария в панели Source Control.
Рекомендуемый режим: Режим Clean для комментариев кода, режим Dev Task для описаний PR и сообщений коммитов.
Браузер (Safari, Chrome, Firefox)
Любой элемент input, textarea или contenteditable принимает диктовку. Это охватывает веб-клиенты электронной почты, Google Docs, Notion в браузере, формы проблем GitHub и практически каждое веб-приложение.
Приложение Slack для рабочего стола
Приложения на основе Electron, такие как Slack, принимают системную вставку. Диктуйте прямо в поле составления сообщения. Режим Clean хорошо работает для сообщений; режим Meeting Notes полезен для набора резюме после встречи в цепочках Slack.
Notion
Как приложение для рабочего стола, так и версия браузера работают. Диктовка прямо на страницы Notion с режимом Clean или Meeting Notes создаёт хорошо отформатированное содержание.
Mail и Calendar
Нативные приложения macOS имеют полную поддержку. Окна составления электронной почты, описания событий календаря и поля заметок все принимают диктовку.
Поиск и устранение неисправностей
Текст не появляется:
- Проверьте, что разрешение Accessibility предоставлено в System Settings
- Проверьте, что курсор размещён в редактируемом поле (не в области только для чтения)
- Некоторые защищённые текстовые поля (как некоторые менеджеры паролей) блокируют программный ввод намеренно
Текст появляется в неправильном месте:
- Точка вставки переместилась между нажатием клавиши быстрого доступа и появлением текста. Держите целевое окно в фокусе во время диктовки.
Дополнительные символы или повреждённый вывод:
- Это иногда происходит в приложениях с автозаполнением, которое неправильно интерпретирует быстрый ввод символов. Отключите автозаполнение в этом приложении или печатайте медленнее, отрегулировав настройки.
Работает в некоторых приложениях, но не в других:
- Некоторые изолированные в песочнице или усилившие безопасность приложения ограничивают программный ввод. Это политика безопасности приложения, а не ограничение Telvr.
Что делает системную диктовку отличной
Практическая разница между системной диктовкой и специфичными для приложения инструментами голоса — это мысленная модель.
С инструментами, специфичными для приложения, голосовой ввод — это функция определённых приложений. Вы помните, какие приложения поддерживают его и соответственно переключаете ваше поведение.
С системной диктовкой голосовой ввод — это поведение, доступное везде. Клавиша быстрого доступа всегда есть. Привычка становится рефлекторной, а не намеренной — вы тянетесь к клавише быстрого доступа так же, как вы тянетесь к любому ярлыку клавиатуры.
Эта согласованность — это то, что делает голосовой ввод устойчивым инструментом производительности, а не случайным экспериментом.