Windowsの音声入力オプション
Windowsは、完全に無料の組み込みツールからエンタープライズグレードのプロフェッショナルソフトウェアまで、あらゆるデスクトッププラットフォームより多くの音声認識オプションを提供しています。セットアップの正しいオプションは、何が必要かに応じて2分から午後かかります。
このガイドは3つのレベルをカバー: 組み込みWindowsボイスタイピング、専門的な使用のためのDragon プロフェッショナル、そして Telvr のようなモダンで人工知能を使用した オプションの現在の状態をwindowsユーザーが組み込みツール以上の何かが必要。
オプション1: Windows音声タイピング(組み込み)
Windows音声タイピングはWindows上の音声入力への最速パスです。ゼロのインストールを必要として、Windows 10バージョン20H2以降、ならびにWindows 11で利用可能。
セットアップ
- テキストフィールドを持つアプリケーションからWin + Hを押す
- マイクロフォンウィジェットがスクリーンの上に表示される
- マイクロフォンボタンをクリックするか、再度Win+Hを押す
- 話し始める
それは全部です。インストール、アカウント、基本使用のための構成は不要です。
自動句読点の有効化
自動句読点(Windows 11と最近のWindows 10ビルド)はあなたが明確にそれを言う必要なしにコンマとピリオドを自動的に追加。
- Win+Hでボイスタイピングを開く
- ウィジェットのギア アイコンをクリック
- 「自動句読点」を有効化
言語セットアップ
あなたの言語以外のシステムデフォルト以外をディクテーション場合:
- 設定 > 時間と言語 > 言語と地域に進む
- 目的言語パックを追加
- その言語のための音声認識パッケージをダウンロード
- ディクテーション前にタスクバー言語セレクタ経由でを入力言語に切り替え
2026年時点での Windows Voice Typing サポートされている言語: 英語(US、UK、AU、IN)、中国語(簡体中文、繁体中文)、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、日本語、韓国語、アラビア語、および 約15の他。完全なリストについてはMicrosoftの公式ドキュメント。
音声タイピングコマンド
Windows音声タイピングはいくつかの音声コマンド:
- 「リッスン停止」 - マイクロフォンを無効化
- 「削除」 - 最後の指示したテキストを削除
- 「スクラッチ」 - 最後の発話削除
- 「眠りに行く」 / 「起きる」 - リッスン状態の切り替え
制限
Windows音声タイピングは生のトランスクリプションを生成。AIエンリッチメント、メールフォーマット、構造化出力はなし。フィラー単語がテキストに表示される。句読点は有効化時オートコンプリートで処理されますが、複雑な文の構造が手動クリーンアップが必要な場合があります。
出力を編集することを期待することができるをご削除で十分です。専門的品質のテキストが没編集が必要でない場合、正しいツール。
オプション2: Dragon Professional(Windows)
Dragon プロフェッショナルは、ドメイン固有の語彙をもつWindows ユーザーが必要とする - 主に法律、医学、金融、技術分野でプロフェッショナルグレード精度の選択肢です。
インストール
- Nuanceのウェブサイトからドラゴンプロフェッショナル購入(月$699作で2026)
- インストーラーをダウンロード
- セットアップウィザードを実行
- ボイスプロフィール作成(初期訓練5-10分)
ボイスプロフィール訓練
Dragonのボイス訓練は精度を著しく改善。セットアップ中:
- 提供されたテキスト段落を読む(読値2-3分)
- Dragonはあなたの音声パターン、アクセント、話し方スタイル分析
- プロファイル、あなたのユーザーアカウントに保存
精度はあなたがするの修正より時間とともにさらに改善。
カスタム語彙
カスタム語彙機能は、プロフェッショナル使用のためのドラゴンの最強売上です:
- Dragonの語彙エディタを開く
- ドメイン固有の用語を追加(医学条件、法律引用、製品名、技術用語)
- 頭字語の書かれた形式と話された形式を追加(話された: 「会社」、書かれた: 「アクメ法人」)
高度に専門的な語彙の専門家にとって、この機能のみ価格正当。
ドラゴン基本
ドラゴンのプッシュトゥトーク等価物: カスタマイズ可能なキー(デフォルトはテンキーマイナスキー)を押下と放すリッスン開始。「リッスン停止」と言うか、リッスン停止キーをもう一度押す。
ドラゴンはまた、アプリケーションコントロールコマンド - あなたはアプリケーション間の音声スイッチ、ボタンをクリック、ナビゲート メニューを、Windowsフィーチャーとボイスコントロール。モビリティ障害を持つユーザーのために有用。
オプション3: Windows用のモダンAI音声認識
2026年のWindowsマーケットのギャップはWhisperレベルのトランスクリプション精度、AI テキストエンリッチメント、システム全体のプッシュトゥトークインターフェース組み合わせる。そのような組み合わせを備えたツール macOS(Telvr、Wispr Flow)に存在がWindows上ではまだありません。
Windows ユーザーが今日使用できることについて
Whisperデスクトップ(オープンソース): 複数の コミュニティツールはWhisperをWindowsに持ってきます。最も メンテナンスされているは:
- Whispering(オープンソース、GitHub) - オーディオ記録、ローカル Whisper、クリップボード貼付でトランスクリプト
- FasterWhisper on Windows - Pythonセットアップが必要、量子化モデルを通じた改善パフォーマンス
これはエンリッチメントなしに生のWhisper トランスクリプション生成。セットアップはコマンドラインツールとの技術的な快適さを必要。
音声イン(Chrome拡張機能): Chromeの任意のテキストフィールドへの音声入力を追加するブラウザ拡張機能。Google のWebスピーチAPI、Whisper を使用していません。英語で精度は良好ですが、他の言語のために限定。Chrome 内部のみで動作。
Telvrのためのもの
Telvrのもので開発中。利用可能な場合、Telvr experience 完全をWindowsに持ってきます: プッシュトゥトーク、Whisper large-v3トランスクリプション、6つのAIエンリッチメント モード、システム全体テキスト挿入。
Telvr ウェブサイトでウェイトリストにサインアップしてWindowsバージョンが起動されたら通知される。
マイクロフォン設定(すべての方法に適用)
マイクロフォン品質は、どのスピーチ認識ツール使用するより問題。貧しいマイク基本モデルに関係なく精度を制限します。
組み込みラップトップマイク
静かな環境で機能する。バックグラウンド ノイズ、HVACスペース、アンビエント オフィスサウンド闘争できます。
外部USBマイク
有意なアップグレード。エントリレベルUSBマイク($50-100、Blue Yeti Nano、Rode NT-USB Mini)は、組み込みラップトップマイクより大幅にクリーンなオーディオ生成。改善されたインプット品質は直接より良い精度に翻訳。
ヘッドセットマイク
マイク一貫性距離と位置ヘッドセットを特に良くディクテーションのために作成。USB またはBluetoothヘッドセット両方の仕事; 可能であれば アナログ3.5mm回避(ノイズを導入しやすい傾向)。
Windows でマイク設定
- 設定 > システム > サウンドに進む
- 入力で、優先マイクを選択
- 「マイクを構成」をクリックして、キャリブレーションウィザードに従う
- 入力レベルを確認するためにボリュームメーター使用
目標入力レベル: 会話的な音量で話すときボリュームバーはおおよその最大の75%に到達すべき。すぐに弱い認識; ほんの少しのうるさい、歪みが発生しています。
一般的な問題のトラブルシューティング
音声タイピング非起動(Win+H):
- テキストフィールドがアクティブであるか確認(まずテキストボックスにクリック)
- マイクロフォン パーミッション確認: 設定 > プライバシーとセキュリティ > マイク
ツール精度が低い:
- 異なるマイクでテスト
- より静かな環境に移動
- わずかにより遅く、よりはっきりと話す
- ドラゴン: 複数時間使用後の精度調整ウィザードを実行
テキストは間違った場所に表示される:
- 対象アプリは特定のフィールドで音声入力をサポートしない場合があります
- 正しいウィンドウとテキストフィールドの焦点を確認
高レイテンシ(スピーチとテキスト表示の間の長い待ち):
- Windows ボイスタイピングはMicrosoftのサーバー処理; インターネット接続確認
- ドラゴン: ローカル処理、CPU使用率確認。他の要求アプリは遅くすることが可能。