Voice-Eingabe auf Windows in 2026
Windows-Nutzer hatten schon immer mehr Diktatur-Optionen als Mac-Nutzer — teilweise weil Dragon NaturallySpeaking seinen Ruf auf Windows baute und teilweise weil Windowss offenes Ökosystem mehr Tools von Drittanbietern anzog. Aber die Landschaft hat sich beträchtlich verschoben.
Dragons Dominanz ist erodiert, als AI-gestützte Alternativen entstanden. Windows Voice Typing hat sich verbessert. Und neue Push-to-Talk-Werkzeuge, die auf Whisper und anderen modernen Modellen bauen, sind auf den Markt gekommen. Hier ist eine komplette Karte deiner Optionen.
Windows Voice Typing (integriert, Win+H)
Microsofts integriertes Voice Typing, zugänglich mit Win+H, ist der reibungslose Ausgangspunkt. Es funktioniert in den meisten Windows-Textfeldern, unterstützt Auto-Interpunktion und kostet nichts.
Funktionsweise: Drücke Win+H und ein schwingendes Mikrofon-Widget erscheint. Sprich und Text erscheint im aktiven Feld. Sag "Zuhören beenden" oder drücke den Button wieder um zu stoppen.
Genauigkeit: Gut für Englisch in ruhigen Umgebungen. Microsoft hat das zugrunde liegende Modell seit dem ursprünglichen Windows 10-Start erheblich verbessert. Verarbeitet Umgangssprache zuverlässig.
Auto-Interpunktion: Verfügbar und funktioniert angemessen gut. Du musst nicht "Punkt" und "Komma" für die meisten Sätze sagen — das System folgert sie.
Sprachunterstützung: Unterstützte Sprachen sind limitierter als Whisper-basierte Werkzeuge. Ab 2026 unterstützt Windows Voice Typing etwa 25 Sprachen.
Einschränkungen: Keine AI-Anreicherung. Funktioniert nur in Windows-Textfeldern, nicht jede Anwendung. Keine Custom-Modi. Ausgabequality ist reine Transkription.
Am besten für: Windows-Nutzer, die gelegentliche Voice-Eingabe brauchen ohne irgendetwas zu installieren.
Dragon Professional (Nuance)
Dragon Professional bleibt der Goldstandard für Windows-Diktatur-Genauigkeit, besonders für spezialisiertes Vokabular. Bei $699 einmalig ist es eine signifikante Investition, aber es kommt mit Fähigkeiten, die kein anderes Werkzeug hat.
Genauigkeit: Exzellent, besonders nach Voice-Training. Dragon lernt deine Stimm-Muster und Vokabular über Zeit. Für medizinische, juristische oder technische Terminologie übertrifft Dragons Genauigkeit auf trainiertem Vokabular Allzweck-Modelle.
Custom-Vokabular: Du kannst Domain-spezifische Begriffe, Eigennamen und spezialisierte Phrasen hinzufügen. Das ist Dragons größter Konkurrenz-Vorteil.
Integration: Tiefe Windows-Integration, einschließlich Kontrolle von Anwendungen durch Voice. Dragon kann Menüs navigieren, Buttons klicken und Windows kontrollieren — weit über Texteingabe hinaus.
Latenz: Nahezu sofortiges Feedback für trainierte Stimmen. Reaktionszeit ist konsequent unter einer Sekunde.
Einschränkungen: Hohe Vorab-Kosten mit kein Abo-Option für das Hauptprodukt. Software-Architektur ist veraltet. Keine AI-Anreicherung oder Text-Formatierung — es transkribiert genau was du sagst. Mac-Version eingestellt.
Am besten für: Profis in Bereichen wie Medizin, Recht oder Finanzen, die absolute höchste Genauigkeit für spezialisiertes Vokabular brauchen und auf Windows sind.
Telvr (Windows-Version in Entwicklung)
Telvr ist derzeit eine macOS-Anwendung mit aktiv in Entwicklung Windows-Support. Die Kern-Erfahrung — Push-to-Talk mit AI-Anreicherung, systemweite Text-Einfügung, Whisper-large-v3-Genauigkeit — ist für Windows geplant.
Was Windows-Nutzer erwarten können: Der gleiche Workflow, den macOS-Nutzer heute haben. Halte einen Hotkey in jeder Anwendung, sprich, lasse los und bekomme formatierter Text an der Cursor-Position in etwa zwei Sekunden. Sechs Anreicherungsmodi decken E-Mail, Besprechungsnotizen, Zusammenfassungen, Dev-Aufgaben und allgemeine Bereinigung ab.
Warum es für Windows wichtig ist: Es gibt derzeit kein Windows-Werkzeug, das Whisper-Level-Transkriptions-Genauigkeit mit AI Text-Anreicherung und echter systemweiter Einfügung in einer einfachen Push-to-Talk-Schnittstelle kombiniert. Windows Voice Typing fehlt Anreicherung; Dragon fehlt moderne AI-Formatierung; Whisper-Werkzeuge fehlt Integration.
Preise: EUR 3/Monat Infrastruktur plus EUR 0,03 pro Minute — identisch zur macOS-Version.
Wenn du auf Windows bist und dieser Workflow dich spricht, ist die Anmeldung zur Warteliste auf der Telvr-Website die beste Weise, benachrichtigt zu werden, wenn die Windows-Version startet.
Whisper-basierte Werkzeuge (Windows)
Mehrere Community- und Commercial-Werkzeuge bringen Whisper-Transkription zu Windows:
Whisper Transcriber / lokale CLI: Führe Whisper direkt auf Windows aus. Erfordert Python-Setup und CUDA-fähige GPU für schnelle Inference (obwohl CPU für kleinere Modelle funktioniert). Erzeugt reine Transkription; keine Anreicherung.
MacWhisper äquivalente Werkzeuge: Mehrere Windows-Apps wickeln Whisper in eine basic-Schnittstelle. Die meisten sind dateibasiert (Aufnahme Audio, bekommen Transkript), nicht Echtzeit-Tastatur-Ersatz.
Einschränkungen: Alle aktuellen Windows-Whisper-Werkzeuge erfordern manuelle Integration-Arbeit. Keine bietet die Push-to-Talk systemweite Einfügung-Erfahrung, die Telvr auf macOS bietet. Keine Anreicherungsschicht.
Am besten für: Entwickler, Datenschutz-fokussierte Nutzer oder die komfortabel sind, ihre eigene Pipeline zu bauen.
Google Voice Typing (Chrome)
Google Voice Typing ist auf Windows im Chrome-Browser verfügbar. Es funktioniert in jedem contenteditable Feld innerhalb Chrome, mit Genauigkeit, die von Googles massiven Trainingsdaten profitiert.
Einschränkungen: Chrome-only. Funktioniert nicht in nativen Windows-Anwendungen. Keine Anreicherung. Datenschutz-Überlegungen.
Am besten für: Nutzer, die hauptsächlich in Chrome arbeiten und kostenlose Voice-Eingabe für Web-Anwendungen brauchen.
Windows Speech Recognition (Legacy)
Älter als Windows Voice Typing, Windows Speech Recognition (zugänglich über Kontrollpaneel oder Suche) bietet mehr Befehle aber schlechtere Genauigkeit als die moderne Win+H-Implementierung. Sie ist großteils von Windows Voice Typing abgelöst und wert zu skippen außer du brauchst deine Anwendungscontrol-Befehle.
Vergleichstabelle
| Feature | Windows Voice Typing | Dragon Professional | Telvr (macOS) | Whisper (lokal) | |---|---|---|---|---| | Plattform | Windows | Windows | macOS (Win kommt) | Beide | | Systemweit | Meiste Apps | Ja | Ja | Custom Setup | | AI-Anreicherung | Nein | Nein | Ja (6 Modi) | Nein | | Latenz | 1-3s | Unter 1s | Unter 2s | 3-15s | | Sprachunterstützung | ~25 | ~15 | 50+ (automatische Erkennung) | 99 | | Preis | Kostenlos | $699 einmalig | EUR 3/Monat + Nutzung | Kostenlos | | Custom-Vokabular | Nein | Ja | Custom-Prompt | Nein |
Empfehlungen für Windows-Nutzer
Die aktuelle Realität: Windows-Nutzer in 2026 haben nicht ein einzelnes Werkzeug, das moderne AI-Genauigkeit, Anreicherung und nahtlose systemweite Integration kombiniert. Das ist die Lücke, die Telvrs Windows-Version addressieren wird wenn sie startet.
In der Zwischenzeit:
Für gelegentliche, kostenlose Voice-Eingabe: Windows Voice Typing (Win+H) ist der offensichtliche Ausgangspunkt. Die Auto-Interpunktion und verbesserte Genauigkeit machen es brauchbar für alltägliche Aufgaben.
Für spezialisiertes professionelles Vokabular: Dragon Professional bleibt die einzige echte Option für Windows-Nutzer, die Custom-Vokabular-Training und hohe Genauigkeit für Domain-spezifische Terminologie brauchen.
Für technische Nutzer, die beste Transkription wollen: Lokales Whisper über ein Community-Wrapper wie Whispering gibt dir Whisper-Genauigkeit, aber erfordert Setup und erzeugt reine Ausgabe.
Für Windows-Nutzer, die die Telvr-Erfahrung wollen: Melde dich zur Warteliste an. Die macOS-Version demonstriert, was der Windows-Release liefern wird.
Die Lücke in dem Windows-Markt ist signifikant und es ist genau die Lücke, die moderne Push-to-Talk-Werkzeuge mit AI-Anreicherung positioniert sind zu füllen.