Wie funktioniert Telvr?

Drücke eine Taste irgendwo auf deinem System, sprich natürlich, und Telvr transkribiert deine Stimme in Echtzeit mit Whisper. Der fertige Text wird automatisch an der Cursorposition eingefügt — kein Kopieren, kein App-Wechsel.

Welche Sprachen werden unterstützt?

Telvr unterstützt über 50 Sprachen über OpenAIs Whisper large-v3 Modell. Die Spracherkennung erfolgt automatisch — sprich einfach in deiner bevorzugten Sprache und Telvr erledigt den Rest.

Brauche ich ein Abonnement?

Nein. Telvr nutzt ein Pay-as-you-go-Modell: 3 EUR monatliche Infrastrukturgebühr plus 0,03 EUR pro Minute Nutzung. Keine Bindung, keine automatische Verlängerung. Du lädst dein Guthaben auf und nutzt es in deinem eigenen Tempo.

Funktioniert Telvr offline?

Derzeit benötigt Telvr eine Internetverbindung für die cloudbasierte Transkription über Groq. Eine Community Edition mit lokaler Verarbeitung über deinen eigenen API-Schlüssel ist für die Zukunft geplant.

Welche Apps werden unterstützt?

Telvr funktioniert systemweit — es fügt Text an der Cursorposition in jeder Anwendung ein. E-Mail-Programme, Chat-Apps, Code-Editoren, Browser, Textverarbeitungen — wenn du darin tippen kannst, funktioniert Telvr dort.

Sind meine Daten sicher?

Alle Daten werden über TLS-Verschlüsselung übertragen. Audioaufnahmen werden nach der Transkription nicht dauerhaft gespeichert. Groq verarbeitet dein Audio unter einem Auftragsverarbeitungsvertrag (AVV). Wir verkaufen oder teilen deine Daten nicht.

← Blog2026-02-17

Spracherkennung auf Windows: Kompletter Setup-Leitfaden (2026)

Windows Voice-Input-Optionen

Windows bietet mehr Spracherkennung-Optionen als jede andere Desktop-Plattform, reichte von vollständig kostenlos integriertem Werkzeug zu Enterprise-Grade-professioneller Software. Das Einrichtung der richtigen Option dauert zwischen zwei Minuten und einem Nachmittag, abhängig, was du brauchst.

Dieser Leitfaden deckt drei Tiers: das integrierte Windows Voice Typing, das sofort verfügbar ist, Dragon Professional für spezialisierte professionelle Nutzung, und die aktuelle Zustand von modernen AI-powered Optionen für Windows-Nutzer, die mehr als das integrierte Werkzeug wollen.

Option 1: Windows Voice Typing (integriert)

Windows Voice Typing ist der schnellste Weg zu Voice-Input auf Windows. Es benötigt keine Installation und ist verfügbar auf Windows 10-Version 20H2 und später, sowie Windows 11.

Setup

Drücke Win + H von jeder Anwendung mit einem aktiven Textfeld
Ein Mikrofon-Widget erscheint am oben des Schirms
Klick den Mikrofon-Button oder drücke Win+H wieder
Beginne zu sprechen

Das ist es. Keine Installation, keine Konto, keine Konfiguration benötigt für Grund-Nutzung.

Aktiviere Auto-Interpunktion

Auto-Interpunktion (Windows 11 und neuere Windows 10-Builds) fügt Kommas und Punkte automatisch ein ohne, dass du sie explizit sagst.

Drücke Win+H um Voice Typing zu öffnen
Klick das Getriebe-Icon im Widget
Aktiviere "Auto-Interpunktion"

Sprach-Setup

Wenn du in einer anderen Sprache als dein System-Standard diktieren willst:

Gehe zu Einstellungen > Zeit und Sprache > Sprache und Region
Füge dein gewünschtes Sprachpaket hinzu
Lade das Spracherkennung-Paket für diese Sprache
Wechsle Input-Sprache via die Taskbar-Sprach-Selector bevor du diktierst

Unterstützte Sprachen für Windows Voice Typing (ab 2026): Englisch (US, UK, AU, IN), Chinesisch (vereinfacht, traditionell), Französisch, Deutsch, Spanisch, Italienisch, Portugiesisch, Japanisch, Koreanisch, Arabisch und ungefähr 15 andere. Komplette Liste bei Microsofts offizieller Dokumentation.

Voice-Typing-Befehle

Windows Voice Typing unterstützt mehrere Voice-Befehle:

"Zuhören beenden" — deaktiviert das Mikrofon
"Lösche das" — entfernt den letzten diktierten Text
"Kratze das" — entfernt die letzte Äußerung
"Geh schlafen" / "Wach auf" — schaltet Zuhören-Zustand um

Einschränkungen

Windows Voice Typing erzeugt roh Transkription. Es gibt keine AI-Anreicherung, keine E-Mail-Formatierung und keine strukturiert Ausgabe. Füllwörter erscheinen im Text. Interpunktion wird von Auto-Interpunktion verarbeitet, wenn aktiviert, aber komplexe Satz-Strukturen könnten manuelle Bereinigung brauchen.

Es funktioniert gut für alltägliche Diktatur wo du erwartest, die Ausgabe zu bearbeiten. Es ist nicht das richtige Werkzeug, wenn du professionell-Qualität Text ohne Bearbeitung brauchst.

Option 2: Dragon Professional (Windows)

Dragon Professional ist die Wahl für Windows-Nutzer, die professionell-Grade Genauigkeit mit Domain-spezifisches Vokabular brauchen — hauptsächlich in Recht, Medizin, Finanzen und technische Felder.

Installation

Kaufe Dragon Professional von Nuances Webseite ($699 ab 2026)
Lade den Installer herunter
Führe den Setup-Wizard aus
Erstelle ein Voice-Profil (anfangs Training dauert 5-10 Minuten)

Voice-Profil-Training

Dragons Voice-Training verbessert Genauigkeit signifikant. Während Setup:

Lese bereitgestellte Text-Passagen (2-3 Minuten Lesen)
Dragon analysiert dein Voice-Muster, Akzent und Sprechstil
Das Profil speichert zu deinem User-Konto

Genauigkeit verbessert sich weitere über Zeit, während Dragon Korrektionen lernt, die du machst.

Custom-Vokabular

Die Custom-Vokabular-Feature ist Dragons stärkster Selling-Point für professionelle Nutzung:

Öffne Dragons Vokabular-Editor
Füge Domain-spezifische Begriffe hinzu (medizinische Bedingungen, juristische Zitate, Produkt-Namen, technische Begriffe)
Füge schriftform und gesprochene Form für Abkürzungen hinzu (gesprochene: "die Firma," geschrieben: "Acme Korporation")

Für Profis mit hochspezialisiertem Vokabular, rechtfertigt diese Feature allein die Kosten.

Dragon-Grundlagen

Das Push-to-Talk-Äquivalent in Dragon: drücke und lasse los eine anpassbare Taste (Standard ist die Minus-Taste auf dem Numpad) um zu starten zuhörend. Sage "Zuhören beenden" oder drücke die Taste wieder um zu stoppen.

Dragon unterstützt auch Application-Control-Befehle — du kannst zwischen Anwendungen diktieren, Buttons klicken, Menüs navigieren und Windows-Features durch Voice kontrollieren. Das ist nützlich für Nutzer mit Mobilitäts-Beeinträchtigungen.

Option 3: Moderne AI-Spracherkennung für Windows

Die Lücke im Windows-Markt in 2026 ist die Abwesenheit von einem Werkzeug, das Whisper-Level-Transkriptions-Genauigkeit mit AI Text-Anreicherung in einer systemweiten Push-to-Talk-Schnittstelle kombiniert. Werkzeuge mit dieser Kombination existieren auf macOS (Telvr, Wispr Flow) aber nicht noch auf Windows.

Was Windows-Nutzer heute nutzen können

Whisper-Desktop (Open-Source): Mehrere Community-Werkzeuge bringen Whisper zu Windows. Die meisten-warteten sind:

Whispering (Open-Source, GitHub) — zeichnet Audio auf, transkribiert via lokales Whisper, einfügen zu Clipboard
FasterWhisper auf Windows — erfordert Python-Setup, bessere Performance via quantisiert Modelle

Diese erzeugen roh Whisper-Transkription ohne Anreicherung. Setup erfordert technische Komfortablkeit mit Befehls-Zeile-Werkzeugen.

Voice In (Chrome-Extension): Eine Browser-Extension, die Voice-Input zu jedem Textfeld in Chrome hinzufügt. Nutzt Googles Web-Speech API, nicht Whisper. Genauigkeit ist gut für Englisch; limitiert für andere Sprachen. Funktioniert nur in Chrome.

Telvr für Windows

Telvrs Windows-Version ist in Entwicklung. Wenn verfügbar, wird es die volle Telvr-Erfahrung zu Windows bringen: Push-to-Talk, Whisper-large-v3-Transkription, sechs AI-Anreicherungsmodi und systemweite Text-Einfügung.

Melde dich zur Warteliste auf der Telvr-Webseite an um benachrichtigt zu werden, wenn die Windows-Version startet.

Mikrofon-Setup (Anwendbar auf alle Methoden)

Mikrofon-Qualität ist wichtiger als welche Spracherkennung-Werkzeug du nutzt. Ein schlechtes Mikrofon wird Genauigkeit limitieren unabhängig von dem zugrunde liegenden Modell.

Integriertes Laptop-Mikrofon

Arbeitet in ruhigen Umgebungen. Könnte mit Hintergrundlärm, HVAC oder Umgebungs-Office-Laute kämpfen.

Externes USB-Mikrofon

Eine signifikante Upgrade. Entry-Level USB-Mics ($50-100, Blue Yeti Nano, Rode NT-USB Mini) erzeugen bedeutsam sauberer Audio als integrierte Laptop-Mics. Die verbesserter Input-Qualität übersetzt direkt zu besserer Genauigkeit.

Headset-Mikrofon

Konsistente Mikrofon-Distanz und Position macht Headsets besonders gut für Diktatur. USB- oder Bluetooth-Headsets funktionieren beide; vermeide analog 3.5mm wenn möglich, da sie Lärm einzuführen tendieren.

Mikrofon-Setup in Windows

Gehe zu Einstellungen > System > Sound
Unter Input, wähle dein bevorzugtes Mikrofon
Klick "Konfiguriere Mikrofon" und folge den Kalibrierungs-Wizard
Nutze das Volumen-Messgerät um zu verifizieren die Input-Level ist stark ohne Clipping

Ziel-Input-Level: Der Volumen-Balken sollte ungefähr 75% des Maximum erreichen, wenn im normalen Gespräch-Volumen sprichst. Zu ruhig bedeutet schwächere Erkennung; zu laut verursacht Clipping.

Troubleshooting häufige Probleme

Voice Typing aktiviert nicht (Win+H):

Überprüfe, dass ein Textfeld aktiv ist (klick in eine Textbox zuerst)
Verifiziere Mikrofon-Permissions: Einstellungen > Datenschutz und Sicherheit > Mikrofon

Schlechte Genauigkeit in jedem Werkzeug:

Test mit einem anderen Mikrofon
Wechsle zu einer ruhigeren Umgebung
Sprich leicht langsamer und klarer
Für Dragon: führe den Genauigkeits-Tuning-Wizard nach mehreren Stunden Nutzung aus

Text erscheint an falschen Orten:

Die Ziel-Anwendung unterstützt Voice-Input vielleicht nicht in diesem spezifischen Feld
Stelle sicher, dass der Fokus auf dem richtigen Fenster und Textfeld ist

Hohe Latenz (lange Warten zwischen sprechen und Text-Erscheinen):

Windows Voice Typing verarbeitet auf Microsofts Servern; überprüfe Internet-Verbindung
Für Dragon: lokale Verarbeitung, überprüfe CPU-Nutzung — andere anspruchsvolle Apps können es verlangsamen