Jetzt schneller, weil offline: Gboard-Spracheingabe wird verbessert


Bisher war die Spracheingabe durch die Verbindung zum Server gebremst, mit dem aktualisierten Sprachpaket wird diese aber deutlich schneller.

Ich bin kein Freund von Sprachnachrichten. Während gefühlt mehr als die Hälfte meiner Kontakte kein Problem damit hat, sich 6-minütige Aufzeichnungen mit Einschüben von Äh und Ehm anzuhören oder selber zu verfassen, kann ich dem wenig abgewinnen. Allerdings bin ich grundsätzlich ein Freund der Spracheingabe und gerade wenn meine Nachrichten nicht nur Zwei- oder Dreiwortsätze sind, dann diktiere ich diese schlicht und lasse das Gesprochene in Text transkribieren – bevorzugt über die Gboard Tastatur App.

Diese hat aber bisher so funktioniert, dass die Spracheingabe stark von der verfügbaren Internetverbindung abhing und das, was ich sage an die Server von Google übermittelt, wo das Audio in Text umgewandelt wird und zurück an mein Smartphone kommt.

Mit einer Aktualisierung der Sprachpakete (bisher leider nur für die Englische Sprache und exklusiv für Pixel-Geräte) hat Google aber jetzt ein Update bereit gestellt, das die Spracheingabe komplett lokal realisiert und damit vor allen Dingen eine Verbesserung bei der Geschwindigkeit der Transkription zeigt:

Beim Prozess der Verbesserung, der im entsprechenden Blogpost sehr detailliert erklärt wird, spricht Google davon, dass man das Neurale Netzwerk, das zur Spracherkennung verwendet wird über einen längeren Zeitraum verbessert und für den lokalen Einsatz optimiert hat. So wurde das gesamte Paket auf 450MB verkleinert und die finale Version, die sich Pixel-Nutzer auf ihr Smartphone installieren können sogar bis auf rund 80MB verkleinert – ohne Kompromisse bei der Genauigkeit der Spracherkennung zu machen.

Leider bleibt man in dem Artikel die Information schuldig, wie weit die Arbeiten an den anderen Sprachen, die die Gboard Spracheingabe unterstützt, sind und so wissen wir nicht, zu welchem Zeitpunkt wir auch hierzulande eventuell mit einer schnelleren Umwandlung von Spracheingaben in Text rechnen können. Aber bis dahin bleiben uns ja noch gestammelte Sprachnachrichten, die wie ein Referat in der 8. Klasse mit „ehm… ja“ enden.

Kommentar verfassen

%d Bloggern gefällt das: