Ich bin ein Fan von Google Now und ich nutze die Sprachsteuerung so oft es sich anbietet. Sowohl auf meinem Smartphone, wie auch auf dem Tablet. Aber manchmal stoße ich hie und da an Googles Grenzen und nicht selten scheitert es daran, dass ich schlicht nicht richtig verstanden wurde. Auch Siri und Cortana bieten einige relevante Features an, die die Arbeit mit Spracheingabe einfach machen – aber auch sie haben ihre Grenzen. Darum ist der Markt der „Personal Assistants“ ein heiß umkämpftes Pflaster und während die drei großen Firmen hinter den virtuellen Damen stetig daran arbeiten, ihre Funktionen auszuweiten und die Erkennung und Interaktionen besser zu machen, ist der Schlüssel oft, einfach die jeweilige Firma zu kaufen, die in diesem bereich weiter ist und dem eigenen Team hinzuzufügen. Das könnte nun Soundhound passieren.
Soundhound habt ihr schon einmal gehört, oder? Bevor es Shazam gab, gab es die SoundHound App, sie erkennt noch heute hoch akkurat ein Lied, das gerade läuft und kann euch sofort die Texte dazu liefern. Dabei kann SoundHound sogar aus selbst gesummten oder gesungenen Melodien erkennen, welches Lied ihr sucht. Und das funktioniert tatsächlich. Mal besser, mal schlechter – aber es ist ein Feature, dass Shazam beispielsweise erst gar nicht anbietet. (Vielleicht weil die meisten Menschen ihre Gesangskünste doch etwas zu gut einschätzen? ;) )
Aber Soundhound kann noch mehr – viel mehr
Aber Soundhound hat in den letzten Jahren nicht nur weiter an der SoundHound App gearbeitet, sondern auch an Hound, einem weiteren Personal Assistant. Und Hound hat es in sich! Während das Promo-Video (wie viele andere) Großes verspricht,
…hält eine interne Demo, was dort beworben wurde. Im nachfolgenden Video seht ihr, wie schlau ein Sprachassistent wirklich sein kann. Ich warne euch aber vor: es könnte passieren, dass ihr mit offenem Mund da steht:
Ganz ehrlich? Das ist mit Abstand das Beste, was jemals in Sachen Spracheingabe gezeigt wurde. Nicht nur ist die Erkennung unglaublich gut, sondern auch die Komplexität der Anfragen und die Verknüpfung mit einer vorherigen Spracheingabe ist so ausgereift, dass Siri, Google Now und Cortana höchstwahrscheinlich mit einem „Entschuldige, das habe ich nicht verstanden“ antworten würden.
Natürlich ist das nur eine interne Demo – daher kann ich mir gar nicht ausmalen, was Hound wohl alles leisten kann, wenn die App final auf den großen mobilen Plattformen verfügbar sein wird. Ob, und wie gut das ganze mit anderen Sprachen funktioniert ist ebenfalls abzuwarten, aber was Soundhound hier abliefert ist Lichtjahre von dem entfernt, was andere Dienste leisten.
Tatsächlich bleibt für mich aber eine Frage die wichtigste, nachdem ich dieses Video gesehen habe: Wer wird Soundhound das beste Angebot machen? Apple, Microsoft oder Google?
Denn seien wir ehrlich: so eine großartige Spracherkennung und Logik wird jeder der drei großen Kontrahenten haben wollen. Und jeder der drei wird sich dieses Schätzchen sicherlich eine sehr große Summe kosten lassen…