Audi, BMW, Ford, Infiniti, Mercedes, Peugeot, VW, Volvo Wie gut klappt die Sprachsteuerung?

Foto: Hans-Dieter Seufert

Infotainment per Sprache zu bedienen lenkt weniger ab als Knöpfe oder Touchscreen. Aber nur, wenn die Systeme gut funktionieren. Wir machen den Test.

Immer mehr Funktionen, immer unübersichtlichere Menüs, und auf den Verkehr soll man auch noch achten: Die Bedienung im Firmenwagen wird mit jeder Modellgeneration anspruchsvoller und lenkt immer stärker ab. Wie gut, dass sich viele Funktionen inzwischen per Sprache steuern lassen. Doch obwohl einige Hersteller schon seit 20 Jahren Sprachbediensysteme anbieten, ist die Technik noch immer weit von der Perfektion entfernt.

Um zu überprüfen, wie hilfreich die Systeme im Alltag sind, haben wir keine Profitester, sondern normale Autofahrer gebeten, die Spracheingaben in acht Fahrzeugen von Audi, BMW, Ford, Infiniti, Mercedes, Peugeot, VW und Volvo  auszuprobieren. Und stellen dabei riesige Unterschiede fest.

AUDI Q5

Die Spracheingabe im Q5 gehört eindeutig zu den besseren Systemen. Die Tester loben vor allem, dass sie ganze Adressen am Stück diktieren können und nicht auf eine spezielle Formulierung festgelegt sind. So versteht der Audi sowohl "Spiele den Sender Deutschlandfunk" als auch nur "Sender Deutschlandfunk".

Nicht so flexibel zeigt sich der Q5 bei Adresseingaben. Dennoch benötigen die Tester beim Erstkontakt im Schnitt nur 1,5 Versuche pro Eingabe, mit etwas Übung sogar nur 1,2. Größere Probleme machten Telefonnummern, bei denen der Audi teils schon mit dem Wählen beginnt, bevor die komplette Nummer diktiert ist. Ihre Zufriedenheit drücken die Hobbytester dennoch mit der zweitbesten Gesamtnote von 1,4 aus.

   Insgesamt kam der Audi mit vielen Eingabe­varian­ten klar und akzeptierte ganze Adressen bis hin zur Hausnummer. Zudem bietet er geübten Nutzern die Möglichkeit, den Sprachdialog zu verkürzen, um in weniger Zwischenschritten ans Ziel zu kommen.
–    Mit längeren Telefonnummern konnte man den Q5 aus dem Konzept bringen, und einige Tester wünschten sich mehr Formulierungsvorschläge als Hilfen auf dem Monitor. Einige Zwischenschritte hielten sie dagegen für überflüssig.

BMW 5er

Dass es noch besser geht, zeigt BMW. Das System dechiffriert Sprachkommandos nicht im Auto, sondern sendet sie per Mobilfunk auf einen externen Server, wo sie mit leistungsfähigen Computern entschlüsselt und zurück ins Auto geschickt werden. Daher ist der 5er sogar in der Lage, abwegige Formulierungen wie "Ich habe Hunger" als Sonderzielsuche für Restaurants zu deuten. Der Testsieger hebt damit die Grenze zwischen Sprachsteuerung und digitaler Assistenz à la Siri und Co. auf. Die Erkennungsquote fällt entsprechend hoch aus: Selbst während der Fahrt benötigt der BMW im Schnitt nur 1,1 Versuche pro Bedienaufgabe und verlangt kaum Zwischenschritte. Nach dem Sprechen der Adresse startet das Navi sofort mit der Routenführung.

+    Sehr hohe Erkennungsquote. Kommt selbst mit undeutlich gesprochenen Befehlen klar, verzichtet auf lästige Zwischenschritte und setzt Kommandos unmittelbar um. Verlangt so gut wie keine Übung oder Einarbeitung. Als einziges System wirklich intuitiv nutzbar.
–    Negative Kommentare fanden sich kaum auf den Bewertungsbögen. Zwei Probanden hätten sich angesichts der hohen Erkennungsquote gewünscht, die Leitansagen unterbrechen zu können, ein weiterer monierte zu wenig Hilfeeinblendungen.

FORD S-MAX

Die Sprachsteuerung von Ford schafft es mit einer ordentlichen Erkennungsquote, die selbst undeutlich gesprochene Kommandos versteht, noch ins Mittelfeld. Allerdings müssen sich die Tester genau an vorgegebene Formulierungen halten. So gilt es, Telefonnummern in Einzelziffern zu diktieren ("zwei, vier, eins, eins") und nicht zu gruppieren ("vierundzwanzig, elf"), was eine hohe Konzentration verlangt. Umständliches Bestätigen von korrekt erkannten Befehlen kostet zudem Zeit und Nerven. Eine echte Blöße gibt sich der S-Max bei Radiosendern: Hier verlangt er statt des Sendernamens die Frequenz (FM 92,2 statt SWR 3).

+    Der S-Max verstand selbst undeutlich gesprochene Kommandos, mit etwas Übung unterliefen den Testern nur wenige Fehlversuche. Zudem akzeptierte der Ford komplette Adresseingaben in einem Rutsch und stellte mögliche Kommandos auf dem Monitor dar.
–    Die vorgegebenen Menüstrukturen erforderten Einarbeitung, Nummern mussten in Einzelziffern gesprochen, korrekt verstandene Befehle nochmals bestätigt werden. Radiosender anzuwählen erfordert das Wissen um deren Frequenz – wenig praxistauglich.

Foto: Hans-Dieter Seufert

INFINITI Q50

Mit dem System von Infiniti tun sich die Tester am schwersten, und zwar aus unterschiedlichen Gründen: Die Spracheingabe verlangt zwingend ganz konkrete Befehle, unterteilt selbst simple Adresseingaben in bis zu zehn Einzelschritte und versteht oft wichtige Schlüsselbegriffe wie "Navigation" nicht, ohne die weder Adressen eingegeben noch Routenführungen beendet werden können.

Unsere Hobbytester benötigen daher im Schnitt dreimal so viele Versuche pro Aufgabe wie im BMW, Sendernamen erkennt der Q50 gar nicht. Mit 3,7 fällt die Schulnote für den Gesamteindruck am schlechtesten aus, das System wird überwiegend als nicht hilfreich empfunden.

+    Dass Infiniti angesichts der wenigen im deutschsprachigen Raum verkauften Autos überhaupt eine Spracheingabe anbietet, ist löblich. Die Sprachtaste am Lenkrad ist zudem gut ertastbar und unterbricht auf Wunsch die langen Erklärtexte des Systems.
–    Die Sprachbedienung reagiert nur auf ganz konkrete Befehle, die jedoch oft trotz deutlicher Aussprache nicht verstanden werden. Zudem machen viele Zwischenschritte und Unterbrechungen bei Adresseingaben die Benutzung zur Geduldsprobe.

MERCEDES E-KLASSE

Wie BMW dechiffriert auch Mercedes einige gesprochene Bedienkommandos (Sonderziele, Adressen) auf einem externen Server. Die Erkennungsquote fällt entsprechend hoch aus, sie kommt jedoch nicht ganz an die des 5er heran. Vor allem für Telefonnummern, die nur in Einzelziffern verstanden werden, benötigen die Tester oft mehrere Versuche. Auch die Wahl von Radiostationen klappt erst mit dem Schlüsselbegriff "Sender". 1,5 Versuche pro Aufgabe während der Fahrt sind dennoch sehr gut. Das System wurde insgesamt als recht intuitiv empfunden und mit einer Gesamtnote von 1,8 ­bewertet.

+    Das System überzeugt mit hoher Erkennungsrate bei Adressen und Sonderzielen, zudem versteht es unterschiedliche Formulierungen. Praktisch: Bei Unterbrechungen während der Eingabe bleibt es beim letzten Menüpunkt stehen.
–    Nach dem Einsteigen dauert es mehrere Sekunden, bis losgesprochen werden kann. Mit Telefonnummern und Radiosendern tat sich das System zum Teil schwer und verlangt selbst bei korrekt verstandenen Adresseingaben noch ein Starten der Führung.

PEUGEOT 3008

Um das Navi mit einem Ziel zu füttern, muss der Fahrer zunächst "Fahr mich zu Adresse" sagen, dann Straße, Hausnummer und Stadt in genau dieser Reihenfolge nennen. Angesichts der ­anspruchsvollen Vorgaben fallen die Hilfe­texte am obersten Rand des Monitors viel zu klein aus und lenken während der Fahrt ab.

Unsere Tester benötigen daher anfangs im Schnitt 3,6 Anläufe pro Adresseingabe, bei den beiden besten Systemen sind es nur 1,3. Sonderziele wie Tankstellen oder Parkplätze lassen sich zudem nur auf dem Monitor anzeigen, nicht jedoch per Sprache als Routenziel auswählen. Viele Zwischenschritte und lange Erklärtexte sorgen für weiteren Frust.

+    Sofern sich der Fahrer an die geforderte Formulierung hält, versteht der Peugeot auch weniger deutlich gesprochene Befehle. Telefonnummern lassen sich aus jedem Menü heraus diktieren. Griffgünstig gelegene Lenkradtaste.
–    Auch der Peugeot erkennt Nummernkolonnen nur, wenn sie in Einzelziffern gesprochen werden, und besteht auf bestimmten Schlüsselbegriffen samt richtiger Reihenfolge. Einige Tester fühlten sich durch die langen Erklärtexte mehr verwirrt als unterstützt.

Foto: Hans-Dieter Seufert

VW GOLF

Obwohl der Golf nicht so viele Kommando­varianten versteht wie etwa der BMW, kommen die Tester gut mit ihm zurecht. Was unter anderem an den prima ablesbaren Sprachbeispielen liegt, die eingeblendet werden, sobald der Fahrer die Eingabetaste drückt. Zudem versteht er Telefonnummern auch dann, wenn sie in Gruppen formuliert wurden ("elf" statt "eins-eins"). Daher benötigen die Tester selbst beim Erstkontakt im Schnitt bloß 1,2 Versuche pro Bedienaufgabe – der beste Wert im Test.
Dass sie dieses Niveau während der Fahrt nicht halten können, liegt unter anderem an dem überempfindlichen Mikro­fon. So ermahnte das System die Tester immer wieder, leiser zu sprechen, obwohl diese ihre Stimme nur leicht erhoben, um gegen die Fahrgeräusche anzukommen. Mit 1,8 schneidet der Golf deshalb etwas schlechter ab als der auffassungsfreudige Audi.

+    Sehr gute optische Unterstützung, die den Nutzer selten im Unklaren über die akzeptierten Befehle lässt. Telefonnummern können unterschiedlich ausgesprochen und problemlos korrigiert werden, falls mal eine Ziffer verrutscht.
–    Im Golf durften die Tester nicht zu laut sprechen, sonst verstand sie das System nicht mehr. Angesichts der hohen Trefferquote wünschten sich einige Tester weniger Rückfragen – beispielsweise ob nach einer Adresseingabe die Routenführung starten soll.

Foto: Hans-Dieter Seufert

VOLVO V90

Im V90 müssen sich Fahrer präzise an starre Eingabeschritte halten, da fast keine Varianten akzeptiert werden. Zum Beenden von Eingaben versteht der Volvo nicht mal "Abbruch", sondern nur "abbrechen", Navigationsansagen zu stoppen gelingt nur über "Routenführung anhalten". Auch die Eingabe von Radiosendern oder Telefonnummern empfinden die Tester als nicht intuitiv.

Immerhin werden einige Schlüssel­begriffe in dem Kombiinstrument eingeblendet – sofern die Anzeige nicht gerade mit anderen Hinweisen (nicht angelegte Gurte etc.) blockiert ist. Selbst mit etwas Übung führt dies dann auch zu vielen Fehlversuchen. Immerhin startet die Navigation nach der Adresseingabe gleich mit der Routenführung.

+    Werden Sprachkommandos, die der Volvo kennt, gegeben, fällt die Erkennungsquote selbst bei mäßig deutlicher Aussprache ordentlich aus. Zahlenkolonnen versteht der V90 gut, zudem lässt sich der Lenkradknopf blind ertasten.
–    Umständliche Eingaben mit vielen Zwischenschritten erfordern Konzentration. Ebenso dass das System nur auf bestimmte Formulierungen reagiert, die auswendig gelernt werden müssen, da sie nicht immer eingeblendet werden, wenn man sie braucht.

Download Sprachsteuerung: Alle Ergebnisse können Sie hier herunterladen (PDF, 0,04 MByte) Kostenlos