»Duplex« reserviert Restauranttisch: Spracherkennung alltagstauglich
Wenn der Computer anruft

Paderborn(WB). »Alexa, weck mich morgen um 7 Uhr«, »Siri, ruf Gabi an«. Die digitalen Assistenten hören aufs Wort. Google »Duplex« reserviert telefonisch einen Tisch im Restaurant, beantwortet Fragen – und ist nicht als künstliche Intelligenz zu erkennen. Dabei ist automatische Spracherkennung kein triviales Problem, ganz im Gegenteil.

Freitag, 08.03.2019, 13:00 Uhr

Professor Dr. Reinhold Häb-Umbach leitet das Fachgebiet Nachrichtentechnik an der Universität Paderborn. In »Siri und Alexa: Verstehen wir uns?«, seinem Vortrag im Heinz-Nixdorf-Museumsforum (HNF) in Paderborn, nahm er am Mittwoch mehr als 300 Zuhörer mit auf eine Reise durch Geschichte, Möglichkeiten und Gefahren der automatischen Sprachverarbeitung. Gesprochene Sprache sei das ausgefeilteste Verhalten des komplexesten Organismus im bekannten Universum, erklärte Häb-Umbach.

Die erste Hürde: trotz vieler Umgebungsgeräusche und unterschiedlicher Aussprache überhaupt Wörter in den Audiostreams, die ein Mikrofone liefert, zu erkennen. 1960 sei es IBM und den Bell Labs gelungen, einzelne Worte unter Laborbedingungen zu erkennen. Statistische Methoden ermöglichten es in den 80er-Jahren, Fachtexte richtig zu erkennen.

»Es kann prinzipiell keine 100-prozentige Zuverlässigkeit geben«

Einen großen Schub gab es in den 2010er Jahren, als neuronale Netze ins Spiel kamen und dem Computer dadurch künstliche Intelligenz (KI) einhauchten. Microsoft, IBM, Google, Amazon und andere konnten die Erkennungsraten signifikant steigern und machten so Anwendungen für Verbraucher möglich: die Geburtsstunde von Siri, Alexa & Co. Vor zwei Jahren dann ein weiterer Meilenstein: Automatische Spracherkennung konkurriert mit Menschen auf Augenhöhe.

Dann wurde es technisch: Häb-Umbach versuchte das Grundprinzip eines künstlichen Neurons zu erklären. Das hat sein Vorbild im Nervensystem eines Lebewesens, bildet sein biologisches Vorbild aber nicht nach, vielmehr muss man es als Modell der Informationsverarbeitung verstehen. Stark vereinfacht besteht das künstliche neuronale Netzwerk (KNN) aus Neuronen oder Knoten, die Informationen von außen oder von anderen Neuronen bekommen und verändert an andere Knoten weiterleiten. Während das Netzwerk lernt, verändern sich die Gewichtungen der Verbindungen, abhängig von den Lernregeln und Ergebnissen. Allerdings, warnt Häb-Umbach: »Es kann prinzipiell keine 100-prozentige Zuverlässigkeit geben«.

»Sie sprechen deutsch ins Telefon und der Kollege in Tokio hört die japanische Übersetzung«

Nutzbringend eingesetzt wird die automatische Spracherkennung bereits in Form der digitalen Sprachassistenten (Siri, Alexa, Cortana etc.) und vieler Chatbots. Intensiv gearbeitet wird an der Verschriftlichung von Besprechungen, an deren Ende die KI auch gleich eine Zusammenfassung erstellt. Auch automatische Übersetzer sind bald vielleicht keine Zukunftsmusik mehr: »Sie sprechen deutsch ins Telefon und der Kollege in Tokio hört die japanische Übersetzung«, skizziert Häb-Umbach das Ziel.

Aber es drohen auch Gefahren: Eine Software, die Firmen bei der Bewerberauswahl unterstützt, sei zweifelhaft. Nach einem 15-minütigen Chat des Bewerbers mit dem Programm spucke es ein psychologisches Profil aus, das ihn möglicherweise als extrovertiert oder depressiv markiere. Ob so ein Programm objektiver urteile als ein Mensch, hänge aber von den Trainingsdaten ab.

Chatbots hätte ihre Berechtigung, wenn sie Hotline-Mitarbeiter unterstützten. Dass die Software auch genutzt werde, um Kampagnen in sozialen Netzwerken loszutreten, zum Beispiel, um den Wahlkampf zu beeinflussen, sei höchst bedenklich.

Was ist mit Siri und Alexa?

Häb-Umbach erinnerte an den Erfolg der IBM-KI Watson, die Anfang Februar im HNF ebenfalls im Rahmen der Vortragsreihe »Mensch, Roboter!« ihren großen Auftritt hatte. Der Erfolg der KI gegen die Champions der Quizsendung »Jeopardy!« müsse man vor dem Hintergrund bewerten, dass die Gehirne seiner menschlichen Widersacher mit 20 Watt zufrieden gewesen seien, der Computer aber 200.000 Watt konsumiert habe.

Was ist mit Siri und Alexa? Der Philosoph John Searle zeigte bereits 1980 in seinem Gedankenexperiment »Das chinesische Zimmer«, dass ein Computer ein Programm ausführen und regelbasiert Zeichen verändern kann, ohne deren Bedeutung zu verstehen. »Aber ist das Intelligenz?«, fragte Häb-Umbach am Ende des Vortrags.

Kommentare

Diese Diskussion ist geschlossen. Kommentieren ist nicht mehr möglich.
 
https://event.yoochoose.net/news/705/consume/10/2/6456525?categorypath=%2F2%2F2158585%2F2158590%2F2198306%2F2509831%2F2198346%2F
Neuhaus glaubt an „mächtig Stimmung“
Uwe Neuhaus (links, mit Assistent Peter Nemeth) setzt auf die Hilfe der Fans. Foto: Starke
Nachrichten-Ticker