facebook-likehamburgerlupeoverview_iconoverviewplusslider-arrow-downslider-arrow-leftslider-arrow-righttwitter
Foto: Ian Dooley

Foto: Ian Dooley

Alexa, Alice und Co. – Die neuen digitalen Dienstmägde

Natural Language Processing (NLP) als Teil der Künstlichen Intelligenz beinhaltet alles, was die Spracherkennung und ihre synthetische -ausgabe angeht. In unser Wohnzimmer ist NLP mit digitalen Sprachassistenten schon eingezogen. Ist das gut?

„Voice First“: Auf lange Sicht soll, so der technische Fortschritt, eine sprachbasierte Nutzeroberfläche, wie wir sie von Amazons Sprachassistenten Alexa, Alice oder Samsungs Bixby kennen, die bisherigen Bedienoberflächen ablösen. Das bedeutet Stimme statt „Swipe“, Gestik oder bewährtes Eintippen von Befehlen. Als letzte Ausgabe der synthetischen Sprache in Verbindung mit KI wurde im Mai das Projekt Google Duplex vorgestellt, bei dem Sprachassistenten von Google bei Geschäften anrufen – oder angerufen werden – und Termine vereinbaren. Wie verheißungsvoll ist das für uns und unsere Kommunikation – oder machen diese Marketinginstrumente uns am Ende nur zu Hyper-Shoppern und Datenquellen?

Belauschen und Analysieren

Wir lassen diese Sprach-Geräte für Heimanwender in unser Wohnzimmer, Küche und Schlafzimmer und gewöhnen uns an sie. Das Marktforschungsinstitut Statista schätzt den weltweiten Absatz an Lautsprechern mit Sprachassistenten für 2017 auf 25 Millionen. Für Holger Schulze, Professor an der Universität Kopenhagen und Leiter des dortigen Sound Studies Lab sind sie „die neuen Dienstmägde“, denen wir Befehle erteilen, die erwarten, dass wir klar sprechen – und die immer mithören. Das ständige Belauschen und Analysieren von Gesprächen in der Cloud ist nur vor ein paar Monaten nach hinten losgegangen, als ein Alexa-Gerät in den USA die Unterhaltung eines Ehepaars mitschnitt und die Aufzeichnung wahllos an Personen aus dem Adressbuch per E-Mail versendete.

“Wir lassen diese Sprach-Geräte für Heimanwender in unser Wohnzimmer, Küche und Schlafzimmer und gewöhnen uns an sie. ” Foto: Amazon

E-Commerce durchdringt den privaten Raum

Dabei geht es diesen Geräten eigentlich nur um das Eine. Holger Schulze erklärt: „Das ist nichts anderes als ein Dienstleister mit Datenbankzugriff und Auftragsservice, dessen Sprach-Ein- und Ausgabe die Bedienung erleichtert. Eigentlich interagieren wir mit einem Unternehmen: Das versteht man unter dem Begriff des Conversational Commerce, dem gesprächsbasierten Verkauf. Ziel ist, durch das Gespräch einen Verkauf herbeizuführen. Ob das nun ein Konsumgut ist, eine Dienstleistung oder ob eine werbefinanzierte Datenbankabfragung durchgeführt wird, ist egal.“ Bislang musste der User noch aktiv auf die Nutzerschnittstelle klicken, eine Geste machen oder tippen. Jetzt übernimmt die Sprachsteuerung den aktiven Part.

Die finanzielle Ausschöpfung aller Lebensbereiche

Ist das jetzt schlecht? Erst mal nicht. Holger Schulze sagt: „Das größere Problem ist, dass diese Geräte dazu führen, dass wir uns mit ihnen einen Verkaufsstand unaufhörlich in die Küche oder ins Schlafzimmer holen. Dieser bietet permanent an und nutzt aus, dass wir gelegentlich Dinge benötigen – und diese gleich bestellen. Die Merkantilisierung, also die Verkaufsförmlichkeit, vieler Lebensbereiche wird dadurch kompromisslos weitergetrieben.“ Die Kommerzialisierung unseres Alltags hat damit eine weitere Spielart, die des E-Commerces, hinzubekommen. In Bezug auf Sprache eröffnet das noch einmal mehr Möglichkeiten des Anpreisens für die Verkäufer. „Sie brauchen nicht mehr literate Kunden, sie müssen nicht mehr schreiben oder einen Computer und ein Amazon-Interface bedienen können. Nun reden sie mit den Kunden und können noch auf andere Weise verkaufen“, sagt Holger Schulze. Gut findet er an den neuen Sprachassistenten aber, dass sie Menschen mit Behinderungen das Leben erleichtern. Dafür seien sie nicht ausgelegt, aber darin läge ihr innovativer Nutzen.

Durch spracherkennende Systeme wird das Einkaufen im Netz noch einfacher. Foto: Kevin Kristhian

Chatbox als Überwachungsmechanismus

Für den Schweizer Künstler, Coder und KI-Experimentierer Samim Winiger werden vielmehr Unternehmer die vielversprechendsten Kunden für NLP und damit auch Alexa. Das Ziel: Mitarbeiter ständig zu überwachen und sie zu mehr Leistung und Effizienz anzutreiben. Er erklärt: „Es gab viele Meldungen in den Medien, dass Arbeitgeber am Arbeitsplatz heimlich oder zumindest nicht kommuniziert Mikrofone aufstellen: Im Sales-, Betriebs- und auch im Office-Bereich. Die chinesische KP macht das mittlerweile für die Mitarbeiter der Zugwartung. NLP wird genutzt, um konstant mitzuschneiden, was die Mitarbeiter machen und dann mit einer Aktivitäts- sowie einer Performance-Erkennung abzugleichen.“ Er kommentiert: „Warum das für Konsumenten so gehypt wird, ist auch Ablenkung. Chatboxen für Konsumenten sind Überwachungsmechanismen – gefördert von der NSA. Das kann man nicht besser sagen.“

Datengetriebene Mitarbeiter-Effizienz

Unter dem Abgleich der Aktivitäten und Performance-Erkennung versteht man eine Data Fusion. Dazu Samim Winiger weiter: „Es gibt eine Kamera, gleichzeitig sind eine Spracherkennung und ein Keylogger im Spiel, der die Tastatur-Anschläge aufzeichnet. Die Idee dabei ist, einen Algorithmus für das Mitarbeiter-Assessment zu entwickeln, der komplett datengetrieben herausfindet, wie effektiv die Mitarbeiter sind.“ Sprachassistenten werden damit mehr als nur Heim-Verkäufer; sie sind auch noch ständig überwachende Performance-Tracker in unserer Leistungsgesellschaft.

Umso leistungsfähiger unsere Technik wird, umso vielseitiger können Daten gesammelt werden. “Voice ist nur ein Teil von diesem Konstrukt”. Foto: Kyle Johnston

Doch eigentlich ist das „Voice First“ erst der Zwischenschritt zum angestrebtem Level einer Datenfusion für die komplette Auswertung des Menschen zu einer Art „Human Interface“, so Samim Winigers Einschätzung. Er berichtet: „Man erzielt die Datenfusion aus verschiedenen Sensoren, indem man noch multimodaler Informationen aus Kamera, Sprache und sogar per Skelett-Erkennung sammelt. Voice ist nur ein Teil von diesem Konstrukt.“
Schöne neue Welt? Das gibt es bereits heute schon: Etwa eine mobile App, die die Mitarbeiter-Performance im Büro trackt und analysiert, welche Räume wie genutzt werden, wie sich Mitarbeiter darin bewegen und welche Tools verwendet werden. Der „gläserne Mensch“ war der Begriff, der 1982 benutzt wurde, um das damalige Volkszählungsgesetz und seine Datenschutzproblematik anzuprangern. Klingt aktueller denn je.

Mein Kommentar