Silicon Valley: Der große Lauschangriff

von Daniel Leisegang

Der Wettstreit um einen gigantischen Zukunftsmarkt tritt in die heiße Phase ein: Mitte Juni kündigte Apple auf der firmeneigenen Entwicklerkonferenz an, seinen sprachgesteuerten Assistenten „Siri“ erstmals für andere Anbieter zu öffnen. Siri soll so zu einer umfassenden Software-Plattform für unterschiedlichste digitale Dienstleistungen werden.[1]

Amazon, Google und Facebook haben ebenfalls ähnliche Systeme angekündigt oder bereits im Angebot. Die jeweiligen Assistenten verfolgen dasselbe Ziel: Unter Zuhilfenahme „künstlicher Intelligenz“ sollen sie uns bei den alltäglichsten Erledigungen unterstützen – Termine planen, Licht regeln oder Taxis bestellen.

Die Verrichtung solcher Aufgaben erscheint auf den ersten Blick banal. Tatsächlich aber dürften die sprachgesteuerten Diener eine neue digitale Ära einläuten: In den 1990er Jahren revolutionierte das World Wide Web unsere Kommunikation und unser Medienverhalten; eine Dekade später gelang dies Smartphones und Apps. In den kommenden Jahre soll nun die sprachgesteuerte Computernutzung die Apps ablösen – und uns gleichzeitig die Tür zu einer neuen, digitalen Dienstleistungswelt aufstoßen.

Dieser Artikel stammt aus der Ausgabe Juli 2016. Klicken Sie hier, um zur Inhaltsübersicht dieser Ausgabe zu gelangen.

Allerdings hat diese Vision zwei gewaltige Haken: Denn zum einen versorgen uns die Assistenten nur mit ausgewählten Diensten. Die Konzerne legen fest, welche Tür sich ihren Kunden öffnet – und welche nicht. Sie werden damit endgültig zu den Einlassern – Gatekeepern – die das Internet einst eigentlich überflüssig machen sollte. Zum anderen müssen die digitalen Diener, um ihre Aufgaben zu erfüllen, uns nicht nur in- und auswendig kennen, sondern auch unentwegt belauschen – und zwar im öffentlichen wie im privaten Raum gleichermaßen.

Reale Science-Fiction

Bislang sind uns kommunizierende Computer vor allem aus Science-Fiction-Filmen vertraut, sei es das Weltraumepos „Star Trek“, Stanley Kubricks „Odyssee 2001“ oder Douglas Adams’ Zukunftssatire „Per Anhalter durch die Galaxis“. Folgsam führen die Rechner dort menschliche Befehle aus: Sie bereiten einen Earl-Grey-Tee zu, ermitteln den Aufenthaltsort eines Crew-Mitglieds oder finden die endgültige Antwort auf die letzte aller Fragen („42“).

Die Faszination für die dialogbasierte Technik speist sich dabei aus zweierlei. Erstens kann der Computer durch sie sprachliche Äußerungen verstehen, wie wir sie auch im Alltag verwenden. Selbst Kleinkinder können ihn daher benutzen. Zweitens braucht es nur eines knappen Befehls, um den Rechner zu komplexen Handlungen zu veranlassen.

Die gewaltigen technischen Entwicklungen der vergangenen Jahre lassen diesen Zukunftstraum nun Wirklichkeit werden. So ist die Hardware immer leistungsfähiger geworden. Aktuelle Smartphonemodelle verfügen mitunter über eine ähnliche Rechenkraft wie hochpreisige Laptops. Darüber hinaus setzen die Internetkonzerne auf sogenannte Clouddienste: Die Nutzerdaten werden dabei nicht auf den Geräten, sondern auf den Firmenservern gespeichert, analysiert und weiterverarbeitet. Auf diese Weise gelangen die Unternehmen auch an wichtige Informationen über ihre Kunden, deren Verhalten und soziale Beziehungen.

Auch im Softwarebereich wurden enorme Fortschritte erzielt – nicht zuletzt auf dem Feld der Spracherkennung. Selbst seitenlange Diktate übertragen Computer inzwischen weitgehend fehlerfrei in Schriftsprache.

All dies bildet auch die Grundlage für die entscheidende Entwicklung: die der sogenannten künstlichen Intelligenz – Computerprogramme, die selbstständig Anwendungsprobleme lösen und dabei ihre eigenen Fähigkeiten ständig erweitern. Indem die lernfähige Software zudem noch gesammelte Nutzungsdaten auswertet, soll sie sich weitgehend autonom an unterschiedliche Kontexte und Bedingungen anpassen können.

Der Bot als trojanisches Pferd

Wie weit dieser Ansatz bereits gediehen ist, zeigen die Pläne, die Facebook Mitte April auf seiner Entwicklerkonferenz „F8“ vorstellte.

So will der Konzern unter anderem seine Messenger-App, die weltweit über 900 Millionen Menschen nutzen, mit Bots ausstatten – Kommunikationsroboter, die eigenständig mit den Nutzern kommunizieren.[2] Die Bots sollen nicht nur Antworten auf jede erdenkliche Frage liefern, sondern auch individuelle Kundenwünsche erfüllen. Damit es zum direkten Verkaufsgespräch zwischen den Bots und den Nutzern kommt, müssen die Unternehmen Facebook nur Schnittstellen zu ihren Shopsystemen und damit zu ihren Datenbanken bereitstellen.

Aus Sicht der Nutzer bieten die Bots zahlreiche Vorteile. Künftig brauchen sie nicht mehr zwischen verschiedenen Apps wechseln, um unterschiedliche Angebote zu nutzen. Stattdessen erhalten sie via Facebook alles aus einer Hand. Erste Möglichkeiten gibt es bereits: So lässt sich schon jetzt die aktuelle Nachrichten- und Wetterlage über den Messenger abfragen – CNN und der Dienst Poncho bieten hier erste Bots an. Und der Internethändler „Spring“ ermöglicht es, Schuhe per Verkaufschat zu ordern.

Dass ausgerechnet Facebook auf dialogbasierte Computer setzt, hat einen guten Grund: In der Vergangenheit sind dessen Versuche kläglich gescheitert, die Dominanz Apples und Googles auf dem Markt mobiler Betriebssysteme zu brechen. Seinen neuen Assistenten hingegen könnte Facebook – gleich einem trojanischen Pferd – auf die Smartphones jedes Herstellers einschleusen. Die geschlossenen Systeme von Google und Apple ließen sich dann von innen heraus besetzen. Denn je mehr der mit künstlicher Intelligenz ausgestattete Messenger die Funktionen der installierten Applikationen übernimmt, umso eher hat das vertraute Desktopsystem mit seinen bunten Icons ausgedient.[3]

An die neue Dauerpräsenz der Kommunikationsroboter werden sich die Nutzer vermutlich erst einmal gewöhnen müssen. Denn die Bots können sich jederzeit auch in private Gespräche einmischen: Verabreden sich beispielsweise zwei Nutzer per Messenger-App zum Essen, schlägt der Assistent prompt eine Auswahl umliegender Restaurants vor. Eine kurze Anweisung soll genügen – und der passende Tisch wird reserviert.

Das neue Shoppen

Allerdings präsentieren die Bots nur eine stark eingeschränkte Angebotspalette. Denn die Assistenten greifen zuallererst auf die Schnittstellen ausgewählter Kooperationspartner zu: Amazon statt eBay, Bing statt Google, Spotify statt Deezer, Yelp statt TripAdvisor. Damit gleicht das System einer Suchmaschine, die nur bestimmte Webseiten abfragt – und zwar eben jene, deren Inhaber den Konzernen am meisten dafür zahlen. Mit den Prinzipien eines offenen World Wide Webs hat dies nur noch äußerst wenig gemein.

Dennoch werden sich die Bots wahrscheinlich durchsetzen. Denn aus Sicht vieler wird einmal mehr der Wunsch nach Bequemlichkeit überwiegen. Und in der Tat war Einkaufen nie leichter: So muss der Bot nur Größe, Material und Farbe erfragen, um innerhalb weniger Sekunden eine geeignete Auswahl an Schuhen zu präsentieren. Auf die gleiche Weise kann er die Morgennachrichten zusammenstellen, den nächsten Roman empfehlen oder auf ein neu eröffnetes Geschäft in der näheren Umgebung aufmerksam machen. Und sind die Adress- und Kreditkartendaten erst einmal hinterlegt, lassen sich die Bezahlprozesse ebenfalls weitgehend automatisch und im Hintergrund abwickeln.

In der schönen neuen Servicewelt sind dabei jene Konzerne im Vorteil, die bereits in den vergangenen Jahren sämtliche Daten ihrer Nutzer abgegriffen und ausgewertet haben. Vor allem Facebook hat hier die Nase vorn, kennt es doch die Interessen seiner weltweit rund 1,3 Milliarden Nutzer ganz genau. Aber auch der Suchmaschinengigant Google weiß recht detailliert, was seine Kunden wünschen.

Doch die Konkurrenz schläft nicht – und will die Bots sogar zu unseren Mitbewohnern machen. Wie das aussehen soll, hat der Internethändler Amazon bereits eindrucksvoll vorgemacht. Dessen digitaler Diener „Echo“ hat die Form eines knapp 25 Zentimeter hohen Zylinders, in dem Lautsprecher und Mikrofon untergebracht sind. Einmal angeschlossen, kann man per Sprachbefehl alle möglichen Produkte ordern, ausgewählte Filmtitel suchen oder das Baujahr des Eiffelturms erfragen.

Das Gerät ist in den USA seit gut einem Jahr für knapp 180 US-Dollar erhältlich; über drei Millionen der Assistenten hat Amazon bereits verkauft. Der Erfolg hat die Rivalen gehörig aufgeschreckt. Mitte Mai stellte Google daher ebenfalls einen vernetzten und zuhörenden Lautsprecher namens „Google Home“ vor.

Die Kunden stört es offenbar nicht, dass ihr digitaler Diener sämtliche Gespräche belauscht. Die Systeme werden in der Regel auf Zuruf aktiviert. So wartet Amazons Assistenten geduldig auf das Signalwort „Alexa“ (so lautet der Name des sprachgesteuerten Programms), um dann konkrete Anweisungen entgegenzunehmen. Dabei kommt es aber offenbar immer wieder zu Fehlfunktionen: Nutzer berichten, dass „Alexa“ ohne explizite Aufforderung inmitten eines Gesprächs reagiert und wahllos Produkte bei Amazon bestellt.

Die Datafizierung der Stimme

Hinzu kommt, dass die „Datafizierung“ von Millionen Stimmen eine anonyme Webnutzung künftig erheblich erschwert. Ist man noch ganz altmodisch mit Maus oder Tastatur unterwegs, lassen sich Webdienste nutzen, ohne die eigene Identität preiszugeben. Selbst bei Einkäufen kann man auf anonyme Zahlungsmethoden wie BitCoin ausweichen.

Ersetzt jedoch künftig die menschliche Stimme das Passwort, lassen sich jede Abfrage, jeder Befehl, ja nahezu jedes belauschte Gespräch einzelnen Personen zuordnen.[4] Somit ist der Nutzer, sofern er seine Stimme nicht künstlich verfremdet, kaum noch in der Lage, sich unerkannt im Netz zu bewegen.[5]

Aber auch in der „realen Welt“ bleibt man dank des Dauerlauschens nicht unerkannt: Sind sprachbasierte Dienste erst einmal allerorten installiert, kann ein Großteil unserer Gespräche auf Schritt und Tritt abgehört werden – nicht nur in den eigenen vier Wänden, sondern auch im Bus, in der Fußgängerzone oder im Café.

Mit vergleichsweise geringem Aufwand ließen sich so auch umfassende Bewegungsprofile einzelner Personen und ihres sozialen Umfelds erstellen. Dieses enorme Überwachungspotential dürfte auch den Geheimdiensten nicht verborgen geblieben sein. Anfang Mai erkundigte sich der US-Journalist Matt Novak daher beim FBI, ob der Dienst auch Amazons „Echo“ nutze, um Personen abzuhören.[6]

Allzu weit hergeholt ist dieser Verdacht nicht: Erst Mitte Mai wurde bekannt, dass das FBI in San Francisco in den Straßen rund um ein Bundesgericht für die Dauer eines knappen Jahres versteckte Mikrophone installiert hatte – ohne zuvor eine richterliche Genehmigung eingeholt zu haben.[7] Ob das FBI nun auch digitale Assistenten für seine Lauschangriffe nutzen werde, wollte der Geheimdienst „weder bestätigen noch verneinen“.[8]

Das Ende der Utopie

Schon jetzt ist abzusehen, dass die sprachbasierten Assistenten gewaltige Auswirkungen haben werden: auf den digitalen Markt, unsere Konsumgewohnheiten und – nicht zuletzt – auf unser aller Privatsphäre.

Die Sorge darüber speist sich weniger aus kulturpessimistischer Technikskepsis, als vielmehr aus der schon jetzt immensen Marktmacht der Konzerne. Heute gibt es in nahezu jedem deutschen Haushalt gleich mehrere Smartphones, Tablets und Computer, die in der Regel dauerhaft mit dem Internet verbunden sind. Auf diesen Geräten laufen künftig die sprachgesteuerten Applikationen, mit denen die Unternehmen noch weiter in die Privatsphäre jedes Einzelnen vordringen können, als sie es ohnehin schon tun.

Insbesondere zwei Aspekte machen diese Aussicht so bedrohlich: Erstens unterliegen die Konzerne – im Gegensatz zu staatlichen Behörden – kaum rechtlichen Beschränkungen.[9] Davon profitieren aber ausgerechnet die Geheimdienste: Sie nutzen die fehlende Kontrolle – das wissen wir spätestens seit den Snowden-Enthüllungen – allzu gerne, um die Bürgerinnen und Bürger in Zusammenarbeit mit den Konzernen auszuspähen.

Vor dieser Ausspähung aber können sich – zweitens – nicht einmal jene Nutzer schützen, die sich gegen die sprachgesteuerte Technik entscheiden. Umso dringlicher sind verbindliche Vorgaben, wann die Konzerne welche Daten erheben, auf ihren Servern speichern und auswerten dürfen. Andernfalls verwandelt sich die optimistische Utopie tatsächlich unausweichlich in eine düstere Überwachungsdystopie. Wie diese aussehen kann, wissen wir ebenfalls aus zahlreichen Science-Fiction-Klassikern wie „Alphaville“, „Minority Report“ – oder auch „1984“.

^{^[1]} Vgl. Apple öffnet sich: Aus Funktionen werden Plattformen, www.sueddeutsche.de, 14.6.2016.

^{^[2]} Automatisierte Bot-Kommunikation ist in den sozialen Netzwerken bereits weit verbreitet: So sollen hinter gut acht Prozent der weltweit rund 320 Millionen Twitter-Profile Bots stecken. Vgl. www.venturebeat.com, 12.8.2014. Und sogar ein Viertel aller Twitter-Follower Donald Trumps sind laut Experten angeblich Bots, vgl. www.sueddeutsche.de, 23.5.2016.

^{^[3]} Anfang Juni äußerte die US-Professorin Kelli Burns den Verdacht, dass Facebook schon jetzt die Nutzerinnen und Nutzer mithilfe der Smartphone-Mikrophone heimlich belausche. Auf Grundlage des Gehörten soll Facebook dann gezielt Werbung schalten. Der Konzern dementierte dies umgehend. Vgl. http://newsroom.fb.com, 2.6.2016.

^{^[4]} Die Merkmale der menschlichen Stimme sind aus Sicht von Sicherheitsexperten so unverwechselbar wie ein Fingerabdruck oder die Iris. Vgl. www.theguardian.com, 19.2.2016.

^{^[5]} So speichert beispielsweise Apple die Spracheingaben seiner Nutzer für die Dauer von zwei Jahren auf den firmeneigenen Servern. Vgl. www.mactechnews.de, 19.4.2016.

^{^[6]} Vgl. www.gizmodo.com, 11.5.2016.

^{^[7]} Vgl. www.eastbayexpress.com, 11.5.2016.

^{^[8]} Insbesondere die Forschungen des US-Verteidigungsministeriums seit den 1970er Jahren haben die Spracherkennungstechnologie verbessert. Vgl. www.engadget.com, 7.7.2014.

^{^[9]} Vgl. dazu: Bundesverfassungsgericht: Angriff auf den Großen Lauschangriff, www.spiegel. de, 2.3.2004.

Themen: Datenschutz, Technologiepolitik, Wirtschaft

Aus: »Blätter« 7/2016, S. 21-24

Aktuelle Ausgabe Juni 2026

In der Juni-Ausgabe deutet Andreas Püttmann den Aufstieg der Rechten als Ausdruck einer tiefgreifenden kulturellen Krise und eines entgrenzten Narzissmus. Meron Mendel plädiert für eine Pluralisierung der Erinnerungskultur, die nicht nur warnt, sondern auch verbindet. Angesichts des gegenwärtigen autoritären Umbruchs entwirft Franziska Brantner einen neuen Liberalismus, der Freiheit, Gerechtigkeit und Nachhaltigkeit zusammendenkt. Nina Kolleck erklärt, warum die Nutzung von Social Media kein Privatproblem ist und die Verantwortung für deren gravierende Folgen zuvorderst bei den Plattformbetreibern liegt. Carola Lentz würdigt die Geschichte des Goethe-Instituts und die demokratische Qualität seiner Kulturarbeit, die heute zunehmend in das Fahrwasser rauer Machtpolitik gerate. Wolfgang Zellner lotet in einer von Ordnungszerfall und Großmachtkonkurrenz geprägten Welt die Handlungsspielräume Europas aus, während Wolfgang Kaleck fragt, wie sich das Völkerrecht gegen Trump verteidigen – und weiterentwickeln – lässt.

Zur Ausgabe Probeabo