Auto­matische Sprach­erkennung Mensch und Maschine hören mit

1
Auto­matische Sprach­erkennung - Mensch und Maschine hören mit

Sie haben es alle getan: Mitarbeiter hörten zur Kontrolle Mitschnitte von Nutzern ab.

Amazon, Google, Apple, Microsoft und Facebook – die Enthüllungen der letzten Monate haben gezeigt: Wo sogenannte „künst­liche Intelligenz“ zur Sprach­erkennung einge­setzt wird, haben auch menschliche Mitarbeiter zugehört. Kein Wunder: Maschinelles Lernen basiert auch auf menschlicher Arbeit. Doch wirft die Praxis Fragen zum Daten­schutz auf.

Eine Kette von Enthüllungen

Als erste hatte es im Früh­jahr Amazons Sprach­assistentin Alexa getroffen: Die Nach­richten­agentur Bloomberg berichtete, dass Amazon welt­weit Mitschnitte von Alexa-Geräten abhören ließ, um die Qualität der Sprach­erkennung zu verbessern. Im Laufe des Sommers enthüllten dann Journalisten, dass auch Google, Apple, Microsoft und Facebook Audio­aufnahmen ihrer Nutzer von menschlichen Helfern analysieren ließen. Ob für Spracha­ssistenten wie Alexa, Google Assistant und Siri, oder für Über­setzungs­funk­tionen wie die von Skype: Wo „künst­liche Intelligenz“ (K.I.) gesprochene Sprache in Text über­setzt, waren auch menschliche Ohren im Spiel.

Lernende Maschinen brauchen menschliche Lehrer

Wer sich die zugrunde liegende Technik näher anschaut, wird das wenig verwunderlich finden: Was von Anbietern als künstliche Intelligenz verkauft wird, basiert in aller Regel tatsäch­lich auf maschinellem Lernen. Die neuronalen Netze, die dabei zum Einsatz kommen, müssen von Menschen und mit von Menschen vorsortiertem Daten­material trainiert werden. Die vermeintliche „Intelligenz“, mit der Computer­algorithmen etwa Bild­inhalte erkennen oder Sprache in Text über­tragen, ist nichts weiter als eine Methode, menschliche Fähig­keiten zur Muster­erkennung mit Hilfe statistischer Verfahren zu auto­matisieren. Und so braucht es eben auch Menschen, um die Ergeb­nisse dieser Verfahren zu beur­teilen und zu verbessern: Wenn zum Beispiel Siri mal wieder etwas nicht verstanden hat, muss ihr eben ein menschlicher Hörer auf die Sprünge helfen.

Anonymisieren wirkt nicht immer

Vielen Nutzern dürfte die Vorstellung unsym­pathisch sein, dass irgend­welche Fremden ihre Gespräche mit Alexa oder gar ihre Skype-Telefonate belauschen. Wohl auch deshalb haben die Anbieter den menschlichen Beitrag zur angeblichen Intelligenz der Maschinen bisher nicht an die große Glocke gehängt. Entsprechend groß war dann die Aufregung über die Enthüllungen. Die Anbieter wiegelten indes ab: Nur ein winziger Teil der Sprach­aufnahmen würde von Menschen abge­hört, und die wüssten dann nicht, von wem die Aufnahmen stammen. Wie Audiobei­spiele zeigen, die dem belgischen Sender VRT zugespielt wurden, lässt sich die Identität der Betroffenen zuweilen aber aus den Inhalten der Aufnahmen ableiten.

Anbieter reagieren unterschiedlich

Apple, Facebook und Google haben die kritisierte Praxis nach eigenen Angaben inzwischen erst einmal ausgesetzt. Damit reagieren sie wohl auch auf entsprechende Forderungen etwa des Hamburger Datenschutzbeauftragten an Google. Microsoft wiederum ergänzte seine Datenschutzerklärung um Hinweise auf die „manuelle Über­prüfung“: In der Fassung vom August ist nun unter anderem zu lesen: „Um die Genauigkeit unserer auto­matisierten Verarbeitungs­methoden (einschließ­lich KI) zu trainieren und zu verbessern, über­prüfen wir manuell einige der Vorher­sagen und Schluss­folgerungen (...). Beispiels­weise über­prüfen wir manuell kurze Ausschnitte kleiner Stich­proben aus Sprach­daten (...).“

Amazon führt Ausschalter ein

Auto­matische Sprach­erkennung - Mensch und Maschine hören mit

Bei Amazon lässt sich das Mithören durch Menschen abschalten. © Screenshot Amazone.de

Amazon lässt seinen Nutzern mitt­lerweile die Wahl – zumindest denen, die wissen, wo sie danach suchen müssen: In den „Alexa-Daten­schutz“-Einstel­lungen, die in der Alexa-App oder auch auf der Amazon-Website zu finden sind, lässt sich nun unter dem Titel „Legen Sie fest, wie Ihre Daten Alexa verbessern sollen“ die Option „Bei der Verbesserung von Amazon Services und beim Entwickeln neuer Funk­tionen mithelfen“ ausschalten. Amazon warnt an gleicher Stelle allerdings auch, dass dann „die Sprach­erkennung und neue Funk­tionen möglicher­weise nicht ordnungs­gemäß“ arbeiten.

[Update 29.08.2019] Apple setzt ab Herbst auf Opt-In

Inzwischen hat sich auch Apple zum weiteren Vorgehen bei der Qualitätskontrolle von Siri geäußert. Demnach will das Unternehmen die Kontrolle von Siri-Aufnahmen im Herbst wieder aufnehmen – aber mit einigen Änderungen gegen­über der bisherigen Praxis: Zum einen will Apple solche Aufnahmen dann nur noch mit ausdrück­licher Zustimmung der Nutzer abhören. Hierfür will auch Apple eine neue Daten­schutz-Einstellung einführen, die anders als bei Amazon stan­dard­mäßig deaktiviert sein soll („Opt-In“). Zudem sollen in Zukunft nur noch Apples eigene Mitarbeiter die Aufnahmen abhören und nicht wie bisher auch externe Dienst­leister. [Ende Update]

Daten­schutz­probleme auch ohne Mitlauscher

Bei allem berechtigten Ärger über die Kommunikations­politik der Anbieter sollte sich allerdings jeder Nutzer auch fragen, was schwerer wiegt: Dass einzelne Mitarbeiter irgendwo auf der Welt einzelne Audio­schnipsel zu hören kriegen? Oder was der jeweilige Anbieter durch eine systematische maschinelle Analyse alles Gesagten über jeden einzelnen Nutzer heraus­finden und in seinen Daten­banken speichern kann – auch ohne dass jemals ein Mensch mitlauscht? Wer cloudbasierte Sprach­erkennung nutzt, verrät durch den Inhalt des Gesagten wie durch biome­trische Informationen seiner Stimme sehr viel über sich und seine Vorlieben und Abneigungen, seine Gefühle und seine Gesundheit. Auch wenn sich das menschliche Mitlauschen abschalten lässt, wird es darum für Nutzer, denen Daten­schutz am Herzen liegt, weiterhin gute Gründe geben, von derlei Diensten nur sehr vorsichtigen Gebrauch zu machen.

Newsletter: Bleiben Sie auf dem Laufenden

Mit den Newslettern der Stiftung Warentest haben Sie die neuesten Nach­richten für Verbraucher immer im Blick. Sie haben die Möglich­keit, Newsletter aus verschiedenen Themen­gebieten auszuwählen.

test.de-Newsletter bestellen

1

Mehr zum Thema

1 Kommentar Diskutieren Sie mit

Nur registrierte Nutzer können Kommentare verfassen. Bitte melden Sie sich an. Individuelle Fragen richten Sie bitte an den Leserservice.

Kommentarliste

Nutzer­kommentare können sich auf einen früheren Stand oder einen älteren Test beziehen.

  • marcbs am 29.08.2019 um 16:02 Uhr
    Welche "Enthüllungen"? War doch schon immer klar.

    Wer Lesen kann, tatsächlich liest, versteht und danach handelt, ist klar im Vorteil .-)
    .
    Juristisch-rhetorisch verschwurbelt stand es zumindest schon ewig in den Bedingungen bei Google und facebook.
    Grob umgangssprachlich übersetzt habe ich seit Jahren immer etwa Folgendes gelesen.
    GOOGLE, facebook/Whatsapp sinngemäß:
    .
    "Du gibst uns die Rechte an allen Informationen, die wir uns über deine verbundenen Geräte aneignen können, wir dürfen alles für jeden Zweck unbegrenzt verwenden und haften nicht. Wenn dadurch die Rechte Anderer verletzt werden (Adressen- o.a. Daten-Freigabe), bist du schuld. Dieses System wird von uns ständig verbessert.
    Du darfst in die von uns nach Gutdünken und zugunsten unserer Aktionäre freigegebenen und nach diesen Interessen manipulierten Daten über ein paar (bis auf alle deine Daten in EUR) kostenlose und kostenpflichtige (in Daten und EUR) Dienste reinschnuppern."
    Mein Fazit:
    Ist nix Besonderes passiert.
    Wissen ist Macht. Und eine neue Währung.