Manchmal fühlt sich die Gegenwart schon ganz schön nach Science-Fiction an. Ein Universalübersetzer, wie er in der Serie Star Trek an jedem Raumflotten-Uniform-Revers hängt, steckt heute in praktisch jeder Hosentasche. Aber auch in der Zukunft gibt es noch unterschiedliche Sprachen und Völkerverständigung ist mehr, als Worte von einer Sprache in die andere zu übertragen.

Zu diesem Thema gibt es eine Star-Trek-Folge, es ist sogar eine der besten überhaupt: Captain Picard strandet darin mit einem Mitglied einer ihm unbekannten Spezies auf einem kargen Planeten. Dank seines Kommunikators können die beiden die Worte verstehen, die der jeweils andere spricht, aber sie ergeben keinen Sinn. Im Lauf der Handlung redet der Fremde immer wieder mit scheinbar sinnlosen Satzfetzen auf Picard ein, bis dieser begreift, dass sein Gegenüber in Metaphern spricht, die sich auf Ereignisse in der Geschichte seines Volkes beziehen. Seine Sprache, sein gesamtes Denken, funktioniert völlig anders, was eine direkte maschinelle Übersetzung unmöglich macht.

Das ist nur ein Science-Fiction-Gedankenexperiment. Aber auch menschliche Sprachen sind so unterschiedlich, dass in Übersetzungen Nuancen und kulturelle Unterschiede verloren gehen können. Deshalb ist es auch für die Technologie der Zukunft, der künstlichen Intelligenz, wichtig, dass sie die Sprache der Menschen spricht, die sie verwenden.

Peter Sarlin, der CEO von Silo AI © Silo AI

Das findet jedenfalls Peter Sarlin, Gründer und Chef der Firma Silo AI aus Finnland. Sein Unternehmen hat vor wenigen Tagen ein Sprachmodell veröffentlicht, also das, was im Moment meist gemeint ist, wenn von künstlicher Intelligenz die Rede ist. Die KI von Silo unterscheidet sich von der Konkurrenz, weil darin andere Sprachen stecken: Dänisch, Schwedisch, Norwegisch, Isländisch und Finnisch, dazu kommen Englisch und mehrere Programmiersprachen.

Die Wikinger-KI

Viking 7B heißt das Modell, Wikinger, weil es aus dem Norden kommt und weil es Silo erst einmal um die nordischen Sprachen geht. Das Ziel von Sarlin und Silo ist es aber, Sprachmodelle für alle 24 offiziellen Sprachen der Europäischen Union zu entwickeln.

Solche KI-Systeme analysieren Millionen von Texten und leiten daraus Regeln darüber ab, wie Sprache funktioniert. Im Internet – und damit auch in den Trainingsdaten der meisten Modelle – ist praktisch alles auf Englisch. Sprachen wie Französisch oder Deutsch kommen darin zwar vor, aber nur als kleiner Teil. Und andere Sprachen wie Finnisch, dürften in den Trainingsdaten von GPT-4, dem Modell hinter ChatGPT, nur eine sehr ungeordnete Rolle spielen.

Dennoch kann ChatGPT bereits auf Finnisch antworten. Warum reicht das nicht? "ChatGPT denkt auf Englisch und übersetzt dann die Antwort", sagt Sarlin. Manche Forschende gehen davon aus, dass sich in KI-Modellen durch die Analyse von Sprache auch eine Art Vorstellung von der Welt entwickelt. Deshalb kann ChatGPT mitunter auch Logikfragen beantworten. "Wenn sich dieses reasoning nur aus englischen Texten entwickelt, dann kommuniziert das Modell, als wäre es Amerikaner", sagt Sarlin. 

Die Folgen, die das haben könnte, mögen zunächst eher subtil sein. Vorstellbar wäre, dass ein Chatbot einen ungewohnten Tonfall anschlägt oder bestimmte Redewendungen nicht kennt. Aber auch Wertvorstellungen und kulturelle Eigenheiten sind in Sprache verankert. Und je tiefer künstliche Intelligenz in den Alltag und in Arbeitsprozesse integriert wird, desto schwieriger ist es abzusehen, welche Auswirkungen auf das Ergebnis schon kleine Unterschiede in der zugrundeliegenden Technik haben könnten. 

Auch deshalb sollten, so kann man das Vorhaben von Silo AI verstehen, die KI-Modelle, die in europäischen Büros E-Mails schreiben, in europäischen Autos die Spracheingabe steuern und möglicherweise auch irgendwann in europäischen Krankenhäusern bei der Diagnose helfen, wenigstens zum Teil aus Europa kommen. Und nicht immer nur aus Kalifornien.