Kürzlich veröffentlichten chinesische Wissenschaftler eine merkwürdige Arbeit. Sie begann mit dem Satz: "Klar, hier ist eine mögliche Einleitung zu deinem Thema: ..." Hatte hier künstliche Intelligenz (KI) einen Textvorschlag gemacht, den die Autoren einfach übernommen hatten?

Für die Zeitschrift, die den Artikel publiziert hatte, war das peinlich. Die Reaktion kam schnell: Der nicht gekennzeichnete Einsatz von KI sei "ein Verstoß gegen die Richtlinien", schrieb der Verlag auf seiner Website und zog den Artikel zurück. "Die Zeitschrift bedauert aufrichtig", heißt es weiter, "und entschuldigt sich bei den Lesern."

Der Fall mag kurios erscheinen, doch er zeigt exemplarisch, wie weit verbreitet der Einsatz von KI in der Wissenschaft mittlerweile ist. Denn für viele Forschende geht es vor allem darum, schnell und viel zu veröffentlichen. Das wird mit Aufmerksamkeit und Zitierungen belohnt. Und Programme wie ChatGPT sind wie gemacht dafür, das wissenschaftliche Schreiben und Publizieren zu beschleunigen. Allerdings besteht die Gefahr, dass die KI halluziniert, Fakten und Quellen frei erfindet. Dann steht die wissenschaftliche Glaubwürdigkeit auf dem Spiel.

Hat wohl ChatGPT diesen Text geschrieben? Das fragen sich heute Gutachter, die Studien oder Fördergeldanträge prüfen, ebenso wie Professorinnen, die Hausarbeiten benoten. Dabei ist die Antwort selten so einfach wie im Fall des Papers aus Peking. Denn oft sind es nicht ganze Textblöcke oder Sätze, die verdächtig klingen, sondern nur einzelne Begriffe.

"Es gibt einige Wörter, die KI-Tools wie ChatGPT besonders häufig verwenden", sagt James Zou, Associate Professor für Datenwissenschaft in Stanford. Realm (Bereich) sei so ein Wort, auch intricate (kompliziert) und pivotal (zentral). Oft klingen diese Wörter ein bisschen zu akademisch, beschreiben einfache Ideen etwas zu kompliziert. Zou und sein Team machten sich das zunutze, um zu untersuchen, wie häufig Studien inzwischen von künstlicher Intelligenz geschrieben werden.

"Dafür sind wir zunächst einmal alle englischen Wörter durchgegangen", erklärt Zou. "Mit einem Computer, natürlich." Das Team habe von Menschen geschriebene Texte mit solchen von ChatGPT verglichen. Heraus kam eine Liste jener Wörter, die statistisch häufiger von der KI verwendet werden. "Oft hat sich unser Verdacht erhärtet", sagt Zou. Unter den Lieblingswörtern der KI waren viele, die schon beim Lesen auffällig künstlich klangen. Meticulous zum Beispiel (akribisch), "das taucht seit der Einführung von ChatGPT teilweise fast 35-mal häufiger auf". Nach diesen Wörtern durchsuchte das Team dann knapp eine Million Papers, die zwischen 2020 und Februar 2024 erschienen waren.

Das Ergebnis ihrer im April veröffentlichten Studie: Wenige Monate nachdem ChatGPT Ende 2022 eingeführt worden war, stieg der Anteil von Texten, die mit KI bearbeitet wurden, schnell an – und wächst seitdem beständig weiter. Am steilsten ist demnach die Kurve in der Informatik. Im Schnitt habe die KI dort fast jeden fünften Satz "wesentlich verändert oder erzeugt", heißt es in der Studie. Ähnlich sieht es in der Elektrotechnik aus. Niedriger, doch ebenfalls wachsend ist der KI-Anteil in Physik und Mathe. Zous Erklärung für die Unterschiede zwischen den Disziplinen ist naheliegend: "Informatiker kommen eben schneller mit neuen Technologien wie der künstlichen Intelligenz in Kontakt."

Schöne neue Wörter

Anteil der untersuchten Papers, in deren Zusammenfassungen

diese englischen Begriffe vorkommen, in Prozent

seit ChatGPT

24

"significant"

(bedeutsam)

0,3

"delves"

(vertieft)

16

0

2012

2022

2012

2022

ZEIT-GRAFIK/Quelle: Dmitry Kobak et al., arXiv.org

Schöne neue Wörter

Anteil der untersuchten Papers,

in deren Zusammenfassungen

diese englischen Begriffe

vorkommen, in Prozent

seit ChatGPT

0,3

"delves"

(vertieft)

0

2012

2022

24

"significant"

(bedeutsam)

16

2012

2022

ZEIT-GRAFIK/

Quelle: Dmitry Kobak et al., arXiv.org

Schöne neue Wörter

Anteil der untersuchten Papers,

in deren Zusammenfassungen

diese englischen Begriffe

vorkommen, in Prozent

seit ChatGPT

0,3

"delves"

(vertieft)

0

2012

2022

24

"significant"

(bedeutsam)

16

2012

2022

ZEIT-GRAFIK/

Quelle: Dmitry Kobak et al., arXiv.org

Schöne neue Wörter

Anteil der untersuchten Papers, in deren Zusammenfassungen

diese englischen Begriffe vorkommen, in Prozent

seit ChatGPT

24

"significant"

(bedeutsam)

0,3

"delves"

(vertieft)

16

0

2012

2022

2012

2022

ZEIT-GRAFIK/Quelle: Dmitry Kobak et al., arXiv.org

Schöne neue Wörter

Anteil der untersuchten Papers,

in deren Zusammenfassungen

diese englischen Begriffe

vorkommen, in Prozent

seit ChatGPT

0,3

"delves"

(vertieft)

0

2012

2022

24

"significant"

(bedeutsam)

16

2012

2022

ZEIT-GRAFIK/

Quelle: Dmitry Kobak et al., arXiv.org

Schöne neue Wörter

Anteil der untersuchten Papers,

in deren Zusammenfassungen

diese englischen Begriffe

vorkommen, in Prozent

seit ChatGPT

0,3

"delves"

(vertieft)

0

2012

2022

24

"significant"

(bedeutsam)

16

2012

2022

ZEIT-GRAFIK/

Quelle: Dmitry Kobak et al., arXiv.org

Man müsse jedoch aufpassen, nicht vorschnell zu urteilen, mahnt Zou. Diese "KI-Wörter" in einem wissenschaftlichen Text zu lesen, sei zwar "beinah so, als fände man eine smoking gun" – als erwische man einen Killer auf frischer Tat. Aber eben nur beinah. Denn mit letzter Sicherheit lässt sich der KI-Einsatz im Einzelfall nicht nachweisen. Vielleicht ist Englisch nicht die Muttersprache der beschuldigten Autorin? Vielleicht hat sie genau diese Wörter in anderen Artikeln gelesen, will den eigenen Text seriöser, wissenschaftlicher wirken lassen?

"Unnatürlich" nennt Zou die Hochkonjunktur einzelner Wörter zwar. Doch für sich genommen sind sprachliche Trends noch nichts Ungewöhnliches, auch nicht in der Wissenschaft. Meist stehen sie in Verbindung mit einer neuen Entdeckung, Technologie oder mit einem historischen Ereignis. 2020 erreichten Wörter wie pandemic und quarantine Rekordwerte, tauchten plötzlich 20-mal häufiger in Studien auf. Als content words bezeichnet eine Forschungsgruppe aus Tübingen solche Begriffe, da sie direkt im Zusammenhang mit dem Inhalt des jeweiligen Artikels stehen. Davon klar abgegrenzt sind die style words – Wörter, die vom Thema unabhängig in jeder Studie stehen könnten.