Auf der Intensivstation ist es niemals still. Das langsam tiefer werdende Tut-tut-tut des Pulsoxymeters kündigt einen drohenden Sauerstoffmangel an. Eine leere Medikamentenpumpe bittet mit quäkenden Tönen um Aufmerksamkeit. Am alarmierendsten ist das Fiepen des Notfallalarms. Jetzt zählt jede Minute. Wie viele Ärzte haben schweißgebadet vor einem kritisch kranken Patienten gestanden und sich gewünscht, sie hätten diesen Notfall vorhersehen können?

Der Neurologe Nils Schweingruber arbeitet daran, diesen Wunsch zu erfüllen. Er versucht, in die Zukunft zu schauen – zumindest für ein paar Stunden. Es ist nicht lange her, da arbeitete er selbst auf einer Intensivstation. Am Universitätsklinikum Hamburg-Eppendorf (UKE) kümmerte er sich um Patienten mit schweren Schlaganfällen und Hirnblutungen. Patienten, deren Gehirn anschwoll, gegen das Innere ihres Schädels drückte und sich selbst zu zerquetschen drohte. Normalerweise herrscht im Gehirn ein Druck von etwa 0,013 bar. Durch eine Schwellung, einen Tumor oder eine Blutung kann der Hirndruck dramatisch steigen. Spätestens ab 0,05 bar besteht Lebensgefahr. Eine spezielle Beatmung, abschwellende Medikamente und eine Narkose können den Hirndruck senken. Als letzte Maßnahme entfernen Neurochirurgen einen Teil der Schädeldecke, um dem Gehirn Platz zu verschaffen.

Am besten wäre es, man könnte eine Hirndruckkrise erkennen, bevor sie entsteht, doch selbst erfahrenen Intensivmedizinern fällt das schwer. Schweingruber kam ein Gedanke: Die Monitore, Beatmungsgeräte und Sensoren, mit denen die Patienten auf der Intensivstation verkabelt sind, produzieren nicht nur Alarmtöne, sondern auch unendlich viele Daten. In der digitalen Patientenakte werden diese mit Laborwerten und medizinischen Notizen verbunden. Könnte die Lösung in diesem Datenmeer versteckt sein?

Das UKE hat sich früh digitalisiert und hütet einen seltenen Schatz, nämlich die Daten von fast 1.400 Hirndruck-Patienten, die im vergangenen Jahrzehnt auf den Intensivstationen behandelt wurden. Das entspricht 63 Behandlungsjahren. Ein perfektes Trainingslager für die künstliche Intelligenz (KI). Nils Schweingruber ließ einen KI-Algorithmus in den Daten nach Mustern suchen, und tatsächlich fand die KI einen Zusammenhang zwischen den Vital-, Labor- und Gerätedaten einerseits und dem Hirndruck auf der anderen Seite. Das Programm kann eine Hirndruckkrise in den folgenden sechs Stunden mit einer Treffsicherheit von 85 Prozent vorhersagen. Das ist genug Zeit, um die richtige Behandlung einzuleiten.

Ein britisches Team programmierte einen "KI-Arzt", der die Daten von 90.000 Patienten mit einer schweren Blutvergiftung (Sepsis) durchforstete. In einem virtuellen Vergleich entschied er deutlich treffsicherer als ein menschlicher Kollege und hätte in der Realität viele Menschenleben gerettet. Wissenschaftler aus der Schweiz fütterten eine KI mit den Daten von über 55.000 intensivmedizinischen Patienten, um ein Kreislaufversagen zu prognostizieren. Die KI sagte in einem Testlauf 82 Prozent der Fälle mehr als zwei Stunden vor dem Ereignis korrekt vorher.

Damit solche KI-Prognosen zuverlässig sind, müssen drei Faktoren zusammenkommen, sagt der Medizinethiker Vince Madai, Leiter des Projektteams "Verantwortungsvolle Algorithmen" des Berliner Instituts für Gesundheitsforschung, das zur Charité gehört. Erstens eine Menge an Daten. Meist gilt: Je mehr, desto besser. Zweitens arbeiten KIs mit Zahlen. Es ist für eine KI viel einfacher, einen Schlaganfall oder einen Knochenbruch zu erkennen als eine Depression, weil sie jeden Bildpunkt einer Röntgen- oder MRT-Aufnahme als Zahl lesen kann, traurige Gedanken aber nicht. Der dritte Faktor ist die Verfügbarkeit der Daten: Aufgrund der strengen deutschen Datenschutzrichtlinien waren viele Bereiche für die KI bisher nicht zugänglich. Für intensivmedizinische Patienten gibt es aber eine Vielzahl an frei zugänglichen Datenbanken.

Manche KI ist in der Praxis allerdings kläglich gescheitert. Etwa die Sepsis-Prognose eines großen amerikanischen Unternehmens für Gesundheitssoftware, die die versprochene 80-prozentige Trefferquote aus der Testphase weit verfehlte. Stattdessen erkannte sie im Krankenhausalltag nur ein Drittel der Blutvergiftungen, gleichzeitig waren 90 Prozent der Warnungen Fehlalarme. Was war geschehen? Das Hauptproblem war ein Datenleck. So nennt man es, wenn eine KI mit Daten trainiert wird, die in der Praxis gar nicht vorhanden sind. In diesem Fall war die Verabreichung von Antibiotika in das KI-Training mit eingeflossen. Wenn ein Patient Antibiotika bekommt, heißt das jedoch, dass das Ärzteteam eine Infektion bereits in Betracht gezogen hat. Die KI erreichte im Test eine hohe Treffsicherheit, versagte aber in der Praxis dabei, eine Sepsis früher als die Fachleute zu erkennen. Sie hatte geschummelt.