Die ChatGPT-Erfinder von OpenAI haben am Montagabend die neuste Version ihrer künstlichen Intelligenz GPT4 vorgestellt: OpenAI-CTO Mina Murati demonstrierte, wie die „GPT4o“ getaufte KI in Gesprächen mit den Nutzern sowohl schneller antwortet als auch qualitativ bessere Antworten gibt. Vor allem aber ist in der neuen Version Audioerkennung und -ausgabe direkt im Modell integriert. Die OpenAI-KI kann damit nun Gespräche direkt führen, benötigt keine Tastatureingaben oder Audio-Erkennungsprogramme mehr.
Das Ergebnis, das Murati zusammen mit zwei leitenden Entwicklern demonstrierte, verblüfft: Die KI antwortet flüssig und ohne Stocken. Mehr noch: Sie erkennt die Emotionen in der Stimme des Gegenübers und geht direkt darauf ein: Wenn jemand Angst hat, zeigt die KI Einfühlungsvermögen, kann fröhlich, gelassen oder dramatisch angehaucht antworten.
Zudem kann die KI Emotionen auch auf Verlangen simulieren: Murati zeigte etwa, wie die KI eine Gute-Nacht-Geschichte erzählt und dabei die Wünsche der Nutzer berücksichtigt. Das gezeigte Gespräch mit der KI verblüfft auch, da sie wie ein Mensch auf Zwischenrufe und Unterbrechungen eingeht, anstatt vorgefertigte Antworten wie eine Audio-Aufnahme abzuspulen.
Natürlich handelt es sich bei der Demo auf der Bühne im OpenAI-Hauptquartier um eine zuvor vielfach geprobte Übung – doch laut Murati ist die Interaktion live, nicht vorher aufgezeichnet. Wenn OpenAI hier nicht schummelt, dann sind die Fähigkeiten von GPT4o insbesondere beim Simulieren von Emotionen beeindruckend – und ein Stück weit erschreckend.
Die KI soll dies nicht nur auf Englisch beherrschen, sondern auch noch in 49 weiteren Sprachen. „Wir wollen diese Erfahrung zu jedem Nutzer bringen“, erklärt Murati – und kündigt an, dass das neue Modell nicht nur auf zahlende Nutzer hört, sondern nach und nach für alle Nutzer weltweit zur Verfügung gestellt werden soll.
Das kann OpenAI auch deswegen leisten, da die neue KI deutlich effizienter mit Rechenzeit umgehen soll als die Vorgänger. OpenAI spart also Geld, wenn sie allen Nutzern diese Version zur Verfügung stellt.
Zuerst jedoch soll nun OpenAIs „Red Team“ die KI testen und an ihre Grenzen bringen. Das „Red Team“ soll sicherstellen, dass die KI nicht für maliziöse Zwecke missbraucht werden kann. Und es soll Hintertüren und Tricks zum Umgehen der eingebauten Sperren finden und diese schließen lassen, bevor die restlichen Nutzer sie ausnutzen können.
GTP4o könnte künftig etwa als Assistent auf mobilen Geräten eingesetzt werden und dabei konstant Audio-Daten auswerten. Doch als Suchmaschinen-Ersatz, wie von vielen Analysten vorab vermutet, soll GPT4o nicht dienen. Der große Konkurrenzkampf zu Google wurde vorerst vertagt.
Dennoch war die Terminwahl für die Vorstellung nicht zufällig gewählt. Dienstag beginnt Google seine Entwicklerkonferenz und wird dort die neuesten Fähigkeiten der eigenen KI Gemini zeigen. OpenAI hat nun vorgelegt – und Google wird es schwer haben, an GPT4o vorbeizuziehen.