Skip to content

GPT 4o übertrifft alles

Neue Entwicklungen: OpenAI und das Modell GPT-4o

Sam Altman, der CEO von OpenAI, veröffentlichte in dieser Woche einen Tweet mit nur einem Wort: "Her". Dieser einfache Tweet bezog sich auf den Film "Her" aus dem Jahr 2013, in dem eine KI eine zentrale Rolle spielt.

Der Film, in dem Joaquin Phoenix eine Beziehung zu einer KI aufbaut, die von Scarlett Johansson gesprochen wird, zeigt eine futuristische Interaktion zwischen Mensch und Maschine.

Die KI im Film spricht fließend und emotionsgeladen und wirkt dadurch sehr menschlich. Die neuen Entwicklungen von OpenAI, die gestern vorgestellt wurden, scheinen diesen Film ein Stück näher an die Realität zu bringen.

Das umfassende KI-Modell

Im Fokus der Präsentation stand das neue KI-Modell GPT-4o. Das "o" steht für "omni", was aus dem Lateinischen übersetzt "alles" bedeutet. Dieses Omnimodell kann nicht nur Text, sondern auch Audio- und Bildinhalte verarbeiten.

Es erkennt Emotionen in Gesichtern, beherrscht bis zu 50 Sprachen und kann simultan übersetzen. Kurz nach der Präsentation fiel der Börsenkurs der Sprachlernplattform Duolingo, was die weitreichenden Fähigkeiten dieses Modells unterstreicht.

Interaktion nahezu menschlich

Bisher konnte ChatGPT Bilder erkennen und sprechen, doch mit GPT-4o wird dies noch einfacher und in Echtzeit ablaufen. Man kann jetzt mit der KI wie mit einem Menschen kommunizieren. GPT-4o spricht und hört gleichzeitig zu und ermöglicht es dem Benutzer, die KI zu unterbrechen, wenn die Antworten zu ausführlich sind oder nicht relevant erscheinen.

Außerdem kann man die KI bitten, verschiedene Stimmlagen zu verwenden, wie euphorischer, dramatischer oder auch singend. Sollte das reale Nutzererlebnis den Erwartungen der OpenAI-Präsentation entsprechen, könnte dies Sprach-Assistenten wie Alexa von Amazon und Siri von Apple in den Schatten stellen.

Verfügbarkeit des GPT-4o

Das Modell GPT-4o beeindruckt auch in anderen Bereichen. Beispielsweise half es in der Präsentation dabei, eine Gleichung zu lösen. Der OpenAI-Mitarbeiter hielt einfach das Handy auf das Blatt mit der Gleichung, und GPT-4o lieferte Lösungsvorschläge.

Was die Textgenerierung betrifft, zeigt ein Test, dass die neue GPT-Version viel schneller ist und exakter auf spezifische Aufforderungen reagiert. GPT-4o wird zunächst den ChatGPT-Plus-Kunden zur Verfügung stehen.

Später wird es auch für die kostenlosen Nutzer verfügbar sein, wenn auch mit Einschränkungen bei den ausgetauschten Nachrichten. Zudem kündigte OpenAI eine ChatGPT-Desktop-App an, die anfänglich für MacOS und später im Jahr für Windows erscheinen soll.

Einbindung von GPT-4o im Alltag

Die Fortschritte im Bereich der künstlichen Intelligenz, wie sie mit GPT-4o präsentiert wurden, könnten den Alltag massiv verändern. Von der Kommunikation zu analytischen Aufgaben zeigt das Modell vielseitige Einsatzmöglichkeiten.

Fest steht: das unterstreicht die rasante Entwicklung und die Integration von KI in immer mehr Lebensbereiche.

Autor dieses Beitrags

Simon Feller

Experte für Künstliche Intelligenz (KI) und Prozessautomatisierung