Skip to content

Google stellt neueste Version seines KI-Modells Gemini 1.5 vor

Auf einen Blick

  • Google hat das KI-Modell Gemini 1.5 eingeführt, das gemäß Google eine „drastisch verbesserte Leistung“ bietet.
  • Gemini 1.5 Pro kann bis zu einer Million Token verarbeiten, was einer großen Menge an Daten entspricht – etwa einer Stunde Video, 700.000 Wörtern oder 30.000 Zeilen Code.
  • Es handelt sich um ein multimodales Modell, das für eine Vielzahl von Aufgaben optimiert ist und auf einer Transformer-basierte Architektur mit einer Mixed-of-Experts (MoE)-Architektur basiert.
  • Die KI wurde erfolgreich getestet, unter anderem bei der Analyse der Protokolle der Apollo-11-Raumfahrtmission.

Gemini 1.5

Google hat die neueste Version seines KI-Modells, Gemini 1.5, vorgestellt. Diese Aktualisierung tritt in die Fußstapfen von Gemini 1.0 Pro und bietet eine Reihe von Verbesserungen und neuen Funktionen.

Im Video: Google stellt Gemini 1.5 vor

Merkmale und Verbesserungen

Das Besondere an Gemini 1.5 ist seine verbesserte Fähigkeit zur Verarbeitung großer Datenmengen. Im Vergleich zu seinem Vorgängermodell ist es in der Lage, rund 700.000 Wörter oder 30.000 Codezeilen zu verarbeiten, was 35-mal mehr Daten bedeutet, die von Gemini 1.5 Pro gehandhabt werden können.

Neben textbasierten Daten kann dieses neue KI-Modell von Google auch mit non-textuellen Daten umgehen. Es kann bis zu 11 Stunden Audiodaten oder eine Stunde Videodaten in einer Reihe von Sprachen verarbeiten. Ein weiterer bemerkenswerter Fortschritt ist die Fähigkeit, Kontextfenster von bis zu 1 Million Token zu nutzen, eine deutliche Steigerung gegenüber Gemini 1.0, die 32.000 Token verarbeiten konnte.

Gemini 1.5 Pro verwendet eine Transformer-basierte Architektur und enthält eine Kombination aus Expertennetzwerken, die auf verschiedene Aufgaben spezialisiert sind. Dies bietet mehr Effizienz und Flexibilität bei der Verarbeitung komplexer Datensätze und Aufgaben.

Anwendungen und Testfälle

Gemini 1.5 wurde bereits in verschiedenen Szenarien angewendet und getestet. Ein bemerkenswertes Beispiel ist die Verwendung der Technologie zum Durchsuchen des Protokolls der Apollo-11-Raumfahrtmission. Die KI konnte humorvolle Momente in den mehr als 400 Seiten finden und sie sinnvoll interpretieren.

Mit der Fähigkeit, bis zu einer Stunde Video und bis zu elf Stunden Audio zu verarbeiten, zeigt Gemini 1.5 Pro sein Potential in einer Vielzahl von Anwendungen, bei denen große Datenmengen analysiert werden müssen.

Egal ob es sich um Text, Video, Audio oder Code handelt, dieses Modell ist darauf ausgelegt, börsennotierte Unternehmen und Entwicklern dabei zu helfen, komplexere und nützlichere Anwendungen zu erstellen.

Autor dieses Beitrags

Simon Feller

Experte für Künstliche Intelligenz (KI) und Prozessautomatisierung