Über viele Jahre hinweg (2023–2025) hat die künstliche Intelligenz auf vielen Gebieten enorme Fortschritte gemacht. Große Sprachmodelle (LLMs) und Chatbots, multimodale Systeme, wissenschaftliche KI-Tools und Robotik verzeichneten alle Durchbrüche.
Technologiegiganten brachten neue KI-Assistenten auf den Markt, Open-Source-Communities veröffentlichten leistungsstarke Modelle, und selbst Regulierungsbehörden begannen, die Auswirkungen von KI zu adressieren.
Im Folgenden geben wir einen Überblick über die auffälligsten Errungenschaften – von GPT-4-Erweiterungen und Googles Gemini bis hin zum Nobelpreis für AlphaFold und KI-gesteuerten Entdeckungen in Wissenschaft und Kunst.
Generative Sprachmodelle und Chatbots
Moderne LLMs wurden deutlich leistungsfähiger und multimodal. OpenAIs GPT-4 Turbo (Ankündigung Nov 2023) kann nun 128.000 Tokens in einem Prompt verarbeiten (etwa 300 Seiten Text) und ist dabei deutlich kostengünstiger als GPT-4.
Im Mai 2024 stellte OpenAI GPT-4o (Omni) vor, ein verbessertes Modell, das Text, Bilder und Audio in Echtzeit verarbeitet – und GPT-4 damit effektiv „Sehen und Hören“ in der Konversation verleiht. ChatGPT selbst verfügt nun über integrierte Bild- und Sprachfunktionen: Nutzer können Fotos hochladen oder mit dem Bot sprechen, der dann auf diese visuellen oder akustischen Eingaben reagiert.
- GPT-4 Turbo und GPT-4o (Omni): GPT-4 Turbo (Nov 2023) senkte die Kosten und verlängerte die Kontextlänge auf 128K Tokens. GPT-4o (Mai 2024) machte KI wirklich multimodal und erzeugt Text, Sprache und Bilder mit nahezu menschlicher Geschwindigkeit.
- Fortschritte bei ChatGPT: Ende 2023 „kann ChatGPT jetzt sehen, hören und sprechen“ – Bilder und Audio können als Eingaben hochgeladen oder gesprochen werden, und der Bot antwortet entsprechend.
Außerdem wurde DALL·E 3 (Okt 2023) integriert, sodass Bilder aus Text mithilfe konversationeller Eingaben generiert werden können. - Googles Gemini-Serie: Im Dez 2024 brachte Google DeepMind die ersten Gemini 2.0-Modelle („Flash“ und Prototypen) heraus, die für das „agentische Zeitalter“ entwickelt wurden – KI, die autonom mehrstufige Aufgaben ausführt.
Google testet Gemini 2.0 bereits in der Suche (AI Overviews) und anderen Produkten für über eine Milliarde Nutzer, was die verbesserten Denk- und Multimodal-Fähigkeiten widerspiegelt. - Weitere Modelle: Meta veröffentlichte im April 2024 LLaMA 3 (offene LLMs mit bis zu 400 Milliarden Parametern) und behauptet, viele Vorgängermodelle zu übertreffen.
Anthropics Claude 3 und Microsofts Copilot-Tools bauen ebenfalls auf diesen Fortschritten auf (z. B. Copilot basiert auf OpenAI-Technologie).
Diese Innovationen ermöglichen es KI-Assistenten, deutlich längere und inhaltsreichere Gespräche zu führen und vielfältige Eingaben zu verarbeiten.
Sie treiben auch neue „Assistent“-Apps über APIs an (Googles „AI Overviews“, OpenAIs Assistants API etc.) und machen KI für Entwickler und Endnutzer zugänglicher.
Multimodale & kreative KI-Fortschritte
Die Kreativität und visuelle Wahrnehmung von KI haben einen enormen Sprung gemacht. Text-zu-Bild- und Text-zu-Video-Modelle erreichten neue Qualitätsstufen:
OpenAIs DALL·E 3 (Okt 2023) erzeugt fotorealistische Bilder aus Eingaben und ist sogar in ChatGPT integriert, um die Eingabeaufforderungen gezielt zu steuern.
Google stellte Imagen 3 (Okt 2024) und Veo 2 (Dez 2024) vor – hochmoderne Text-zu-Bild- und Text-zu-Video-Engines –, die Qualität, Detailtreue und Konsistenz in KI-Kunst und Videoproduktion deutlich verbessern.
Auch die Musik-KI verbesserte sich mit Googles MusicFX-Tools und verwandten Forschungen (z. B. MusicLM-Experimente).
- Generative Kunstmodelle: DALL·E 3 und Imagen 3 folgen subtilen Eingaben (einschließlich eingebettetem Text in Bildern) mit hoher Genauigkeit.
Googles Veo 2 kann kurze Videoclips aus einer einzigen Textbeschreibung erzeugen – ein bedeutender Schritt für Videosynthese.
Stable Diffusion und Midjourney veröffentlichten ebenfalls neuere Versionen (v3, v6) mit verbesserter Realitätsnähe in diesem Jahr. - KI in Geräten: Apple brachte Apple Intelligence (in iOS 18 und macOS 15, Ende 2024) – integrierte generative KI auf iPhone/iPad/Mac.
Sie bietet Schreibassistenten (Umschreiben, Korrekturlesen, Zusammenfassen in Mail/Pages), eine noch intelligentere Siri und Bildwerkzeuge wie Image Playground (lustige Illustrationen per Text erstellen) und Genmoji (KI-generierte individuelle Emojis).
Fotos erhielten eine natürliche Sprachsuche („finde Maya beim Skateboarden“) und die „Clean Up“-KI entfernt unerwünschte Objekte aus Bildern.
Apples Ansatz legt Wert auf On-Device-Verarbeitung und Datenschutz. - KI in der Kunst: Ein eindrucksvolles Beispiel: Im Nov 2024 verkaufte Sotheby’s das erste Gemälde eines humanoiden Roboters.
Ein Porträt von Alan Turing, gezeichnet vom KI-gesteuerten Roboter Ai-Da, erzielte 1,08 Millionen US-Dollar.
Dieser rekordverdächtige Verkauf („A.I. God: Portrait of Alan Turing“) unterstreicht die wachsende Rolle der KI in der Kreativität und ihren kulturellen Einfluss.
Insgesamt demokratisieren generative Modelle die Kreativität: Jeder kann jetzt mit wenigen Worten Kunst, Musik oder Video erzeugen.
Der Fokus der Branche hat sich von bloßer Neuheit (surreale Bilder) hin zu nützlicher Bildgenerierung (Logos, Diagramme, Karten) und menschenähnlicher Realitätsnähe verschoben.
(Im März 2025 veröffentlichte OpenAI sogar „4o Image Generation“, das beste Bildmodell in GPT-4o integriert für präzise, fotorealistische Ergebnisse, die durch Konversation gesteuert werden.)
Diese Werkzeuge werden schnell in Apps, Browser und kreative Arbeitsabläufe eingebunden.
KI in Wissenschaft, Medizin und Mathematik
KI-Erfolge haben wissenschaftliche Entdeckungen und Forschungsfortschritte beflügelt:
- AlphaFold 3 – Biomoleküle: Im Nov 2024 stellte Google DeepMind (mit Isomorphic Labs) AlphaFold 3 vor, ein neues Modell, das die 3D-Strukturen aller Biomoleküle (Proteine, DNA, RNA, Liganden usw.) gleichzeitig mit beispielloser Genauigkeit vorhersagt.
Bei Protein-Wirkstoff-Interaktionen ist AlphaFold 3 etwa 50 % genauer als traditionelle Methoden.
Die Entwickler veröffentlichten sofort einen kostenlosen AlphaFold-Server, damit Forscher weltweit molekulare Strukturen vorhersagen können.
Dies baut auf AlphaFold 2s Protein-Vorhersagen auf und wird voraussichtlich die Wirkstoffentwicklung und Genomforschung revolutionieren. - Nobelpreis – Protein-Faltung: Die Bedeutung dieses Fortschritts wurde durch den Chemie-Nobelpreis 2024 unterstrichen.
Demis Hassabis und John Jumper (DeepMind) teilten sich den Preis (mit David Baker) für die Entwicklung von AlphaFold (KI zur Protein-Faltung).
Das Nobelkomitee hob hervor, dass AlphaFold „völlig neue Möglichkeiten“ im Protein-Design eröffnete.
(Dies ist eine der prominentesten KI-Leistungen bisher.) - AlphaProteo – Wirkstoffdesign: Ebenfalls 2024 kündigte DeepMind AlphaProteo an, eine KI, die neuartige Proteinbinder entwirft – Moleküle, die Zielproteine mit hoher Affinität binden.
AlphaProteo kann die Entwicklung neuer Antikörper, Biosensoren und Wirkstoffkandidaten beschleunigen, indem es vielversprechende Proteinstrukturen für vorgegebene Ziele generiert. - Mathematik – AlphaGeometry: DeepMinds AlphaGeometry und AlphaProof erzielten einen weiteren Durchbruch.
Im Juli 2024 löste AlphaGeometry 2 ein Problem der Internationalen Mathematikolympiade in 19 Sekunden und erreichte damit das Niveau eines Silbermedaillengewinners.
Dies ist ein seltener Fall, in dem KI fortgeschrittene Mathematik auf Gymnasialniveau bewältigt. - Quantencomputing – AlphaQubit & Willow: KI verbesserte auch modernste Hardware.
2024 kündigte Google AlphaQubit an, einen KI-basierten Decoder, der Fehler in Quantencomputern (z. B. Googles Sycamore-Chips) deutlich besser erkennt als frühere Methoden.
Im Dez 2024 stellte Google Willow vor, einen neuen Quantenchip, der mit fortschrittlicher Fehlerkorrektur eine Benchmark-Aufgabe in unter 5 Minuten löste, für die der beste Supercomputer heute etwa 10^24 Jahre bräuchte.
Diese Erfolge brachten Willow die Auszeichnung „Physik-Durchbruch des Jahres 2024“ ein und zeigen die Rolle der KI im Quantenfortschritt.
Auch in Medizin und Gesundheit erzielten KI-Modelle Fortschritte. So erreichte Googles neues Med-Gemini (auf medizinische Daten feinjustiert) 91,1 % bei einem US-Medizinexamen (USMLE-ähnlich) und übertraf frühere Modelle deutlich.
KI-gestützte Werkzeuge für Radiologie und Pathologie (z. B. Derm und Path Foundations) wurden veröffentlicht, um die Bildanalyse zu verbessern.
Insgesamt ist KI heute ein unverzichtbarer Forschungspartner – von der nanoskaligen Kartierung des menschlichen Gehirns (mit KI-unterstützter EM-Bildgebung) bis zur Beschleunigung des Tuberkulose-Screenings in Afrika, wie Google-Forscher berichten.
KI in Robotik und Automatisierung
Von KI gesteuerte Roboter lernen komplexe Aufgaben aus der realen Welt.
Teslas Optimus-Humanoide wurden im Oktober 2024 öffentlich vorgeführt („We, Robot“-Event). Mehrere Dutzend Optimus-Einheiten gingen, standen und tanzten sogar auf der Bühne – wobei spätere Berichte darauf hinwiesen, dass die ersten Demos teilweise ferngesteuert waren.
Dennoch zeigte die Veranstaltung den schnellen Fortschritt hin zu universell einsetzbaren Robotern.
- DeepMinds ALOHA-Roboter: Googles KI-Labor erzielte beeindruckende Fortschritte bei Haushaltsrobotern.
2024 lernte der ALOHA-Roboter (Autonomous Legged Household Assistant), Schuhe zu binden, Hemden aufzuhängen, andere Roboter zu reparieren, Zahnräder einzusetzen und sogar eine Küche zu reinigen – allein durch KI-Planung und visuelle Wahrnehmung.
Die Open-Source-Veröffentlichung „ALOHA Unleashed“ zeigte Roboter, die zwei Arme für Aufgaben koordinieren – ein Novum in der universellen Manipulation. - Robotic Transformers: DeepMind stellte RT-2 (Robotic Transformer 2) vor, ein Modell für Vision, Sprache und Aktion, das aus Internetbildern und echten Roboterdaten lernen kann.
RT-2 ermöglicht Robotern, Anweisungen wie Menschen zu verstehen, indem es Webwissen nutzt.
Es wurde demonstriert, wie ein Roboter Objekte sortiert, indem er Textbefehlen folgt. - Industrieroboter: Weitere Firmen machten Fortschritte: Boston Dynamics verfeinerte Atlas- und Spot-Roboter (ohne großen Durchbruch), und KI-gesteuerte autonome Fahrzeuge verbesserten sich (Teslas Full Self-Driving Beta wurde breiter ausgerollt, obwohl vollständige Autonomie noch ungelöst ist).
In der Fertigung sammelten KI-zentrierte Unternehmen wie Figure AI Kapital, um Haushaltsroboter für Aufgaben zu entwickeln.
Diese Bemühungen zeigen, dass Roboter zunehmend schwierigere Aufgaben ohne explizite Programmierung erledigen. Vollständig autonome humanoide Roboter sind jedoch noch Zukunftsmusik.
Die Demonstrationen (Optimus, ALOHA, RT-2) sind Meilensteine, doch Forscher warnen, dass noch viel Arbeit nötig ist, bevor Roboter sicher und zuverlässig in großem Maßstab mit Menschen zusammenarbeiten können.
KI in Produkten, Industrie und Gesellschaft
Die Auswirkungen von KI reichen bis in Alltagsprodukte und sogar in die Politik:
- Verbrauchergeräte: Große Technologiemarken integrierten KI-Agenten.
Microsofts Copilot (eingebettet in Windows, Office, Bing) und Googles Bard/Bard AI in der Suche (mit Gemini im Hintergrund) brachten LLM-Power zu den Nutzern.
Apples Geräte erhielten Apple Intelligence (wie oben beschrieben), und Hardwarehersteller wie Nvidia verkauften Rekordzahlen an KI-GPUs, die sowohl Cloud- als auch Verbraucher-KI antreiben.
(Nvidia wurde 2024 zum wertvollsten Unternehmen der Welt dank des KI-Booms.) - Regulierung – EU-KI-Gesetz: Angesichts der Reichweite von KI griffen auch Regulierungsbehörden ein.
Am 1. August 2024 trat das EU-KI-Gesetz in Kraft, das erste umfassende KI-Gesetz.
Es etabliert einen risikobasierten Rahmen: KI mit geringem Risiko (Spamfilter, Videospiele) unterliegt minimalen Regeln; Transparenzvorschriften verpflichten KI-Systeme wie Chatbots, ihre KI-Natur offenzulegen; KI mit hohem Risiko (medizinische oder Einstellungs-Tools) unterliegt strenger Aufsicht; und eindeutig inakzeptable KI (z. B. „soziale Bewertung“ von Personen durch Regierungen) ist verboten.
Dieses Regelwerk (zusammen mit kommenden Leitlinien für universelle Modelle) ist ein bedeutender Fortschritt in der KI-Governance und wird voraussichtlich weltweit Standards setzen. - Wachstum der Branche: Der KI-Sektor verzeichnete historische Finanzierungen und Bewertungen: OpenAI erreichte Ende 2023 eine geschätzte Bewertung von 157 Milliarden US-Dollar, und Unternehmen wie Anthropic, Inflection und chinesische KI-Startups sammelten Milliardenrunden ein.
NVIDIAs Nachfrage nach KI-Hardware trieb die Marktkapitalisierung bis Mitte 2024 auf über 3,5 Billionen US-Dollar.
Diese Zahlen verdeutlichen, wie zentral KI für die Tech-Wirtschaft geworden ist.
>>> Haben Sie schon einmal versucht: Vergleich von KI und menschlicher Intelligenz ?
Kurz gesagt: KI ist längst nicht mehr auf Labore oder Neuheitsdemos beschränkt – sie ist in Telefonen, Autos, Arbeitsplätzen und der öffentlichen Politik verankert.
Die oben genannten Fortschritte – vom umfassenden Wissen von GPT-4 bis zu den wissenschaftlichen Revolutionen von AlphaFold – zeigen die rasche Reife der KI.
Mit Blick auf 2025 deuten diese Errungenschaften auf noch leistungsfähigere und praktischere KI-Anwendungen in unserem Alltag hin.