В течение многих лет (2023–2025) искусственный интеллект сделал огромный шаг вперёд по многим направлениям. Большие языковые модели (LLM) и чат-боты, мультимодальные системы, научные инструменты ИИ и робототехника достигли значительных прорывов.

Технологические гиганты выпустили новых AI-ассистентов, сообщества с открытым исходным кодом представили мощные модели, а регуляторы начали реагировать на влияние ИИ.

Ниже мы рассмотрим самые впечатляющие достижения — от расширений GPT-4 и Google Gemini до Нобелевской премии AlphaFold и открытий в науке и искусстве, сделанных с помощью ИИ.

Генеративные языковые модели и чат-боты

Современные LLM стали значительно мощнее и мультимодальными. GPT-4 Turbo от OpenAI (анонсирован в ноябре 2023 года) теперь может обрабатывать 128 000 токенов в одном запросе (примерно 300 страниц текста) и при этом работает гораздо дешевле, чем GPT-4.

В мае 2024 года OpenAI представила GPT-4o (Omni) — усовершенствованную модель, которая обрабатывает текст, изображения и аудио в реальном времени — фактически наделяя GPT-4 возможностями «зрения и слуха» в разговоре. В ChatGPT теперь встроены функции работы с изображениями и голосом: пользователи могут загружать фотографии или говорить с ботом, и он будет отвечать, опираясь на визуальный или аудиоввод.

  • GPT-4 Turbo и GPT-4o (Omni): GPT-4 Turbo (ноябрь 2023) снизил затраты и увеличил длину контекста до 128K токенов. GPT-4o (май 2024) сделал ИИ по-настоящему мультимодальным, позволяя генерировать текст, речь и изображения с почти человеческой скоростью.
  • Достижения ChatGPT: К концу 2023 года ChatGPT «теперь может видеть, слышать и говорить» — изображения и аудио можно загружать или озвучивать как запросы, и бот отвечает соответственно.
    Также была интегрирована DALL·E 3 (октябрь 2023), что позволяет создавать изображения из текста с помощью диалогового ввода.
  • Серия Google Gemini: В декабре 2024 года Google DeepMind выпустила первые модели Gemini 2.0 («Flash» и прототипы), предназначенные для «эры агентов» — ИИ, способного автономно выполнять многоэтапные задачи.
    Google уже начала тестирование Gemini 2.0 в Поиске (AI Overviews) и других продуктах для более чем миллиарда пользователей, демонстрируя улучшенные способности к рассуждению и мультимодальности.
  • Другие модели: Meta выпустила LLaMA 3 в апреле 2024 года (открытые LLM с весами до 400 млрд параметров), утверждая, что она превосходит многие предыдущие модели.
    Anthropic представила Claude 3, а инструменты Microsoft Copilot также основаны на этих достижениях (например, Copilot построен на технологиях OpenAI).

Эти инновации позволяют AI-ассистентам вести гораздо более длительные и содержательные диалоги, а также обрабатывать разнообразные типы данных.

Они также обеспечивают работу новых приложений «ассистентов» через API (Google «AI Overviews», OpenAI Assistants API и др.), делая ИИ более доступным для разработчиков и конечных пользователей.

Генеративные языковые модели и чат-боты

Мультимодальные и творческие достижения ИИ

Творческие способности и визуальное восприятие ИИ значительно выросли. Модели преобразования текста в изображение и текста в видео достигли новых высот:

OpenAI представила DALL·E 3 (октябрь 2023), генерирующую фотореалистичные изображения по запросам, интегрированную с ChatGPT для помощи в составлении запросов.

Google выпустила Imagen 3 (октябрь 2024) и Veo 2 (декабрь 2024) — передовые движки для преобразования текста в изображение и видео, значительно повышающие качество, детализацию и согласованность в создании AI-арта и видео.

Даже музыкальный ИИ улучшился благодаря инструментам Google MusicFX и связанным исследованиям (например, эксперименты MusicLM).

  • Модели генеративного искусства: DALL·E 3 и Imagen 3 способны точно следовать тонким запросам (включая встроенный текст на изображениях).
    Google Veo 2 может создавать короткие видеоклипы по одному текстовому описанию — значительный шаг в синтезе видео.
    Stable Diffusion и Midjourney также выпустили новые версии (v3, v6) с улучшенным реализмом в этом году.
  • ИИ в устройствах: Apple запустила Apple Intelligence (в iOS 18 и macOS 15, конец 2024) — встроенный генеративный ИИ на iPhone, iPad и Mac.
    Он добавляет помощников по написанию (переписывание, корректура, резюмирование в Mail/Pages), ещё более умного Siri и инструменты для работы с изображениями, такие как Image Playground (создание забавных иллюстраций по тексту) и Genmoji (ИИ-генерируемые кастомные эмодзи).
    Фото получили поиск на естественном языке («найти Майю на скейтборде»), а функция «Clean Up» удаляет нежелательные объекты с фотографий.
    Подход Apple делает акцент на обработке данных на устройстве и конфиденциальности.
  • ИИ в искусстве: Яркий пример — в ноябре 2024 года Sotheby’s продал первую картину, созданную гуманоидным роботом.
    Портрет Алана Тьюринга, нарисованный роботом с ИИ Ai-Da, был продан за 1,08 миллиона долларов США.
    Эта рекордная продажа («A.I. God: Portrait of Alan Turing») подчёркивает растущую роль ИИ в творчестве и его культурное влияние.

В целом генеративные модели демократизируют творчество: теперь любой может создавать искусство, музыку или видео всего несколькими словами.
Фокус индустрии сместился с простых новинок (сюрреалистичных изображений) на полезную генерацию изображений (логотипы, схемы, карты) и реализм, приближенный к человеческому.

(В марте 2025 года OpenAI даже выпустила «4o Image Generation», интегрировав свою лучшую модель генерации изображений в GPT-4o для точных, фотореалистичных результатов, управляемых диалогом.)

Эти инструменты быстро внедряются в приложения, браузеры и творческие процессы.

Мультимодальные и творческие достижения ИИ

ИИ в науке, медицине и математике

Достижения ИИ способствовали научным открытиям и прогрессу в исследованиях:

  • AlphaFold 3 — биомолекулы: В ноябре 2024 года Google DeepMind (в сотрудничестве с Isomorphic Labs) представила AlphaFold 3 — новую модель, которая одновременно предсказывает трёхмерные структуры всех биомолекул (белков, ДНК, РНК, лигандов и др.) с беспрецедентной точностью.
    Для взаимодействия белков с лекарствами AlphaFold 3 примерно на 50% точнее традиционных методов.
    Создатели сразу же запустили бесплатный AlphaFold Server, чтобы исследователи по всему миру могли предсказывать молекулярные структуры.
    Это расширение возможностей AlphaFold 2, который предсказывал только белки, и ожидается, что оно преобразит разработку лекарств и геномные исследования.
  • Нобелевская премия — сворачивание белков: Значимость этого прорыва была отмечена Нобелевской премией по химии 2024 года.
    Демис Хассабис и Джон Джампер (DeepMind) разделили премию (вместе с Дэвидом Бейкером) за разработку AlphaFold (ИИ для сворачивания белков).
    Нобелевский комитет отметил, что AlphaFold «открыла совершенно новые возможности» в дизайне белков.
    (Это одно из самых заметных достижений ИИ на сегодняшний день.)
  • AlphaProteo — разработка лекарств: Также в 2024 году DeepMind анонсировала AlphaProteo — ИИ, который создаёт новые белковые связывающие молекулы — вещества, которые прочно связываются с целевыми белками.
    AlphaProteo ускоряет создание новых антител, биосенсоров и лекарственных кандидатов, генерируя перспективные белковые структуры для заданных целей.
  • Математика — AlphaGeometry: DeepMind представила AlphaGeometry и AlphaProof, ещё один прорыв.
    В июле 2024 года AlphaGeometry 2 решила задачу Международной математической олимпиады за 19 секунд, достигнув уровня серебряного призёра.
    Это редкий случай, когда ИИ справляется со сложной школьной математикой.
  • Квантовые вычисления — AlphaQubit и Willow: ИИ также улучшил передовое оборудование.
    В 2024 году Google представила AlphaQubit — ИИ-декодер, который значительно лучше выявляет ошибки в квантовых компьютерах (например, чипах Sycamore от Google), чем предыдущие методы.
    В декабре 2024 года Google представила Willow — новый квантовый чип, который с помощью продвинутой коррекции ошибок решил эталонную задачу менее чем за 5 минут, тогда как лучшему суперкомпьютеру сегодня потребовалось бы около 10^24 лет.
    Эти достижения принесли Willow награду «Прорыв года в физике 2024», подчёркивая роль ИИ в развитии квантовых технологий.

В медицине и здравоохранении модели ИИ также добились успехов. Например, новая модель Google Med-Gemini (дообученная на медицинских данных) набрала 91,1% на медицинском экзамене в США (по типу USMLE), значительно превзойдя предыдущие модели.

Были выпущены инструменты с ИИ для радиологии и патологии (например, Derm и Path Foundations) для улучшения анализа изображений.
В целом ИИ стал незаменимым партнёром в исследованиях — от картирования человеческого мозга на наномасштабе (с помощью ИИ для электронной микроскопии) до ускорения скрининга туберкулёза в Африке, как сообщают исследователи Google.

ИИ в науке, медицине и математике

ИИ в робототехнике и автоматизации

Роботы с ИИ осваивают сложные задачи из реального мира.

Гуманоидные роботы Tesla Optimus были публично продемонстрированы в октябре 2024 года на мероприятии «We, Robot». Несколько десятков роботов Optimus ходили, стояли и даже танцевали на сцене — хотя позднее сообщалось, что первые демонстрации частично управлялись удалённо людьми.

Тем не менее, событие подчеркнуло быстрый прогресс в создании универсальных роботов.

  • Роботы ALOHA от DeepMind: Лаборатория ИИ Google добилась впечатляющих успехов в области домашних роботов.
    В 2024 году робот ALOHA (Автономный Домашний Помощник на ногах) научился завязывать шнурки, вешать рубашку, ремонтировать другого робота, вставлять шестерёнки и даже убирать на кухне, используя только планирование и зрение ИИ.
    Проект «ALOHA Unleashed» с открытым исходным кодом показал, как роботы координируют работу двух рук для выполнения задач — впервые в универсальной манипуляции.
  • Роботизированные трансформеры: DeepMind представила RT-2 (Robotic Transformer 2) — модель, объединяющую зрение, язык и действия, которая может обучаться как на интернет-изображениях, так и на данных реальных роботов.
    RT-2 позволяет роботам понимать инструкции так, как это делает человек, используя знания из интернета.
    Модель была продемонстрирована на примере сортировки объектов роботом по текстовым командам.
  • Промышленные роботы: Другие компании также добились прогресса: Boston Dynamics продолжила совершенствовать роботов Atlas и Spot (хотя без громких прорывов), а автономные транспортные средства с ИИ улучшились (например, бета-версия Full Self-Driving от Tesla получила более широкое распространение, хотя полная автономность пока не достигнута).
    В производстве компании, ориентированные на ИИ, такие как Figure AI, привлекли финансирование для создания домашних роботов для бытовых задач.

Эти усилия показывают, что роботы всё лучше справляются с всё более сложными задачами без явного программирования. Однако по-настоящему полностью автономные гуманоиды ещё впереди.

Демонстрации (Optimus, ALOHA, RT-2) — важные вехи, но исследователи предупреждают, что предстоит ещё много работы, чтобы роботы могли безопасно и надёжно работать рядом с людьми в больших масштабах.

ИИ в робототехнике и автоматизации

ИИ в продуктах, промышленности и обществе

Влияние ИИ распространяется на повседневные продукты и даже на политику:

  • Потребительские устройства: Крупные технологические продукты интегрировали AI-агентов.
    Copilot от Microsoft (встроенный в Windows, Office, Bing) и Bard/Bard AI от Google в Поиске (на базе Gemini) предоставили пользователям мощь больших языковых моделей.
    Устройства Apple получили Apple Intelligence (как описано выше), а производители аппаратного обеспечения, такие как Nvidia, продали рекордное количество AI-графических процессоров, обеспечивающих работу как облачных, так и потребительских ИИ.
    (В 2024 году Nvidia стала самой дорогой компанией мира благодаря буму ИИ.)
  • Регулирование — Закон ЕС об ИИ: Учитывая масштаб влияния ИИ, регуляторы также приняли меры.
    1 августа 2024 года вступил в силу Закон ЕС об ИИ — первый комплексный закон об искусственном интеллекте.
    Он устанавливает рамки на основе оценки рисков: ИИ с низким риском (фильтры спама, видеоигры) подчиняется минимальным правилам; правила прозрачности обязывают системы ИИ, такие как чат-боты, раскрывать, что они ИИ; ИИ с высоким риском (медицинские или кадровые инструменты) подлежит строгому контролю; а явно неприемлемый ИИ (например, «социальное кредитование» граждан государствами) запрещён.
    Этот набор правил (вместе с предстоящими руководствами по универсальным моделям) является важным достижением в управлении ИИ и, вероятно, повлияет на стандарты во всём мире.
  • Рост отрасли: Сам сектор ИИ получил историческое финансирование и оценки: OpenAI достигла оценочной стоимости в 157 миллиардов долларов в конце 2023 года, а компании, такие как Anthropic, Inflection и китайские стартапы в области ИИ, привлекли многомиллиардные инвестиции.
    Спрос на оборудование NVIDIA для ИИ поднял её рыночную капитализацию выше 3,5 триллионов долларов к середине 2024 года.
    Эти цифры подчёркивают, насколько ИИ стал центральным элементом технологической экономики.

>>> Вы когда-нибудь пробовали: Сравнение искусственного интеллекта и человеческого разума ?

ИИ в продуктах, промышленности и обществе


Короче говоря, ИИ уже не ограничивается лабораториями или демонстрациями новинок — он встроен в телефоны, автомобили, рабочие места и государственную политику. 

Приведённые выше достижения — от обширных знаний GPT-4 до научных революций AlphaFold — демонстрируют быстрое созревание ИИ.

В преддверии 2025 года эти успехи предвещают ещё более мощные и практичные применения ИИ в нашей повседневной жизни.