Может ли ИИ учиться без данных?
Современный ИИ не может полностью учиться без данных. Машинное обучение и глубокое обучение опираются на данные для распознавания шаблонов, выработки правил и повышения эффективности. Даже продвинутые модели, такие как GPT или системы обучения с подкреплением, нуждаются во входных данных или опыте взаимодействия с окружением, чтобы «учиться» и делать точные прогнозы. Другими словами, данные — это самый важный ресурс для развития ИИ, и без данных ИИ не может понимать или принимать полезные решения.
Понимание связи ИИ с данными
Задаётесь вопросом, "может ли ИИ учиться самостоятельно без каких-либо данных?" Чтобы получить максимально подробный и обоснованный ответ, давайте глубже рассмотрим эту тему вместе с INVIAI.
Например, в обучении с учителем ИИ учится на огромных наборах данных, размеченных людьми (изображения, текст, аудио и т.д.), чтобы выявлять закономерности.
Даже в обучении без учителя ИИ всё равно нужны необработанные, неразмеченные данные, чтобы самостоятельно обнаруживать скрытые структуры или шаблоны в этих данных.
Таким образом, независимо от метода, ИИ должен «питаться» данными — будь то размеченные данные, самораспознаваемые данные (самоконтролируемое обучение) или данные из реальной среды. Без входных данных система не сможет изучить ничего нового.
Распространённые методы обучения ИИ
Сегодня модели ИИ в основном обучаются следующими способами:
Обучение с учителем
Обучение без учителя
Самоконтролируемое обучение
Обучение с подкреплением (RL)
Обучение с подкреплением — это обучение программного агента поведению в среде путем информирования его о результатах его действий.
— Википедия
Федеративное обучение
Для чувствительных данных, таких как личные медицинские изображения, федеративное обучение позволяет нескольким устройствам (или организациям) совместно обучать общую модель без обмена сырыми данными.
- Глобальная модель отправляется на каждое устройство
 - Обучение происходит только на локальных данных
 - Обновления модели передаются обратно
 - Сырые данные не покидают устройство
 
Обучение без примеров (Zero-Shot Learning)
Способность ИИ делать выводы о новых концепциях без конкретных примеров, опираясь на ранее приобретённые обширные знания.
- Распознаёт невиданные концепции
 - Использует базу предварительных знаний
 - Предварительно обучен на огромных наборах данных
 - Позволяет рассуждать о новых идеях
 
Модель ИИ обучена распознавать или классифицировать объекты/концепции, примеров которых она никогда не видела ранее.
— IBM, определение Zero-Shot Learning
В итоге: Все эти методы показывают, что магического способа для ИИ учиться без данных не существует — в той или иной форме данные необходимы. ИИ может уменьшить зависимость от размеченных человеком данных или учиться на опыте, но не может учиться из ничего.

Передовые тенденции: обучение на «опыте» вместо статичных данных
Исследователи сейчас изучают способы, как ИИ может меньше зависеть от данных, предоставленных человеком. Например, DeepMind недавно предложил модель «потоков» в эпоху «ИИ, основанного на опыте», где ИИ учится преимущественно на собственных взаимодействиях с миром, а не на задачах и вопросах, созданных человеком.
Мы можем достичь этого, позволяя агентам непрерывно учиться на собственном опыте — то есть на данных, которые агент генерирует сам во время взаимодействия с окружением… Опыт станет основным средством улучшения, превосходящим сегодняшние масштабы данных, предоставляемых человеком.
— Исследование DeepMind, цитата из VentureBeat
Другими словами, в будущем ИИ будет самостоятельно генерировать свои данные через эксперименты, наблюдения и корректировку действий — подобно тому, как люди учатся на реальном опыте.
Данные, предоставленные человеком
- Требует размеченных наборов данных
 - Зависит от человеческой экспертизы
 - Ограничен доступными примерами
 - Статический подход к обучению
 
Самогенерируемые данные
- Создаёт собственные задачи
 - Учится на обратной связи из окружения
 - Непрерывное улучшение
 - Динамический подход к обучению
 
Удивительно, но несмотря на отсутствие внешних обучающих данных, AZR достигает высоких результатов в математике и программировании, даже превосходя модели, обученные на десятках тысяч размеченных примеров. Это доказывает, что ИИ может создавать собственный «набор данных», постоянно ставя и решая задачи.
Автономные обучающие системы
Помимо AZR, многие другие исследования изучают ИИ, который обучается автономно. Интеллектуальные агентские системы могут взаимодействовать с программным обеспечением и виртуальными мирами, накапливая опытные данные.
- Взаимодействие с инструментами и сайтами
 - Обучение через симуляционные игры
 - Самостоятельная постановка целей и вознаграждений
 - Развитие автономных привычек
 

Основные выводы
Вместо этого ИИ может меньше зависеть от данных, предоставленных человеком, за счёт:
- Использования неразмеченных данных (обучение без учителя)
 - Обучения на обратной связи из окружения (обучение с подкреплением)
 - Создания собственных задач (например, модель AZR)
 
Многие эксперты считают, что в будущем ИИ всё больше будет учиться через опыт, который он сам собирает, делая опыт основным «данным», помогающим ему совершенствоваться.