Чи може ШІ навчатися без даних?
Сучасний ШІ не може навчатися повністю без даних. Машинне навчання та глибинне навчання покладаються на дані для розпізнавання закономірностей, формування правил і покращення результатів. Навіть просунуті моделі, як GPT чи системи підкріплювального навчання, все одно потребують вхідних даних або досвіду з оточення, щоб «навчатися» і робити точні прогнози. Іншими словами, дані — це найважливіше паливо для розвитку ШІ, і без даних ШІ не може розуміти чи приймати корисні рішення.
Розуміння взаємозв’язку ШІ з даними
Ви замислюєтеся, "Чи може ШІ навчатися самостійно без жодних даних?" Щоб отримати найдетальнішу та найрозумнішу відповідь, давайте глибше розглянемо цю тему разом з INVIAI.
Наприклад, у керованому навчанні ШІ навчається на величезних наборах даних, які люди маркували (зображення, текст, аудіо тощо), щоб розпізнавати закономірності.
Навіть у некерованому навчанні ШІ все одно потребує сирих, немаркованих даних, щоб самостійно виявляти приховані структури або закономірності в цих даних.
Отже, незалежно від методу, ШІ має «живитися» даними — чи то маркованими, чи самостійно маркованими (самокероване навчання), чи даними з реального світу. Без жодних вхідних даних система не зможе навчитися нічого нового.
Поширені методи навчання ШІ
Сьогодні моделі ШІ здебільшого навчаються за такими підходами:
Кероване навчання
Некероване навчання
Самокероване навчання
Підкріплювальне навчання (RL)
Підкріплювальне навчання — це навчання програмного агента поведінці в середовищі шляхом інформування його про результати його дій.
— Вікіпедія
Федеративне навчання
Для чутливих даних, таких як особисті медичні зображення, федеративне навчання дозволяє кільком пристроям (або організаціям) спільно тренувати спільну модель без обміну сирими даними.
- Глобальна модель надсилається на кожен пристрій
- Навчання лише на локальних даних
- Повертаються лише оновлення моделі
- Сирі дані ніколи не покидають пристрій
Навчання без прикладів (Zero-Shot Learning)
Здатність ШІ робити висновки про нові поняття без конкретних прикладів, спираючись на раніше здобуті широкі знання.
- Розпізнає невідомі поняття
- Використовує базу попередніх знань
- Попередньо натренований на величезних наборах даних
- Дозволяє міркувати про нові ідеї
Модель ШІ навчається розпізнавати або класифікувати об’єкти/поняття, яких вона раніше не бачила у прикладах.
— IBM, визначення Zero-Shot Learning
Підсумок: Усі ці методи показують, що немає магічного способу, щоб ШІ навчався без даних — у тій чи іншій формі дані потрібні. ШІ може зменшувати залежність від маркованих людиною даних або навчатися з досвіду, але не може навчатися з нічого.

Сучасні тенденції: навчання з «досвіду» замість статичних даних
Дослідники зараз шукають способи, щоб ШІ менше залежав від даних, наданих людиною. Наприклад, DeepMind нещодавно запропонував модель «потоків» в епоху «ШІ на основі досвіду», де ШІ навчається переважно через власні взаємодії зі світом, а не через проблеми та питання, створені людиною.
Ми можемо досягти цього, дозволяючи агентам безперервно навчатися на власному досвіді — тобто на даних, які генерує сам агент під час взаємодії з оточенням… Досвід стане основним засобом покращення, перевершуючи сьогоднішні масштаби даних, наданих людиною.
— Дослідження DeepMind, цитата з VentureBeat
Іншими словами, у майбутньому ШІ сам генеруватиме власні дані через експерименти, спостереження та коригування дій — подібно до того, як люди навчаються на реальному досвіді.
Дані, надані людиною
- Потребує маркованих наборів даних
- Залежить від людської експертизи
- Обмежений доступними прикладами
- Статичний підхід до навчання
Самогенеровані дані
- Створює власні виклики
- Навчається на відгуках оточення
- Безперервне вдосконалення
- Динамічний підхід до навчання
Вражає, що, не використовуючи зовнішні тренувальні дані, AZR досягає найкращих результатів у математиці та програмуванні, навіть перевершуючи моделі, навчені на десятках тисяч маркованих прикладів. Це демонструє, що ШІ може генерувати власний «набір даних», постійно ставлячи та розв’язуючи завдання.
Автономні системи навчання
Окрім AZR, багато інших досліджень вивчають ШІ, який навчається автономно. Інтелектуальні агентські системи можуть взаємодіяти з програмним забезпеченням і віртуальними світами, накопичуючи досвід.
- Взаємодія з інструментами та вебсайтами
- Навчання через симуляційні ігри
- Самостійне встановлення цілей і винагород
- Розвиток автономних звичок

Основні висновки
Натомість ШІ може менше залежати від даних, наданих людиною, завдяки:
- Використанню немаркованих даних (некероване навчання)
- Навчанню на основі відгуків оточення (підкріплювальне навчання)
- Створенню власних викликів (наприклад, модель AZR)
Багато експертів вважають, що в майбутньому ШІ дедалі більше навчатиметься через досвід, який він збирає сам, роблячи досвід основним «джерелом даних», що допомагає йому вдосконалюватися.