Ви замислюєтеся, “Чи може ШІ навчатися самостійно без будь-яких даних?” Щоб отримати найдетальнішу та найрозумнішу відповідь, давайте глибше розглянемо цю тему разом з INVIAI.
По-перше, важливо зрозуміти, що дані є основним елементом усіх сучасних моделей машинного навчання ШІ. ШІ не може «створювати» знання самостійно без вхідних даних.
Наприклад, у навченні з учителем ШІ навчається на великих наборах даних, які люди позначили (зображення, текст, аудіо тощо), щоб розпізнавати закономірності.
Навіть у навченні без учителя ШІ все одно потрібні сирі, непозначені дані, щоб самостійно виявляти приховані структури чи закономірності в цих даних.
Отже, незалежно від методу, ШІ має «живитися» даними — чи то позначеними, самопозначеними (самонавчання) або даними з реального світу. Без жодних вхідних даних система не зможе навчитися нічого нового.
Поширені методи навчання ШІ
Сьогодні моделі ШІ здебільшого навчаються за такими підходами:
- Навчання з учителем:
ШІ навчається на великих позначених наборах даних. Наприклад, щоб розпізнавати котів на зображеннях, потрібні тисячі фото з позначками «кіт» або «не кіт» для тренування. Цей метод дуже ефективний, але вимагає значних зусиль для маркування.
- Навчання без учителя:
ШІ отримує непозначені сирі дані і шукає в них закономірності або кластери. Наприклад, алгоритми кластеризації групують набори даних із подібними характеристиками. Цей метод дозволяє ШІ «самонавчатися» на основі даних і виявляти закономірності без участі людини.
- Самонавчання (Self-Supervised Learning):
Варіант, що використовується для великих нейронних мереж і великих мовних моделей (LLM), де модель сама генерує позначки для даних (наприклад, передбачає наступне слово в реченні або відновлює пропущені частини) і навчається на них. Цей підхід дозволяє ШІ використовувати величезні текстові або зображувальні набори даних без участі людини у маркуванні.
- Навчання з підкріпленням (Reinforcement Learning, RL):
Замість статичних даних ШІ (агент) взаємодіє з середовищем і навчається на основі сигналів винагороди. Вікіпедія визначає RL так: “Навчання з підкріпленням — це навчання програмного агента поведінці в середовищі шляхом інформування його про результати його дій.”
Іншими словами, ШІ здійснює дії, спостерігає результати (наприклад, винагороду або штраф) і коригує стратегії для покращення ефективності.
Наприклад, замість того, щоб людина навчала шахи, AlphaZero від DeepMind грає мільйони партій сам із собою, відкриваючи нові стратегії через сигнали перемоги без використання заздалегідь підготовлених експертних наборів даних.
- Федеративне навчання:
Для конфіденційних даних, таких як особисті медичні зображення, Федеративне навчання дозволяє кільком пристроям (або організаціям) спільно тренувати спільну модель без обміну сирими даними.
Google пояснює, що у Федеративному навчанні глобальна модель надсилається на кожен пристрій для навчання на локальних даних, а назад надсилаються лише оновлення моделі — сирі дані не покидають пристрій.
Таким чином, модель може навчатися на даних із різних локацій без централізації. Проте ШІ все одно потребує локальних даних на кожному пристрої для навчання.
- Навчання без прикладів (Zero-Shot Learning):
Це здатність ШІ робити висновки про нові поняття без конкретних прикладів. IBM визначає Zero-Shot Learning як ситуації, коли “модель ШІ навчається розпізнавати або класифікувати об’єкти/поняття, яких вона раніше не бачила у прикладах.”
Навчання без прикладів базується на раніше здобутих широких знаннях. Наприклад, багато великих мовних моделей (LLM), таких як GPT, попередньо навчені на величезних текстових корпусах. Завдяки цьому попередньому знанню вони можуть міркувати про нові поняття навіть без явних прикладів.
Хоча може здатися, що ШІ може «навчатися без даних», насправді LLM все одно покладаються на великі початкові набори даних для формування базових мовних навичок.
Підсумовуючи, усі ці методи демонструють, що немає магічного способу, щоб ШІ навчався без даних — у тій чи іншій формі. ШІ може зменшувати залежність від даних, позначених людиною, або навчатися на досвіді, але він не може навчатися з нічого.
Сучасні тенденції: навчання з «досвіду» замість статичних даних
Дослідники зараз шукають способи, щоб ШІ менше залежав від даних, наданих людиною. Наприклад, DeepMind нещодавно запропонував модель «потоків» в епоху «досвідного ШІ», де ШІ навчається переважно на власних взаємодіях зі світом, а не на проблемах і питаннях, створених людиною.
VentureBeat цитує дослідження DeepMind: “Ми можемо досягти цього, дозволяючи агентам безперервно навчатися на власному досвіді — тобто на даних, які генерує сам агент під час взаємодії з середовищем… Досвід стане основним засобом вдосконалення, перевершуючи сьогоднішні обсяги даних, наданих людиною.”
Іншими словами, у майбутньому ШІ сам генеруватиме власні дані через експерименти, спостереження та коригування дій — подібно до того, як люди навчаються на реальному досвіді.
Конкретним прикладом є модель Absolute Zero Reasoner (AZR). AZR тренується повністю через самогру, не потребуючи вхідних даних від людини. Вона генерує власні завдання (наприклад, фрагменти коду або математичні задачі), розв’язує їх і використовує результати (через виконання коду або зворотний зв’язок із середовища) як сигнали винагороди для навчання.
Вражає, що, не використовуючи зовнішні тренувальні дані, AZR досягає найкращих результатів у математиці та програмуванні, навіть перевершуючи моделі, навчені на десятках тисяч позначених прикладів. Це демонструє, що ШІ може створювати власний «набір даних», постійно ставлячи та розв’язуючи завдання.
Окрім AZR, багато інших досліджень вивчають ШІ, який навчається автономно. Інтелектуальні агентські системи можуть взаємодіяти з програмним забезпеченням і віртуальними світами (інструментами, вебсайтами, симуляційними іграми), накопичуючи досвід.
ШІ можна налаштувати на самостійне встановлення цілей і винагород, подібно до того, як люди формують звички. Хоча це ще на стадії досліджень, ці ідеї підкреслюють: жоден ШІ не може справді навчатися без даних — натомість «дані» надходять із власного досвіду ШІ.
>>> Дізнайтеся більше:
Чи потрібно знати програмування, щоб користуватися штучним інтелектом?
Коротко кажучи, сьогоднішньому ШІ все ще потрібні дані (у тій чи іншій формі) для навчання. Не існує справжнього «ШІ без даних».
Натомість ШІ може менше залежати від даних, наданих людиною, використовуючи непозначені дані (навчання без учителя), навчаючись на зворотному зв’язку із середовища (навчання з підкріпленням) або навіть створюючи власні завдання (наприклад, модель AZR).
Багато експертів вважають, що в майбутньому ШІ дедалі більше навчатиметься через досвід, який він сам накопичує, роблячи досвід основним «джерелом даних», що допомагає йому вдосконалюватися.
Але незалежно від цього, істина залишається: ШІ не може навчатися з нічого; джерело «даних» може бути складнішим (наприклад, сигнали середовища, винагороди), але завжди потрібен якийсь вхід для навчання і вдосконалення машини.