Vă întrebați, Poate inteligența artificială să învețe singură, fără niciun fel de date?” Pentru a obține un răspuns cât mai detaliat și rezonabil, să explorăm acest subiect în profunzime împreună cu INVIAI.

În primul rând, este important să înțelegem că datele reprezintă elementul central în toate modelele moderne de inteligență artificială bazate pe învățarea automată. Inteligența artificială nu poate „stabili” cunoștințe de una singură fără date de intrare.

De exemplu, în cazul învățării supravegheate, AI învață din seturi mari de date etichetate de oameni (imagini, texte, audio etc.) pentru a identifica tipare.

Chiar și în cazul învățării nesupravegheate, AI are nevoie de date brute, neetichetate, pentru a descoperi singură structuri sau tipare ascunse în aceste date.

Prin urmare, indiferent de metodă, AI trebuie „hrănită” cu date — fie ele etichetate, autoetichetate (auto-supervizate) sau provenite din medii reale. Fără niciun fel de date de intrare, sistemul nu poate învăța nimic nou.

Metode comune de învățare AI

Astăzi, modelele AI învață în principal prin următoarele abordări:

  • Învățare supravegheată:

AI învață din seturi mari de date etichetate. De exemplu, pentru a recunoaște pisicile în imagini, sunt necesare mii de fotografii etichetate „pisică” sau „fără pisică” pentru antrenament. Această metodă este foarte eficientă, dar necesită un efort considerabil de etichetare.

  • Învățare nesupravegheată:

AI primește date brute, neetichetate, și caută tipare sau grupări în acestea. De exemplu, algoritmii de clusterizare grupează seturi de date cu caracteristici similare. Această metodă permite AI să „învețe singură” din date și să descopere tipare fără intervenția umană.

  • Învățare auto-supervizată:

O variantă folosită pentru rețele neuronale mari și modele lingvistice extinse (LLM), unde modelul generează singur etichete pentru date (de exemplu, prezicerea următorului cuvânt într-o propoziție sau reconstruirea unor părți lipsă) și apoi învață din acestea. Această abordare permite AI să utilizeze seturi masive de texte sau imagini fără etichetare umană.

  • Învățare prin întărire (RL):

În loc de date statice, AI (numit agent) interacționează cu un mediu și învață pe baza semnalelor de recompensă. Wikipedia definește RL astfel: „Învățarea prin întărire este procesul prin care un agent software învață cum să se comporte într-un mediu, fiind informat despre rezultatele acțiunilor sale.”

Cu alte cuvinte, AI ia decizii, observă rezultatele (de exemplu, recompense sau penalizări) și ajustează strategiile pentru a-și îmbunătăți performanța.

De exemplu, în loc să fie învățat de un om să joace șah, AlphaZero de la DeepMind joacă milioane de partide cu sine însuși, descoperind strategii noi prin semnale de câștig, fără a se baza pe seturi de date predefinite de experți.

  • Învățare federată:

Pentru date sensibile, cum ar fi imagini medicale personale, Învățarea federată permite mai multor dispozitive (sau organizații) să antreneze împreună un model comun fără a partaja datele brute.

Google explică că în Învățarea federată, modelul global este trimis fiecărui dispozitiv pentru antrenament pe date locale, iar doar actualizările modelului sunt trimise înapoi — datele brute nu părăsesc niciodată dispozitivul.

Astfel, modelul poate învăța din date distribuite în mai multe locații fără a le centraliza. Totuși, AI are nevoie în continuare de date locale pe fiecare dispozitiv pentru a învăța.

  • Învățare Zero-Shot:

Aceasta este capacitatea AI de a deduce concepte noi fără exemple specifice. IBM definește Învățarea Zero-Shot ca situații în care „un model AI este antrenat să recunoască sau să clasifice obiecte/concepte pe care nu le-a mai văzut niciodată anterior.”

Învățarea zero-shot se bazează pe cunoștințe anterioare extinse. De exemplu, multe modele lingvistice mari (LLM), precum GPT, sunt pre-antrenate pe corpuri masive de texte. Datorită acestei cunoașteri prealabile, pot raționa despre concepte noi chiar și fără exemple explicite.

Deși poate părea că AI poate „învața fără date”, în realitate, LLM-urile se bazează în continuare pe seturi mari inițiale de date pentru a-și construi capacitățile fundamentale de limbaj.

În concluzie, toate aceste metode arată că nu există o cale magică prin care AI să învețe fără date — într-o formă sau alta. AI poate reduce dependența de datele etichetate de oameni sau poate învăța din experiență, dar nu poate învăța din nimic.

Metode populare de învățare AI

Tendințe avansate: Învățarea din „experiență” în loc de date statice

Cercetătorii explorează acum modalități prin care AI să se bazeze mai puțin pe datele furnizate de oameni. De exemplu, DeepMind a propus recent un model de „fluxuri” în era „inteligenței artificiale bazate pe experiență”, unde AI învață în principal din propriile interacțiuni cu lumea, mai degrabă decât din probleme și întrebări concepute de oameni.

VentureBeat a citat cercetarea DeepMind: „Putem realiza acest lucru permițând agenților să învețe continuu din propriile experiențe — adică date generate de agent însuși în timpul interacțiunii cu mediul… Experiența va deveni principalul mijloc de îmbunătățire, depășind în volum datele furnizate de oameni în prezent.”

Cu alte cuvinte, în viitor, AI va genera singură propriile date prin experimentare, observație și ajustarea acțiunilor — similar modului în care oamenii învață din experiența reală.

Un exemplu concret este modelul Absolute Zero Reasoner (AZR). AZR este antrenat complet prin auto-joc, fără a necesita date furnizate de oameni. El generează singur probleme (de exemplu, fragmente de cod sau probleme matematice), le rezolvă și folosește rezultatele (prin execuția codului sau feedback-ul mediului) ca semnale de recompensă pentru a învăța.

Remarcabil, deși nu folosește date externe de antrenament, AZR obține performanțe de top în sarcini de matematică și programare, depășind chiar modele antrenate pe zeci de mii de exemple etichetate. Acest lucru demonstrează că AI poate genera propriul „set de date” prin provocări și rezolvări continue.

Pe lângă AZR, multe alte studii explorează AI care învață autonom. Sistemele de agenți inteligenți pot interacționa cu software și lumi virtuale (unelte, site-uri web, jocuri de simulare) pentru a acumula date experiențiale.

AI poate fi proiectată să-și stabilească propriile obiective și recompense, similar modului în care oamenii dezvoltă obiceiuri. Deși sunt încă în fază de cercetare, aceste idei întăresc punctul de vedere: nicio inteligență artificială nu poate învăța cu adevărat fără date — în schimb, „datele” provin din propriile experiențe ale AI.

>>> Aflați mai multe: 

Trebuie să știu programare pentru a folosi inteligența artificială?

Inteligența artificială gândește ca oamenii?

Tendință de ultimă oră - învățarea din „experiență” în loc de date statice


Pe scurt, inteligența artificială de astăzi are în continuare nevoie de date (sub o formă sau alta) pentru a învăța. Nu există așa ceva ca o „inteligență artificială fără date”.

În schimb, AI poate învăța mai puțin din datele furnizate de oameni prin: utilizarea datelor neetichetate (învățare nesupravegheată), învățarea din feedback-ul mediului (învățare prin întărire) sau chiar crearea propriilor provocări (de exemplu, modelul AZR).

Mulți experți consideră că, în viitor, AI va învăța tot mai mult prin experiența pe care o acumulează singură, făcând din experiență principalul „set de date” care o ajută să se perfecționeze.

Dar, indiferent de situație, adevărul rămâne: AI nu poate învăța din nimic; sursa „datelor” poate fi mai sofisticată (de exemplu, semnale din mediu, recompense), dar va avea întotdeauna nevoie de o formă de input pentru ca mașina să învețe și să se îmbunătățească.

Referințe externe
Acest articol a fost compilat cu referire la următoarele surse externe: