Zajímá vás, může se umělá inteligence učit sama bez jakýchkoli dat?” Pro co nejpodrobnější a nejrozumnější odpověď si pojďme toto téma podrobněji rozebrat s INVIAI.

Nejprve je důležité pochopit, že data jsou jádrem všech moderních modelů strojového učení. AI si nemůže sama „vytvořit“ znalosti bez vstupních dat.

Například v učením pod dohledem se AI učí z rozsáhlých datasetů, které lidé označili (obrázky, texty, zvuky atd.), aby rozpoznala vzory.

I v učení bez dohledu AI stále potřebuje surová, neoznačená data, aby sama objevila skryté struktury nebo vzory v těchto datech.

Proto bez ohledu na metodu musí být AI „krmena“ daty — ať už označenými, samo-označenými (self-supervised) nebo daty z reálného světa. Bez vstupních dat se systém nic nového nenaučí.

Běžné metody učení AI

Dnes se AI modely učí především těmito způsoby:

  • Učení pod dohledem:

AI se učí z velkých označených datasetů. Například k rozpoznání koček na obrázcích je potřeba tisíce fotografií označených jako „kočka“ nebo „ne kočka“ pro trénink. Tato metoda je velmi účinná, ale vyžaduje značné úsilí při označování dat.

  • Učení bez dohledu:

AI dostane neoznačená surová data a hledá v nich vzory nebo shluky. Například shlukovací algoritmy seskupují data s podobnými vlastnostmi. Tato metoda umožňuje AI „učit se sama“ z dat a objevovat vzory bez lidského zásahu.

  • Samo-učení (Self-Supervised Learning):

Varianta používaná u velkých neuronových sítí a velkých jazykových modelů (LLM), kde model sám generuje označení pro data (např. předpovídá další slovo ve větě nebo rekonstruuje chybějící části) a učí se z nich. Tento přístup umožňuje AI využívat obrovské textové nebo obrazové dataset bez lidského označování.

  • Posilované učení (Reinforcement Learning, RL):

Místo statických dat AI (tzv. agent) interaguje s prostředím a učí se na základě signálů odměny. Wikipedia definuje RL takto: „Posilované učení je výuka softwarového agenta, jak se chovat v prostředí tím, že mu sdělujeme výsledky jeho akcí.”

Jinými slovy, AI provádí akce, sleduje výsledky (např. odměnu nebo trest) a upravuje strategie, aby zlepšila výkon.

Například místo aby člověk učil šachy, DeepMindův AlphaZero odehraje miliony her proti sobě samému a objevuje nové strategie díky signálům výhry, aniž by se spoléhal na předem připravené odborné datasety.

  • Federované učení:

Pro citlivá data, jako jsou osobní lékařské snímky, federované učení umožňuje více zařízením (nebo organizacím) společně trénovat sdílený model bez sdílení surových dat.

Google vysvětluje, že v federovaném učení je globální model odeslán na každé zařízení k tréninku na lokálních datech a zpět se posílají pouze aktualizace modelu — surová data zařízení nikdy neopustí.

Tímto způsobem se model může učit z dat z různých míst, aniž by byla data centralizována. AI však stále potřebuje lokální data na každém zařízení k učení.

  • Zero-Shot Learning:

Schopnost AI odvozovat nové koncepty bez konkrétních příkladů. IBM definuje Zero-Shot Learning jako situace, kdy „AI model je trénován k rozpoznání nebo klasifikaci objektů či konceptů, které nikdy předtím neviděl.”

Zero-shot learning spoléhá na dříve získané široké znalosti. Například mnoho velkých jazykových modelů (LLM) jako GPT je předtrénováno na obrovských textových korpusech. Díky této předchozí znalosti mohou uvažovat o nových konceptech i bez explicitních příkladů.

I když se může zdát, že AI se může „učit bez dat“, ve skutečnosti LLM stále spoléhají na rozsáhlé počáteční datasety k vybudování základních jazykových schopností.

Ve shrnutí, všechny tyto metody ukazují, že neexistuje žádný zázračný způsob, jak se AI může učit bez dat — v nějaké podobě je data vždy potřebuje. AI může snížit závislost na lidsky označených datech nebo se učit ze zkušeností, ale nemůže se učit z ničeho.

Populární metody učení AI

Pokročilé trendy: Učení z „zkušeností“ místo statických dat

Výzkumníci nyní zkoumají způsoby, jak snížit závislost AI na datech poskytovaných lidmi. Například DeepMind nedávno navrhl model „streams“ v éře „AI založené na zkušenostech“, kde se AI učí především ze svých vlastních interakcí se světem, nikoli z lidsky navržených problémů a otázek.

VentureBeat citoval výzkum DeepMind: „Toho lze dosáhnout tím, že agentům umožníme neustále se učit ze svých vlastních zkušeností — tedy dat generovaných agentem samotným při interakci s prostředím… Zkušenost se stane hlavním prostředkem zlepšování, překonávajícím dnešní rozsah dat poskytovaných lidmi.”

Jinými slovy, v budoucnu si AI sama bude generovat svá vlastní data prostřednictvím experimentování, pozorování a úprav svých akcí — podobně jako se lidé učí ze skutečných zkušeností.

Konkrétním příkladem je model Absolute Zero Reasoner (AZR). AZR je trénován zcela prostřednictvím samohraní, bez potřeby lidského vstupu. Sám si generuje problémy (např. kódové úryvky nebo matematické úlohy), řeší je a využívá výsledky (např. spuštěním kódu nebo zpětnou vazbou z prostředí) jako signály odměny k učení.

Je pozoruhodné, že i bez použití externích tréninkových dat dosahuje AZR špičkových výsledků v matematice a programování, dokonce překonává modely trénované na desetitisících označených příkladů. To dokazuje, že AI může generovat vlastní „dataset“ tím, že si neustále klade a řeší výzvy.

Kromě AZR mnoho dalších studií zkoumá AI, která se učí autonomně. Inteligentní agenti mohou interagovat se softwarem a virtuálními světy (nástroje, weby, simulační hry) a shromažďovat tak zkušenostní data.

AI může být navržena tak, aby si sama stanovovala cíle a odměny, podobně jako lidé rozvíjejí návyky. Ačkoliv je to stále ve fázi výzkumu, tyto myšlenky potvrzují, že žádná AI se skutečně nemůže učit bez dat — místo toho „data“ pocházejí z vlastních zkušeností AI.

>>> Více informací: 

Potřebuji znát programování, abych mohl(a) používat umělou inteligenci?

Myslí umělá inteligence jako lidé?

Nejmodernější trend – učení z „zkušeností“ místo statických dat


Stručně řečeno, současná AI stále potřebuje data (v nějaké podobě) k učení. Neexistuje něco jako skutečně „bezdatová AI“.

Místo toho může AI snižovat závislost na lidsky dodávaných datech použitím neoznačených dat (učení bez dohledu), učením se ze zpětné vazby z prostředí (posilované učení) nebo dokonce vytvářením vlastních výzev (např. model AZR).

Mnoho odborníků věří, že v budoucnu se AI bude stále více učit ze zkušeností, které sama sbírá, a zkušenost se tak stane hlavním „datovým“ zdrojem pro její zlepšování.

Ale pravda zůstává: AI se nemůže učit z ničeho; zdroj „dat“ může být sofistikovanější (např. signály z prostředí, odměny), ale vždy bude potřebovat nějaký vstup, aby se mohla učit a zlepšovat.

Externí odkazy
Tento článek byl sestaven s odkazem na následující externí zdroje: