Vraagt u zich af, “Kan AI zelfstandig leren zonder enige data?” Om het meest gedetailleerde en onderbouwde antwoord te krijgen, laten we dit onderwerp grondig verkennen met INVIAI.
Allereerst is het belangrijk te begrijpen dat data het kernbestanddeel is van alle moderne machine learning AI-modellen. AI kan niet zelfstandig kennis “opbouwen” zonder invoerdata.
Bijvoorbeeld, bij supervised learning leert AI van enorme datasets die door mensen zijn gelabeld (afbeeldingen, tekst, audio, enz.) om patronen te herkennen.
Zelfs bij unsupervised learning heeft AI nog steeds ruwe, niet-gelabelde data nodig om verborgen structuren of patronen binnen die data zelfstandig te ontdekken.
Daarom moet AI, ongeacht de methode, “gevoed” worden met data—of dat nu gelabelde data is, zelf-gelabelde data (self-supervised) of data uit de echte wereld. Zonder enige invoerdata kan het systeem niets nieuws leren.
Veelvoorkomende AI-leermethoden
Tegenwoordig leren AI-modellen voornamelijk via de volgende benaderingen:
- Supervised Learning:
AI leert van grote, gelabelde datasets. Bijvoorbeeld, om katten op afbeeldingen te herkennen, zijn duizenden foto’s nodig die gelabeld zijn als “kat” of “geen kat” voor training. Deze methode is zeer effectief, maar vereist veel labeling.
- Unsupervised Learning:
AI krijgt niet-gelabelde ruwe data en zoekt naar patronen of clusters daarin. Bijvoorbeeld, clustering-algoritmen groeperen datasets met vergelijkbare kenmerken. Deze methode stelt AI in staat om zelfstandig te leren van data en patronen te ontdekken zonder menselijke begeleiding.
- Self-Supervised Learning:
Een variant die wordt gebruikt voor grote neurale netwerken en LLM’s, waarbij het model zelf labels genereert voor data (bijvoorbeeld het voorspellen van het volgende woord in een zin of het reconstrueren van ontbrekende delen) en daar vervolgens van leert. Deze aanpak stelt AI in staat om enorme tekst- of afbeeldingsdatasets te gebruiken zonder menselijke labeling.
- Reinforcement Learning (RL):
In plaats van statische data, werkt AI (een agent genoemd) samen met een omgeving en leert op basis van beloningssignalen. Wikipedia definieert RL als: “Reinforcement learning is het aanleren van gewenst gedrag aan een software-agent door het informeren over de resultaten van zijn acties.”
Met andere woorden, AI onderneemt acties, observeert de uitkomsten (bijvoorbeeld beloning of straf) en past strategieën aan om beter te presteren.
Een voorbeeld is DeepMind’s AlphaZero, dat in plaats van door een mens te worden geleerd, miljoenen partijen tegen zichzelf speelt en nieuwe strategieën ontdekt via winstsignalen zonder te vertrouwen op vooraf aangeleverde expertendatasets.
- Federated Learning:
Voor gevoelige data, zoals persoonlijke medische beelden, maakt Federated Learning het mogelijk dat meerdere apparaten (of organisaties) gezamenlijk een gedeeld model trainen zonder ruwe data te delen.
Google legt uit dat bij Federated Learning het globale model naar elk apparaat wordt gestuurd om lokaal te trainen op eigen data, en alleen modelupdates worden teruggestuurd—ruwe data verlaat het apparaat nooit.
Op deze manier kan het model leren van data verspreid over meerdere locaties zonder deze te centraliseren. Toch heeft AI nog steeds lokale data op elk apparaat nodig om te leren.
- Zero-Shot Learning:
Dit is het vermogen van AI om nieuwe concepten af te leiden zonder specifieke voorbeelden. IBM definieert Zero-Shot Learning als situaties waarin “een AI-model wordt getraind om objecten/concepten te herkennen of classificeren die het nog nooit eerder heeft gezien.”
Zero-shot learning steunt op eerder verworven brede kennis. Veel grote taalmodellen (LLM’s) zoals GPT zijn bijvoorbeeld vooraf getraind op enorme tekstcorpora. Dankzij deze voorkennis kunnen ze redeneren over nieuwe concepten, zelfs zonder expliciete voorbeelden.
Hoewel het lijkt alsof AI “kan leren zonder data,” vertrouwen LLM’s in werkelijkheid nog steeds op grote initiële datasets om fundamentele taalvaardigheden op te bouwen.
Samenvattend laten al deze methoden zien dat er geen magische manier is voor AI om zonder data te leren—op de een of andere manier is data altijd nodig. AI kan de afhankelijkheid van door mensen gelabelde data verminderen of leren uit ervaring, maar het kan niet uit het niets leren.
Geavanceerde trends: leren van “ervaring” in plaats van statische data
Onderzoekers onderzoeken nu manieren waarop AI minder afhankelijk kan zijn van door mensen aangeleverde data. Zo stelde DeepMind recent een “streams”-model voor in het tijdperk van “ervaring-gebaseerde AI,” waarbij AI vooral leert van eigen interacties met de wereld in plaats van van door mensen ontworpen problemen en vragen.
VentureBeat citeerde DeepMind’s onderzoek: “We kunnen dit bereiken door agenten continu te laten leren van hun eigen ervaringen—dat wil zeggen, data die door de agent zelf wordt gegenereerd tijdens interactie met de omgeving… Ervaring zal de primaire manier van verbetering worden, voorbij de huidige schaal van door mensen aangeleverde data.”
Met andere woorden, in de toekomst zal AI zelf zijn eigen data genereren via experimenteren, observeren en het aanpassen van acties—vergelijkbaar met hoe mensen leren van echte ervaringen.
Een concreet voorbeeld is het Absolute Zero Reasoner (AZR)-model. AZR wordt volledig getraind via zelfspel, zonder menselijke invoer. Het genereert eigen problemen (bijvoorbeeld codefragmenten of wiskundige vraagstukken), lost deze op en gebruikt de uitkomsten (via code-uitvoering of feedback uit de omgeving) als beloningssignalen om te leren.
Opmerkelijk is dat AZR, ondanks het ontbreken van externe trainingsdata, topprestaties behaalt in wiskunde- en programmeertaken, zelfs beter dan modellen die zijn getraind op tienduizenden gelabelde voorbeelden. Dit toont aan dat AI zijn eigen “dataset” kan creëren door continu uitdagingen te stellen en op te lossen.
Naast AZR onderzoeken veel andere studies AI die autonoom leert. Intelligente agentsystemen kunnen interactie hebben met software en virtuele werelden (tools, websites, simulatiespellen) om ervaringsdata te verzamelen.
AI kan zo worden ontworpen dat het eigen doelen en beloningen stelt, vergelijkbaar met hoe mensen gewoontes ontwikkelen. Hoewel dit nog in onderzoeksfase is, onderstreept dit het punt: geen enkele AI kan echt leren zonder data—de “data” komt dan uit de eigen ervaringen van de AI.
>>> Lees meer:
Kortom, de AI van vandaag heeft nog steeds data nodig (in welke vorm dan ook) om te leren. Er bestaat geen echte “data-loze AI.”
In plaats daarvan kan AI minder afhankelijk worden van door mensen aangeleverde data door: gebruik te maken van niet-gelabelde data (unsupervised learning), te leren van feedback uit de omgeving (reinforcement learning), of zelfs eigen uitdagingen te creëren (zoals het AZR-model).
Veel experts verwachten dat AI in de toekomst steeds meer zal leren via de ervaring die het zelf verzamelt, waardoor ervaring de belangrijkste “data” wordt die helpt bij verbetering.
Maar hoe dan ook blijft de waarheid: AI kan niet uit het niets leren; de “data”-bron kan geavanceerder zijn (bijvoorbeeld omgevingssignalen, beloningen), maar er is altijd een vorm van invoer nodig om te leren en te verbeteren.