Si sta chiedendo, L’intelligenza artificiale può imparare da sola senza alcun dato?” Per ottenere una risposta dettagliata e ragionevole, esploriamo questo argomento a fondo con INVIAI.

Innanzitutto, è importante capire che i dati sono l’elemento centrale in tutti i modelli di intelligenza artificiale basati sul machine learning moderno. L’IA non può “costruire” conoscenza da sola senza dati di input.

Ad esempio, nel supervised learning, l’IA apprende da enormi set di dati etichettati dagli esseri umani (immagini, testi, audio, ecc.) per identificare schemi.

Anche nel unsupervised learning, l’IA necessita comunque di dati grezzi non etichettati per scoprire autonomamente strutture o schemi nascosti all’interno di quei dati.

Quindi, indipendentemente dal metodo, l’IA deve essere “nutrita” con dati—che siano dati etichettati, auto-etichettati (self-supervised) o provenienti da ambienti reali. Senza alcun dato di input, il sistema non può apprendere nulla di nuovo.

Metodi comuni di apprendimento dell’IA

Oggi, i modelli di IA apprendono principalmente attraverso i seguenti approcci:

  • Supervised Learning:

L’IA apprende da grandi set di dati etichettati. Per esempio, per riconoscere i gatti nelle immagini, sono necessarie migliaia di foto etichettate come “gatto” o “non gatto” per l’addestramento. Questo metodo è molto efficace ma richiede un notevole sforzo di etichettatura.

  • Unsupervised Learning:

L’IA riceve dati grezzi non etichettati e cerca schemi o cluster al loro interno. Per esempio, gli algoritmi di clustering raggruppano set di dati con caratteristiche simili. Questo metodo permette all’IA di “autoapprendere” dai dati e scoprire schemi senza guida umana.

  • Self-Supervised Learning:

Una variante utilizzata per grandi reti neurali e modelli di linguaggio di grandi dimensioni (LLM), in cui il modello genera autonomamente etichette per i dati (ad esempio, prevedendo la parola successiva in una frase o ricostruendo parti mancanti) e poi apprende da esse. Questo approccio consente all’IA di utilizzare enormi set di dati testuali o di immagini senza etichettatura umana.

  • Reinforcement Learning (RL):

Invece di dati statici, l’IA (chiamata agente) interagisce con un ambiente e apprende basandosi su segnali di ricompensa. Wikipedia definisce il RL come: “Il reinforcement learning insegna a un agente software come comportarsi in un ambiente informandolo dei risultati delle sue azioni.”

In altre parole, l’IA compie azioni, osserva i risultati (ad esempio, ricompense o penalità) e adatta le strategie per migliorare le prestazioni.

Per esempio, invece di essere insegnato da un umano a giocare a scacchi, AlphaZero di DeepMind gioca milioni di partite contro se stesso, scoprendo nuove strategie attraverso segnali di vittoria senza affidarsi a set di dati esperti preforniti.

  • Federated Learning:

Per dati sensibili, come immagini mediche personali, il Federated Learning permette a più dispositivi (o organizzazioni) di addestrare collaborativamente un modello condiviso senza condividere i dati grezzi.

Google spiega che nel Federated Learning il modello globale viene inviato a ogni dispositivo per l’addestramento su dati locali, e solo gli aggiornamenti del modello vengono restituiti—i dati grezzi non lasciano mai il dispositivo.

In questo modo, il modello può apprendere da dati distribuiti su più sedi senza centralizzarli. Tuttavia, l’IA necessita comunque di dati locali su ogni dispositivo per imparare.

  • Zero-Shot Learning:

È la capacità dell’IA di inferire nuovi concetti senza esempi specifici. IBM definisce lo Zero-Shot Learning come situazioni in cui “un modello di IA è addestrato a riconoscere o classificare oggetti/concept mai visti prima.”

Lo zero-shot learning si basa su conoscenze ampie acquisite in precedenza. Per esempio, molti modelli di linguaggio di grandi dimensioni (LLM) come GPT sono pre-addestrati su enormi corpora testuali. Grazie a questa conoscenza pregressa, possono ragionare su nuovi concetti anche senza esempi espliciti.

Anche se può sembrare che l’IA possa “imparare senza dati”, in realtà gli LLM si basano ancora su grandi set di dati iniziali per costruire capacità linguistiche fondamentali.

In sintesi, tutti questi metodi dimostrano che non esiste un modo magico per l’IA di imparare senza dati—in una forma o nell’altra. L’IA può ridurre la dipendenza dai dati etichettati dall’uomo o imparare dall’esperienza, ma non può imparare dal nulla.

Metodi di apprendimento dell’IA più diffusi

Tendenze avanzate: imparare dall’“esperienza” invece che da dati statici

I ricercatori stanno ora esplorando modi per far sì che l’IA si affidi meno ai dati forniti dall’uomo. Per esempio, DeepMind ha recentemente proposto un modello a “flussi” nell’era dell’“IA basata sull’esperienza”, in cui l’IA impara principalmente dalle proprie interazioni con il mondo piuttosto che da problemi e domande progettate dall’uomo.

VentureBeat ha citato la ricerca di DeepMind: “Possiamo ottenere questo permettendo agli agenti di imparare continuamente dalle proprie esperienze—cioè dai dati generati dall’agente stesso mentre interagisce con l’ambiente… L’esperienza diventerà il mezzo principale di miglioramento, superando la scala attuale dei dati forniti dall’uomo.”

In altre parole, in futuro l’IA stessa genererà i propri dati attraverso sperimentazione, osservazione e aggiustamento delle azioni—simile a come gli esseri umani apprendono dall’esperienza reale.

Un esempio concreto è il modello Absolute Zero Reasoner (AZR). AZR è addestrato interamente tramite self-play, senza necessità di input umano. Genera i propri problemi (ad esempio, frammenti di codice o problemi matematici), li risolve e utilizza i risultati (attraverso l’esecuzione del codice o feedback ambientale) come segnali di ricompensa per apprendere.

Notevolmente, pur non utilizzando dati di addestramento esterni, AZR raggiunge prestazioni di vertice in compiti matematici e di programmazione, superando persino modelli addestrati su decine di migliaia di esempi etichettati. Questo dimostra che l’IA può generare il proprio “dataset” ponendo e risolvendo continuamente sfide.

Oltre ad AZR, molti altri studi esplorano IA che imparano autonomamente. I sistemi di agenti intelligenti possono interagire con software e mondi virtuali (strumenti, siti web, giochi di simulazione) per accumulare dati esperienziali.

L’IA può essere progettata per definire i propri obiettivi e ricompense, simile a come gli esseri umani sviluppano abitudini. Sebbene ancora in fase di ricerca, queste idee rafforzano il concetto: nessuna IA può davvero imparare senza dati—invece, i “dati” provengono dalle esperienze dell’IA stessa.

>>> Scopra di più: 

Ho bisogno di conoscere la programmazione per usare l’IA?

L’IA pensa come gli esseri umani?

Tendenza all’avanguardia - imparare dall’“esperienza” invece che da dati statici


In breve, l’IA di oggi ha ancora bisogno di dati (di una forma o dell’altra) per imparare. Non esiste un’“IA senza dati” vera e propria.

Piuttosto, l’IA può imparare meno dai dati forniti dall’uomo utilizzando dati non etichettati (unsupervised learning), apprendendo dal feedback ambientale (reinforcement learning) o persino creando le proprie sfide (ad esempio, il modello AZR).

Molti esperti ritengono che in futuro l’IA imparerà sempre più attraverso l’esperienza che raccoglie autonomamente, rendendo l’esperienza il principale “dato” che la aiuta a migliorare.

Ma in ogni caso, la verità rimane: l’IA non può imparare dal nulla; la fonte dei “dati” può essere più sofisticata (ad esempio, segnali ambientali, ricompense), ma avrà sempre bisogno di qualche forma di input per poter apprendere e migliorare.

Riferimenti esterni
Questo articolo è stato compilato facendo riferimento alle seguenti fonti esterne: