Je, unajiuliza, “Je, AI inaweza kujifunza yenyewe bila data yoyote?” Ili kupata jibu la kina na lenye mantiki, hebu tuchunguze mada hii kwa undani pamoja na INVIAI.
Kwanza, ni muhimu kuelewa kwamba data ni kiini cha mifano yote ya kisasa ya AI ya kujifunza mashine. AI haiwezi “kujenga” maarifa yenyewe bila data ya kuingiza.
Kwa mfano, katika kujifunza kwa usimamizi, AI hujifunza kutoka kwa seti kubwa za data zilizotambulishwa na binadamu (picha, maandishi, sauti, n.k.) ili kutambua mifumo.
Hata katika kujifunza bila usimamizi, AI bado inahitaji data ghafi isiyotambulishwa kugundua miundo au mifumo iliyofichwa ndani ya data hiyo yenyewe.
Kwa hiyo, bila kujali mbinu, AI lazima "ilizwe" na data—iwe ni data iliyotambulishwa, data inayojitambulisha yenyewe (self-supervised), au data kutoka kwa mazingira halisi. Bila data yoyote ya kuingiza, mfumo hauwezi kujifunza kitu kipya.
Mbinu za Kawaida za Kujifunza AI
Leo, mifano ya AI hujifunza hasa kupitia mbinu zifuatazo:
- Kujifunza kwa Usimamizi:
AI hujifunza kutoka kwa seti kubwa za data zilizotambulishwa. Kwa mfano, kutambua paka kwenye picha, picha elfu nyingi zilizoandikwa “paka” au “si paka” zinahitajika kwa mafunzo. Mbinu hii ni yenye ufanisi mkubwa lakini inahitaji juhudi kubwa za utambulisho.
- Kujifunza Bila Usimamizi:
AI hupatiwa data ghafi isiyotambulishwa na kutafuta mifumo au makundi ndani yake. Kwa mfano, algoriti za kugawanya huchanganya seti za data zenye sifa zinazofanana. Mbinu hii inaruhusu AI kujifunza yenyewe kutoka kwa data na kugundua mifumo bila mwongozo wa binadamu.
- Kujifunza kwa Kujisimamia:
Tofauti inayotumika kwa mitandao mikubwa ya neva na LLMs, ambapo mfano huunda lebo za data yenyewe (mfano, kutabiri neno linalofuata katika sentensi au kurekebisha sehemu zilizokosekana) kisha hujifunza kutoka kwa hizo lebo. Njia hii inawawezesha AI kutumia seti kubwa za maandishi au picha bila utambulisho wa binadamu.
- Kujifunza kwa Kuimarisha (RL):
Badala ya data tulivu, AI (inayojulikana kama wakala) huingiliana na mazingira na kujifunza kwa msingi wa ishara za zawadi. Wikipedia inaelezea RL kama: “Kujifunza kwa kuimarisha ni kufundisha wakala wa programu jinsi ya kujiendesha katika mazingira kwa kumjulisha matokeo ya vitendo vyake.”
Kwa maneno mengine, AI huchukua hatua, huangalia matokeo (mfano, zawadi au adhabu), na kurekebisha mikakati ili kuboresha utendaji.
Kwa mfano, badala ya kuwa na binadamu anaye fundisha chess, AlphaZero wa DeepMind hucheza mamilioni ya michezo dhidi yake mwenyewe, kugundua mikakati mipya kupitia ishara za ushindi bila kutegemea seti za data za wataalamu zilizotolewa awali.
- Kujifunza kwa Ushirikiano (Federated Learning):
Kwa data nyeti, kama picha za matibabu binafsi, Kujifunza kwa Ushirikiano huruhusu vifaa vingi (au mashirika) kufundisha mfano wa pamoja bila kushiriki data ghafi.
Google inaelezea kwamba katika Kujifunza kwa Ushirikiano, mfano wa ulimwengu hutumwa kwa kila kifaa kwa mafunzo kwenye data ya eneo hilo, na marekebisho ya mfano tu ndiyo hurudishwa—data ghafi haiondoki kifaa.
Kwa njia hii, mfano unaweza kujifunza kutoka kwa data katika maeneo mbalimbali bila kuikusanya katikati. Hata hivyo, AI bado inahitaji data ya eneo hilo kwenye kila kifaa ili kujifunza.
- Kujifunza Bila Mfano (Zero-Shot Learning):
Hii ni uwezo wa AI kutafsiri dhana mpya bila mifano maalum. IBM inaelezea Kujifunza Bila Mfano kama hali ambapo “mfano wa AI umefundishwa kutambua au kuainisha vitu/dhana ambazo haujawahi kuona mifano yake hapo awali.”
Kujifunza bila mfano hutegemea maarifa mapana yaliyopatikana awali. Kwa mfano, mifano mingi mikubwa ya lugha (LLMs) kama GPT imefundishwa awali kwa makusanyo makubwa ya maandishi. Shukrani kwa maarifa haya ya awali, wanaweza kufikiria kuhusu dhana mpya hata bila mifano wazi.
Ingawa inaweza kuonekana kama AI inaweza “kujifunza bila data,” kwa kweli, LLMs bado hutegemea seti kubwa za data za awali kujenga uwezo wa msingi wa lugha.
Kwa muhtasari, Mbinu zote hizi zinaonyesha kwamba hakuna njia ya kichawi ya AI kujifunza bila data—kwa namna moja au nyingine. AI inaweza kupunguza utegemezi wa data zilizotambulishwa na binadamu au kujifunza kutoka kwa uzoefu, lakini haiwezi kujifunza kutoka kwa kitu chochote.
Mwelekeo wa Juu: Kujifunza Kutoka “Uzoefu” Badala ya Data Tulivu
Watafiti sasa wanachunguza njia za AI kupunguza utegemezi wa data zinazotolewa na binadamu. Kwa mfano, DeepMind hivi karibuni ilipendekeza mfano wa “mifuriko” katika enzi ya “AI inayotegemea uzoefu,” ambapo AI hujifunza hasa kutoka kwa mwingiliano wake mwenyewe na dunia badala ya matatizo na maswali yaliyoundwa na binadamu.
VentureBeat iliripoti utafiti wa DeepMind: “Tunaweza kufanikisha hili kwa kuruhusu mawakala kujifunza kwa kuendelea kutoka kwa uzoefu wao wenyewe—yaani, data inayozalishwa na wakala mwenyewe wakati wa kuingiliana na mazingira… Uzoefu utakuwa njia kuu ya kuboresha, ukizidi kiwango cha leo cha data zinazotolewa na binadamu.”
Kwa maneno mengine, siku zijazo, AI yenyewe itazalisha data zake kupitia majaribio, uchunguzi, na marekebisho ya hatua—kama vile binadamu wanavyojifunza kutoka kwa uzoefu halisi wa dunia.
Mfano halisi ni mfano wa Absolute Zero Reasoner (AZR). AZR hujifunza kabisa kupitia kucheza mwenyewe, bila hitaji la data kutoka kwa binadamu. Huunda matatizo yake mwenyewe (mfano, vipande vya msimbo au matatizo ya hisabati), kuyatatua, na kutumia matokeo (kupitia utekelezaji wa msimbo au mrejesho wa mazingira) kama ishara za zawadi kujifunza.
Kwa kushangaza, licha ya kutotumia data za mafunzo za nje, AZR hufikia utendaji wa juu katika kazi za hisabati na programu, hata kuzidi mifano iliyofunzwa kwa maelfu ya mifano iliyotambulishwa. Hii inaonyesha kuwa AI inaweza kuunda “seti yake ya data” kwa kuendelea kujiuliza na kutatua changamoto.
Pamoja na AZR, tafiti nyingi zinaangazia AI inayojifunza kwa uhuru. Mifumo ya mawakala wenye akili inaweza kuingiliana na programu na dunia za mtandao (zana, tovuti, michezo ya kuigiza) kukusanya data za uzoefu.
AI inaweza kubuniwa kuweka malengo na zawadi zake mwenyewe, kama vile binadamu wanavyotengeneza tabia. Ingawa bado iko katika hatua za utafiti, mawazo haya yanathibitisha hoja: hakuna AI inayoweza kweli kujifunza bila data—badala yake, “data” hutokana na uzoefu wa AI yenyewe.
>>> Jifunze Zaidi:
Kwa kifupi, AI ya leo bado inahitaji data (ya aina moja au nyingine) ili kujifunza. Hakuna AI halisi isiyo na data kabisa.
Badala yake, AI inaweza kujifunza kidogo kutoka kwa data zinazotolewa na binadamu kwa: kutumia data isiyotambulishwa (kujifunza bila usimamizi), kujifunza kutoka kwa mrejesho wa mazingira (kujifunza kwa kuimarisha), au hata kuunda changamoto zake mwenyewe (mfano, AZR).
Wataalamu wengi wanaamini kwamba siku zijazo, AI itajifunza zaidi kupitia uzoefu inayokusanya yenyewe, na uzoefu utakuwa “data” kuu inayosaidia kuboresha.
Lakini bila kujali, ukweli unabaki: AI haiwezi kujifunza kutoka kwa kitu chochote; chanzo cha “data” kinaweza kuwa cha hali ya juu zaidi (mfano, ishara za mazingira, zawadi), lakini daima itahitaji aina fulani ya kuingiza ili mashine ijifunze na kuboresha.