Adakah anda tertanya-tanya, Bolehkah AI belajar sendiri tanpa sebarang data?” Untuk mendapatkan jawapan yang paling terperinci dan munasabah, mari kita terokai topik ini dengan mendalam bersama INVIAI.

Pertama, penting untuk difahami bahawa data adalah elemen teras dalam semua model AI pembelajaran mesin moden. AI tidak boleh “membina” pengetahuan sendiri tanpa data input.

Contohnya, dalam pembelajaran terarah, AI belajar daripada set data besar yang telah dilabel oleh manusia (imej, teks, audio, dan lain-lain) untuk mengenal pasti corak.

Walaupun dalam pembelajaran tanpa pengawasan, AI masih memerlukan data mentah yang tidak dilabel untuk menemui struktur atau corak tersembunyi dalam data tersebut secara sendiri.

Oleh itu, tanpa mengira kaedah, AI mesti “diberi makan” dengan data—sama ada data yang dilabel, data yang melabel sendiri (pembelajaran kendiri), atau data daripada persekitaran sebenar. Tanpa sebarang data input, sistem tidak dapat mempelajari apa-apa yang baru.

Kaedah Pembelajaran AI yang Biasa

Hari ini, model AI kebanyakannya belajar melalui pendekatan berikut:

  • Pembelajaran Terarah:

AI belajar daripada set data besar yang telah dilabel. Contohnya, untuk mengenal pasti kucing dalam imej, ribuan gambar yang dilabel “kucing” atau “bukan kucing” diperlukan untuk latihan. Kaedah ini sangat berkesan tetapi memerlukan usaha pelabelan yang besar.

  • Pembelajaran Tanpa Pengawasan:

AI diberikan data mentah yang tidak dilabel dan mencari corak atau kelompok dalam data tersebut. Contohnya, algoritma pengelompokan mengumpulkan set data dengan ciri-ciri yang serupa. Kaedah ini membolehkan AI “belajar sendiri” daripada data dan menemui corak tanpa bimbingan manusia.

  • Pembelajaran Kendiri:

Varian yang digunakan untuk rangkaian neural besar dan model bahasa besar (LLM), di mana model menjana label untuk data sendiri (contohnya, meramalkan perkataan seterusnya dalam ayat atau membina semula bahagian yang hilang) dan kemudian belajar daripadanya. Pendekatan ini membolehkan AI menggunakan set data teks atau imej yang besar tanpa pelabelan manusia.

  • Pembelajaran Pengukuhan (RL):

Daripada data statik, AI (dipanggil agen) berinteraksi dengan persekitaran dan belajar berdasarkan isyarat ganjaran. Wikipedia mentakrifkan RL sebagai: “Pembelajaran pengukuhan adalah mengajar agen perisian bagaimana berkelakuan dalam persekitaran dengan memberitahunya hasil tindakan yang diambil.”

Dengan kata lain, AI mengambil tindakan, memerhati hasil (contohnya, ganjaran atau penalti), dan menyesuaikan strategi untuk meningkatkan prestasi.

Contohnya, bukannya diajar manusia bermain catur, AlphaZero dari DeepMind bermain berjuta-juta permainan melawan dirinya sendiri, menemui strategi baru melalui isyarat kemenangan tanpa bergantung pada set data pakar yang disediakan terlebih dahulu.

  • Pembelajaran Persekutuan:

Bagi data sensitif, seperti imej perubatan peribadi, Pembelajaran Persekutuan membolehkan pelbagai peranti (atau organisasi) bekerjasama melatih model bersama tanpa berkongsi data mentah.

Google menerangkan bahawa dalam Pembelajaran Persekutuan, model global dihantar ke setiap peranti untuk latihan menggunakan data tempatan, dan hanya kemas kini model dihantar balik—data mentah tidak pernah keluar dari peranti.

Dengan cara ini, model boleh belajar daripada data di pelbagai lokasi tanpa memusatkannya. Namun, AI masih memerlukan data tempatan pada setiap peranti untuk belajar.

  • Pembelajaran Zero-Shot:

Ini adalah keupayaan AI untuk membuat inferens konsep baru tanpa contoh khusus. IBM mentakrifkan Pembelajaran Zero-Shot sebagai situasi di mana “model AI dilatih untuk mengenal pasti atau mengklasifikasikan objek/konsep yang belum pernah dilihat contoh sebelumnya.”

Pembelajaran zero-shot bergantung pada pengetahuan luas yang diperoleh sebelum ini. Contohnya, banyak model bahasa besar (LLM) seperti GPT telah dilatih awal pada korpus teks yang sangat besar. Terima kasih kepada pengetahuan awal ini, mereka boleh berfikir tentang konsep baru walaupun tanpa contoh eksplisit.

Walaupun nampak seperti AI boleh “belajar tanpa data,” sebenarnya LLM masih bergantung pada set data awal yang besar untuk membina keupayaan bahasa asas.

Kesimpulannya, semua kaedah ini menunjukkan bahawa tiada cara ajaib untuk AI belajar tanpa data—dalam apa jua bentuk sekalipun. AI mungkin mengurangkan kebergantungan pada data yang dilabel manusia atau belajar daripada pengalaman, tetapi ia tidak boleh belajar daripada ketiadaan.

Kaedah Pembelajaran AI Popular

Trend Terkini: Belajar dari “Pengalaman” Daripada Data Statik

Para penyelidik kini meneroka cara agar AI kurang bergantung pada data yang disediakan manusia. Contohnya, DeepMind baru-baru ini mencadangkan model “aliran” dalam era “AI berasaskan pengalaman,” di mana AI belajar terutamanya daripada interaksi sendiri dengan dunia dan bukan daripada masalah dan soalan yang direka manusia.

VentureBeat memetik kajian DeepMind: “Kita boleh mencapai ini dengan membenarkan agen belajar secara berterusan daripada pengalaman sendiri—iaitu, data yang dijana oleh agen itu sendiri semasa berinteraksi dengan persekitaran… Pengalaman akan menjadi cara utama peningkatan, melebihi skala data yang disediakan manusia hari ini.”

Dengan kata lain, pada masa depan, AI sendiri akan menjana data melalui eksperimen, pemerhatian, dan penyesuaian tindakan—serupa dengan cara manusia belajar daripada pengalaman dunia sebenar.

Satu contoh konkrit ialah model Absolute Zero Reasoner (AZR). AZR dilatih sepenuhnya melalui permainan kendiri, tanpa memerlukan input manusia. Ia menjana masalah sendiri (contohnya, potongan kod atau masalah matematik), menyelesaikannya, dan menggunakan hasilnya (melalui pelaksanaan kod atau maklum balas persekitaran) sebagai isyarat ganjaran untuk belajar.

Menariknya, walaupun tidak menggunakan data latihan luaran, AZR mencapai prestasi teratas dalam tugasan matematik dan pengaturcaraan, malah mengatasi model yang dilatih dengan puluhan ribu contoh yang dilabel. Ini menunjukkan bahawa AI boleh menjana “set data” sendiri dengan terus mencabar dan menyelesaikan masalah.

Selain AZR, banyak kajian lain meneroka AI yang belajar secara autonomi. Sistem agen pintar boleh berinteraksi dengan perisian dan dunia maya (alat, laman web, permainan simulasi) untuk mengumpul data pengalaman.

AI boleh direka untuk menetapkan matlamat dan ganjaran sendiri, serupa dengan bagaimana manusia membentuk tabiat. Walaupun masih dalam peringkat penyelidikan, idea ini mengukuhkan fakta: tiada AI yang benar-benar boleh belajar tanpa data—sebaliknya, “data” itu datang daripada pengalaman AI sendiri.

>>> Ketahui lebih lanjut: 

Adakah saya perlu tahu pengaturcaraan untuk menggunakan AI?

Adakah AI Berfikir Seperti Manusia?

Trend terkini - belajar dari “pengalaman” bukan data statik


Ringkasnya, AI hari ini masih memerlukan data (dalam satu bentuk atau lain) untuk belajar. Tiada istilah “AI tanpa data” yang sebenar.

Sebaliknya, AI boleh belajar dengan kurang bergantung pada data yang disediakan manusia dengan: menggunakan data yang tidak dilabel (pembelajaran tanpa pengawasan), belajar daripada maklum balas persekitaran (pembelajaran pengukuhan), atau bahkan mencipta cabaran sendiri (contohnya, model AZR).

Banyak pakar percaya bahawa pada masa depan, AI akan semakin banyak belajar melalui pengalaman yang dikumpul sendiri, menjadikan pengalaman sebagai “data” utama yang membantu ia berkembang.

Tetapi apa pun, kebenarannya tetap sama: AI tidak boleh belajar daripada ketiadaan; sumber “data” boleh lebih canggih (contohnya, isyarat persekitaran, ganjaran), tetapi ia sentiasa memerlukan bentuk input untuk mesin belajar dan memperbaiki diri.

Rujukan Luar
Artikel ini disusun dengan rujukan kepada sumber luar berikut: