Apakah Anda bertanya-tanya, “Apakah AI dapat belajar sendiri tanpa data sama sekali?” Untuk mendapatkan jawaban yang paling rinci dan masuk akal, mari kita telusuri topik ini secara mendalam bersama INVIAI.
Pertama, penting untuk memahami bahwa data adalah elemen inti dalam semua model AI pembelajaran mesin modern. AI tidak dapat “membangun” pengetahuan sendiri tanpa data input.
Misalnya, dalam pembelajaran terawasi, AI belajar dari kumpulan data besar yang telah diberi label oleh manusia (gambar, teks, audio, dll.) untuk mengenali pola.
Bahkan dalam pembelajaran tanpa pengawasan, AI tetap membutuhkan data mentah yang belum diberi label untuk menemukan struktur atau pola tersembunyi dalam data tersebut secara mandiri.
Oleh karena itu, terlepas dari metodenya, AI harus “diberi makan” dengan data—baik data berlabel, data yang diberi label sendiri (self-supervised), atau data dari lingkungan dunia nyata. Tanpa data input, sistem tidak dapat mempelajari hal baru apapun.
Metode Pembelajaran AI yang Umum
Saat ini, model AI terutama belajar melalui pendekatan berikut:
- Pembelajaran Terawasi:
AI belajar dari kumpulan data besar yang sudah diberi label. Misalnya, untuk mengenali kucing dalam gambar, dibutuhkan ribuan foto yang diberi label “kucing” atau “bukan kucing” untuk pelatihan. Metode ini sangat efektif tetapi memerlukan upaya pelabelan yang besar.
- Pembelajaran Tanpa Pengawasan:
AI diberikan data mentah yang belum diberi label dan mencari pola atau kelompok di dalamnya. Misalnya, algoritma pengelompokan mengelompokkan dataset dengan karakteristik serupa. Metode ini memungkinkan AI untuk “belajar sendiri” dari data dan menemukan pola tanpa bimbingan manusia.
- Pembelajaran Self-Supervised:
Varian yang digunakan untuk jaringan saraf besar dan model bahasa besar (LLM), di mana model menghasilkan label untuk data sendiri (misalnya, memprediksi kata berikutnya dalam kalimat atau merekonstruksi bagian yang hilang) dan kemudian belajar dari label tersebut. Pendekatan ini memungkinkan AI memanfaatkan kumpulan data teks atau gambar besar tanpa pelabelan manusia.
- Pembelajaran Penguatan (Reinforcement Learning - RL):
Alih-alih data statis, AI (disebut agen) berinteraksi dengan lingkungan dan belajar berdasarkan sinyal penghargaan. Wikipedia mendefinisikan RL sebagai: “Pembelajaran penguatan adalah mengajarkan agen perangkat lunak bagaimana berperilaku dalam suatu lingkungan dengan memberitahukan hasil dari tindakannya.”
Dengan kata lain, AI mengambil tindakan, mengamati hasil (misalnya, penghargaan atau hukuman), dan menyesuaikan strategi untuk meningkatkan kinerja.
Misalnya, daripada diajari manusia bermain catur, AlphaZero dari DeepMind memainkan jutaan pertandingan melawan dirinya sendiri, menemukan strategi baru melalui sinyal kemenangan tanpa bergantung pada dataset ahli yang sudah disediakan.
- Pembelajaran Federasi:
Untuk data sensitif, seperti gambar medis pribadi, Pembelajaran Federasi memungkinkan beberapa perangkat (atau organisasi) melatih model bersama tanpa berbagi data mentah.
Google menjelaskan bahwa dalam Pembelajaran Federasi, model global dikirim ke setiap perangkat untuk dilatih dengan data lokal, dan hanya pembaruan model yang dikirim kembali—data mentah tidak pernah keluar dari perangkat.
Dengan cara ini, model dapat belajar dari data di berbagai lokasi tanpa mengonsolidasikannya. Namun, AI tetap membutuhkan data lokal di setiap perangkat untuk belajar.
- Pembelajaran Zero-Shot:
Ini adalah kemampuan AI untuk menyimpulkan konsep baru tanpa contoh spesifik. IBM mendefinisikan Pembelajaran Zero-Shot sebagai situasi di mana “model AI dilatih untuk mengenali atau mengklasifikasikan objek/konsep yang belum pernah dilihat sebelumnya.”
Pembelajaran zero-shot bergantung pada pengetahuan luas yang diperoleh sebelumnya. Misalnya, banyak model bahasa besar (LLM) seperti GPT dilatih awal pada korpus teks besar. Berkat pengetahuan awal ini, mereka dapat menalar tentang konsep baru meskipun tanpa contoh eksplisit.
Meskipun tampak seperti AI dapat “belajar tanpa data,” kenyataannya LLM masih bergantung pada kumpulan data awal yang besar untuk membangun kemampuan bahasa dasar.
Singkatnya, semua metode ini menunjukkan bahwa tidak ada cara ajaib bagi AI untuk belajar tanpa data—dalam bentuk apapun. AI mungkin mengurangi ketergantungan pada data berlabel manusia atau belajar dari pengalaman, tetapi tidak dapat belajar dari ketiadaan.
Tren Lanjutan: Belajar dari “Pengalaman” daripada Data Statis
Para peneliti kini mengeksplorasi cara agar AI lebih sedikit bergantung pada data yang disediakan manusia. Misalnya, DeepMind baru-baru ini mengusulkan model “streams” di era “AI berbasis pengalaman,” di mana AI belajar terutama dari interaksinya sendiri dengan dunia daripada masalah dan pertanyaan yang dirancang manusia.
VentureBeat mengutip riset DeepMind: “Kita dapat mencapainya dengan membiarkan agen terus belajar dari pengalamannya sendiri—yaitu, data yang dihasilkan oleh agen itu sendiri saat berinteraksi dengan lingkungan… Pengalaman akan menjadi sarana utama peningkatan, melampaui skala data yang disediakan manusia saat ini.”
Dengan kata lain, di masa depan, AI akan menghasilkan data sendiri melalui eksperimen, pengamatan, dan penyesuaian tindakan—mirip dengan cara manusia belajar dari pengalaman dunia nyata.
Contoh konkret adalah model Absolute Zero Reasoner (AZR). AZR dilatih sepenuhnya melalui self-play, tanpa memerlukan input dari manusia. Model ini menghasilkan masalah sendiri (misalnya, potongan kode atau soal matematika), menyelesaikannya, dan menggunakan hasilnya (melalui eksekusi kode atau umpan balik lingkungan) sebagai sinyal penghargaan untuk belajar.
Menariknya, meskipun tidak menggunakan data pelatihan eksternal, AZR mencapai kinerja terbaik dalam tugas matematika dan pemrograman, bahkan melampaui model yang dilatih dengan puluhan ribu contoh berlabel. Ini menunjukkan bahwa AI dapat menghasilkan “dataset” sendiri dengan terus mengajukan dan menyelesaikan tantangan.
Selain AZR, banyak studi lain mengeksplorasi AI yang belajar secara mandiri. Sistem agen cerdas dapat berinteraksi dengan perangkat lunak dan dunia virtual (alat, situs web, permainan simulasi) untuk mengumpulkan data pengalaman.
AI dapat dirancang untuk menetapkan tujuan dan penghargaan sendiri, mirip dengan bagaimana manusia mengembangkan kebiasaan. Meskipun masih dalam tahap penelitian, ide-ide ini memperkuat poin: tidak ada AI yang benar-benar dapat belajar tanpa data—melainkan, “data” tersebut berasal dari pengalaman AI sendiri.
>>> Pelajari lebih lanjut:
Apakah saya perlu mengetahui pemrograman untuk menggunakan AI?
Singkatnya, AI saat ini masih membutuhkan data (dalam satu bentuk atau lainnya) untuk belajar. Tidak ada yang namanya “AI tanpa data” secara sejati.
Sebaliknya, AI dapat belajar lebih sedikit dari data yang disediakan manusia dengan: menggunakan data tanpa label (pembelajaran tanpa pengawasan), belajar dari umpan balik lingkungan (pembelajaran penguatan), atau bahkan menciptakan tantangan sendiri (misalnya, model AZR).
Banyak ahli percaya bahwa di masa depan, AI akan semakin banyak belajar melalui pengalaman yang dikumpulkannya sendiri, menjadikan pengalaman sebagai “data” utama yang membantunya berkembang.
Tetapi bagaimanapun juga, kenyataannya tetap: AI tidak dapat belajar dari ketiadaan; sumber “data” bisa lebih canggih (misalnya, sinyal lingkungan, penghargaan), tetapi selalu membutuhkan bentuk input agar mesin dapat belajar dan berkembang.