Apakah Pembelajaran Mesin?

Pembelajaran Mesin (ML) adalah cabang kecerdasan buatan (AI) yang membolehkan komputer belajar daripada data dan meningkatkan keupayaan pemprosesannya dari masa ke masa tanpa pengaturcaraan terperinci. Dengan kata lain, ML membolehkan komputer “belajar” daripada pengalaman untuk secara beransur-ansur meningkatkan ketepatan ramalan, serupa dengan cara manusia belajar daripada pengalaman dunia sebenar.

Apakah Pembelajaran Mesin? Apakah prinsip dan aplikasi kaedah pembelajaran mesin? Mari kita terokai jawapan terperinci di bawah bersama INVIAI!

Apakah Pembelajaran Mesin?

Pembelajaran Mesin (ML, juga dikenali sebagai machine learning) adalah cabang kecerdasan buatan (AI) yang memfokuskan pada membolehkan komputer mensimulasikan pembelajaran manusia untuk secara automatik melaksanakan tugas dan meningkatkan prestasi dengan mengumpul pengalaman daripada data. Secara ringkas, ia adalah "bidang kajian yang memberi komputer keupayaan untuk belajar tanpa diprogram secara eksplisit," menurut definisi klasik oleh pakar Arthur Samuel dari tahun 1950-an. Definisi ini masih sah sehingga hari ini: bukannya memprogram setiap arahan khusus, kita memberi data kepada mesin untuk membuat inferens peraturan dan secara beransur-ansur memperbaiki hasil dari masa ke masa.

Bidang kajian yang memberi komputer keupayaan untuk belajar tanpa diprogram secara eksplisit.

— Arthur Samuel, Saintis Komputer (1950-an)

Hari ini, pembelajaran mesin hadir secara meluas dalam kehidupan seharian. Banyak perkhidmatan dalam talian yang kita gunakan setiap hari – daripada enjin carian Internet, penapis e-mel spam, sistem cadangan filem/produk, hingga perisian perbankan yang mengesan transaksi luar biasa – dikuasakan oleh algoritma pembelajaran mesin.

Enjin Carian

Peringkat pintar dan hasil yang diperibadikan

Pengesanan Spam

Penapisan e-mel automatik dan keselamatan

Cadangan

Kandungan dan cadangan produk yang diperibadikan

Teknologi ini juga muncul dalam banyak aplikasi mudah alih, seperti ciri pengecaman suara yang membolehkan pembantu maya memahami pertuturan anda. Terima kasih kepada keupayaannya untuk belajar dan memperbaiki, pembelajaran mesin telah menjadi asas kebanyakan sistem AI moden. Malah, kebanyakan kemajuan AI dalam 5–10 tahun terakhir sangat berkait rapat dengan pembelajaran mesin, sehingga ramai orang menganggap AI dan ML hampir sinonim.

Pembelajaran Mesin (ML, juga dikenali sebagai machine learning)
Visualisasi konsep Pembelajaran Mesin

Hubungan Antara Pembelajaran Mesin, AI, dan Pembelajaran Mendalam

Kecerdasan Buatan (AI) adalah konsep luas yang merangkumi semua teknik yang membolehkan mesin melakukan tingkah laku "cerdik" seperti manusia. Pembelajaran Mesin adalah kaedah untuk merealisasikan AI dengan membolehkan mesin belajar daripada data dan bukannya diprogram langkah demi langkah secara eksplisit. Dalam ekosistem AI, ML memainkan peranan penting sehingga banyak sistem AI sebenarnya dibina berdasarkan model pembelajaran mesin.

Pengaturcaraan Tradisional

Sistem Berasaskan Peraturan

  • Pengaturcaraan langkah demi langkah secara eksplisit
  • Peraturan dan logik tetap
  • Kebolehsuaian terhad
Pembelajaran Mesin

Pembelajaran Berpandukan Data

  • Belajar corak daripada data
  • Memperbaiki dari masa ke masa
  • Menyesuaikan diri dengan situasi baru

Pembelajaran Mendalam adalah subbidang khas pembelajaran mesin. Pembelajaran mendalam menggunakan rangkaian neural tiruan berlapis-lapis (rangkaian neural mendalam) untuk secara automatik mengekstrak ciri daripada data mentah dengan campur tangan manusia yang minimum. Terima kasih kepada struktur berlapis-lapisnya, algoritma pembelajaran mendalam dapat memproses jumlah data yang besar (contohnya, imej, audio, teks) dan belajar ciri penting untuk pengelasan atau ramalan tanpa memerlukan pengaturcara menyediakan ciri tersebut terlebih dahulu. Ini mengurangkan usaha "mengajar" mesin dan memanfaatkan data berskala besar untuk model.

Kecerdasan Buatan

Konsep luas tingkah laku mesin yang cerdas

Pembelajaran Mesin

Subset AI yang memfokuskan pada pembelajaran daripada data

Pembelajaran Mendalam

Subset ML yang menggunakan rangkaian neural

Sebaliknya, algoritma ML "klasik" (yang tidak menggunakan pembelajaran mendalam) sering bergantung kuat pada ciri input yang direka oleh manusia dan memerlukan pemprosesan data yang lebih terstruktur untuk mencapai hasil yang baik. Anda boleh membayangkan AI sebagai set teknologi pintar yang luas, pembelajaran mesin sebagai subset AI, dan pembelajaran mendalam sebagai subset pembelajaran mesin – yang memfokuskan pada model rangkaian neural mendalam.

Perbezaan penting: Robotik dan pembelajaran mesin adalah dua bidang berbeza. Robotik melibatkan perkakasan dan automasi mekanikal, manakala ML terutamanya merujuk kepada algoritma perisian. Namun, robot moden boleh mengintegrasikan ML untuk menjadi "lebih pintar," contohnya, robot autonomi menggunakan pembelajaran mesin untuk belajar cara navigasi.
Hubungan Antara Pembelajaran Mesin, AI dan Pembelajaran Mendalam
Hubungan hierarki antara AI, Pembelajaran Mesin, dan Pembelajaran Mendalam

Jenis-Jenis Pembelajaran Mesin

Terdapat banyak kaedah dan algoritma berbeza dalam pembelajaran mesin. Secara asasnya, ML dibahagikan kepada empat jenis utama berdasarkan bagaimana sistem belajar daripada data:

Pembelajaran Berpandukan

Pembelajaran berpandukan adalah kaedah melatih model menggunakan data berlabel. Ini bermakna data input sudah mempunyai hasil yang diketahui, membantu algoritma belajar daripada contoh khusus. Model menyesuaikan parameter dalaman untuk meramalkan output yang sepadan dengan label yang diberikan. Contohnya, jika kita memberikan algoritma banyak imej berlabel anjing/kucing, model belajar daripada imej ini untuk membezakan imej anjing dengan tepat daripada imej bukan anjing. Pembelajaran berpandukan adalah jenis pembelajaran mesin yang paling biasa hari ini, digunakan dalam pelbagai tugas seperti pengecaman tulisan tangan, pengelasan e-mel spam, atau ramalan harga hartanah.

Pengelasan Imej

Mengenal objek dalam foto

Penapisan E-mel

Pengesanan dan pengelasan spam

Pembelajaran Tanpa Pengawasan

Dengan pembelajaran tanpa pengawasan, data input tidak mempunyai label. Algoritma secara automatik mencari corak dan struktur tersembunyi dalam set data tanpa panduan awal. Tujuannya adalah supaya mesin menemui kumpulan data atau peraturan asas yang mungkin belum diketahui manusia. Contohnya, program pembelajaran tanpa pengawasan boleh menganalisis data pembelian dalam talian dan secara automatik mengelompokkan pelanggan ke dalam kumpulan dengan tingkah laku pembelian yang serupa.

Pengelompokan ini membantu perniagaan memahami segmen pelanggan yang berbeza walaupun tiada label "jenis pelanggan" khusus sebelum ini. Pembelajaran tanpa pengawasan sering digunakan dalam analisis data pelawat, pengurangan dimensi, dan sistem cadangan.

Segmentasi Pelanggan

Mengelompokkan pelanggan berdasarkan corak tingkah laku

Analisis Pasaran

Menemui tren pasaran tersembunyi

Pembelajaran Semi-berpandukan

Pembelajaran semi-berpandukan menggabungkan data berlabel dan tidak berlabel semasa latihan. Biasanya, hanya sebahagian kecil data yang berlabel, manakala kebanyakan data tidak berlabel. Algoritma semi-berpandukan menggunakan set data berlabel kecil ini untuk membimbing pengelasan dan pengekstrakan ciri pada set data tidak berlabel yang lebih besar. Pendekatan ini memanfaatkan jumlah data tidak berlabel yang banyak tanpa memerlukan pelabelan manual yang meluas.

Pembelajaran semi-berpandukan sangat berguna apabila pengumpulan data berlabel sukar atau mahal, meningkatkan ketepatan berbanding pembelajaran tanpa pengawasan sepenuhnya.

Data Berlabel 20%
Data Tidak Berlabel 80%

Pembelajaran Penguatan

Pembelajaran penguatan adalah kaedah di mana algoritma belajar melalui mekanisme ganjaran/hukuman dengan berinteraksi dengan persekitaran. Berbeza dengan pembelajaran berpandukan, model tidak diberikan pasangan data input-output tetapi mencuba pelbagai tindakan dan menerima maklum balas (ganjaran atau penalti) berdasarkan kejayaan tindakan tersebut.

Dari masa ke masa, urutan tindakan yang menghasilkan keputusan baik akan "diperkuat", membantu model secara beransur-ansur belajar strategi optimum untuk mencapai matlamat tertentu. Pembelajaran penguatan sering digunakan untuk melatih AI bermain permainan, mengawal robot, atau mengajar kereta pandu sendiri.

Contoh terkenal ialah sistem IBM Watson – yang menggunakan pembelajaran penguatan untuk memutuskan bila hendak menjawab dan berapa banyak untuk bertaruh, akhirnya memenangi rancangan kuiz Jeopardy! pada tahun 2011.

— Pencapaian IBM Watson

AI Permainan

Belajar strategi optimum melalui permainan

Robotik

Navigasi dan kawalan autonomi

Kenderaan Autonomi

Pengambilan keputusan pandu sendiri

Jenis-Jenis Pembelajaran Mesin
Empat jenis utama pendekatan Pembelajaran Mesin

Bagaimana Pembelajaran Mesin Berfungsi

Pembelajaran Mesin beroperasi berdasarkan data. Pertama, sistem perlu mengumpul set data yang besar dan pelbagai dari pelbagai sumber (sensor, sistem transaksi, rangkaian sosial, pangkalan data terbuka, dan lain-lain). Kualiti data adalah penting: jika data bising, tidak lengkap, atau tidak mewakili, model ML mungkin belajar secara salah dan menghasilkan keputusan yang tidak tepat.

Prinsip Kualiti Data: Semakin bersih dan mewakili data, semakin berkesan model belajar, tetapi data mesti diproses terlebih dahulu (dibersihkan, dinormalisasi, dan lain-lain) untuk bersedia bagi latihan.
1

Pengumpulan & Pra-pemprosesan Data

Pertama, kenal pasti data input dan kumpulkan dari sumber yang boleh dipercayai. Kemudian, data dibersihkan, kesilapan dibuang, nilai hilang diisi, atau maklumat input dinormalisasi. Langkah ini mengambil masa yang signifikan tetapi sangat mempengaruhi ketepatan model akhir.

  • Kenal pasti dan kumpul data dari sumber boleh dipercayai
  • Bersihkan data dan buang kesilapan
  • Isi nilai hilang dan normalisasi input
  • Pastikan kualiti dan keterwakilan data
2

Pemilihan Algoritma & Latihan Model

Berdasarkan jenis data dan matlamat (pengelasan atau ramalan), pilih algoritma yang sesuai (contohnya, regresi linear, pokok keputusan, rangkaian neural, dan lain-lain). Data latihan yang diproses dimasukkan ke dalam model untuk belajar dengan mengoptimumkan fungsi kerugian. Latihan menyesuaikan parameter model untuk meminimumkan kesilapan ramalan pada set data latihan.

  • Pilih algoritma sesuai untuk tugas
  • Masukkan data latihan ke dalam model
  • Optimumkan parameter fungsi kerugian
  • Minimakan kesilapan ramalan
3

Penilaian & Pelaksanaan

Selepas latihan, model diuji pada data baru (set ujian) untuk menilai kualiti. Metrik biasa termasuk ketepatan, Precision, Recall, atau F1-Score, bergantung pada tugas. Jika keputusan memenuhi keperluan, model dilaksanakan dalam aplikasi atau perkhidmatan sebenar; jika tidak, data atau algoritma mungkin disesuaikan dan dilatih semula.

  • Uji model pada data baru (set ujian)
  • Ukur ketepatan, precision, recall
  • Laksanakan jika keputusan memenuhi keperluan
  • Sesuaikan dan latih semula jika perlu
Bagaimana Pembelajaran Mesin Berfungsi
Proses aliran kerja lengkap Pembelajaran Mesin

Aplikasi Praktikal Pembelajaran Mesin

Pembelajaran mesin digunakan secara meluas dalam kehidupan sebenar, dari kemudahan harian hingga bidang teknologi tinggi. Berikut adalah beberapa contoh tipikal aplikasi ML:

AI Generatif

Ini adalah teknologi ML yang membolehkan penciptaan kandungan baru (teks, imej, video, kod sumber, dan lain-lain) berdasarkan input pengguna. Model AI generatif (seperti model bahasa besar) belajar daripada set data besar untuk memahami permintaan dan secara automatik menghasilkan kandungan yang sesuai. Contoh: ChatGPT adalah aplikasi AI generatif terkenal yang boleh menjawab soalan atau merangka teks mengikut niat pengguna.

Pengecaman Ucapan

Pembelajaran mesin membantu komputer memahami pertuturan manusia dan menukarnya menjadi teks. Teknologi Pengecaman Ucapan ini menggunakan model pembelajaran mesin (sering digabungkan dengan pemprosesan bahasa semula jadi) untuk mengenal pasti dan menyalin kata-kata yang diucapkan. Aplikasi praktikal termasuk pembantu maya pada telefon (contohnya, Siri, Google Assistant) yang melaksanakan arahan suara atau ciri suara-ke-teks yang memudahkan interaksi pengguna dengan peranti.

Chatbot dan Sokongan Pelanggan

Banyak chatbot di laman web dan media sosial dilengkapi dengan pembelajaran mesin untuk secara automatik menjawab soalan lazim (FAQ), membantu nasihat produk, dan berinteraksi dengan pelanggan 24/7. Terima kasih kepada ML, chatbot dapat memahami niat pengguna dan memberikan respons yang sesuai, malah belajar dari setiap perbualan untuk meningkatkan perkhidmatan. Ini membantu perniagaan menjimatkan tenaga kerja sambil meningkatkan pengalaman pelanggan (contohnya, pembantu maya, chatbot e-dagang yang mencadangkan produk dan menjawab pertanyaan dengan segera).

Penglihatan Komputer

Bidang ML ini membolehkan komputer "melihat" dan memahami kandungan imej atau video. Algoritma penglihatan komputer sering menggunakan rangkaian neural konvolusi (CNN) untuk mengenal ciri imej, seterusnya mengesan objek, mengklasifikasi, atau pengecaman corak dalam data visual. Aplikasinya pelbagai: dari penandaan automatik pada foto media sosial, pengenalan wajah pada telefon, hingga diagnosis imej perubatan (mengesan tumor dalam sinar-X) dan kereta pandu sendiri (mengenal pejalan kaki, papan tanda lalu lintas, dan lain-lain).

Sistem Cadangan

Ini adalah algoritma ML yang menganalisis tingkah laku pengguna untuk memberi cadangan diperibadikan yang sesuai dengan keutamaan individu. Contohnya, berdasarkan sejarah tontonan atau pembelian, sistem mencadangkan filem atau produk yang mungkin menarik minat anda. Platform e-dagang dan perkhidmatan penstriman (Netflix, Spotify, dan lain-lain) menggunakan ML untuk memperibadikan kandungan yang dipaparkan, meningkatkan pengalaman pengguna dan meningkatkan jualan.

Pengesanan Penipuan

Dalam kewangan dan perbankan, pembelajaran mesin digunakan untuk mengesan transaksi penipuan atau luar biasa dengan cepat. Model ML boleh dilatih menggunakan data transaksi penipuan berlabel (pembelajaran berpandukan) untuk mengenal pasti tanda-tanda aktiviti penipuan. Digabungkan dengan teknik pengesanan anomali, sistem ML boleh memberi amaran tentang transaksi "luar biasa" berbanding tingkah laku normal untuk siasatan lanjut. Terima kasih kepada ML, bank dan syarikat kad kredit dapat mengesan penipuan dengan segera, meminimumkan kerugian dan risiko untuk pelanggan.
Aplikasi dunia sebenar Pembelajaran Mesin
Aplikasi dunia sebenar Pembelajaran Mesin merentasi industri
Aplikasi Tambahan: ML mempunyai banyak aplikasi lain seperti: kawalan automatik di kilang (robotik), analisis rantaian bekalan, ramalan cuaca, analisis data genomik dalam biologi, dan lain-lain. Perkembangan ML membuka kemungkinan baru dalam hampir setiap bidang.

Kelebihan dan Kekangan Pembelajaran Mesin

Seperti teknologi lain, pembelajaran mesin mempunyai kelebihan ketara tetapi juga kekangan tertentu. Memahami ini membantu kita mengaplikasikan ML dengan berkesan dan mengelakkan risiko berpotensi.

Kelebihan

Manfaat Utama

  • Keupayaan mencari corak dalam data besar: ML boleh mengesan corak dan tren tersembunyi dalam set data besar yang sukar dikesan manusia. Ini membolehkan perniagaan mengekstrak wawasan daripada "big data" untuk membuat keputusan yang lebih tepat.
  • Automasi dan pengurangan kebergantungan manusia: Sistem ML boleh belajar dan memperbaiki algoritma analitik dengan campur tangan manusia yang minimum. Dengan hanya menyediakan data input, model boleh secara automatik "menyusun" dan melaras parameter dalaman untuk mengoptimumkan hasil. Ini membolehkan automasi tugas kompleks (seperti pengelasan, ramalan) secara berterusan tanpa pengaturcaraan manual untuk setiap kes.
  • Peningkatan dari masa ke masa & pengalaman diperibadikan: Berbeza dengan perisian tradisional (dengan prestasi tetap), model pembelajaran mesin meningkatkan ketepatan apabila memproses lebih banyak data. Dengan setiap latihan tambahan, model mengumpul pengalaman dan membuat ramalan lebih baik. Ini membolehkan sistem ML menyesuaikan untuk pengguna individu – contohnya, mencadangkan kandungan yang semakin selaras dengan keutamaan penonton – dan meningkatkan pengalaman pengguna dari masa ke masa.
Kekangan

Cabaran Utama

  • Kebergantungan pada kualiti data: Model ML memerlukan set data latihan yang sangat besar yang mesti tepat, pelbagai, dan tidak berat sebelah. Data berkualiti rendah menghasilkan keputusan buruk (prinsip "sampah masuk, sampah keluar"). Selain itu, pengumpulan dan pemprosesan data besar memerlukan infrastruktur penyimpanan dan pengkomputeran yang kukuh, yang boleh mahal dan memerlukan sumber yang banyak.
  • Risiko kesilapan pembelajaran atau keputusan berat sebelah: Model ML boleh gagal teruk jika data latihan tidak mencukupi atau tidak mewakili. Dalam beberapa kes, dengan set data yang sangat kecil, algoritma mungkin menemui peraturan yang secara matematik "munasabah" tetapi secara praktikal salah. Ini menyebabkan model menghasilkan ramalan berat sebelah atau mengelirukan, memberi kesan negatif pada keputusan yang dibuat berdasarkan ramalan tersebut. Oleh itu, adalah penting untuk memeriksa dengan teliti kebolehpercayaan keputusan ML, terutamanya apabila data input terhad.
  • Kekurangan ketelusan: Banyak model ML kompleks (terutamanya pembelajaran mendalam) beroperasi sebagai "kotak hitam" – menjadikan sangat sukar untuk menjelaskan mengapa model membuat ramalan tertentu. Contohnya, rangkaian neural mendalam dengan berjuta-juta parameter mungkin mencapai ketepatan tinggi, tetapi sukar untuk mengetahui ciri mana yang menyebabkan keputusan. Kekurangan kebolehterangan ini menimbulkan cabaran dalam bidang yang memerlukan akauntabiliti keputusan (seperti kewangan, penjagaan kesihatan). Sebaliknya, beberapa model yang lebih mudah (contohnya, pokok keputusan) lebih mudah disahkan dan ditafsir kerana logik keputusannya boleh dijejak – satu kelebihan yang tidak dimiliki rangkaian neural "kotak hitam".
Prinsip "Sampah Masuk, Sampah Keluar": Data berkualiti rendah pasti menghasilkan keputusan buruk, tidak kira betapa canggihnya algoritma ML. Kualiti data adalah asas kejayaan ML.
Kelebihan dan kekurangan Pembelajaran Mesin
Mengimbangi kelebihan dan kekangan Pembelajaran Mesin

Kesimpulan

Secara ringkas, Pembelajaran Mesin adalah teknologi utama dalam era data besar. Ia membolehkan komputer belajar dan meningkatkan keupayaan ramalan dari masa ke masa tanpa pengaturcaraan langkah demi langkah yang terperinci. Oleh itu, ML telah dan terus digunakan secara meluas dalam kehidupan dan industri, dari pembantu maya pintar hingga sistem automatik canggih.

Pembelajaran Mesin adalah alat yang membantu manusia memanfaatkan sepenuhnya nilai data dalam era digital, membuka banyak peluang untuk aplikasi teknologi pintar pada masa depan.

— Wawasan INVIAI
Rujukan Luar
Artikel ini disusun dengan rujukan kepada sumber luar berikut:
96 artikel
Rosie Ha adalah penulis di Inviai, yang pakar berkongsi pengetahuan dan penyelesaian mengenai kecerdasan buatan. Dengan pengalaman dalam penyelidikan dan aplikasi AI dalam pelbagai bidang seperti perniagaan, penciptaan kandungan, dan automasi, Rosie Ha akan menyampaikan artikel yang mudah difahami, praktikal dan memberi inspirasi. Misi Rosie Ha adalah untuk membantu semua orang memanfaatkan AI dengan berkesan bagi meningkatkan produktiviti dan mengembangkan kreativiti.
Cari