Ano ang Machine Learning?
Ang Machine Learning (ML) ay isang sangay ng artificial intelligence (AI) na nagpapahintulot sa mga computer na matuto mula sa datos at pagbutihin ang kanilang kakayahan sa pagproseso sa paglipas ng panahon nang hindi kinakailangang detalyadong i-programa. Sa madaling salita, pinapayagan ng ML ang mga computer na “matuto” mula sa karanasan upang unti-unting mapabuti ang katumpakan ng mga hula, katulad ng paraan ng pagkatuto ng tao mula sa totoong karanasan.
Ano ang Machine Learning?
Machine Learning (ML, kilala rin bilang machine learning) ay isang sangay ng artificial intelligence (AI) na nakatuon sa pagpapahintulot sa mga computer na gayahin ang pagkatuto ng tao upang awtomatikong magsagawa ng mga gawain at pagbutihin ang pagganap sa pamamagitan ng pag-ipon ng karanasan mula sa datos. Sa madaling salita, ito ay "ang larangan ng pag-aaral na nagbibigay sa mga computer ng kakayahang matuto nang hindi tahasang ini-programa," ayon sa klasikong depinisyon ni eksperto Arthur Samuel mula pa noong 1950s. Ang depinisyong ito ay nananatiling totoo hanggang ngayon: sa halip na i-programa ang bawat partikular na utos, nagbibigay tayo ng datos para sa makina upang mahinuha ang mga patakaran at unti-unting mapabuti ang mga resulta sa paglipas ng panahon.
Ang larangan ng pag-aaral na nagbibigay sa mga computer ng kakayahang matuto nang hindi tahasang ini-programa.
— Arthur Samuel, Computer Scientist (1950s)
Sa kasalukuyan, malawak ang presensya ng machine learning sa pang-araw-araw na buhay. Maraming online na serbisyo na ginagamit natin araw-araw – mula sa mga search engine sa Internet, mga spam email filter, mga sistema ng rekomendasyon ng pelikula/produkto, hanggang sa mga software sa bangko na nakakakita ng mga kakaibang transaksyon – ay pinapagana ng mga algorithm ng machine learning.
Mga Search Engine
Matalinong pagraranggo at personalisadong mga resulta
Pag-detect ng Spam
Awtomatikong pag-filter ng email at seguridad
Mga Rekomendasyon
Personal na nilalaman at mga suhestiyon ng produkto
Ang teknolohiyang ito ay makikita rin sa maraming mobile application, tulad ng mga tampok sa pagkilala ng boses na nagpapahintulot sa mga virtual assistant na maunawaan ang iyong pananalita. Dahil sa kakayahan nitong matuto at mag-improve, ang machine learning ay naging pundasyon ng karamihan sa mga modernong sistema ng AI. Sa katunayan, karamihan sa mga pag-unlad ng AI sa nakaraang 5–10 taon ay malapit na konektado sa machine learning, kaya marami ang halos itinuturing na magkasingkahulugan ang AI at ML.

Ang Ugnayan ng Machine Learning, AI, at Deep Learning
Artificial Intelligence (AI) ay isang malawak na konsepto na sumasaklaw sa lahat ng teknik na nagpapahintulot sa mga makina na magsagawa ng mga "matalinong" kilos tulad ng tao. Ang Machine Learning ay isang pamamaraan upang maisakatuparan ang AI sa pamamagitan ng pagpapahintulot sa mga makina na matuto mula sa datos sa halip na tahasang i-programa nang hakbang-hakbang. Sa loob ng ekosistema ng AI, ang ML ay may napakahalagang papel kaya maraming sistema ng AI ay pangunahing binubuo ng mga modelo ng machine learning.
Mga Sistemang Batay sa Panuntunan
- Tahasang programming hakbang-hakbang
- Mga nakapirming panuntunan at lohika
- Limitadong kakayahang mag-adapt
Pagkatuto Batay sa Datos
- Natututo ng mga pattern mula sa datos
- Pinapabuti sa paglipas ng panahon
- Nag-aangkop sa mga bagong sitwasyon
Deep Learning ay isang espesyal na subfield ng machine learning. Ginagamit ng deep learning ang multi-layer artificial neural networks (malalim na neural networks) upang awtomatikong kunin ang mga tampok mula sa raw na datos na may minimal na interbensyon ng tao. Dahil sa multi-layer na istruktura nito, ang mga algorithm ng deep learning ay maaaring magproseso ng napakalaking dami ng datos (hal., mga larawan, audio, teksto) at matutunan ang mahahalagang tampok para sa klasipikasyon o prediksyon nang hindi kinakailangang magbigay ng mga tampok na iyon nang maaga ang mga programmer. Ito ay nakababawas sa pagsisikap ng "pagtuturo" sa makina at nakikinabang sa malawakang datos para sa modelo.
Artificial Intelligence
Machine Learning
Deep Learning
Sa kabilang banda, ang "klasikal" na mga algorithm ng ML (hindi gumagamit ng deep learning) ay madalas na malaki ang pag-asa sa mga tampok na dinisenyo ng tao at nangangailangan ng mas istrukturadong pagproseso ng datos upang makamit ang magagandang resulta. Maaaring isipin ang AI bilang isang malawak na hanay ng matatalinong teknolohiya, machine learning bilang subset ng AI, at deep learning bilang subset ng machine learning – na nakatuon sa mga modelo ng malalim na neural network.

Mga Uri ng Machine Learning
Maraming iba't ibang pamamaraan at algorithm sa machine learning. Sa pangkalahatan, ang ML ay nahahati sa apat na pangunahing uri batay sa kung paano natututo ang sistema mula sa datos:
Supervised Learning
Ang supervised learning ay isang pamamaraan ng pagsasanay ng mga modelo gamit ang labeled na datos. Ibig sabihin, ang input na datos ay may kilalang inaasahang resulta, na tumutulong sa algorithm na matuto mula sa mga partikular na halimbawa. Inaayos ng modelo ang mga panloob na parametro upang mahulaan ang mga output na tumutugma sa mga ibinigay na label. Halimbawa, kung bibigyan natin ang algorithm ng maraming labeled na larawan ng aso/pusa, matututo ang modelo mula sa mga larawang ito upang tumpak na makilala ang mga larawan ng aso mula sa hindi aso. Ang supervised learning ang pinakakaraniwang uri ng machine learning ngayon, na ginagamit sa napakaraming gawain tulad ng pagkilala sa sulat-kamay, klasipikasyon ng spam email, o prediksyon ng presyo ng real estate.
Klasipikasyon ng Larawan
Pagkilala sa mga bagay sa mga larawan
Pag-filter ng Email
Pag-detect at klasipikasyon ng spam
Unsupervised Learning
Sa unsupervised learning, ang input na datos ay walang label. Awtomatikong hinahanap ng algorithm ang mga nakatagong pattern at istruktura sa dataset nang walang paunang gabay. Layunin nito na matuklasan ng makina ang mga grupo ng datos o mga panuntunang nakatago na maaaring hindi pa alam ng tao. Halimbawa, maaaring suriin ng isang unsupervised learning program ang datos ng online shopping at awtomatikong pangkatin ang mga customer sa mga grupo na may magkakatulad na gawi sa pagbili.
Ang clustering na ito ay tumutulong sa mga negosyo na maunawaan ang iba't ibang segment ng customer kahit na walang partikular na label ng "uri ng customer" bago. Madalas gamitin ang unsupervised learning sa pagsusuri ng datos ng bisita, pagbawas ng dimensyon, at mga sistema ng rekomendasyon.
Segmentasyon ng Customer
Pagpangkat ng mga customer ayon sa mga pattern ng gawi
Pagsusuri ng Merkado
Pagtuklas ng mga nakatagong trend sa merkado
Semi-supervised Learning
Ang semi-supervised learning ay pinagsasama ang parehong labeled at unlabeled na datos sa panahon ng pagsasanay. Karaniwan, maliit lamang na bahagi ng datos ang may label, habang karamihan ay walang label. Ginagamit ng mga semi-supervised algorithm ang maliit na labeled na dataset upang gabayan ang klasipikasyon at pagkuha ng tampok sa mas malaking unlabeled na dataset. Ang pamamaraang ito ay nakikinabang sa napakalaking dami ng unlabeled na datos nang hindi nangangailangan ng malawakang manual na pag-label.
Partikular na kapaki-pakinabang ang semi-supervised learning kapag mahirap o magastos ang pagkolekta ng labeled na datos, na nagpapabuti ng katumpakan kumpara sa purong unsupervised learning.
Reinforcement Learning
Ang reinforcement learning ay isang pamamaraan kung saan ang mga algorithm ay natututo sa pamamagitan ng mekanismo ng gantimpala/parusa sa pakikipag-ugnayan sa kapaligiran. Hindi tulad ng supervised learning, ang modelo ay hindi binibigyan ng pares ng input-output na datos kundi nagsusubok ng iba't ibang aksyon at tumatanggap ng feedback (gantimpala o parusa) batay sa tagumpay ng mga aksyon na iyon.
Sa paglipas ng panahon, ang mga sunod-sunod na aksyon na nagbibigay ng magagandang resulta ay "pinatitibay", na tumutulong sa modelo na unti-unting matutunan ang pinakamainam na estratehiya upang makamit ang isang itinakdang layunin. Madalas gamitin ang reinforcement learning upang sanayin ang AI sa paglalaro ng mga laro, pagkontrol ng mga robot, o pagtuturo sa mga self-driving na sasakyan.
Isang kilalang halimbawa ay ang IBM Watson system – na gumamit ng reinforcement learning upang magpasya kung kailan sasagot at kung magkano ang ipupusta, na sa huli ay nanalo sa Jeopardy! quiz show noong 2011.
— Tagumpay ng IBM Watson
Game AI
Pagkatuto ng pinakamainam na estratehiya sa pamamagitan ng paglalaro
Robotics
Autonomous na pag-navigate at kontrol
Autonomous na Sasakyan
Paggawa ng desisyon sa sarili nitong pagmamaneho

Paano Gumagana ang Machine Learning
Ang Machine Learning ay gumagana batay sa datos. Una, kailangang mangolekta ang sistema ng malaki at magkakaibang dataset mula sa iba't ibang pinagmulan (mga sensor, sistema ng transaksyon, social networks, open databases, atbp.). Mahalaga ang kalidad ng datos: kung ang datos ay maingay, hindi kumpleto, o hindi representatibo, maaaring matuto nang mali ang modelo ng ML at magbigay ng hindi tumpak na resulta.
Pangongolekta at Preprocessing ng Datos
Una, tukuyin ang input na datos at kolektahin ito mula sa mga mapagkakatiwalaang pinagmulan. Pagkatapos, ang datos ay nililinis, tinatanggal ang mga error, pinupunan ang mga nawawalang halaga, o inino-normalize ang impormasyon ng input. Ang hakbang na ito ay kumakain ng maraming oras ngunit malaki ang epekto sa katumpakan ng huling modelo.
- Tukuyin at kolektahin ang datos mula sa mga mapagkakatiwalaang pinagmulan
- Linisin ang datos at alisin ang mga error
- Punuan ang mga nawawalang halaga at i-normalize ang mga input
- Tiyakin ang kalidad at representatibidad ng datos
Pagpili ng Algorithm at Pagsasanay ng Modelo
Batay sa uri ng datos at layunin (klasipikasyon o prediksyon), pumili ng angkop na algorithm (hal., linear regression, decision trees, neural networks, atbp.). Ang naprosesong training data ay ipapasok sa modelo upang matuto sa pamamagitan ng pag-optimize ng loss function. Inaayos ng pagsasanay ang mga parametro ng modelo upang mabawasan ang mga error sa prediksyon sa training dataset.
- Pumili ng angkop na algorithm para sa gawain
- Ipasok ang training data sa modelo
- I-optimize ang mga parametro ng loss function
- Bawasan ang mga error sa prediksyon
Pagsusuri at Pag-deploy
Pagkatapos ng pagsasanay, sinusubukan ang modelo sa bagong datos (test set) upang suriin ang kalidad. Karaniwang mga sukatan ay accuracy, Precision, Recall, o F1-Score, depende sa gawain. Kung pumasa ang mga resulta sa mga kinakailangan, ide-deploy ang modelo sa totoong aplikasyon o serbisyo; kung hindi, maaaring baguhin ang datos o algorithm at muling sanayin.
- Subukan ang modelo sa bagong datos (test set)
- Sukatin ang accuracy, precision, recall
- I-deploy kung pumasa sa mga kinakailangan
- Ayusin at muling sanayin kung kinakailangan

Mga Praktikal na Aplikasyon ng Machine Learning
Malawak ang aplikasyon ng machine learning sa totoong buhay, mula sa mga pang-araw-araw na kaginhawaan hanggang sa mga high-tech na larangan. Narito ang ilang tipikal na halimbawa ng mga aplikasyon ng ML:
Generative AI
Pagkilala sa Pananalita
Chatbots at Suporta sa Customer
Computer Vision
Mga Sistema ng Rekomendasyon
Pag-detect ng Panlilinlang

Mga Kalamangan at Limitasyon ng Machine Learning
Tulad ng ibang teknolohiya, ang machine learning ay may mga kapansin-pansing kalamangan ngunit mayroon ding ilang limitasyon. Ang pag-unawa dito ay tumutulong sa atin na epektibong magamit ang ML at maiwasan ang mga posibleng panganib.
Pangunahing Benepisyo
- Kakayahang makakita ng mga pattern sa malaking datos: Kayang matukoy ng ML ang mga nakatagong pattern at trend sa napakalaking dataset na mahirap makita ng tao. Pinapayagan nito ang mga negosyo na makakuha ng mga insight mula sa "big data" para sa mas tumpak na paggawa ng desisyon.
- Awtomasyon at pagbawas ng pag-asa sa tao: Kayang matuto at pagbutihin ng mga sistema ng ML ang mga analytical algorithm nang may minimal na interbensyon ng tao. Sa simpleng pagbibigay ng input na datos, maaaring awtomatikong "buoin" at i-tune ng modelo ang mga panloob na parametro upang ma-optimize ang mga resulta. Pinapayagan nito ang awtomasyon ng mga komplikadong gawain (tulad ng klasipikasyon, prediksyon) nang tuloy-tuloy nang hindi kailangang mano-manong i-programa bawat kaso.
- Pagbuti sa paglipas ng panahon at personalisadong karanasan: Hindi tulad ng tradisyunal na software (na may nakapirming pagganap), ang mga modelo ng machine learning ay pinapabuti ang katumpakan habang dumadami ang datos na pinoproseso. Sa bawat karagdagang pagsasanay, nakakakuha ang mga modelo ng karanasan at nakakagawa ng mas mahusay na prediksyon. Pinapayagan nito ang mga sistema ng ML na i-customize para sa bawat user – halimbawa, nagrerekomenda ng nilalaman na mas tumutugma sa mga kagustuhan ng manonood – at pinapahusay ang karanasan ng user sa paglipas ng panahon.
Pangunahing Hamon
- Pag-asa sa kalidad ng datos: Nangangailangan ang mga modelo ng ML ng napakalaking training dataset na dapat ay tumpak, magkakaiba, at walang kinikilingan. Ang mababang kalidad ng datos ay nagreresulta sa mahihirap na resulta (prinsipyo ng "garbage in, garbage out"). Bukod dito, ang pagkolekta at pagproseso ng napakalaking datos ay nangangailangan ng matatag na storage at computing infrastructure, na maaaring magastos at kumonsumo ng maraming resources.
- Panganib ng mga error sa pagkatuto o bias na resulta: Maaaring mag-fail nang seryoso ang mga modelo ng ML kung kulang o hindi representatibo ang training data. Sa ilang kaso, sa napakaliit na dataset, maaaring makahanap ang algorithm ng matematikal na "plausible" ngunit praktikal na mali na mga patakaran. Nagdudulot ito ng mga modelo na magbigay ng biased o maling prediksyon, na negatibong nakakaapekto sa mga desisyong batay dito. Kaya mahalagang maingat na suriin ang pagiging maaasahan ng mga resulta ng ML, lalo na kapag limitado ang input na datos.
- Kakulangan sa transparency: Maraming komplikadong modelo ng ML (lalo na ang deep learning) ay gumagana bilang isang "black box" – na nagpapahirap na ipaliwanag kung bakit gumawa ang modelo ng partikular na prediksyon. Halimbawa, ang isang deep neural network na may milyun-milyong parametro ay maaaring makamit ang mataas na katumpakan, ngunit mahirap malaman kung aling mga tampok ang nagdala sa desisyon. Ang kakulangan sa explainability na ito ay nagdudulot ng hamon sa mga larangang nangangailangan ng pananagutan sa resulta (tulad ng pananalapi, pangangalaga sa kalusugan). Sa kabilang banda, ang ilang mas simpleng modelo (hal., decision trees) ay mas madaling suriin at ipaliwanag dahil ang kanilang lohika ng desisyon ay masusundan – isang kalamangan na wala ang mga "black box" na neural network.

Konklusyon
Sa kabuuan, ang Machine Learning ay isang mahalagang teknolohiya sa panahon ng big data. Pinapayagan nito ang mga computer na matuto at pagbutihin ang kakayahan sa prediksyon sa paglipas ng panahon nang hindi kinakailangang detalyadong i-programa hakbang-hakbang. Bilang resulta, malawak ang aplikasyon ng ML sa buhay at industriya, mula sa matatalinong virtual assistant hanggang sa mga advanced na awtomatikong sistema.
Ang Machine Learning ay ang kasangkapan na tumutulong sa mga tao na ganap na mapakinabangan ang halaga ng datos sa digital na panahon, na nagbubukas ng maraming oportunidad para sa mga aplikasyon ng matalinong teknolohiya sa hinaharap.
— INVIAI Insight
Comments 0
Leave a Comment
No comments yet. Be the first to comment!