Pencapaian AI

Selama bertahun-tahun (2023–2025), kecerdasan buatan telah melangkah jauh di pelbagai bidang. Model bahasa besar (LLM) dan chatbot, sistem multimodal, alat AI saintifik, dan robotik semuanya mencatatkan pencapaian penting.

Gergasi teknologi melancarkan pembantu AI baharu, komuniti sumber terbuka memperkenalkan model berkuasa, dan pihak pengawal selia turut mengambil langkah menangani impak AI.

Di bawah ini kami mengulas pencapaian paling menonjol, daripada peluasan GPT-4 dan Google Gemini hingga Hadiah Nobel AlphaFold dan penemuan berasaskan AI dalam sains dan seni.

Senarai Kandungan

1. Model Bahasa Generatif dan Chatbot
2. Kemajuan AI Multimodal & Kreatif
3. AI dalam Sains, Perubatan dan Matematik
4. AI dalam Robotik dan Automasi
5. AI dalam Produk, Industri dan Masyarakat

Model Bahasa Generatif dan Chatbot

LLM moden menjadi jauh lebih berupaya dan multimodal. GPT-4 Turbo OpenAI (diumumkan Nov 2023) kini boleh memproses 128,000 token dalam satu arahan (kira-kira 300 muka surat teks) dan kos operasinya jauh lebih rendah berbanding GPT-4.

Pada Mei 2024, OpenAI memperkenalkan GPT-4o (Omni), model yang dinaik taraf yang mengendalikan teks, imej, dan audio secara masa nyata – memberikan GPT-4 kebolehan “melihat dan mendengar” dalam perbualan. ChatGPT kini mempunyai ciri imej dan suara terbina dalam: pengguna boleh memuat naik gambar atau bercakap dengan bot, dan ia akan memberi respons berdasarkan input visual atau audio tersebut.

GPT-4 Turbo dan GPT-4o (Omni): GPT-4 Turbo (Nov 2023) mengurangkan kos dan memanjangkan konteks kepada 128K token. GPT-4o (Mei 2024) menjadikan AI benar-benar multimodal, menghasilkan teks, ucapan dan imej secara bergantian dengan kelajuan hampir seperti manusia.
Kemajuan ChatGPT: Menjelang akhir 2023, ChatGPT “boleh melihat, mendengar, dan bercakap” – imej dan audio boleh dimuat naik atau diucapkan sebagai arahan, dan bot boleh menjawab mengikut input tersebut.
Ia juga mengintegrasikan DALL·E 3 (Okt 2023) supaya boleh menghasilkan imej daripada teks dengan bantuan arahan perbualan.
Siri Gemini Google: Pada Dis 2024, Google DeepMind melancarkan model pertama Gemini 2.0 (“Flash” dan prototaip) yang direka untuk “era agen” – AI yang boleh melaksanakan tugas berbilang langkah secara autonomi.
Google sudah mula menguji Gemini 2.0 dalam Carian (AI Overviews) dan produk lain untuk lebih satu bilion pengguna, mencerminkan kebolehan penaakulan dan multimodal yang dipertingkatkan.
Model lain: Meta melancarkan LLaMA 3 pada April 2024 (LLM berat terbuka sehingga 400B parameter) yang mendakwa mengatasi banyak model terdahulu.
Anthropic dengan Claude 3 dan alat copilot Microsoft turut membina berdasarkan kemajuan ini (contohnya Copilot dibina atas teknologi OpenAI).

Inovasi ini membolehkan pembantu AI mengadakan perbualan yang lebih panjang dan kaya serta mengendalikan input yang pelbagai.

Mereka juga menyokong aplikasi “pembantu” baharu melalui API (Google “AI Overviews”, OpenAI Assistants API, dan lain-lain), menjadikan AI lebih mudah diakses oleh pembangun dan pengguna akhir.

Model Bahasa Generatif dan Chatbot

Kemajuan AI Multimodal & Kreatif

Kreativiti dan kefahaman visual AI berkembang pesat. Model teks-ke-imej dan teks-ke-video mencapai tahap baru:

OpenAI’s DALL·E 3 (Okt 2023) menghasilkan imej fotorealistik daripada arahan dan turut diintegrasikan dengan ChatGPT untuk membantu penulisan arahan.

Google memperkenalkan Imagen 3 (Okt 2024) dan Veo 2 (Dis 2024) – enjin teks-ke-imej dan teks-ke-video terkini – yang meningkatkan kualiti, perincian, dan konsistensi dalam seni dan video AI secara dramatik.

AI muzik juga bertambah baik dengan alat MusicFX Google dan penyelidikan berkaitan (contohnya eksperimen MusicLM).

Model seni generatif: DALL·E 3 dan Imagen 3 boleh mengikuti arahan halus (termasuk teks terbenam dalam imej) dengan ketepatan tinggi.
Veo 2 Google boleh menghasilkan klip video pendek daripada satu penerangan teks, satu langkah penting dalam sintesis video.
Stable Diffusion dan Midjourney juga melancarkan versi baharu (v3, v6) dengan realisme lebih baik tahun ini.
AI dalam peranti: Apple melancarkan Apple Intelligence (dalam iOS 18 dan macOS 15, akhir 2024) – AI generatif terbina dalam iPhone/iPad/Mac.
Ia menambah pembantu penulisan (menulis semula, menyemak, meringkaskan dalam Mail/Pages), Siri yang lebih pintar, dan alat imej seperti Image Playground (mencipta ilustrasi menyeronokkan melalui teks) dan Genmoji (emoji tersuai dijana AI).
Foto mendapat carian bahasa semula jadi (“cari Maya bermain papan luncur”), dan AI “Clean Up” membuang objek tidak diingini dari foto.
Pendekatan Apple menekankan pemprosesan di peranti dan privasi.
AI dalam seni: Contoh menarik: pada Nov 2024 Sotheby’s menjual lukisan pertama oleh robot humanoid.
Potret Alan Turing yang dilukis oleh robot berkuasa AI Ai-Da mencapai harga AS$1.08 juta.
Jualan rekod ini (“A.I. God: Portrait of Alan Turing”) menegaskan peranan AI yang semakin berkembang dalam kreativiti dan impak budaya.

Secara keseluruhan, model generatif mendemokrasikan kreativiti: sesiapa sahaja kini boleh menghasilkan seni, muzik atau video dengan beberapa patah perkataan.
Fokus industri telah beralih daripada sekadar keunikan (imej surreal) kepada penjanaan imej yang berguna (logo, rajah, peta) dan realisme seperti manusia.

(Pada Mac 2025 OpenAI juga melancarkan “4o Image Generation”, menggabungkan model imej terbaiknya ke dalam GPT-4o untuk hasil fotorealistik tepat yang dipandu oleh perbualan.)

Alat ini dengan pantas disepadukan ke dalam aplikasi, pelayar, dan aliran kerja kreatif.

Kemajuan AI Multimodal & Kreatif

AI dalam Sains, Perubatan dan Matematik

Pencapaian AI telah memacu penemuan saintifik dan kemajuan penyelidikan:

AlphaFold 3 – biomolekul: Pada Nov 2024 Google DeepMind (bersama Isomorphic Labs) memperkenalkan AlphaFold 3, model baru yang meramalkan struktur 3D semua biomolekul (protein, DNA, RNA, ligan, dan lain-lain) serentak, dengan ketepatan yang belum pernah dicapai.
Bagi interaksi protein-ubat, AlphaFold 3 kira-kira 50% lebih tepat daripada kaedah tradisional.
Penciptanya segera melancarkan AlphaFold Server percuma supaya penyelidik di seluruh dunia boleh meramalkan struktur molekul.
Ini memperluaskan ramalan protein sahaja AlphaFold 2 dan dijangka mengubah penemuan ubat dan penyelidikan genomik.
Hadiah Nobel – Lipatan Protein: Kepentingan kemajuan ini diserlahkan dengan Hadiah Nobel Kimia 2024.
Demis Hassabis dan John Jumper (DeepMind) berkongsi hadiah (bersama David Baker) atas pembangunan AlphaFold (AI lipatan protein).
Jawatankuasa Nobel menyatakan AlphaFold “membuka kemungkinan baharu sepenuhnya” dalam reka bentuk protein.
(Ini antara pencapaian AI paling terkenal setakat ini.)
AlphaProteo – reka bentuk ubat: Juga pada 2024, DeepMind mengumumkan AlphaProteo, AI yang mereka pengikat protein baharu – molekul yang mengikat protein sasaran dengan kekuatan tinggi.
AlphaProteo boleh mempercepat penciptaan antibodi, biosensor dan petunjuk ubat baharu dengan menjana struktur protein yang menjanjikan untuk sasaran tertentu.
Matematik – AlphaGeometry: DeepMind’s AlphaGeometry dan AlphaProof mencatatkan satu lagi pencapaian.
Pada Julai 2024, AlphaGeometry 2 menyelesaikan masalah dari Olimpik Matematik Antarabangsa dalam 19 saat, mencapai tahap pemenang pingat perak.
Ini kes jarang AI menangani matematik sekolah menengah lanjutan.
Pengkomputeran kuantum – AlphaQubit & Willow: AI juga memperbaiki perkakasan canggih.
Pada 2024 Google mengumumkan AlphaQubit, penyahkod berasaskan AI yang mengenal pasti kesilapan dalam komputer kuantum (contohnya cip Sycamore Google) jauh lebih baik daripada kaedah terdahulu.
Kemudian pada Dis 2024 Google memperkenalkan Willow, cip kuantum baru yang, menggunakan pembetulan ralat maju, menyelesaikan tugasan penanda aras dalam masa kurang 5 minit yang memerlukan superkomputer terbaik hari ini ~10^24 tahun.
Pencapaian ini memenangi anugerah “Penemuan Fizik Tahun 2024”, menonjolkan peranan AI dalam kemajuan kuantum.

Dalam bidang perubatan dan kesihatan, model AI juga mencatat kemajuan. Contohnya, Med-Gemini Google yang baharu (disesuaikan dengan data perubatan) memperoleh skor 91.1% dalam penanda aras peperiksaan perubatan AS (gaya USMLE), mengatasi model terdahulu dengan margin besar.

Alat berasaskan AI untuk radiologi dan patologi (contohnya Derm dan Path Foundations) dilancarkan untuk meningkatkan analisis imej.
Secara keseluruhan, AI kini menjadi rakan penyelidikan yang tidak ternilai – daripada pemetaan otak manusia pada skala nano (dengan pengimejan EM dibantu AI) hingga mempercepat saringan TB di Afrika, seperti dilaporkan oleh penyelidik Google.

$AI dalam Sains, Perubatan dan Matematik$

AI dalam Robotik dan Automasi

Robot yang dikuasakan AI sedang mempelajari tugas dunia sebenar yang kompleks.

Robot humanoid Optimus Tesla dipertontonkan secara awam pada Oktober 2024 (acara “We, Robot”). Beberapa puluh unit Optimus berjalan, berdiri dan malah menari di atas pentas – walaupun laporan kemudian menyatakan demo awal sebahagiannya dikawal jauh oleh manusia.

Namun, acara itu menonjolkan kemajuan pesat ke arah robot serbaguna.

Robot ALOHA DeepMind: Makmal AI Google mencatat kemajuan mengagumkan dalam robot domestik.
Pada 2024 robot ALOHA (Pembantu Rumah Berkaki Autonomi) belajar mengikat tali kasut, menggantung baju, membaiki robot lain, memasang gear dan membersihkan dapur hanya menggunakan perancangan dan penglihatan AI.
“ALOHA Unleashed” sumber terbuka menunjukkan robot mengkoordinasi dua lengan untuk tugasan, pertama kali dalam manipulasi serbaguna.
Transformer Robotik: DeepMind memperkenalkan RT-2 (Robotic Transformer 2), model visi-bahasa-tindakan yang boleh belajar daripada imej internet dan data robot sebenar.
RT-2 membolehkan robot mentafsir arahan seperti manusia dengan memanfaatkan pengetahuan web.
Ia dipertontonkan membantu robot menyusun objek mengikut arahan teks.
Robot industri: Syarikat lain juga maju: Boston Dynamics terus memperbaiki robot Atlas dan Spot (walaupun tiada pencapaian utama tunggal), dan kenderaan autonomi berkuasa AI bertambah baik (Beta Pemanduan Sendiri Tesla diperluaskan, walaupun autonomi penuh masih belum tercapai).
Dalam pembuatan, syarikat berfokus AI seperti Figure AI mengumpul dana untuk membina robot rumah untuk tugasan harian.

Usaha ini menunjukkan robot melakukan tugasan semakin sukar tanpa pengaturcaraan eksplisit. Namun, robot humanoid sepenuhnya autonomi sebenar masih dalam perancangan masa depan.

Demo (Optimus, ALOHA, RT-2) adalah mercu tanda, tetapi penyelidik memberi amaran masih banyak kerja sebelum robot boleh bekerja dengan selamat dan boleh dipercayai bersama manusia secara meluas.

AI dalam Robotik dan Automasi

AI dalam Produk, Industri dan Masyarakat

Impak AI meluas kepada produk harian dan juga dasar:

Peranti pengguna: Produk teknologi utama menggabungkan agen AI.
Copilot Microsoft (terbenam dalam Windows, Office, Bing) dan Bard/Bard AI Google dalam Carian (dengan Gemini di belakangnya) membawa kuasa LLM kepada pengguna.
Peranti Apple mendapat Apple Intelligence (seperti di atas) dan pengeluar perkakasan seperti Nvidia menjual jumlah GPU AI rekod, menyokong AI awan dan pengguna.
(Nvidia menjadi syarikat paling bernilai dunia pada 2024 berikutan ledakan AI.)
Peraturan – Akta AI EU: Mencerminkan jangkauan AI, pengawal selia turut bertindak.
Pada 1 Ogos 2024 Akta AI EU berkuat kuasa, undang-undang AI komprehensif pertama.
Ia menetapkan rangka kerja berasaskan risiko: AI risiko rendah (penapis spam, permainan video) mempunyai peraturan minimum; peraturan ketelusan memaksa sistem AI seperti chatbot mendedahkan mereka adalah AI; AI risiko tinggi (alat perubatan atau pengambilan pekerja) dikenakan pengawasan ketat; dan AI yang jelas tidak boleh diterima (contohnya “penilaian sosial” individu oleh kerajaan) diharamkan.
Set peraturan ini (bersama garis panduan akan datang untuk model serbaguna) adalah pencapaian besar dalam tadbir urus AI dan dijangka mempengaruhi piawaian di seluruh dunia.
Pertumbuhan industri: Sektor AI mencatat pembiayaan dan penilaian bersejarah: OpenAI mencapai penilaian dilaporkan $157 bilion pada akhir 2023, dan syarikat seperti Anthropic, Inflection dan startup AI China mengumpul pusingan dana berbilion dolar.
Permintaan perkakasan AI NVIDIA melonjakkan nilai pasaran melebihi $3.5 trilion menjelang pertengahan 2024.
Angka ini menegaskan bagaimana AI menjadi teras ekonomi teknologi.