ในช่วงหลายปีที่ผ่านมา (2023–2025) ปัญญาประดิษฐ์ได้ก้าวกระโดดไปข้างหน้าในหลายด้าน โมเดลภาษาขนาดใหญ่ (LLMs) และแชทบอท ระบบมัลติโมดอล เครื่องมือ AI ทางวิทยาศาสตร์ และหุ่นยนต์ต่างก็มีความก้าวหน้าอย่างโดดเด่น
บริษัทยักษ์ใหญ่ด้านเทคโนโลยีได้เปิดตัวผู้ช่วย AI ใหม่ ชุมชนโอเพนซอร์สเผยแพร่โมเดลที่ทรงพลัง และแม้แต่หน่วยงานกำกับดูแลก็เริ่มดำเนินมาตรการเพื่อรับมือกับผลกระทบของ AI
ด้านล่างนี้เราจะสำรวจความสำเร็จที่โดดเด่นที่สุด ตั้งแต่การขยาย GPT-4 และ Google Gemini ไปจนถึงรางวัลโนเบลของ AlphaFold และการค้นพบทางวิทยาศาสตร์และศิลปะที่ขับเคลื่อนด้วย AI
โมเดลภาษาสร้างสรรค์และแชทบอท
โมเดลภาษาขนาดใหญ่สมัยใหม่มีความสามารถมากขึ้นและรองรับมัลติโมดอล OpenAI เปิดตัว GPT-4 Turbo (พฤศจิกายน 2023) ที่สามารถประมวลผล 128,000 โทเค็น ในคำสั่งเดียว (ประมาณ 300 หน้า) และมีต้นทุนการใช้งานต่ำกว่า GPT-4 อย่างมาก
ในเดือนพฤษภาคม 2024 OpenAI เปิดตัว GPT-4o (Omni) โมเดลอัปเกรดที่รองรับข้อความ รูปภาพ และเสียง แบบเรียลไทม์ ซึ่งทำให้ GPT-4 มีความสามารถในการ “มองเห็นและได้ยิน” ในการสนทนา ChatGPT เองก็มีฟีเจอร์ภาพและเสียงในตัว ผู้ใช้สามารถอัปโหลดภาพหรือพูดคุยกับบอท และบอทจะตอบกลับตามข้อมูลภาพหรือเสียงนั้น
- GPT-4 Turbo และ GPT-4o (Omni): GPT-4 Turbo (พฤศจิกายน 2023) ลดต้นทุนและขยายความยาวบริบทเป็น 128K โทเค็น GPT-4o (พฤษภาคม 2024) ทำให้ AI รองรับมัลติโมดอลอย่างแท้จริง สร้างข้อความ เสียง และภาพได้อย่างรวดเร็วใกล้เคียงมนุษย์
- ความก้าวหน้าของ ChatGPT: ภายในปลายปี 2023 ChatGPT “สามารถมองเห็น ได้ยิน และพูดได้” – รองรับการอัปโหลดภาพและเสียงเป็นคำสั่ง และบอทสามารถตอบสนองตามนั้น
นอกจากนี้ยังผสานรวม DALL·E 3 (ตุลาคม 2023) เพื่อสร้างภาพจากข้อความด้วยการสนทนาเชิงนำทาง - ชุด Gemini ของ Google: ในเดือนธันวาคม 2024 Google DeepMind เปิดตัวโมเดล Gemini 2.0 รุ่นแรก (“Flash” และต้นแบบ) ที่ออกแบบมาสำหรับ “ยุคตัวแทน” – AI ที่สามารถทำงานหลายขั้นตอนโดยอัตโนมัติ
Google เริ่มทดสอบ Gemini 2.0 ใน Search (AI Overviews) และผลิตภัณฑ์อื่น ๆ สำหรับผู้ใช้กว่าพันล้านคน สะท้อนถึงความสามารถในการวิเคราะห์และมัลติโมดอลที่พัฒนาขึ้น - โมเดลอื่น ๆ: Meta เปิดตัว LLaMA 3 ในเดือนเมษายน 2024 (โมเดล LLM แบบเปิดน้ำหนักสูงสุด 400 พันล้านพารามิเตอร์) โดยอ้างว่าสามารถทำงานได้ดีกว่าโมเดลก่อนหน้า
Anthropic กับ Claude 3 และเครื่องมือ copilot ของ Microsoft ก็พัฒนาต่อยอดจากความก้าวหน้าเหล่านี้ (เช่น Copilot ที่สร้างบนเทคโนโลยีของ OpenAI)
นวัตกรรมเหล่านี้ช่วยให้ผู้ช่วย AI สามารถสนทนาได้ยาวนานและลึกซึ้งขึ้น รวมถึงรองรับข้อมูลป้อนเข้าหลากหลายรูปแบบ
ยังช่วยขับเคลื่อนแอป “ผู้ช่วย” ใหม่ ๆ ผ่าน API (เช่น Google “AI Overviews”, OpenAI Assistants API) ทำให้ AI เข้าถึงได้ง่ายขึ้นสำหรับนักพัฒนาและผู้ใช้ทั่วไป
ความก้าวหน้าของ AI มัลติโมดอลและสร้างสรรค์
ความคิดสร้างสรรค์และความเข้าใจภาพของ AI พัฒนาอย่างก้าวกระโดด โมเดลแปลงข้อความเป็นภาพ และ แปลงข้อความเป็นวิดีโอ ได้ก้าวสู่ระดับใหม่:
OpenAI เปิดตัว DALL·E 3 (ตุลาคม 2023) ที่สร้างภาพถ่ายสมจริงจากคำสั่ง และผสานรวมกับ ChatGPT เพื่อช่วยเขียนคำสั่งอย่างมีประสิทธิภาพ
Google เปิดตัว Imagen 3 (ตุลาคม 2024) และ Veo 2 (ธันวาคม 2024) ซึ่งเป็นเครื่องมือแปลงข้อความเป็นภาพและวิดีโอที่ล้ำสมัย ช่วยเพิ่มคุณภาพ รายละเอียด และความสม่ำเสมอในการสร้างสรรค์ศิลปะและวิดีโอด้วย AI อย่างมาก
แม้แต่ AI ดนตรีก็พัฒนาด้วยเครื่องมือ MusicFX ของ Google และงานวิจัยที่เกี่ยวข้อง (เช่น การทดลอง MusicLM)
- โมเดลศิลปะสร้างสรรค์: DALL·E 3 และ Imagen 3 สามารถทำตามคำสั่งละเอียดอ่อน (รวมถึงข้อความฝังในภาพ) ได้อย่างแม่นยำ
Google Veo 2 สามารถสร้างคลิปวิดีโอสั้นจากคำอธิบายข้อความเพียงคำเดียว ซึ่งเป็นก้าวสำคัญของการสังเคราะห์วิดีโอ
Stable Diffusion และ Midjourney ก็ปล่อยเวอร์ชันใหม่ (v3, v6) ที่สมจริงขึ้นในปีนี้ - AI ในอุปกรณ์: Apple เปิดตัว Apple Intelligence (ใน iOS 18 และ macOS 15 ปลายปี 2024) ซึ่งเป็น AI สร้างสรรค์ในตัวเครื่อง iPhone/iPad/Mac
เพิ่มผู้ช่วยเขียน (แก้ไข เขียนใหม่ สรุปใน Mail/Pages), Siri ที่ฉลาดขึ้น และเครื่องมือภาพอย่าง Image Playground (สร้างภาพประกอบสนุก ๆ ผ่านข้อความ) และ Genmoji (อิโมจิที่สร้างด้วย AI)
ฟีเจอร์ค้นหาภาพด้วยภาษาธรรมชาติ (“ค้นหา Maya เล่นสเก็ตบอร์ด”) และ AI “Clean Up” ลบวัตถุที่ไม่ต้องการออกจากภาพ
Apple เน้นการประมวลผลบนอุปกรณ์และความเป็นส่วนตัว - AI ในศิลปะ: ตัวอย่างที่น่าประทับใจ: ในเดือนพฤศจิกายน 2024 Sotheby’s ขายภาพวาดชิ้นแรกที่สร้างโดยหุ่นยนต์มนุษย์
ภาพเหมือน Alan Turing ที่วาดโดยหุ่นยนต์ AI Ai-Da ขายได้ถึง 1.08 ล้านดอลลาร์สหรัฐ
การขายที่ทำลายสถิตินี้ (“A.I. God: Portrait of Alan Turing”) เน้นย้ำบทบาทที่เพิ่มขึ้นของ AI ในความคิดสร้างสรรค์และผลกระทบทางวัฒนธรรม
โดยรวมแล้ว โมเดลสร้างสรรค์กำลังทำให้ความคิดสร้างสรรค์เป็นเรื่องที่ทุกคนเข้าถึงได้: ใคร ๆ ก็สามารถสร้างงานศิลปะ ดนตรี หรือวิดีโอได้ด้วยคำสั่งไม่กี่คำ
อุตสาหกรรมได้เปลี่ยนโฟกัสจากความแปลกใหม่ (ภาพเหนือจริง) ไปสู่การสร้างภาพที่ มีประโยชน์ (โลโก้ แผนภูมิ แผนที่) และสมจริงเหมือนมนุษย์
(ในเดือนมีนาคม 2025 OpenAI ยังเปิดตัว “4o Image Generation” ที่ผสานโมเดลภาพที่ดีที่สุดเข้ากับ GPT-4o เพื่อสร้างภาพถ่ายสมจริงที่แม่นยำโดยใช้การสนทนาเป็นแนวทาง)
เครื่องมือเหล่านี้กำลังถูกผนวกเข้ากับแอป เบราว์เซอร์ และกระบวนการสร้างสรรค์อย่างรวดเร็ว
AI ในวิทยาศาสตร์ การแพทย์ และคณิตศาสตร์
ความสำเร็จของ AI ได้ช่วยเร่งการค้นพบและความก้าวหน้าทางวิทยาศาสตร์:
- AlphaFold 3 – ชีวโมเลกุล: ในเดือนพฤศจิกายน 2024 Google DeepMind (ร่วมกับ Isomorphic Labs) เปิดตัว AlphaFold 3 โมเดลใหม่ที่ทำนายโครงสร้าง 3 มิติของ ชีวโมเลกุลทุกชนิด (โปรตีน, DNA, RNA, ลิแกนด์ ฯลฯ) พร้อมกัน ด้วยความแม่นยำที่ไม่เคยมีมาก่อน
สำหรับปฏิสัมพันธ์ระหว่างโปรตีนกับยา AlphaFold 3 มีความแม่นยำสูงกว่าวิธีดั้งเดิมประมาณ 50%
ผู้พัฒนาได้เปิดให้บริการ AlphaFold Server ฟรีเพื่อให้นักวิจัยทั่วโลกสามารถทำนายโครงสร้างโมเลกุลได้
โมเดลนี้ต่อยอดจาก AlphaFold 2 ที่ทำนายเฉพาะโปรตีน และคาดว่าจะเปลี่ยนแปลงวงการค้นคว้ายาและจีโนมิกส์อย่างมาก - รางวัลโนเบล – การพับโปรตีน: ความสำคัญของความก้าวหน้านี้ได้รับการยืนยันด้วยรางวัลโนเบลเคมีปี 2024
Demis Hassabis และ John Jumper (DeepMind) ร่วมกับ David Baker ได้รับรางวัลสำหรับการพัฒนา AlphaFold (AI พับโปรตีน)
คณะกรรมการโนเบลชี้ว่า AlphaFold “เปิดโอกาสใหม่อย่างสิ้นเชิง” ในการออกแบบโปรตีน
(นี่คือหนึ่งในความสำเร็จของ AI ที่ได้รับความสนใจสูงสุดจนถึงปัจจุบัน) - AlphaProteo – การออกแบบยา: ในปี 2024 DeepMind ยังประกาศ AlphaProteo AI ที่ ออกแบบโปรตีนจับเป้าหมายใหม่ ซึ่งเป็นโมเลกุลที่จับกับโปรตีนเป้าหมายได้อย่างแข็งแรง
AlphaProteo ช่วยเร่งการสร้างแอนติบอดีใหม่ เซ็นเซอร์ชีวภาพ และตัวยานำ โดยสร้างโครงสร้างโปรตีนที่มีแนวโน้มดีสำหรับเป้าหมายที่กำหนด - คณิตศาสตร์ – AlphaGeometry: DeepMind’s AlphaGeometry และ AlphaProof แสดงความก้าวหน้าอีกครั้ง
ในเดือนกรกฎาคม 2024 AlphaGeometry 2 แก้ปัญหาจากการแข่งขัน International Mathematical Olympiad ได้ใน 19 วินาที เทียบเท่าระดับเหรียญเงิน
นี่เป็นกรณีที่หายากของ AI ที่แก้โจทย์คณิตศาสตร์ระดับมัธยมปลายขั้นสูง - คอมพิวเตอร์ควอนตัม – AlphaQubit และ Willow: AI ยังช่วยพัฒนาฮาร์ดแวร์ล้ำสมัย
ในปี 2024 Google ประกาศ AlphaQubit ตัวถอดรหัส AI ที่ตรวจจับข้อผิดพลาดในคอมพิวเตอร์ควอนตัม (เช่น ชิป Sycamore ของ Google) ได้ดีกว่าวิธีเดิมมาก
จากนั้นในเดือนธันวาคม 2024 Google เปิดตัว Willow ชิปควอนตัมใหม่ที่ใช้การแก้ไขข้อผิดพลาดขั้นสูง สามารถแก้โจทย์มาตรฐานภายใน 5 นาที ซึ่งซูเปอร์คอมพิวเตอร์ที่ดีที่สุดในปัจจุบันต้องใช้เวลาประมาณ 10^24 ปี
ความสำเร็จนี้ทำให้ Willow ได้รับรางวัล “ความก้าวหน้าทางฟิสิกส์แห่งปี 2024” เน้นย้ำบทบาทของ AI ในความก้าวหน้าควอนตัม
ในด้านการแพทย์และสุขภาพ โมเดล AI ก็มีความก้าวหน้าเช่นกัน ตัวอย่างเช่น Google เปิดตัว Med-Gemini ที่ปรับแต่งด้วยข้อมูลทางการแพทย์ ทำคะแนนได้ 91.1% ในการสอบมาตรฐานทางการแพทย์ของสหรัฐ (แบบ USMLE) ซึ่งสูงกว่ารุ่นก่อนอย่างมาก
เครื่องมือ AI สำหรับรังสีวิทยาและพยาธิวิทยา (เช่น Derm และ Path Foundations) ถูกปล่อยออกมาเพื่อช่วยวิเคราะห์ภาพ
โดยรวมแล้ว AI กลายเป็นพันธมิตรสำคัญในการวิจัย ตั้งแต่การทำแผนที่สมองมนุษย์ในระดับนาโน (ด้วยการถ่ายภาพ EM ที่ช่วยโดย AI) ไปจนถึงการเร่งการตรวจคัดกรองวัณโรคในแอฟริกา ตามรายงานของนักวิจัย Google
AI ในหุ่นยนต์และระบบอัตโนมัติ
หุ่นยนต์ที่ขับเคลื่อนด้วย AI กำลังเรียนรู้การทำงานที่ซับซ้อนในโลกจริง
หุ่นยนต์มนุษย์ Tesla Optimus ถูกสาธิตต่อสาธารณะในเดือนตุลาคม 2024 (งาน “We, Robot”) โดยมีหุ่นยนต์ Optimus หลายสิบตัวเดิน ยืน และเต้นบนเวที แม้ว่ารายงานภายหลังจะระบุว่าการสาธิตในช่วงแรกบางส่วนถูกควบคุมระยะไกลโดยมนุษย์
อย่างไรก็ตาม งานนี้แสดงให้เห็นถึงความก้าวหน้าอย่างรวดเร็วสู่หุ่นยนต์อเนกประสงค์
- หุ่นยนต์ ALOHA ของ DeepMind: ห้องปฏิบัติการ AI ของ Google ทำความก้าวหน้าอย่างน่าประทับใจในหุ่นยนต์สำหรับใช้ในบ้าน
ในปี 2024 หุ่นยนต์ ALOHA (Autonomous Legged Household Assistant) เรียนรู้ที่จะ ผูกเชือกรองเท้า แขวนเสื้อ ซ่อมหุ่นยนต์ตัวอื่น ใส่เกียร์ และแม้แต่ทำความสะอาดครัว โดยใช้เพียงการวางแผนและการมองเห็นของ AI
โครงการ “ALOHA Unleashed” ที่เปิดซอร์สเผยให้เห็นหุ่นยนต์ที่ประสานงานแขนสองข้างเพื่อทำงาน ซึ่งเป็นครั้งแรกของการจัดการอเนกประสงค์ - Robotic Transformers: DeepMind เปิดตัว RT-2 (Robotic Transformer 2) โมเดลภาพ-ภาษา-การกระทำที่สามารถ เรียนรู้จากภาพอินเทอร์เน็ตและข้อมูลหุ่นยนต์จริง
RT-2 ช่วยให้หุ่นยนต์ตีความคำสั่งเหมือนมนุษย์โดยใช้ความรู้จากเว็บ
มีการสาธิตช่วยหุ่นยนต์จัดเรียงวัตถุตามคำสั่งข้อความ - หุ่นยนต์ในอุตสาหกรรม: บริษัทอื่น ๆ ก็มีความก้าวหน้าเช่นกัน Boston Dynamics ปรับปรุงหุ่นยนต์ Atlas และ Spot ต่อเนื่อง (แม้ไม่มีความก้าวหน้าที่โดดเด่น) และยานยนต์ไร้คนขับที่ขับเคลื่อนด้วย AI ก็พัฒนาขึ้น (Tesla Full Self-Driving Beta ขยายการใช้งาน แม้ยังไม่บรรลุอิสระเต็มที่)
ในภาคการผลิต บริษัทที่เน้น AI อย่าง Figure AI ระดมทุนเพื่อสร้างหุ่นยนต์ทำงานบ้าน
ความพยายามเหล่านี้แสดงให้เห็นว่าหุ่นยนต์สามารถทำงานที่ยากขึ้นเรื่อย ๆ โดยไม่ต้องเขียนโปรแกรมเฉพาะ แต่หุ่นยนต์มนุษย์ที่ทำงานได้อย่างอิสระเต็มรูปแบบยังอยู่ในอนาคต
การสาธิต (Optimus, ALOHA, RT-2) เป็นก้าวสำคัญ แต่ผู้วิจัยเตือนว่ายังมีงานอีกมากก่อนที่หุ่นยนต์จะทำงานร่วมกับมนุษย์ได้อย่างปลอดภัยและเชื่อถือได้ในวงกว้าง
AI ในผลิตภัณฑ์ อุตสาหกรรม และสังคม
ผลกระทบของ AI ขยายไปสู่ผลิตภัณฑ์ในชีวิตประจำวันและนโยบายสาธารณะ:
- อุปกรณ์สำหรับผู้บริโภค: ผลิตภัณฑ์เทคโนโลยีหลักหลายรายการผสานรวมตัวแทน AI
Microsoft Copilot (ฝังใน Windows, Office, Bing) และ Google Bard/Bard AI ใน Search (ขับเคลื่อนด้วย Gemini) นำพลังของ LLM สู่ผู้ใช้
อุปกรณ์ของ Apple ได้รับ Apple Intelligence (ตามที่กล่าวข้างต้น) และผู้ผลิตฮาร์ดแวร์อย่าง Nvidia ขาย GPU สำหรับ AI ได้จำนวนมากเป็นประวัติการณ์ สนับสนุนทั้งคลาวด์และ AI สำหรับผู้บริโภค
(Nvidia กลายเป็นบริษัทที่มีมูลค่ามากที่สุดในโลกในปี 2024 จากบูม AI) - กฎระเบียบ – EU AI Act: สะท้อนถึงการเข้าถึงของ AI หน่วยงานกำกับดูแลก็ลงมือดำเนินการ
เมื่อวันที่ 1 สิงหาคม 2024 กฎหมาย EU AI Act มีผลบังคับใช้ เป็นกฎหมาย AI ฉบับแรกที่ครอบคลุมอย่างครบถ้วน
กฎหมายนี้กำหนดกรอบความเสี่ยง: AI ความเสี่ยงต่ำ (เช่น ตัวกรองสแปม เกมวิดีโอ) มีกฎน้อยที่สุด; กฎความโปร่งใส บังคับให้ระบบ AI เช่น แชทบอทต้องเปิดเผยว่าตนเป็น AI; AI ความเสี่ยงสูง (เช่น เครื่องมือแพทย์หรือการจ้างงาน) ต้องได้รับการควบคุมอย่างเข้มงวด; และ AI ที่ ไม่ยอมรับได้ (เช่น “การให้คะแนนทางสังคม” โดยรัฐบาล) ถูกห้ามใช้
ชุดกฎนี้ (พร้อมแนวทางสำหรับโมเดลทั่วไปที่กำลังจะมา) ถือเป็นความสำเร็จครั้งใหญ่ในการกำกับดูแล AI และน่าจะมีอิทธิพลต่อมาตรฐานทั่วโลก - การเติบโตของอุตสาหกรรม: ภาค AI เองได้รับเงินทุนและมูลค่าทางการตลาดที่สูงเป็นประวัติการณ์: OpenAI มีมูลค่าประเมินที่ 157 พันล้านดอลลาร์ปลายปี 2023 และบริษัทอย่าง Anthropic, Inflection และสตาร์ทอัพ AI ของจีนระดมทุนได้หลายพันล้านดอลลาร์
ความต้องการฮาร์ดแวร์ AI ของ NVIDIA ทำให้มูลค่าตลาดสูงกว่า 3.5 ล้านล้านดอลลาร์กลางปี 2024
ตัวเลขเหล่านี้สะท้อนว่า AI กลายเป็นหัวใจสำคัญของเศรษฐกิจเทคโนโลยี
>>> คุณเคยลอง: การเปรียบเทียบปัญญาประดิษฐ์กับสติปัญญามนุษย์ ?
สรุปได้ว่า AI ไม่ได้จำกัดอยู่แค่ในห้องทดลองหรือการสาธิตแปลกใหม่อีกต่อไป แต่ฝังตัวอยู่ในโทรศัพท์ รถยนต์ สถานที่ทำงาน และนโยบายสาธารณะ
ความก้าวหน้าข้างต้น – ตั้งแต่ความรู้กว้างขวางของ GPT-4 ไปจนถึงการปฏิวัติทางวิทยาศาสตร์ของ AlphaFold – แสดงให้เห็นถึงการเติบโตอย่างรวดเร็วของ AI
เมื่อเราก้าวเข้าสู่ปี 2025 ความสำเร็จเหล่านี้เป็นสัญญาณของการประยุกต์ใช้ AI ที่ทรงพลังและใช้งานได้จริงมากขึ้นในชีวิตประจำวันของเรา