בשנים רבות (2023–2025), הבינה המלאכותית קפצה קדימה במגוון תחומים. דגמי שפה גדולים (LLMs) וצ׳אטבוטים, מערכות מולטימודליות, כלים מדעיים מבוססי AI ורובוטיקה כולם חוו פריצות דרך.
ענקיות הטכנולוגיה השיקו עוזרי AI חדשים, קהילות קוד פתוח פרסמו דגמים רבי עוצמה, ואפילו רגולטורים החלו להתמודד עם השפעות ה-AI.
להלן סקירה של ההישגים הבולטים ביותר, מהרחבות GPT-4 וג׳מיני של גוגל ועד פרס נובל של AlphaFold וגילויים מונעי AI במדע ובאמנות.
דגמי שפה גנרטיביים וצ׳אטבוטים
דגמי השפה המודרניים הפכו ליכולים בהרבה והפכו למולטימודליים. GPT-4 Turbo של OpenAI (הוכרז בנובמבר 2023) מסוגל כעת לעבד 128,000 טוקנים בהזמנה אחת (כ-300 עמודי טקסט) והוא זול בהרבה להפעלה מ-GPT-4.
במאי 2024 הציגה OpenAI את GPT-4o (Omni), דגם משודרג המטפל בטקסט, תמונות ואודיו בזמן אמת – מה שמעניק ל-GPT-4 יכולות שיחה עם "ראייה ושמיעה". צ׳אטGPT עצמו כולל כעת תכונות מובנות לתמונות וקול: משתמשים יכולים להעלות תמונות או לדבר עם הבוט, והוא יגיב בהתאם לקלט הוויזואלי או הקולי.
- GPT-4 Turbo ו-GPT-4o (Omni): GPT-4 Turbo (נובמבר 2023) הוריד עלויות והאריך את אורך ההקשר ל-128K טוקנים. GPT-4o (מאי 2024) הפך את ה-AI למולטימודלי אמיתי, מייצר טקסט, דיבור ותמונות במהירות כמעט אנושית.
- התקדמות ChatGPT: בסוף 2023, ChatGPT "יכול כעת לראות, לשמוע ולדבר" – ניתן להעלות תמונות ואודיו או לדבר כהנחיות, והבוט יענה בהתאם.
הוא גם שילב את DALL·E 3 (אוקטובר 2023) כך שיוכל ליצור תמונות מטקסט בעזרת הנחיות שיחה. - סדרת גוגל ג׳מיני: בדצמבר 2024, Google DeepMind השיקה את דגמי Gemini 2.0 הראשונים ("Flash" ופרוטוטיפים) המיועדים ל"עידן הסוכנות" – AI שיכול לבצע משימות מורכבות באופן עצמאי.
גוגל כבר החלה לבדוק את Gemini 2.0 בחיפוש (AI Overviews) ובמוצרים נוספים למעל מיליארד משתמשים, מה שמשקף את יכולות ההסקה והמולטימודליות המשודרגות שלו. - דגמים נוספים: Meta שחררה את LLaMA 3 באפריל 2024 (דגמי LLM פתוחים במשקל עד 400 מיליארד פרמטרים) וטוענת שהוא עולה על דגמים קודמים רבים.
Anthropic עם Claude 3 וכלי הקופיילוט של מיקרוסופט גם הם התבססו על ההתקדמות הזו (למשל, Copilot מבוסס טכנולוגיית OpenAI).
החידושים הללו מאפשרים לעוזרי AI לנהל שיחות ארוכות ועשירות יותר ולטפל בקלטים מגוונים.
הם גם מפעילים אפליקציות "עוזר" חדשות דרך APIs (כגון "AI Overviews" של גוגל, Assistants API של OpenAI ועוד), מה שהופך את ה-AI לנגיש יותר למפתחים ולמשתמשי קצה.
התקדמות מולטימודלית ויצירתית בבינה מלאכותית
היצירתיות וההבנה הוויזואלית של ה-AI פרצו גבולות. דגמי טקסט לתמונה וטקסט לווידאו הגיעו לשיאים חדשים:
DALL·E 3 של OpenAI (אוקטובר 2023) מייצר תמונות פוטוריאליסטיות מהנחיות, ומשולב אף עם ChatGPT לכתיבת הנחיות מונחות.
גוגל הציגה את Imagen 3 (אוקטובר 2024) ואת Veo 2 (דצמבר 2024) – מנועי טקסט לתמונה וטקסט לווידאו מתקדמים – שמשפרים משמעותית את האיכות, הפרטים והעקביות ביצירת אמנות ווידאו מבוססי AI.
גם תחום המוזיקה בינה מלאכותית השתפר עם כלי MusicFX של גוגל ומחקרים נלווים (כגון ניסויי MusicLM).
- דגמי אמנות גנרטיביים: DALL·E 3 ו-Imagen 3 יכולים לעקוב אחרי הנחיות עדינות (כולל טקסט מוטמע בתמונות) בדיוק גבוה.
Veo 2 של גוגל יכול ליצור קטעי וידאו קצרים מתיאור טקסטואלי אחד, צעד משמעותי בסינתזת וידאו.
Stable Diffusion ו-Midjourney גם שחררו גרסאות חדשות (v3, v6) עם ריאליזם משופר השנה. - AI במכשירים: אפל השיקה את Apple Intelligence (ב-iOS 18 ו-macOS 15, סוף 2024) – AI גנרטיבי מובנה באייפון, אייפד ומק.
הוא מוסיף עוזרי כתיבה (עריכה, הגהה, סיכום ב-Mail/Pages), סירי חכמה יותר, וכלי תמונות כמו Image Playground (יצירת איורים מהטקסט) ו-Genmoji (אימוג׳ים מותאמים שנוצרו ב-AI).
חיפוש בשפה טבעית בתמונות ("מצא את מאיה גולשת על סקייטבורד"), ו-AI לניקוי תמונות שמסיר אובייקטים לא רצויים.
הגישה של אפל מדגישה עיבוד מקומי ושמירה על פרטיות. - AI באמנות: דוגמה בולטת: בנובמבר 2024 סותבי'ס מכרה את הציור הראשון שנוצר על ידי רובוט הומנואידי.
דיוקן של אלן טיורינג שצויר על ידי הרובוט המונע AI Ai-Da נמכר ב-1.08 מיליון דולר.
מכירה שיא זו ("A.I. God: Portrait of Alan Turing") מדגישה את התפקיד ההולך וגדל של ה-AI ביצירתיות ובהשפעה התרבותית.
בסך הכל, דגמים גנרטיביים מדמוקרטים את היצירתיות: כל אחד יכול כעת ליצור אמנות, מוזיקה או וידאו בכמה מילים.
מיקוד התעשייה עבר מ"חדשנות" בלבד (תמונות סוריאליסטיות) ליצירת תמונות שימושיות (לוגואים, דיאגרמות, מפות) וריאליזם דמוי אדם.
(במרץ 2025 OpenAI אף שחררה את "4o Image Generation", שמשלבת את דגם התמונה הטוב ביותר שלה ב-GPT-4o לתוצאות מדויקות ופוטוריאליסטיות מונחות שיחה.)
כלים אלו משתלבים במהירות באפליקציות, דפדפנים וזרימות עבודה יצירתיות.
בינה מלאכותית במדע, רפואה ומתמטיקה
הישגי AI הניעו גילויים מדעיים והתקדמות במחקר:
- AlphaFold 3 – ביומולקולות: בנובמבר 2024 חשפה Google DeepMind (בשיתוף Isomorphic Labs) את AlphaFold 3, דגם חדש שמנבא מבנים תלת-ממדיים של כל הביומולקולות (חלבונים, DNA, RNA, ליגנדים ועוד) במקביל ובדיוק חסר תקדים.
בתגובות בין חלבון לתרופה, AlphaFold 3 מדויק בכ-50% יותר משיטות מסורתיות.
יוצריו שחררו מיידית שרת AlphaFold חינמי, כך שחוקרים ברחבי העולם יכולים לנבא מבנים מולקולריים.
זה מרחיב את תחום הניבויים של AlphaFold 2 שמוקדש רק לחלבונים, וצפוי לשנות את תחום גילוי התרופות ומחקר הגנומיקה. - פרס נובל – קיפול חלבונים: חשיבות ההתקדמות הזו הוכרה בפרס נובל לכימיה לשנת 2024.
דמיס הסאביס וג׳ון ג׳אמפר (DeepMind) חלקו את הפרס (עם דיוויד בייקר) על פיתוח AlphaFold (AI לקיפול חלבונים).
ועדת הנובל ציינה כי AlphaFold "פתח אפשרויות חדשות לחלוטין" בעיצוב חלבונים.
(זהו אחד ההישגים הבולטים ביותר של AI עד כה.) - AlphaProteo – עיצוב תרופות: גם ב-2024 הודיעה DeepMind על AlphaProteo, AI שמעצבת קושרי חלבון חדשים – מולקולות שנקשרות לחלבונים במטרה עם חוזק גבוה.
AlphaProteo יכול להאיץ יצירת נוגדנים חדשים, חיישנים ביולוגיים ומובילי תרופות על ידי יצירת מבני חלבון מבטיחים למטרות ספציפיות. - מתמטיקה – AlphaGeometry: DeepMind עם AlphaGeometry ו-AlphaProof הוכיחו פריצת דרך נוספת.
ביולי 2024 פתר AlphaGeometry 2 בעיה מאולימפיאדת המתמטיקה הבינלאומית ב19 שניות, ברמת מדליית כסף.
זו דוגמה נדירה ל-AI שמתמודד עם מתמטיקה מתקדמת ברמת תיכון. - מחשוב קוונטי – AlphaQubit ו-Willow: AI שיפר גם חומרה מתקדמת.
ב-2024 הודיעה גוגל על AlphaQubit, מפענח מבוסס AI שמזהה שגיאות במחשבים קוונטיים (כגון שבבי Sycamore של גוגל) טוב בהרבה משיטות קודמות.
בדצמבר 2024 חשפה גוגל את Willow, שבב קוונטי חדש שעם תיקון שגיאות מתקדם פתר משימה מדדית בפחות מ-5 דקות, משימה שלוקחת למחשב העל הטוב ביותר כיום כ-10^24 שנים.
הישגים אלו זיכו את Willow בפרס "פריצת דרך בפיזיקה לשנת 2024", המדגיש את תפקיד ה-AI בקידום הקוונטום.
ברפואה ובבריאות, דגמי AI גם התקדמו. לדוגמה, Med-Gemini החדש של גוגל (מאומן על נתונים רפואיים) השיג ציון של 91.1% במבחן רפואי אמריקאי (בסגנון USMLE), תוך עקיפת דגמים קודמים בפער משמעותי.
כלים מבוססי AI לרדיולוגיה ופאתולוגיה (כגון Derm ו-Path Foundations) שוחררו לשיפור ניתוח תמונות.
בסך הכל, AI הפך לשותף מחקרי חיוני – ממיפוי מוח האדם בקנה מידה ננו (עם הדמיית EM בסיוע AI) ועד להאצת סינון שחפת באפריקה, כפי שדווח על ידי חוקרי גוגל.
בינה מלאכותית ברובוטיקה ואוטומציה
רובוטים מונעי AI לומדים לבצע משימות מורכבות בעולם האמיתי.
רובוטי הומנואיד Optimus של טסלה הוצגו בפומבי באוקטובר 2024 (אירוע "We, Robot"). כמה עשרות יחידות Optimus הלכו, עמדו ואפילו רקדו על הבמה – אם כי דיווחים מאוחרים יותר ציינו שהדגמות ראשוניות היו חלקית בשליטה מרחוק על ידי בני אדם.
עם זאת, האירוע הדגיש התקדמות מהירה לעבר רובוטים רב-תכליתיים.
- רובוטי ALOHA של DeepMind: מעבדת ה-AI של גוגל השיגה התקדמות מרשימה ברובוטים ביתיים.
ב-2024 למד רובוט ALOHA (עוזר בית רגלי אוטונומי) לקשור שרוכים, לתלות חולצה, לתקן רובוט אחר, להכניס גלגלי שיניים ואפילו לנקות מטבח באמצעות תכנון וראייה מבוססי AI בלבד.
פרויקט "ALOHA Unleashed" בקוד פתוח הראה רובוטים המשתמשים בשתי ידיים למשימות, לראשונה במניפולציה רב-תכליתית. - רובוטים טרנספורמרים: DeepMind הציגה את RT-2 (Robotic Transformer 2), דגם ראייה-שפה-פעולה שיכול ללמוד גם מתמונות אינטרנט וגם מנתוני רובוט אמיתיים.
RT-2 מאפשר לרובוטים לפרש הוראות כמו אדם באמצעות ידע מהרשת.
הדגמה הראתה רובוט שממיין חפצים לפי פקודות טקסט. - רובוטים תעשייתיים: חברות נוספות התקדמו: Boston Dynamics המשיכה לשפר את רובוטי Atlas ו-Spot (ללא פריצת דרך חד-משמעית), ורכבים אוטונומיים מונעי AI השתפרו (גרסת הבטא של Tesla Full Self-Driving התרחבה, אך אוטונומיה מלאה עדיין לא הושגה).
בתעשייה, חברות כמו Figure AI גייסו כספים לפיתוח רובוטים ביתיים למשימות שונות.
מאמצים אלו מראים שרובוטים מבצעים משימות קשות יותר ויותר ללא תכנות מפורש. עם זאת, רובוטים הומנואידיים אוטונומיים לחלוטין עדיין רחוקים.
ההדגמות (Optimus, ALOHA, RT-2) הן אבני דרך, אך החוקרים מזהירים שעדיין נדרש עבודה רבה לפני שרובוטים יוכלו לעבוד לצד בני אדם בבטחה ובאמינות בקנה מידה רחב.
בינה מלאכותית במוצרים, תעשייה וחברה
השפעת ה-AI מתרחבת למוצרים יומיומיים ואפילו למדיניות ציבורית:
- מכשירי צריכה: מוצרי טכנולוגיה מרכזיים שילבו סוכני AI.
Copilot של מיקרוסופט (משולב ב-Windows, Office, Bing) ו-Bard/Bard AI של גוגל בחיפוש (עם Gemini מאחוריו) הביאו את כוח ה-LLM למשתמשים.
מכשירי אפל קיבלו את Apple Intelligence (כאמור) ויצרניות חומרה כמו Nvidia מכרו שיאים של GPUs ל-AI, המפעילים גם ענן וגם AI לצרכן.
(Nvidia הפכה לחברה היקרה בעולם ב-2024 בזכות בום ה-AI.) - רגולציה – חוק ה-AI של האיחוד האירופי: בהתאם להיקף ה-AI, גם הרגולטורים פעלו.
ב-1 באוגוסט 2024 נכנס לתוקף חוק ה-AI של האיחוד האירופי, החוק המקיף הראשון בתחום ה-AI.
הוא מגדיר מסגרת מבוססת סיכון: AI בסיכון נמוך (מסנני ספאם, משחקי וידאו) כפוף לכללים מינימליים; כללי שקיפות מחייבים מערכות AI כמו צ׳אטבוטים לחשוף שהן AI; AI בסיכון גבוה (כלים רפואיים או גיוס עובדים) כפוף לפיקוח מחמיר; ו-AI בלתי מקובל (כגון "דירוג חברתי" של אנשים על ידי ממשלות) אסור.
מערך כללים זה (יחד עם הנחיות עתידיות לדגמים רב-תכליתיים) הוא הישג משמעותי בממשל AI וצפוי להשפיע על תקנים ברחבי העולם. - צמיחת התעשייה: תחום ה-AI עצמו חווה מימון והערכות שווי היסטוריות: OpenAI הגיעה להערכת שווי של 157 מיליארד דולר בסוף 2023, וחברות כמו Anthropic, Inflection וסטארטאפים סיניים גייסו סבבים במיליארדי דולרים.
הביקוש לחומרת AI של NVIDIA העלה את שווי השוק שלה ליותר מ-3.5 טריליון דולר באמצע 2024.
מספרים אלו מדגישים כיצד ה-AI הפך למרכזי בכלכלת הטכנולוגיה.
>>> האם ניסית אי פעם: השוואת בינה מלאכותית לבינה אנושית ?
בקיצור, ה-AI כבר אינו מוגבל למעבדות או הדגמות חדשניות – הוא מוטמע בטלפונים, רכבים, מקומות עבודה ומדיניות ציבורית.
ההתקדמויות שלעיל – מהידע העצום של GPT-4 ועד מהפכות המדע של AlphaFold – מדגימות את הבגרות המהירה של ה-AI.
כשאנחנו נכנסים ל-2025, הישגים אלו מצביעים על יישומי AI חזקים ומעשיים עוד יותר בחיי היומיום שלנו.