على مدى سنوات عديدة (2023–2025)، شهد الذكاء الاصطناعي قفزات كبيرة على عدة أصعدة. شهدت نماذج اللغة الكبيرة (LLMs) والدردشات الآلية، والأنظمة متعددة الوسائط، وأدوات الذكاء الاصطناعي العلمية، والروبوتات جميعها اختراقات مهمة.
أطلقت عمالقة التكنولوجيا مساعدين جدد للذكاء الاصطناعي، وأصدرت المجتمعات مفتوحة المصدر نماذج قوية، وحتى الجهات التنظيمية تحركت لمعالجة تأثير الذكاء الاصطناعي.
فيما يلي نستعرض أبرز الإنجازات اللافتة، من امتدادات GPT-4 وجيميني من جوجل إلى جائزة نوبل لألفافولد والاكتشافات المدفوعة بالذكاء الاصطناعي في العلوم والفنون.
نماذج اللغة التوليدية والدردشات الآلية
أصبحت نماذج اللغة الكبيرة الحديثة أكثر قدرة وتعددًا في الوسائط. يمكن لـ GPT-4 Turbo من OpenAI (المعلن عنه في نوفمبر 2023) الآن معالجة 128,000 رمز في طلب واحد (ما يعادل حوالي 300 صفحة نص) وهو أقل تكلفة بكثير من GPT-4.
في مايو 2024، قدمت OpenAI نموذج GPT-4o (Omni)، وهو نموذج مطور يتعامل مع النصوص والصور والصوت في الوقت الحقيقي – مما يمنح GPT-4 قدرة "الرؤية والسمع" في المحادثات. أصبح لدى ChatGPT الآن ميزات مدمجة للصور والصوت: يمكن للمستخدمين رفع الصور أو التحدث إلى الروبوت، وسيستجيب بناءً على تلك المدخلات البصرية أو الصوتية.
- GPT-4 Turbo و GPT-4o (Omni): خفض GPT-4 Turbo (نوفمبر 2023) التكاليف ووسع طول السياق إلى 128 ألف رمز. جعل GPT-4o (مايو 2024) الذكاء الاصطناعي متعدد الوسائط حقًا، مولدًا النصوص والكلام والصور بسرعة تقارب سرعة الإنسان.
- تطورات ChatGPT: بحلول أواخر 2023، أصبح بإمكان ChatGPT "الرؤية والسمع والتحدث" – يمكن رفع الصور أو الصوت كمدخلات، ويجيب الروبوت وفقًا لذلك.
كما دمج DALL·E 3 (أكتوبر 2023) ليتمكن من توليد الصور من النص بمساعدة التوجيه الحواري. - سلسلة جيميني من جوجل: في ديسمبر 2024، أطلقت Google DeepMind أول نماذج Gemini 2.0 ("فلاش" والنماذج الأولية) المصممة لعصر "الوكيل" – ذكاء اصطناعي قادر على تنفيذ مهام متعددة الخطوات بشكل مستقل.
بدأت جوجل بالفعل اختبار Gemini 2.0 في البحث (نظرات عامة على الذكاء الاصطناعي) ومنتجات أخرى لأكثر من مليار مستخدم، مما يعكس قدراته المحسنة في الاستدلال وتعدد الوسائط. - نماذج أخرى: أصدرت Meta نموذج LLaMA 3 في أبريل 2024 (نماذج مفتوحة الوزن تصل إلى 400 مليار معلمة) مدعية تفوقه على العديد من النماذج السابقة.
كما بنى كل من Claude 3 من Anthropic وأدوات المساعد من Microsoft على هذه التطورات (مثل Copilot المبني على تقنيات OpenAI).
تتيح هذه الابتكارات للمساعدين الذكاء الاصطناعي إجراء محادثات أطول وأكثر ثراءً والتعامل مع مدخلات متنوعة.
كما تدعم تطبيقات "المساعد" الجديدة عبر واجهات برمجة التطبيقات (مثل "نظرات عامة على الذكاء الاصطناعي" من جوجل، وواجهة مساعدي OpenAI)، مما يجعل الذكاء الاصطناعي أكثر وصولًا للمطورين والمستخدمين النهائيين.
التقدم في الذكاء الاصطناعي متعدد الوسائط والإبداعي
شهدت قدرة الذكاء الاصطناعي على الإبداع والفهم البصري طفرة كبيرة. وصلت نماذج تحويل النص إلى صورة وتحويل النص إلى فيديو إلى مستويات جديدة:
يولد نموذج DALL·E 3 من OpenAI (أكتوبر 2023) صورًا فوتوغرافية واقعية من التعليمات النصية، وهو مدمج أيضًا مع ChatGPT لتوجيه كتابة التعليمات.
قدمت جوجل نموذج Imagen 3 (أكتوبر 2024) وVeo 2 (ديسمبر 2024) – وهما محركات متطورة لتحويل النص إلى صورة وفيديو – تحسنت بشكل كبير في الجودة والتفاصيل والاتساق في فنون الفيديو والذكاء الاصطناعي.
حتى الذكاء الاصطناعي الموسيقي شهد تحسنًا مع أدوات MusicFX من جوجل والأبحاث ذات الصلة (مثل تجارب MusicLM).
- نماذج الفن التوليدي: يمكن لـ DALL·E 3 و Imagen 3 اتباع تعليمات دقيقة (بما في ذلك النصوص المدمجة في الصور) بدقة عالية.
يمكن لـ Veo 2 من جوجل توليد مقاطع فيديو قصيرة من وصف نصي واحد، وهو تقدم ملحوظ في توليد الفيديو.
كما أصدرت Stable Diffusion و Midjourney نسخًا جديدة (v3، v6) هذا العام مع واقعية محسنة. - الذكاء الاصطناعي في الأجهزة: أطلقت آبل Apple Intelligence (في iOS 18 و macOS 15، أواخر 2024) – ذكاء اصطناعي توليدي مدمج في iPhone/iPad/Mac.
يضيف هذا مساعدين للكتابة (إعادة صياغة، تدقيق، تلخيص في Mail/Pages)، وسيري أكثر ذكاءً، وأدوات للصور مثل Image Playground (إنشاء رسومات ممتعة عبر النص) و Genmoji (رموز تعبيرية مخصصة مولدة بالذكاء الاصطناعي).
حصلت الصور على بحث باللغة الطبيعية ("ابحث عن مايا تتزلج على اللوح")، وميزة "تنظيف" تزيل الأجسام غير المرغوب فيها من الصور.
تؤكد آبل على المعالجة المحلية والخصوصية. - الذكاء الاصطناعي في الفن: مثال بارز: في نوفمبر 2024، باعت دار سوذبي أول لوحة رسمها روبوت بشري.
لوحة بورتريه لألان تورينج رسمها الروبوت المدعوم بالذكاء الاصطناعي Ai-Da بيعت مقابل 1.08 مليون دولار أمريكي.
تسلط هذه الصفقة القياسية ("إله الذكاء الاصطناعي: بورتريه ألان تورينج") الضوء على الدور المتنامي للذكاء الاصطناعي في الإبداع وتأثيره الثقافي.
بشكل عام، تعمل النماذج التوليدية على ديمقراطية الإبداع: يمكن لأي شخص الآن توليد فن أو موسيقى أو فيديو ببضع كلمات.
تحول تركيز الصناعة من مجرد الجدة (صور سريالية) إلى توليد صور مفيدة (شعارات، مخططات، خرائط) وواقعية شبيهة بالبشر.
(في مارس 2025، أصدرت OpenAI حتى "4o Image Generation"، مدمجة أفضل نموذج صور لديها في GPT-4o لإخراج دقيق وفوتوغرافي موجه بالمحادثة.)
تُدمج هذه الأدوات بسرعة في التطبيقات والمتصفحات وسير العمل الإبداعي.
الذكاء الاصطناعي في العلوم والطب والرياضيات
ساهمت إنجازات الذكاء الاصطناعي في دفع الاكتشافات العلمية والتقدم البحثي:
- AlphaFold 3 – الجزيئات الحيوية: في نوفمبر 2024، كشفت Google DeepMind (بالتعاون مع Isomorphic Labs) عن نموذج AlphaFold 3، وهو نموذج جديد يتنبأ بالهياكل ثلاثية الأبعاد لكافة الجزيئات الحيوية (البروتينات، الحمض النووي، الحمض النووي الريبي، الروابط، وغيرها) في آن واحد، بدقة غير مسبوقة.
في تفاعلات البروتين-الدواء، يعد AlphaFold 3 أكثر دقة بنسبة 50% مقارنة بالطرق التقليدية.
أصدر مبتكروه فورًا خادم AlphaFold مجانيًا ليتمكن الباحثون حول العالم من التنبؤ بالهياكل الجزيئية.
يمثل هذا توسعًا على تنبؤات AlphaFold 2 التي كانت تقتصر على البروتينات فقط، ومن المتوقع أن يغير مجال اكتشاف الأدوية وأبحاث الجينوم. - جائزة نوبل – طي البروتين: تم التأكيد على أهمية هذا التقدم بجائزة نوبل في الكيمياء لعام 2024.
شارك ديميس هسابيس وجون جامبر (DeepMind) الجائزة (مع ديفيد بيكر) لتطوير AlphaFold (ذكاء اصطناعي لطي البروتينات).
أشارت لجنة نوبل إلى أن AlphaFold "فتح آفاقًا جديدة تمامًا" في تصميم البروتينات.
(يُعد هذا أحد أبرز إنجازات الذكاء الاصطناعي حتى الآن.) - AlphaProteo – تصميم الأدوية: في 2024، أعلنت DeepMind عن AlphaProteo، ذكاء اصطناعي يصمم روابط بروتينية جديدة – جزيئات ترتبط بالبروتينات المستهدفة بقوة عالية.
يمكن لـ AlphaProteo تسريع إنشاء أجسام مضادة جديدة، وأجهزة استشعار حيوية، ومرشحات دوائية من خلال توليد هياكل بروتينية واعدة للأهداف المحددة. - الرياضيات – AlphaGeometry: حقق DeepMind من خلال AlphaGeometry و AlphaProof اختراقًا آخر.
في يوليو 2024، حل AlphaGeometry 2 مسألة من الأولمبياد الدولي للرياضيات في 19 ثانية، محققًا مستوى الحاصل على الميدالية الفضية.
يُعد هذا حالة نادرة لتعامل الذكاء الاصطناعي مع الرياضيات المتقدمة على مستوى المدرسة الثانوية. - الحوسبة الكمومية – AlphaQubit و Willow: حسّن الذكاء الاصطناعي أيضًا الأجهزة المتطورة.
في 2024، أعلنت جوجل عن AlphaQubit، وهو فك شيفرة قائم على الذكاء الاصطناعي يحدد الأخطاء في الحواسيب الكمومية (مثل شرائح Sycamore من جوجل) بشكل أفضل بكثير من الطرق السابقة.
ثم في ديسمبر 2024، كشفت جوجل عن Willow، شريحة كمومية جديدة تستخدم تصحيح الأخطاء المتقدم، وحلت مهمة معيارية في أقل من 5 دقائق كانت ستستغرق من أفضل حاسوب فائق حالي حوالي 10^24 سنة.
حصل Willow على جائزة "اختراق الفيزياء لعام 2024"، مما يبرز دور الذكاء الاصطناعي في تقدم الحوسبة الكمومية.
في الطب والصحة، حققت نماذج الذكاء الاصطناعي تقدمًا أيضًا. على سبيل المثال، سجل نموذج جوجل الجديد Med-Gemini (المُحسّن بالبيانات الطبية) نسبة 91.1% في اختبار طبي أمريكي معياري (على غرار USMLE)، متفوقًا بفارق كبير على النماذج السابقة.
تم إصدار أدوات مدعومة بالذكاء الاصطناعي للتصوير الشعاعي والطب الشرعي (مثل Derm و Path Foundations) لتحسين تحليل الصور.
بشكل عام، أصبح الذكاء الاصطناعي شريكًا لا غنى عنه في البحث – من رسم خريطة الدماغ البشري على المستوى النانوي (بمساعدة تصوير EM المدعوم بالذكاء الاصطناعي) إلى تسريع فحص السل في أفريقيا، كما أبلغ باحثو جوجل.
الذكاء الاصطناعي في الروبوتات والأتمتة
تتعلم الروبوتات المدعومة بالذكاء الاصطناعي أداء مهام معقدة في العالم الحقيقي.
تم عرض روبوتات Optimus البشرية من تسلا علنًا في أكتوبر 2024 (فعالية "نحن، الروبوت"). مشى، وقف، ورقص عدة عشرات من وحدات Optimus على المسرح – رغم أن تقارير لاحقة أشارت إلى أن العروض الأولية كانت تُدار جزئيًا عن بُعد بواسطة البشر.
مع ذلك، أبرز الحدث التقدم السريع نحو روبوتات متعددة الأغراض.
- روبوتات ALOHA من DeepMind: حقق مختبر الذكاء الاصطناعي في جوجل تقدمًا ملحوظًا في الروبوتات المنزلية.
في 2024، تعلم روبوت ALOHA (المساعد المنزلي المستقل ذو الأرجل) ربط أربطة الحذاء، تعليق القميص، إصلاح روبوت آخر، إدخال التروس وحتى تنظيف المطبخ باستخدام التخطيط والرؤية بالذكاء الاصطناعي فقط.
أظهرت المصادر المفتوحة "ALOHA Unleashed" تنسيق الروبوت لذراعيه لأداء المهام، وهو الأول من نوعه في التلاعب متعدد الأغراض. - المحولات الروبوتية: قدمت DeepMind نموذج RT-2 (Robotic Transformer 2)، وهو نموذج رؤية-لغة-حركة يمكنه التعلم من صور الإنترنت وبيانات الروبوت الحقيقية.
يتيح RT-2 للروبوتات تفسير التعليمات كما يفعل الإنسان من خلال الاستفادة من المعرفة على الويب.
تم عرضه وهو يساعد روبوتًا في فرز الأشياء باتباع أوامر نصية. - روبوتات الصناعة: حققت شركات أخرى تقدمًا أيضًا: واصلت Boston Dynamics تحسين روبوتات Atlas و Spot (دون اختراق رئيسي)، وتحسنت المركبات الذاتية القيادة المدعومة بالذكاء الاصطناعي (شهدت نسخة بيتا للقيادة الذاتية الكاملة من تسلا انتشارًا أوسع، رغم أن الاستقلالية الكاملة لا تزال غير محققة).
في التصنيع، جمعت شركات تركز على الذكاء الاصطناعي مثل Figure AI تمويلًا لبناء روبوتات منزلية للمهام المنزلية.
تُظهر هذه الجهود قدرة الروبوتات على أداء مهام أصعب تدريجيًا دون برمجة صريحة. ومع ذلك، لا تزال الروبوتات البشرية المستقلة بالكامل في الأفق.
تُعد العروض (Optimus، ALOHA، RT-2) محطات مهمة، لكن الباحثين يحذرون من أن هناك المزيد من العمل قبل أن تتمكن الروبوتات من العمل بأمان وموثوقية جنبًا إلى جنب مع البشر على نطاق واسع.
الذكاء الاصطناعي في المنتجات والصناعة والمجتمع
يمتد تأثير الذكاء الاصطناعي إلى المنتجات اليومية وحتى السياسات:
- الأجهزة الاستهلاكية: دمجت المنتجات التقنية الكبرى وكلاء ذكاء اصطناعي.
أدخلت Microsoft مساعد Copilot (المدمج في ويندوز، أوفيس، وبينغ) وجوجل Bard/Bard AI في البحث (مدعوم بجيميني) قوة نماذج اللغة الكبيرة للمستخدمين.
حصلت أجهزة آبل على Apple Intelligence (كما ذُكر أعلاه) وباعت شركات تصنيع الأجهزة مثل Nvidia أعدادًا قياسية من وحدات معالجة الرسوميات للذكاء الاصطناعي، مما يدعم كلًا من الحوسبة السحابية والذكاء الاصطناعي للمستهلك.
(أصبحت Nvidia الشركة الأعلى قيمة في العالم عام 2024 بفضل طفرة الذكاء الاصطناعي.) - التنظيم – قانون الذكاء الاصطناعي في الاتحاد الأوروبي: نظرًا لاتساع نطاق الذكاء الاصطناعي، تحرك المنظمون أيضًا.
دخل قانون الاتحاد الأوروبي للذكاء الاصطناعي حيز التنفيذ في 1 أغسطس 2024، وهو أول قانون شامل للذكاء الاصطناعي.
يضع إطارًا قائمًا على المخاطر: الذكاء الاصطناعي منخفض المخاطر (مثل مرشحات البريد المزعج، ألعاب الفيديو) يخضع لقواعد بسيطة؛ وقواعد الشفافية تجبر أنظمة الذكاء الاصطناعي مثل الدردشات الآلية على الإفصاح عن كونها ذكاء اصطناعي؛ والذكاء الاصطناعي عالي المخاطر (مثل الأدوات الطبية أو التوظيف) يخضع لرقابة صارمة؛ والذكاء الاصطناعي غير المقبول بوضوح (مثل "التقييم الاجتماعي" للأفراد من قبل الحكومات) محظور.
تشكل هذه القواعد (إلى جانب الإرشادات القادمة للنماذج متعددة الأغراض) إنجازًا كبيرًا في حوكمة الذكاء الاصطناعي ومن المتوقع أن تؤثر على المعايير عالميًا. - نمو الصناعة: شهد قطاع الذكاء الاصطناعي تمويلًا وتقييمات تاريخية: بلغت قيمة OpenAI المعلنة 157 مليار دولار في أواخر 2023، وجمعت شركات مثل Anthropic و Inflection وشركات ناشئة صينية جولات تمويل بمليارات الدولارات.
دفعت طلبات أجهزة الذكاء الاصطناعي من NVIDIA قيمتها السوقية إلى أكثر من 3.5 تريليون دولار بحلول منتصف 2024.
تؤكد هذه الأرقام كيف أصبح الذكاء الاصطناعي محور الاقتصاد التكنولوجي.
>>> هل جربت من قبل: مقارنة الذكاء الاصطناعي بالذكاء البشري ؟
باختصار، لم يعد الذكاء الاصطناعي محصورًا في المختبرات أو العروض التجريبية – بل أصبح مدمجًا في الهواتف، السيارات، أماكن العمل، والسياسات العامة.
تُظهر التطورات السابقة – من المعرفة الواسعة لـ GPT-4 إلى الثورات العلمية لـ AlphaFold – نضوج الذكاء الاصطناعي السريع.
مع دخولنا عام 2025، تشير هذه الإنجازات إلى تطبيقات ذكاء اصطناعي أكثر قوة وعملية في حياتنا اليومية.