آیا تا به حال فکر کردهاید، “آیا هوش مصنوعی میتواند بدون هیچ دادهای بهتنهایی یاد بگیرد?” برای دریافت پاسخ دقیق و منطقیتر، بیایید این موضوع را بهطور جامع با INVIAI بررسی کنیم.
ابتدا باید بدانیم که داده عنصر اصلی در تمام مدلهای مدرن یادگیری ماشین و هوش مصنوعی است. هوش مصنوعی بدون داده ورودی نمیتواند بهتنهایی دانش ایجاد کند.
برای مثال، در یادگیری نظارتشده، هوش مصنوعی از مجموعه دادههای عظیمی که توسط انسانها برچسبگذاری شدهاند (تصاویر، متن، صدا و غیره) برای شناسایی الگوها استفاده میکند.
حتی در یادگیری بدون نظارت، هوش مصنوعی به دادههای خام و بدون برچسب نیاز دارد تا ساختارها یا الگوهای پنهان در آن دادهها را بهصورت خودکار کشف کند.
بنابراین، فارغ از روش، هوش مصنوعی باید با داده «تغذیه» شود—چه دادههای برچسبخورده، دادههای خودبرچسبخورده (خودنظارتی) یا دادههای محیط واقعی. بدون هیچ داده ورودی، سیستم نمیتواند چیز جدیدی یاد بگیرد.
روشهای رایج یادگیری هوش مصنوعی
امروزه مدلهای هوش مصنوعی عمدتاً از روشهای زیر برای یادگیری استفاده میکنند:
- یادگیری نظارتشده:
هوش مصنوعی از مجموعه دادههای بزرگ و برچسبخورده یاد میگیرد. برای مثال، برای شناسایی گربه در تصاویر، هزاران عکس با برچسب «گربه» یا «بدون گربه» برای آموزش لازم است. این روش بسیار مؤثر است اما نیازمند تلاش زیادی برای برچسبگذاری است.
- یادگیری بدون نظارت:
هوش مصنوعی دادههای خام و بدون برچسب دریافت میکند و به دنبال الگوها یا خوشههایی در آن میگردد. برای مثال، الگوریتمهای خوشهبندی دادههایی با ویژگیهای مشابه را گروهبندی میکنند. این روش به هوش مصنوعی اجازه میدهد بدون راهنمایی انسان، از دادهها «خودآموزی» کند و الگوها را کشف نماید.
- یادگیری خودنظارتی:
نوعی روش که برای شبکههای عصبی بزرگ و مدلهای زبان بزرگ (LLM) استفاده میشود، جایی که مدل خودش برای دادهها برچسب تولید میکند (مثلاً پیشبینی کلمه بعدی در جمله یا بازسازی بخشهای گمشده) و سپس از آنها یاد میگیرد. این رویکرد به هوش مصنوعی امکان میدهد از مجموعه دادههای عظیم متنی یا تصویری بدون نیاز به برچسبگذاری انسانی استفاده کند.
- یادگیری تقویتی (RL):
به جای دادههای ایستا، هوش مصنوعی (که به آن عامل گفته میشود) با محیط تعامل میکند و بر اساس سیگنالهای پاداش یاد میگیرد. ویکیپدیا یادگیری تقویتی را اینگونه تعریف میکند: “یادگیری تقویتی آموزش یک عامل نرمافزاری برای رفتار در یک محیط با اطلاعرسانی نتایج اقداماتش است.”
به عبارت دیگر، هوش مصنوعی اقداماتی انجام میدهد، نتایج را مشاهده میکند (مثلاً پاداش یا جریمه) و استراتژیهای خود را برای بهبود عملکرد تنظیم میکند.
برای مثال، به جای اینکه یک انسان شطرنج را آموزش دهد، AlphaZero از DeepMind میلیونها بازی را با خودش انجام میدهد و از طریق سیگنالهای برد، استراتژیهای جدیدی کشف میکند بدون اینکه به دادههای تخصصی قبلی وابسته باشد.
- یادگیری فدرال:
برای دادههای حساس، مانند تصاویر پزشکی شخصی، یادگیری فدرال به چندین دستگاه (یا سازمان) اجازه میدهد تا بهصورت مشترک یک مدل مشترک را آموزش دهند بدون اشتراکگذاری دادههای خام.
گوگل توضیح میدهد که در یادگیری فدرال، مدل جهانی به هر دستگاه ارسال میشود تا روی دادههای محلی آموزش ببیند و تنها بهروزرسانیهای مدل بازگردانده میشود—دادههای خام هرگز از دستگاه خارج نمیشوند.
بدین ترتیب، مدل میتواند از دادههای پراکنده در مکانهای مختلف یاد بگیرد بدون اینکه دادهها متمرکز شوند. با این حال، هوش مصنوعی هنوز به دادههای محلی روی هر دستگاه برای یادگیری نیاز دارد.
- یادگیری بدون نمونه (Zero-Shot Learning):
این توانایی هوش مصنوعی است که بدون نمونههای خاص، مفاهیم جدید را استنباط کند. IBM یادگیری بدون نمونه را اینگونه تعریف میکند که “مدل هوش مصنوعی برای شناسایی یا طبقهبندی اشیاء/مفاهیمی آموزش دیده است که قبلاً نمونهای از آنها ندیده است.”
یادگیری بدون نمونه بر دانش گسترده قبلی متکی است. برای مثال، بسیاری از مدلهای زبان بزرگ مانند GPT بر روی مجموعههای عظیم متنی پیشآموزش دیدهاند. به لطف این دانش پیشین، آنها میتوانند درباره مفاهیم جدید حتی بدون نمونههای صریح استدلال کنند.
اگرچه ممکن است به نظر برسد هوش مصنوعی میتواند «بدون داده یاد بگیرد»، اما در واقع مدلهای زبان بزرگ هنوز به مجموعه دادههای اولیه بزرگ برای ساخت قابلیتهای پایه زبانی وابستهاند.
خلاصه اینکه، هیچ راه جادویی برای یادگیری هوش مصنوعی بدون داده وجود ندارد—به هر شکلی که باشد. هوش مصنوعی ممکن است وابستگی به دادههای برچسبخورده انسانی را کاهش دهد یا از تجربه یاد بگیرد، اما نمیتواند از هیچ چیز یاد بگیرد.
روندهای پیشرفته: یادگیری از «تجربه» به جای دادههای ایستا
پژوهشگران اکنون در حال بررسی راههایی هستند که هوش مصنوعی کمتر به دادههای ارائهشده توسط انسان وابسته باشد. برای مثال، DeepMind اخیراً مدل «جریانها» را در عصر «هوش مصنوعی مبتنی بر تجربه» پیشنهاد داده است، جایی که هوش مصنوعی عمدتاً از تعاملات خود با جهان یاد میگیرد نه از مسائل و سوالات طراحیشده توسط انسان.
VentureBeat تحقیقات DeepMind را اینگونه نقل کرده است: “ما میتوانیم این کار را با اجازه دادن به عوامل برای یادگیری مداوم از تجربیات خود—یعنی دادههایی که خود عامل هنگام تعامل با محیط تولید میکند—انجام دهیم... تجربه به وسیله اصلی بهبود تبدیل خواهد شد و از مقیاس دادههای ارائهشده توسط انسان فراتر خواهد رفت.”
به عبارت دیگر، در آینده، هوش مصنوعی خودش از طریق آزمایش، مشاهده و تنظیم اقدامات، دادههای خود را تولید خواهد کرد—مشابه نحوه یادگیری انسانها از تجربه دنیای واقعی.
مثال ملموس، مدل Absolute Zero Reasoner (AZR) است. AZR کاملاً از طریق خودبازی آموزش میبیند و نیازی به ورودی انسانی ندارد. این مدل مسائل خود را (مثلاً قطعات کد یا مسائل ریاضی) تولید میکند، آنها را حل میکند و از نتایج (از طریق اجرای کد یا بازخورد محیط) به عنوان سیگنالهای پاداش برای یادگیری استفاده میکند.
به طور شگفتانگیز، با وجود عدم استفاده از دادههای آموزشی خارجی، AZR در وظایف ریاضی و برنامهنویسی عملکرد برتری دارد و حتی از مدلهایی که روی دهها هزار نمونه برچسبخورده آموزش دیدهاند، بهتر عمل میکند. این نشان میدهد که هوش مصنوعی میتواند با مطرح کردن و حل چالشها، «مجموعه داده» خود را تولید کند.
علاوه بر AZR، مطالعات زیادی به بررسی هوش مصنوعی میپردازند که بهصورت خودگردان یاد میگیرد. سیستمهای عامل هوشمند میتوانند با نرمافزارها و دنیای مجازی (ابزارها، وبسایتها، بازیهای شبیهسازی) تعامل داشته باشند تا دادههای تجربی جمعآوری کنند.
هوش مصنوعی میتواند طوری طراحی شود که اهداف و پاداشهای خود را تعیین کند، مشابه نحوه شکلگیری عادات در انسانها. اگرچه هنوز در مراحل تحقیقاتی است، این ایدهها تأکید میکنند که: هیچ هوش مصنوعی واقعاً بدون داده نمیتواند یاد بگیرد—بلکه «داده» از تجربیات خود هوش مصنوعی حاصل میشود.
>>> برای اطلاعات بیشتر:
آیا برای استفاده از هوش مصنوعی نیاز به دانستن برنامهنویسی دارم؟
به طور خلاصه، هوش مصنوعی امروزی هنوز برای یادگیری به داده (به هر شکلی) نیاز دارد. هیچ هوش مصنوعی واقعاً «بدون داده» وجود ندارد.
در عوض، هوش مصنوعی میتواند کمتر به دادههای انسانی وابسته باشد با استفاده از دادههای بدون برچسب (یادگیری بدون نظارت)، یادگیری از بازخورد محیطی (یادگیری تقویتی) یا حتی ایجاد چالشهای خود (مانند مدل AZR).
بسیاری از کارشناسان معتقدند که در آینده، هوش مصنوعی بیشتر از طریق تجربیاتی که خودش جمعآوری میکند یاد خواهد گرفت و تجربه به «داده» اصلی برای بهبود تبدیل خواهد شد.
اما حقیقت همچنان باقی است: هوش مصنوعی نمیتواند از هیچ چیز یاد بگیرد؛ منبع «داده» ممکن است پیچیدهتر باشد (مثلاً سیگنالهای محیطی، پاداشها)، اما همیشه به نوعی ورودی برای یادگیری و پیشرفت نیاز دارد.