کیا آپ سوچ رہے ہیں، “کیا مصنوعی ذہانت بغیر کسی ڈیٹا کے خود سے سیکھ سکتی ہے?” سب سے مفصل اور معقول جواب حاصل کرنے کے لیے، آئیے INVIAI کے ساتھ اس موضوع کو گہرائی میں جانچتے ہیں۔
سب سے پہلے، یہ سمجھنا ضروری ہے کہ ڈیٹا تمام جدید مشین لرننگ AI ماڈلز کا بنیادی جزو ہے۔ مصنوعی ذہانت بغیر ان پٹ ڈیٹا کے خود سے "علم قائم" نہیں کر سکتی۔
مثال کے طور پر، سپروائزڈ لرننگ میں، مصنوعی ذہانت بڑے پیمانے پر ڈیٹا سیٹس سے سیکھتی ہے جنہیں انسانوں نے لیبل کیا ہوتا ہے (تصاویر، متن، آڈیو وغیرہ) تاکہ پیٹرنز کی شناخت کی جا سکے۔
یہاں تک کہ انسپروائزڈ لرننگ میں بھی، مصنوعی ذہانت کو خام، بغیر لیبل کے ڈیٹا کی ضرورت ہوتی ہے تاکہ وہ خود سے اس ڈیٹا میں چھپے ہوئے ڈھانچے یا پیٹرنز دریافت کر سکے۔
لہٰذا، طریقہ کار کی پرواہ کیے بغیر، مصنوعی ذہانت کو ڈیٹا سے "غذا" ملنی چاہیے—چاہے وہ لیبل شدہ ڈیٹا ہو، خود لیبل شدہ ڈیٹا (سیلف-سپروائزڈ) ہو یا حقیقی دنیا کے ماحول سے حاصل کردہ ڈیٹا۔ بغیر کسی ان پٹ ڈیٹا کے، نظام کچھ نیا سیکھ نہیں سکتا۔
عام AI سیکھنے کے طریقے
آج، AI ماڈلز بنیادی طور پر درج ذیل طریقوں سے سیکھتے ہیں:
- سپروائزڈ لرننگ:
مصنوعی ذہانت بڑے، لیبل شدہ ڈیٹا سیٹس سے سیکھتی ہے۔ مثال کے طور پر، تصاویر میں بلیوں کو پہچاننے کے لیے ہزاروں تصاویر جن پر "بلی" یا "بلی نہیں" کا لیبل لگا ہو، تربیت کے لیے درکار ہوتے ہیں۔ یہ طریقہ بہت مؤثر ہے لیکن اس میں لیبلنگ کی کافی محنت درکار ہوتی ہے۔
- انسپروائزڈ لرننگ:
مصنوعی ذہانت کو بغیر لیبل کے خام ڈیٹا دیا جاتا ہے اور وہ اس میں پیٹرنز یا کلسٹرز تلاش کرتی ہے۔ مثال کے طور پر، کلسٹرنگ الگورتھمز ایسے ڈیٹا سیٹس کو گروپ کرتے ہیں جن کی خصوصیات ملتی جلتی ہوں۔ یہ طریقہ AI کو بغیر انسانی رہنمائی کے خود سے سیکھنے اور پیٹرنز دریافت کرنے کی اجازت دیتا ہے۔
- سیلف-سپروائزڈ لرننگ:
یہ ایک قسم ہے جو بڑے نیورل نیٹ ورکس اور LLMs کے لیے استعمال ہوتی ہے، جہاں ماڈل خود ڈیٹا کے لیے لیبلز تیار کرتا ہے (مثلاً جملے میں اگلا لفظ پیش گوئی کرنا یا غائب حصے دوبارہ بنانا) اور پھر ان سے سیکھتا ہے۔ یہ طریقہ AI کو انسانی لیبلنگ کے بغیر بڑے متن یا تصویر کے ڈیٹا سیٹس استعمال کرنے کے قابل بناتا ہے۔
- ری انفورسمنٹ لرننگ (RL):
مستقل ڈیٹا کی بجائے، AI (جسے ایجنٹ کہا جاتا ہے) ایک ماحول کے ساتھ تعامل کرتا ہے اور انعامی سگنلز کی بنیاد پر سیکھتا ہے۔ ویکیپیڈیا RL کی تعریف یوں کرتی ہے: “ری انفورسمنٹ لرننگ ایک سافٹ ویئر ایجنٹ کو یہ سکھانا ہے کہ وہ ماحول میں کیسے برتاؤ کرے، اس کے اعمال کے نتائج سے آگاہ کر کے۔”
دوسرے الفاظ میں، AI عمل کرتا ہے، نتائج دیکھتا ہے (مثلاً انعام یا سزا)، اور کارکردگی بہتر بنانے کے لیے حکمت عملیوں کو ایڈجسٹ کرتا ہے۔
مثال کے طور پر، انسانی استاد کی بجائے، DeepMind کا AlphaZero خود سے لاکھوں شطرنج کے کھیل کھیلتا ہے، جیت کے سگنلز کے ذریعے نئی حکمت عملیاں دریافت کرتا ہے بغیر ماہرین کے فراہم کردہ ڈیٹا سیٹس پر انحصار کیے۔
- فیڈریٹڈ لرننگ:
حساس ڈیٹا، جیسے ذاتی طبی تصاویر کے لیے، فیڈریٹڈ لرننگ متعدد آلات (یا تنظیموں) کو بغیر خام ڈیٹا شیئر کیے مشترکہ ماڈل کو تربیت دینے کی اجازت دیتی ہے۔
گوگل وضاحت کرتا ہے کہ فیڈریٹڈ لرننگ میں، عالمی ماڈل ہر آلے کو مقامی ڈیٹا پر تربیت کے لیے بھیجا جاتا ہے، اور صرف ماڈل کی اپ ڈیٹس واپس بھیجی جاتی ہیں—خام ڈیٹا کبھی آلے سے باہر نہیں جاتا۔
اس طرح، ماڈل متعدد مقامات کے ڈیٹا سے سیکھ سکتا ہے بغیر اسے مرکزی بنانے کے۔ تاہم، AI کو سیکھنے کے لیے ہر آلے پر مقامی ڈیٹا کی ضرورت ہوتی ہے۔
- زیرو شاٹ لرننگ:
یہ AI کی وہ صلاحیت ہے کہ وہ مخصوص مثالوں کے بغیر نئے تصورات کا اندازہ لگا سکے۔ IBM زیرو شاٹ لرننگ کو یوں بیان کرتا ہے کہ “ایک AI ماڈل کو ایسے اشیاء/تصورات کو پہچاننے یا درجہ بندی کرنے کے لیے تربیت دیا جاتا ہے جن کی وہ پہلے کبھی مثالیں نہیں دیکھ چکا۔”
زیرو شاٹ لرننگ پہلے سے حاصل کردہ وسیع علم پر انحصار کرتی ہے۔ مثال کے طور پر، بہت سے بڑے زبان کے ماڈلز (LLMs) جیسے GPT بڑے متن کے ذخیرے پر پہلے سے تربیت یافتہ ہوتے ہیں۔ اس سابقہ علم کی بدولت، وہ واضح مثالوں کے بغیر بھی نئے تصورات پر استدلال کر سکتے ہیں۔
اگرچہ یہ لگ سکتا ہے کہ AI "بغیر ڈیٹا کے سیکھ سکتی ہے"، حقیقت میں LLMs اب بھی بنیادی زبان کی صلاحیتیں بنانے کے لیے بڑے ابتدائی ڈیٹا سیٹس پر انحصار کرتے ہیں۔
خلاصہ یہ کہ، تمام یہ طریقے ظاہر کرتے ہیں کہ مصنوعی ذہانت کے لیے بغیر ڈیٹا کے سیکھنے کا کوئی جادوئی طریقہ نہیں ہے—کسی نہ کسی شکل میں۔ AI انسانی لیبل شدہ ڈیٹا پر انحصار کم کر سکتی ہے یا تجربے سے سیکھ سکتی ہے، لیکن وہ کچھ بھی نہ سیکھ سکتی۔
جدید رجحانات: جامد ڈیٹا کی بجائے "تجربے" سے سیکھنا
محققین اب ایسے طریقے تلاش کر رہے ہیں جن سے AI انسانی فراہم کردہ ڈیٹا پر کم انحصار کرے۔ مثال کے طور پر، DeepMind نے حال ہی میں "تجربہ پر مبنی AI" کے دور میں "streams" ماڈل پیش کیا ہے، جہاں AI بنیادی طور پر دنیا کے ساتھ اپنے تعاملات سے سیکھتا ہے نہ کہ انسانوں کے بنائے ہوئے مسائل اور سوالات سے۔
VentureBeat نے DeepMind کی تحقیق کا حوالہ دیا: “ہم یہ اس طرح حاصل کر سکتے ہیں کہ ایجنٹس کو اپنے تجربات سے مسلسل سیکھنے کی اجازت دی جائے—یعنی وہ ڈیٹا جو ایجنٹ خود ماحول کے ساتھ تعامل کرتے ہوئے پیدا کرتا ہے… تجربہ بہت جلد انسانی فراہم کردہ ڈیٹا کی موجودہ مقدار سے بڑھ کر بہتری کا بنیادی ذریعہ بن جائے گا۔”
دوسرے الفاظ میں، مستقبل میں AI خود اپنے تجربات کے ذریعے اپنا ڈیٹا پیدا کرے گا، تجربہ کرے گا، مشاہدہ کرے گا، اور عمل کی اصلاح کرے گا—بالکل اسی طرح جیسے انسان حقیقی دنیا کے تجربے سے سیکھتے ہیں۔
ایک واضح مثال Absolute Zero Reasoner (AZR) ماڈل ہے۔ AZR مکمل طور پر سیلف پلے کے ذریعے تربیت یافتہ ہے، جسے انسانی ان پٹ کی ضرورت نہیں ہوتی۔ یہ خود اپنے مسائل (مثلاً کوڈ کے ٹکڑے یا ریاضی کے مسائل) پیدا کرتا ہے، انہیں حل کرتا ہے، اور نتائج (کوڈ کے نفاذ یا ماحول کی رائے کے ذریعے) کو انعامی سگنلز کے طور پر استعمال کرتا ہے تاکہ سیکھ سکے۔
حیرت انگیز طور پر، بیرونی تربیتی ڈیٹا استعمال نہ کرنے کے باوجود، AZR ریاضی اور پروگرامنگ کے کاموں میں اعلیٰ کارکردگی دکھاتا ہے، یہاں تک کہ ایسے ماڈلز سے بھی بہتر جو ہزاروں لیبل شدہ مثالوں پر تربیت یافتہ ہیں۔ یہ ظاہر کرتا ہے کہ AI مسلسل چیلنجز پیدا کر کے اور حل کر کے اپنا "ڈیٹا سیٹ" خود بنا سکتی ہے۔
AZR کے علاوہ، بہت سی دیگر تحقیقیں ایسی AI پر کام کر رہی ہیں جو خود مختار طور پر سیکھتی ہے۔ ذہین ایجنٹ سسٹمز سافٹ ویئر اور ورچوئل دنیاوں (ٹولز، ویب سائٹس، سیمولیشن گیمز) کے ساتھ تعامل کر کے تجرباتی ڈیٹا جمع کر سکتے ہیں۔
AI کو اس طرح ڈیزائن کیا جا سکتا ہے کہ وہ اپنے مقاصد اور انعامات خود مقرر کرے، بالکل اسی طرح جیسے انسان عادات بناتے ہیں۔ اگرچہ یہ ابھی تحقیق کے مراحل میں ہے، یہ نظریات اس بات کو مضبوط کرتے ہیں کہ: کوئی بھی AI بغیر ڈیٹا کے واقعی سیکھ نہیں سکتی—بلکہ "ڈیٹا" AI کے اپنے تجربات سے آتا ہے۔
>>> مزید جانیں:
مختصر یہ کہ، آج کی AI کو سیکھنے کے لیے اب بھی کسی نہ کسی قسم کا ڈیٹا درکار ہے۔ "بغیر ڈیٹا کی AI" جیسی کوئی چیز حقیقت میں موجود نہیں ہے۔
اس کے بجائے، AI انسانی فراہم کردہ ڈیٹا پر کم انحصار کر سکتی ہے جیسے بغیر لیبل کے ڈیٹا (انسپروائزڈ لرننگ)، ماحولیاتی فیڈبیک سے سیکھنا (ری انفورسمنٹ لرننگ)، یا اپنے چیلنجز خود بنانا (مثلاً AZR ماڈل)۔
بہت سے ماہرین کا ماننا ہے کہ مستقبل میں AI زیادہ تر اپنے جمع کردہ تجربے سے سیکھے گی، اور تجربہ وہ بنیادی "ڈیٹا" ہوگا جو اسے بہتر بنانے میں مدد دے گا۔
لیکن بہرحال، حقیقت یہی ہے: AI کچھ بھی نہ سیکھ سکتی ہے؛ "ڈیٹا" کا ماخذ زیادہ پیچیدہ ہو سکتا ہے (مثلاً ماحولیاتی سگنلز، انعامات)، لیکن مشین کو سیکھنے اور بہتر بنانے کے لیے ہمیشہ کسی نہ کسی قسم کا ان پٹ درکار ہوگا۔