আপনি কি ভাবছেন, এআই কি নিজেই ডেটা ছাড়া শিখতে পারে? সবচেয়ে বিস্তারিত এবং যুক্তিসঙ্গত উত্তর পেতে, চলুন INVIAI-এর সঙ্গে এই বিষয়টি গভীরভাবে অন্বেষণ করি।

প্রথমেই বুঝতে হবে যে ডেটা হল সকল আধুনিক মেশিন লার্নিং এআই মডেলের মূল উপাদান। ইনপুট ডেটা ছাড়া এআই নিজে থেকে “জ্ঞান প্রতিষ্ঠা” করতে পারে না।

উদাহরণস্বরূপ, সুপারভাইজড লার্নিং-এ, এআই মানুষের লেবেল করা বিশাল ডেটাসেট (ছবি, টেক্সট, অডিও ইত্যাদি) থেকে প্যাটার্ন চিনতে শেখে।

এমনকি আনসুপারভাইজড লার্নিং-এও, এআইকে কাঁচা, লেবেলবিহীন ডেটা প্রয়োজন যাতে সে নিজে থেকেই ডেটার মধ্যে লুকানো কাঠামো বা প্যাটার্ন আবিষ্কার করতে পারে।

সুতরাং, যেকোনো পদ্ধতিতে হোক না কেন, এআইকে ডেটা দিয়ে “পুষ্ট” করতে হয়—হোক তা লেবেল করা ডেটা, স্ব-লেবেল করা ডেটা (সেল্ফ-সুপারভাইজড), অথবা বাস্তব পরিবেশ থেকে প্রাপ্ত ডেটা। ইনপুট ডেটা ছাড়া সিস্টেম নতুন কিছু শিখতে পারে না।

সাধারণ এআই শেখার পদ্ধতি

আজকের এআই মডেলগুলো প্রধানত নিম্নলিখিত পদ্ধতিগুলো দ্বারা শেখে:

  • সুপারভাইজড লার্নিং:

এআই বড়, লেবেল করা ডেটাসেট থেকে শেখে। উদাহরণস্বরূপ, ছবিতে বিড়াল চিনতে হাজার হাজার “বিড়াল” বা “বিড়াল নয়” লেবেলযুক্ত ছবি প্রশিক্ষণের জন্য প্রয়োজন। এই পদ্ধতি অত্যন্ত কার্যকর কিন্তু প্রচুর লেবেলিংয়ের প্রয়োজন হয়।

  • আনসুপারভাইজড লার্নিং:

এআইকে লেবেলবিহীন কাঁচা ডেটা দেওয়া হয় এবং সে এর মধ্যে প্যাটার্ন বা ক্লাস্টার খুঁজে বের করে। উদাহরণস্বরূপ, ক্লাস্টারিং অ্যালগরিদম একই ধরনের বৈশিষ্ট্যের ডেটাসেটগুলোকে গ্রুপ করে। এই পদ্ধতিতে এআই “নিজেই শিখতে” পারে এবং মানুষের নির্দেশনা ছাড়াই প্যাটার্ন আবিষ্কার করতে পারে।

  • সেল্ফ-সুপারভাইজড লার্নিং:

এটি বড় নিউরাল নেটওয়ার্ক এবং এলএলএমগুলোর জন্য ব্যবহৃত একটি রূপ, যেখানে মডেল নিজেই ডেটার জন্য লেবেল তৈরি করে (যেমন, বাক্যের পরবর্তী শব্দ অনুমান করা বা অনুপস্থিত অংশ পুনর্গঠন করা) এবং সেগুলো থেকে শেখে। এই পদ্ধতিতে এআই মানুষের লেবেলিং ছাড়াই বিশাল টেক্সট বা ছবি ডেটাসেট ব্যবহার করতে পারে।

  • রিইনফোর্সমেন্ট লার্নিং (আরএল):

স্থির ডেটার পরিবর্তে, এআই (যাকে এজেন্ট বলা হয়) একটি পরিবেশের সঙ্গে ইন্টারঅ্যাক্ট করে এবং পুরস্কার সংকেতের ভিত্তিতে শেখে। উইকিপিডিয়া আরএল-কে সংজ্ঞায়িত করে: “রিইনফোর্সমেন্ট লার্নিং হল একটি সফটওয়্যার এজেন্টকে শেখানো কিভাবে পরিবেশে আচরণ করতে হয় তার কাজের ফলাফল জানিয়ে।”

অর্থাৎ, এআই কাজ করে, ফলাফল পর্যবেক্ষণ করে (যেমন পুরস্কার বা শাস্তি), এবং কর্মক্ষমতা উন্নত করতে কৌশল পরিবর্তন করে।

উদাহরণস্বরূপ, মানুষের শেখানোর পরিবর্তে, ডিপমাইন্ডের আলফাজিরো নিজেই নিজের বিরুদ্ধে মিলিয়ন মিলিয়ন গেম খেলে নতুন কৌশল আবিষ্কার করে, পূর্বনির্ধারিত বিশেষজ্ঞ ডেটাসেটের উপর নির্ভর না করে।

  • ফেডারেটেড লার্নিং:

সংবেদনশীল ডেটার জন্য, যেমন ব্যক্তিগত চিকিৎসা ছবি, ফেডারেটেড লার্নিং একাধিক ডিভাইস (বা প্রতিষ্ঠান) কে কাঁচা ডেটা শেয়ার না করেই একটি শেয়ার্ড মডেল একসাথে প্রশিক্ষণ দেওয়ার সুযোগ দেয়।

গুগল ব্যাখ্যা করে যে ফেডারেটেড লার্নিং-এ, গ্লোবাল মডেলটি প্রতিটি ডিভাইসে পাঠানো হয় স্থানীয় ডেটার উপর প্রশিক্ষণের জন্য, এবং শুধুমাত্র মডেলের আপডেটগুলো ফেরত পাঠানো হয়—কাঁচা ডেটা কখনো ডিভাইস থেকে বের হয় না।

এইভাবে, মডেলটি একাধিক স্থানের ডেটা থেকে শেখতে পারে কেন্দ্রীভূত না হয়ে। তবে, এআইকে শেখার জন্য প্রতিটি ডিভাইসে স্থানীয় ডেটা অবশ্যই প্রয়োজন।

  • জিরো-শট লার্নিং:

এটি হল এআই-এর এমন ক্ষমতা যেখানে নির্দিষ্ট উদাহরণ ছাড়াই নতুন ধারণা অনুমান করতে পারে। আইবিএম জিরো-শট লার্নিংকে সংজ্ঞায়িত করে: “একটি এআই মডেলকে এমনভাবে প্রশিক্ষণ দেওয়া হয় যাতে এটি আগে কখনো দেখা না থাকা বস্তু/ধারণাগুলো চিনতে বা শ্রেণীবদ্ধ করতে পারে।”

জিরো-শট লার্নিং পূর্বে অর্জিত বিস্তৃত জ্ঞানের উপর নির্ভর করে। উদাহরণস্বরূপ, অনেক বড় ভাষা মডেল (এলএলএম) যেমন GPT বিশাল টেক্সট করপাসে প্রি-ট্রেইন করা হয়। এই পূর্ববর্তী জ্ঞানের কারণে, তারা স্পষ্ট উদাহরণ ছাড়াই নতুন ধারণা নিয়ে যুক্তি করতে পারে।

যদিও মনে হতে পারে এআই “ডেটা ছাড়া শিখতে পারে,” বাস্তবে এলএলএমগুলো এখনও বড় প্রাথমিক ডেটাসেটের উপর নির্ভর করে ভাষার মৌলিক দক্ষতা গড়ে তোলার জন্য।

সংক্ষেপে, এই সকল পদ্ধতি দেখায় যে ডেটা ছাড়া এআই শিখার কোনো জাদুকরী উপায় নেই—কোন না কোন রূপে ডেটা প্রয়োজন। এআই হয়তো মানুষের লেবেল করা ডেটার ওপর নির্ভরতা কমাতে পারে বা অভিজ্ঞতা থেকে শিখতে পারে, কিন্তু কিছু না কিছু ডেটা ছাড়া শিখতে পারে না।

জনপ্রিয় এআই শেখার পদ্ধতি

উন্নত প্রবণতা: স্থির ডেটার পরিবর্তে “অভিজ্ঞতা” থেকে শেখা

গবেষকরা এখন এমন উপায় খুঁজছেন যেখানে এআই মানুষের সরবরাহকৃত ডেটার ওপর কম নির্ভর করবে। উদাহরণস্বরূপ, ডিপমাইন্ড সম্প্রতি “অভিজ্ঞতা-ভিত্তিক এআই” যুগে একটি “স্ট্রিমস” মডেল প্রস্তাব করেছে, যেখানে এআই প্রধানত নিজের বিশ্বসঙ্গের সঙ্গে ইন্টারঅ্যাকশনের মাধ্যমে শেখে, মানুষের ডিজাইন করা সমস্যা ও প্রশ্নের পরিবর্তে।

ভেঞ্চারবিট ডিপমাইন্ডের গবেষণাকে উদ্ধৃত করেছে: “আমরা এজেন্টদের তাদের নিজস্ব অভিজ্ঞতা থেকে অবিরত শেখার সুযোগ দিয়ে এটি অর্জন করতে পারি—অর্থাৎ, পরিবেশের সঙ্গে ইন্টারঅ্যাকশনের সময় এজেন্ট নিজেই তৈরি করা ডেটা... অভিজ্ঞতা হবে উন্নতির প্রধান মাধ্যম, যা আজকের মানুষের সরবরাহকৃত ডেটার পরিমাণকে ছাড়িয়ে যাবে।”

অর্থাৎ, ভবিষ্যতে এআই নিজেই পরীক্ষানিরীক্ষা, পর্যবেক্ষণ এবং কর্মপরিবর্তনের মাধ্যমে নিজের ডেটা তৈরি করবে—যেমন মানুষ বাস্তব অভিজ্ঞতা থেকে শেখে।

একটি স্পষ্ট উদাহরণ হল অ্যাবসোলিউট জিরো রিজনার (AZR) মডেল। AZR সম্পূর্ণরূপে স্ব-খেলার মাধ্যমে প্রশিক্ষিত, যার জন্য মানুষের কোনো ইনপুট প্রয়োজন হয় না। এটি নিজেই সমস্যা তৈরি করে (যেমন কোড স্নিপেট বা গণিত সমস্যা), সেগুলো সমাধান করে, এবং ফলাফল (কোড এক্সিকিউশন বা পরিবেশ প্রতিক্রিয়া) পুরস্কার সংকেত হিসেবে ব্যবহার করে শেখে।

অবিশ্বাস্য হলেও, বাহ্যিক প্রশিক্ষণ ডেটা ব্যবহার না করেও AZR গণিত ও প্রোগ্রামিং কাজে শীর্ষস্থানীয় পারফরম্যান্স অর্জন করে, এমনকি হাজার হাজার লেবেলযুক্ত উদাহরণে প্রশিক্ষিত মডেলকেও ছাড়িয়ে যায়। এটি প্রমাণ করে যে এআই নিজেই চ্যালেঞ্জ তৈরি ও সমাধান করে নিজস্ব “ডেটাসেট” তৈরি করতে পারে

AZR ছাড়াও, অনেক অন্যান্য গবেষণায় এমন এআই অন্বেষণ করা হচ্ছে যা স্বায়ত্তশাসিতভাবে শেখে। বুদ্ধিমান এজেন্ট সিস্টেম সফটওয়্যার ও ভার্চুয়াল বিশ্ব (টুলস, ওয়েবসাইট, সিমুলেশন গেম) এর সঙ্গে ইন্টারঅ্যাক্ট করে অভিজ্ঞতার ডেটা সংগ্রহ করতে পারে।

এআইকে এমনভাবে ডিজাইন করা যেতে পারে যাতে এটি নিজেই লক্ষ্য ও পুরস্কার নির্ধারণ করে, যেমন মানুষ অভ্যাস গড়ে তোলে। যদিও এখনো গবেষণার পর্যায়ে, এই ধারণাগুলো নিশ্চিত করে যে: কোনো এআইই সত্যিই ডেটা ছাড়া শিখতে পারে না—বরং “ডেটা” আসে এআই-এর নিজস্ব অভিজ্ঞতা থেকে।

>>> আরও জানুন: 

আমি কি AI ব্যবহার করতে প্রোগ্রামিং জানতে হবে?

এআই কি মানুষের মতো চিন্তা করে?

সর্বাধুনিক প্রবণতা - স্থির ডেটার পরিবর্তে “অভিজ্ঞতা” থেকে শেখা


সংক্ষেপে, আজকের এআই শেখার জন্য এখনও ডেটার (যেকোনো রূপের) প্রয়োজন। সত্যিকারের “ডেটালেস এআই” নেই।

বরং, এআই মানুষের সরবরাহকৃত ডেটা থেকে কম শিখতে পারে যেমন: লেবেলবিহীন ডেটা ব্যবহার করে (আনসুপারভাইজড লার্নিং), পরিবেশগত প্রতিক্রিয়া থেকে শেখে (রিইনফোর্সমেন্ট লার্নিং), অথবা নিজের চ্যালেঞ্জ তৈরি করে (যেমন AZR মডেল)।

অনেক বিশেষজ্ঞ বিশ্বাস করেন ভবিষ্যতে এআই নিজে সংগ্রহ করা অভিজ্ঞতার মাধ্যমে বেশি শিখবে, যা প্রধান “ডেটা” হিসেবে কাজ করবে উন্নতির জন্য।

কিন্তু যাই হোক, সত্যিটা হল: এআই কিছু না কিছু ডেটা ছাড়া শিখতে পারে না; “ডেটা” উৎস হয়তো আরও জটিল (যেমন পরিবেশগত সংকেত, পুরস্কার), কিন্তু শেখার জন্য যেকোনো রূপে ইনপুট প্রয়োজন।

বাইরের রেফারেন্সসমূহ
এই নিবন্ধটি নিম্নলিখিত বাইরের উৎসের মাধ্যমে সংকলিত: