কৃত্রিম বুদ্ধিমত্তা (AI) আজকের দিনে আধুনিক জীবনের একটি পরিচিত অংশ হয়ে উঠেছে, যা ব্যবসা থেকে স্বাস্থ্যসেবা পর্যন্ত প্রতিটি ক্ষেত্রে উপস্থিত। তবে কমই কেউ জানে যে AI-এর উন্নয়নের ইতিহাস ২০শ শতকের মাঝামাঝি সময় থেকে শুরু হয়ে বহু ওঠাপড়ার মধ্য দিয়ে আজকের বিস্ময়কর সাফল্যের পর্যায়ে পৌঁছেছে।
এই নিবন্ধে INVIAI আপনাদেরকে AI-এর গঠন ও উন্নয়নের ইতিহাস সম্পর্কে বিস্তারিত ধারণা দেবে, প্রাথমিক ধারণা থেকে শুরু করে “AI শীতকাল” নামে পরিচিত কঠিন সময়কাল, এবং পরবর্তীতে গভীর শিক্ষার বিপ্লব এবং সৃষ্টিশীল AI তরঙ্গ যা ২০২০-এর দশকে বিস্ফোরিত হয়।
১৯৫০-এর দশক: কৃত্রিম বুদ্ধিমত্তার সূচনা
১৯৫০-এর দশককে AI ক্ষেত্রের আনুষ্ঠানিক সূচনা হিসেবে বিবেচনা করা হয়। ১৯৫০ সালে গণিতজ্ঞ অ্যালান টুরিং “Computing Machinery and Intelligence” শীর্ষক প্রবন্ধ প্রকাশ করেন, যেখানে তিনি একটি বিখ্যাত পরীক্ষা প্রস্তাব করেন যা মেশিনের চিন্তাশক্তি মূল্যায়ন করে – যা পরবর্তীতে টুরিং পরীক্ষা নামে পরিচিত হয়। এটি AI-এর জন্য একটি মৌলিক ধারণার সূচনা হিসেবে গণ্য হয়, যেখানে বলা হয় কম্পিউটার মানুষের মতো “চিন্তা” করতে পারে।
১৯৫৬ সালে “Artificial Intelligence” (কৃত্রিম বুদ্ধিমত্তা) শব্দটি আনুষ্ঠানিকভাবে প্রবর্তিত হয়। সেই গ্রীষ্মে, কম্পিউটার বিজ্ঞানী জন ম্যাককার্থি (ডার্টমাউথ কলেজ) মার্ভিন মিনস্কি, নাথানিয়েল রচেস্টার (আইবিএম) এবং ক্লড শ্যাননের সঙ্গে একটি ঐতিহাসিক কর্মশালা আয়োজন করেন।
ম্যাককার্থি এই কর্মশালার জন্য “কৃত্রিম বুদ্ধিমত্তা” (AI) শব্দটি প্রস্তাব করেন, এবং ১৯৫৬ সালের ডার্টমাউথ ইভেন্টকে সাধারণত AI ক্ষেত্রের জন্ম হিসেবে ধরা হয়। এখানে সাহসী বিজ্ঞানীরা ঘোষণা করেন “শিক্ষা বা বুদ্ধিমত্তার প্রতিটি দিক মেশিন দ্বারা অনুকরণ করা যেতে পারে”, যা এই নতুন ক্ষেত্রের উচ্চাকাঙ্ক্ষী লক্ষ্য স্থির করে।
১৯৫০-এর দশকের শেষের দিকে অনেক প্রথম AI সাফল্য দেখা যায়। ১৯৫১ সালে প্রাথমিক AI প্রোগ্রামগুলি ফেরান্তি মার্ক I কম্পিউটারে চালানো হয় – বিশেষ করে ক্রিস্টোফার স্ট্রাচির দাবা (চেকার্স) প্রোগ্রাম এবং ডাইট্রিখ প্রিন্জর দাবা প্রোগ্রাম, যা প্রথমবারের মতো কম্পিউটারকে বুদ্ধিমত্তাসম্পন্ন খেলা খেলতে সক্ষম করে।
১৯৫৫ সালে, আর্থার স্যামুয়েল আইবিএম-এ একটি দাবা খেলার প্রোগ্রাম তৈরি করেন যা অভিজ্ঞতা থেকে স্বয়ংক্রিয়ভাবে শিখতে পারে, যা প্রথম প্রাথমিক মেশিন লার্নিং সিস্টেম হিসেবে বিবেচিত। একই সময়ে, অ্যালেন নিউয়েল, হার্বার্ট সাইমন এবং সহকর্মীরা লজিক থিওরিস্ট (১৯৫৬) প্রোগ্রাম তৈরি করেন যা স্বয়ংক্রিয়ভাবে গাণিতিক তত্ত্ব প্রমাণ করতে পারে, যা মেশিনের যুক্তি প্রয়োগের ক্ষমতা প্রদর্শন করে।
গণিতের পাশাপাশি, ১৯৫০-এর দশকে AI-এর জন্য বিশেষায়িত সরঞ্জাম ও প্রোগ্রামিং ভাষাও আবিষ্কৃত হয়। ১৯৫৮ সালে জন ম্যাককার্থি লিস্প ভাষা উদ্ভাবন করেন – যা AI-এর জন্য বিশেষভাবে ডিজাইন করা প্রোগ্রামিং ভাষা এবং দ্রুত AI সম্প্রদায়ে জনপ্রিয় হয়ে ওঠে। একই বছর, মনোবিজ্ঞানী ফ্র্যাঙ্ক রোজেনব্লাট প্রথম পারসেপ্ট্রন – একটি কৃত্রিম নিউরাল নেটওয়ার্ক মডেল যা ডেটা থেকে শিখতে পারে – উপস্থাপন করেন। পারসেপ্ট্রন আধুনিক নিউরাল নেটওয়ার্কগুলোর প্রাথমিক ভিত্তি হিসেবে বিবেচিত।
১৯৫৯ সালে আর্থার স্যামুয়েল প্রথমবার “মেশিন লার্নিং” শব্দটি ব্যবহার করেন একটি গুরুত্বপূর্ণ প্রবন্ধে, যেখানে তিনি বর্ণনা করেন কিভাবে কম্পিউটারকে প্রোগ্রাম করা যায় যাতে এটি শিখতে এবং নিজেকে উন্নত করতে পারে এবং এমনকি প্রোগ্রামারকেও পরাজিত করতে পারে। এই উন্নয়নগুলি একটি মহৎ আশাবাদ সৃষ্টি করে: পায়রা বিজ্ঞানীরা বিশ্বাস করতেন যে কয়েক দশকের মধ্যে মেশিন মানুষের মতো বুদ্ধিমান হতে পারবে।
১৯৬০-এর দশক: প্রথম অগ্রগতি
১৯৬০-এর দশকে AI আরও উন্নত হয় বিভিন্ন প্রকল্প ও আবিষ্কারের মাধ্যমে। বিখ্যাত বিশ্ববিদ্যালয়গুলোতে (MIT, স্ট্যানফোর্ড, কার্নেগি মেলন...) AI গবেষণাগার প্রতিষ্ঠিত হয়, যা গবেষণা ও তহবিল আকর্ষণ করে। কম্পিউটার তখন আরও শক্তিশালী হয়, যা আগের দশকের তুলনায় জটিল AI ধারণাগুলো পরীক্ষা করার সুযোগ দেয়।
একটি উল্লেখযোগ্য সাফল্য ছিল প্রথম চ্যাটবট প্রোগ্রাম এর আবির্ভাব। ১৯৬৬ সালে, MIT-র জোসেফ ওয়াইজেনবাম তৈরি করেন ELIZA, যা ব্যবহারকারীর সঙ্গে কথোপকথন অনুকরণ করে, একজন মনোবিদের মতো আচরণ করে। ELIZA খুবই সহজ প্রোগ্রামিং (মূলত কীওয়ার্ড শনাক্তকরণ ও প্রতিক্রিয়া) ব্যবহার করলেও, অনেকেই ভুল করে মনে করতেন যে ELIZA সত্যিই “বোঝে” এবং অনুভূতি রাখে। ELIZA-এর সাফল্য আধুনিক চ্যাটবটগুলোর পথ প্রশস্ত করে এবং মানুষের মেশিনে আবেগ সংযুক্ত করার প্রবণতা নিয়ে প্রশ্ন তোলে।
একই সময়ে, প্রথম বুদ্ধিমান রোবটও আবির্ভূত হয়। ১৯৬৬ থেকে ১৯৭২ পর্যন্ত স্ট্যানফোর্ড রিসার্চ ইনস্টিটিউট (SRI) তৈরি করে শেকি – প্রথম মোবাইল রোবট যা স্ব-সচেতন এবং পরিকল্পনা করতে সক্ষম, শুধুমাত্র সরল কমান্ড অনুসরণ করে না। শেকি সেন্সর ও ক্যামেরা দ্বারা সজ্জিত ছিল, যা তাকে পরিবেশে চলাফেরা করতে এবং কাজগুলো যেমন পথ খোঁজা, বাধা সরানো, ঢাল পার হওয়া ইত্যাদি করতে সাহায্য করত। এটি প্রথম পূর্ণাঙ্গভাবে কম্পিউটার ভিশন, প্রাকৃতিক ভাষা প্রক্রিয়াকরণ এবং পরিকল্পনা একত্রিত রোবট ছিল, যা পরবর্তীতে রোবোটিক্স AI ক্ষেত্রের ভিত্তি স্থাপন করে।
আমেরিকান অ্যাসোসিয়েশন অফ আর্টিফিশিয়াল ইন্টেলিজেন্স (AAAI) এই সময়ে প্রতিষ্ঠিত হয় (এর পূর্বসূরী ছিল IJCAI ১৯৬৯ সম্মেলন এবং AAAI ১৯৮০ থেকে), যা AI গবেষকদের একত্রিত করে এবং AI সম্প্রদায়ের ক্রমবর্ধমান শক্তি প্রদর্শন করে।
১৯৬০-এর দশকে বিশেষজ্ঞ সিস্টেম এবং মৌলিক অ্যালগরিদমের উন্নয়নও ঘটে। ১৯৬৫ সালে, এডওয়ার্ড ফেইগেনবাম এবং সহকর্মীরা DENDRAL তৈরি করেন – যা বিশ্বের প্রথম বিশেষজ্ঞ সিস্টেম হিসেবে বিবেচিত। DENDRAL রাসায়নিক বিশ্লেষণে সাহায্য করার জন্য ডিজাইন করা হয়েছিল, যা পরীক্ষার ডেটা থেকে রাসায়নিক কাঠামো বিশ্লেষণ করে এবং রাসায়নিক বিশেষজ্ঞদের জ্ঞান ও চিন্তাভাবনা অনুকরণ করত। DENDRAL-এর সাফল্য দেখিয়েছিল যে কম্পিউটার জটিল বিশেষজ্ঞ সমস্যাগুলো সমাধান করতে পারে, যা ১৯৮০-এর দশকে বিশেষজ্ঞ সিস্টেমের বিস্ফোরণের ভিত্তি স্থাপন করে।
এছাড়াও, ১৯৭২ সালে মার্সেই বিশ্ববিদ্যালয়ে Prolog প্রোগ্রামিং ভাষা তৈরি হয়, যা লজিক্যাল AI এবং সম্পর্কীয় নিয়মভিত্তিক AI-এর জন্য একটি গুরুত্বপূর্ণ হাতিয়ার। আরেকটি গুরুত্বপূর্ণ মাইলফলক ছিল ১৯৬৯ সালে মারভিন মিনস্কি এবং সেইমুর প্যাপার্ট এর “Perceptrons” বই প্রকাশ, যা একস্তরীয় পারসেপ্ট্রনের গাণিতিক সীমাবদ্ধতা (যেমন XOR সমস্যা সমাধান করতে না পারা) তুলে ধরে, যা নিউরাল নেটওয়ার্ক ক্ষেত্রের প্রতি সন্দেহ সৃষ্টি করে।
অনেক তহবিলদাতা নিউরাল নেটওয়ার্কের প্রতি আস্থা হারাতে শুরু করেন এবং ১৯৬০-এর দশকের শেষের দিকে নিউরাল নেটওয়ার্ক গবেষণা হ্রাস পায়, যা AI-র প্রথম উত্তেজনার পর “শীতল অবস্থা”র সূচনা করে।
১৯৭০-এর দশক: চ্যালেঞ্জ এবং প্রথম “AI শীতকাল”
১৯৭০-এর দশকে AI ক্ষেত্রটি বাস্তবতার চ্যালেঞ্জের মুখোমুখি হয়: আগের দশকের উচ্চাকাঙ্ক্ষা পূরণ হয়নি, কারণ কম্পিউটারের ক্ষমতা, ডেটা এবং বৈজ্ঞানিক জ্ঞানের সীমাবদ্ধতা ছিল। ফলস্বরূপ, ১৯৭০-এর দশকের মাঝামাঝি থেকে AI-র প্রতি আস্থা ও তহবিল ব্যাপকভাবে হ্রাস পায় – যা পরবর্তীতে প্রথম “AI শীতকাল” নামে পরিচিত হয়।
১৯৭৩ সালে, সার জেমস লাইটহিল একটি রিপোর্ট প্রকাশ করেন “Artificial Intelligence: A General Survey” শিরোনামে, যা AI গবেষণার অগ্রগতিকে কঠোর সমালোচনা করে। লাইটহিল রিপোর্ট উল্লেখ করে যে AI গবেষকরা “অত্যধিক প্রতিশ্রুতি দিয়েছেন কিন্তু কমই অর্জন করেছেন”, বিশেষ করে কম্পিউটার ভাষা ও ভিশন বোঝার ক্ষেত্রে।
এই রিপোর্টের প্রভাবে ব্রিটিশ সরকার AI-এর জন্য বরাদ্দ বাজেট প্রায় পুরোপুরি বন্ধ করে দেয়। আমেরিকাতেও DARPA-এর মতো তহবিলদাতা সংস্থাগুলো বাস্তবসম্মত প্রকল্পে মনোযোগ দেয়। ফলে ১৯৭০-এর দশকের মাঝামাঝি থেকে ১৯৮০-এর শুরু পর্যন্ত AI প্রায় স্থবির হয়ে পড়ে, কম অগ্রগতি এবং তহবিলের অভাবে। এই সময়কেই “AI শীতকাল” বলা হয় – ১৯৮৪ সালে এই শব্দটি প্রথম ব্যবহৃত হয়।
তবুও, ১৯৭০-এর দশকে AI গবেষণায় কিছু উজ্জ্বল দিক ছিল। বিশেষজ্ঞ সিস্টেমগুলি একাডেমিক পরিবেশে বিকশিত হয়, যার মধ্যে উল্লেখযোগ্য হল ১৯৭৪ সালে টেড শর্টলিফের স্ট্যানফোর্ডে নির্মিত MYCIN – একটি মেডিকেল বিশেষজ্ঞ সিস্টেম যা রক্ত সংক্রমণের রোগ নির্ণয়ে সাহায্য করে। MYCIN যুক্তি-ভিত্তিক নিয়ম ব্যবহার করে চিকিৎসা পরামর্শ দেয় এবং উচ্চ নির্ভুলতা প্রদর্শন করে, যা বিশেষজ্ঞ সিস্টেমের বাস্তব মূল্য প্রমাণ করে।
এছাড়াও, ১৯৭২ সালে প্রকাশিত Prolog ভাষা প্রাকৃতিক ভাষা প্রক্রিয়াকরণ ও লজিক্যাল সমস্যা সমাধানে ব্যবহৃত হতে শুরু করে। রোবটিক্সে, ১৯৭৯ সালে স্ট্যানফোর্ডের গবেষকরা সফলভাবে স্ট্যানফোর্ড কার্ট তৈরি করেন – প্রথম স্বয়ংক্রিয় চলাচলকারী রোবট যা বাধা পেরিয়ে দূর থেকে নিয়ন্ত্রণ ছাড়াই চলতে পারে। এটি পরবর্তীতে স্বচালিত গাড়ির গবেষণার ভিত্তি স্থাপন করে।
সার্বিকভাবে, ১৯৭০-এর দশকের শেষের দিকে AI গবেষণা নীরব অবসাদে প্রবেশ করে। অনেক AI বিজ্ঞানী অন্যান্য সংশ্লিষ্ট ক্ষেত্র যেমন মেশিন লার্নিং, রোবোটিক্স এবং কম্পিউটার ভিশনে কাজ শুরু করেন।
AI তখন আর আগের দশকের মতো “উজ্জ্বল তারা” নয়, বরং একটি সংকীর্ণ ক্ষেত্র যেখানে অল্প অগ্রগতি হয়। এই সময় গবেষকদের জন্য একটি শিক্ষা ছিল যে কৃত্রিম বুদ্ধিমত্তা প্রকৃতপক্ষে অনেক বেশি জটিল এবং শুধুমাত্র যুক্তি অনুকরণের উপর নির্ভর করে চলা সম্ভব নয়।
১৯৮০-এর দশক: বিশেষজ্ঞ সিস্টেম – উত্থান ও পতন
১৯৮০-এর দশকের শুরুতে AI আবার পুনর্জীবিত হয় – কখনও কখনও “AI পুনর্জাগরণ” বলা হয়। এই পুনরুত্থান ঘটে বিশেষজ্ঞ সিস্টেমের বাণিজ্যিক সাফল্য এবং সরকার ও ব্যবসায় বিনিয়োগের পুনরায় আগ্রহের কারণে। কম্পিউটার শক্তিশালী হয় এবং সম্প্রদায় বিশ্বাস করে যে AI ধারণাগুলো সীমিত পরিসরে বাস্তবায়িত হতে পারে।
একটি বড় চালিকা শক্তি ছিল বাণিজ্যিক বিশেষজ্ঞ সিস্টেম। ১৯৮১ সালে ডিজিটাল ইকুইপমেন্ট কর্পোরেশন XCON (Expert Configuration) চালু করে – একটি বিশেষজ্ঞ সিস্টেম যা কম্পিউটার সিস্টেম কনফিগারেশনে সাহায্য করে এবং কোম্পানিকে কোটি কোটি ডলার সাশ্রয় করে। XCON-এর সাফল্য ব্যবসায়িক সিদ্ধান্ত গ্রহণে বিশেষজ্ঞ সিস্টেমের বিস্তারকে উৎসাহিত করে। অনেক প্রযুক্তি কোম্পানি বিশেষজ্ঞ সিস্টেম শেল তৈরি করে যাতে ব্যবসায়ীরা নিজস্ব সিস্টেম তৈরি করতে পারে।
লিস্প ভাষা পরীক্ষাগার থেকে বেরিয়ে আসে যখন লিস্প মেশিন নামে বিশেষ হার্ডওয়্যার তৈরি হয় যা AI প্রোগ্রাম চালানোর জন্য অপ্টিমাইজড। ১৯৮০-এর দশকের শুরুতে অনেক লিস্প মেশিন স্টার্টআপ (যেমন Symbolics, Lisp Machines Inc.) প্রতিষ্ঠিত হয়, যা বিনিয়োগের উন্মাদনা সৃষ্টি করে এবং AI-এর জন্য “লিস্প যুগ” নামে পরিচিত হয়।
বড় বড় সরকারও এই সময় AI-তে ব্যাপক বিনিয়োগ করে। ১৯৮২ সালে জাপান ৮৫০ মিলিয়ন ডলারের বাজেটে পঞ্চম প্রজন্মের কম্পিউটার প্রকল্প শুরু করে, যা লজিক এবং প্রোলগ ব্যবহার করে বুদ্ধিমান কম্পিউটার তৈরি করার লক্ষ্যে। একইভাবে, মার্কিন যুক্তরাষ্ট্র (DARPA) AI গবেষণায় তহবিল বাড়ায়, বিশেষ করে বিশেষজ্ঞ সিস্টেম, প্রাকৃতিক ভাষা প্রক্রিয়াকরণ এবং জ্ঞানভিত্তিক সিস্টেমে।
এই নতুন আশাবাদের মধ্যে, কৃত্রিম নিউরাল নেটওয়ার্কও ধীরে ধীরে পুনরুজ্জীবিত হয়। ১৯৮৬ সালে গবেষক জেফ্রি হিন্টন এবং সহকর্মীরা ব্যাকপ্রোপাগেশন অ্যালগরিদম প্রকাশ করেন – যা বহুস্তরীয় নিউরাল নেটওয়ার্ক প্রশিক্ষণের জন্য কার্যকর পদ্ধতি, যা ১৯৬৯ সালের “Perceptrons” বইয়ে উল্লিখিত সীমাবদ্ধতা দূর করে।
আসলে ব্যাকপ্রোপাগেশনের ধারণা ১৯৭০ সালে থেকেই ছিল, কিন্তু ১৯৮০-এর দশকের মাঝামাঝি কম্পিউটারের ক্ষমতা বৃদ্ধির কারণে এটি ব্যাপকভাবে ব্যবহৃত হয়। ব্যাকপ্রোপাগেশন অ্যালগরিদম নিউরাল নেটওয়ার্ক গবেষণার দ্বিতীয় ঢেউ শুরু করে। তখন থেকে গভীর নিউরাল নেটওয়ার্ক শিখতে সক্ষম হবে বলে বিশ্বাস বাড়তে থাকে, যা পরবর্তীতে গভীর শিক্ষা (deep learning) এর ভিত্তি গড়ে তোলে।
নতুন গবেষক যেমন ইয়ান লেকুন (ফ্রান্স), ইয়োশুয়া বেনজিও (কানাডা) এই সময়ে নিউরাল নেটওয়ার্ক আন্দোলনে যোগ দেন এবং দশকের শেষে সফল হাতের লেখা স্বীকৃতি মডেল তৈরি করেন।
তবে, AI-এর দ্বিতীয় উত্থান দীর্ঘস্থায়ী হয়নি। ১৯৮০-এর দশকের শেষে AI আবার সংকটে পড়ে কারণ ফলাফল প্রত্যাশা পূরণ করতে পারেনি। বিশেষজ্ঞ সিস্টেমগুলি কিছু সংকীর্ণ ক্ষেত্রে কার্যকর হলেও, তাদের কঠোরতা, সম্প্রসারণের অসুবিধা এবং নিয়ম আপডেটের প্রয়োজনীয়তা স্পষ্ট হয়।
অনেক বড় বিশেষজ্ঞ সিস্টেম প্রকল্প ব্যর্থ হয় এবং লিস্প মেশিন বাজারও পতিত হয় সস্তা ব্যক্তিগত কম্পিউটারের প্রতিযোগিতায়। ১৯৮৭ সালে লিস্প শিল্প প্রায় সম্পূর্ণ ধ্বংসপ্রাপ্ত হয়। AI-তে দ্বিতীয়বারের মতো তহবিল হ্রাস পায় এবং দ্বিতীয় “AI শীতকাল” শুরু হয়। ১৯৮৪ সালে প্রবর্তিত “AI শীতকাল” শব্দটি এই সময়ে প্রযোজ্য হয়, যখন অনেক AI কোম্পানি ১৯৮৭-৮৮ সালে বন্ধ হয়ে যায়। AI আবার একটি মন্দার পর্যায়ে প্রবেশ করে, গবেষকরা তাদের প্রত্যাশা ও কৌশল পুনর্বিবেচনা করতে বাধ্য হন।
সারাংশে, ১৯৮০-এর দশক AI-এর জন্য একটি উত্থান-পতনের চক্র ছিল। বিশেষজ্ঞ সিস্টেম প্রথমবার শিল্পে AI প্রবেশ করায়, কিন্তু স্থির নিয়মভিত্তিক পদ্ধতির সীমাবদ্ধতাও প্রকাশ পায়। তবুও, এই সময়ে অনেক মূল্যবান ধারণা ও সরঞ্জাম জন্মায়: নিউরাল নেটওয়ার্ক অ্যালগরিদম থেকে শুরু করে প্রথম জ্ঞানভিত্তিক সিস্টেম। অতিরিক্তভাবে, অতিরঞ্জিত প্রত্যাশা এড়ানোর শিক্ষা নেওয়া হয়, যা পরবর্তী দশকে আরও সতর্ক ও ভিত্তিপ্রস্তর গবেষণার পথ প্রশস্ত করে।
১৯৯০-এর দশক: AI-এর বাস্তব প্রত্যাবর্তন
১৯৮০-এর দশকের শেষের AI শীতকাল পর, ১৯৯০-এর দশকে AI-তে আস্থা ধীরে ধীরে ফিরে আসে বাস্তবমুখী অগ্রগতির মাধ্যমে। সাধারণ AI (সর্বজনীন কৃত্রিম বুদ্ধিমত্তা) এর পরিবর্তে গবেষকরা বিশেষায়িত AI – অর্থাৎ নির্দিষ্ট সমস্যায় AI প্রযুক্তি প্রয়োগে মনোযোগ দেন, যেখানে তারা উল্লেখযোগ্য ফলাফল পেতে শুরু করেন। AI-এর বিভিন্ন উপশাখা যেমন ভয়েস রিকগনিশন, কম্পিউটার ভিশন, অনুসন্ধান অ্যালগরিদম, জ্ঞানভিত্তিক সিস্টেম স্বাধীনভাবে বিকশিত হয় এবং ব্যাপকভাবে ব্যবহৃত হতে শুরু করে।
একটি গুরুত্বপূর্ণ মাইলফলক ছিল ১৯৯৭ সালের মে মাসে, IBM-এর Deep Blue কম্পিউটার বিশ্ব দাবা চ্যাম্পিয়ন গ্যারি কাসপারভকে পরাজিত করে। এটি ছিল প্রথমবারের মতো AI একটি জটিল বুদ্ধিমত্তাসম্পন্ন খেলা জিতে বিশ্ব চ্যাম্পিয়নকে হারায়, যা ব্যাপক আলোড়ন সৃষ্টি করে।
Deep Blue-এর জয় – যা ব্রুট ফোর্স অনুসন্ধান অ্যালগরিদম এবং খেলার ডাটাবেস ব্যবহার করেছিল – কম্পিউটারের বিশাল গণনাশক্তি এবং বিশেষায়িত প্রযুক্তির ক্ষমতা প্রদর্শন করে। এই ঘটনা AI-এর মিডিয়ায় পুনরায় আগ্রহ সৃষ্টি করে এবং দীর্ঘ সময়ের পর গবেষণায় উৎসাহ জোগায়।
দাবা ছাড়াও, ১৯৯০-এর দশকে AI বিভিন্ন ক্ষেত্রে অগ্রগতি করে। ১৯৯৪ সালে Chinook প্রোগ্রাম ড্রাফটস (চেকার্সের মতো খেলা) সম্পূর্ণরূপে সমাধান করে এবং বিশ্ব চ্যাম্পিয়নকে স্বীকার করতে বাধ্য করে যে তারা আর কম্পিউটারকে হারাতে পারবে না।
ভয়েস রিকগনিশনে, ১৯৯০ সালে Dragon Dictate-এর মতো বাণিজ্যিক সিস্টেম বাজারে আসে এবং দশকের শেষে ভয়েস রিকগনিশন সফটওয়্যার ব্যক্তিগত কম্পিউটারে ব্যাপকভাবে ব্যবহৃত হয়। হাতের লেখা স্বীকৃতি PDA (ব্যক্তিগত ডিজিটাল সহকারী) ডিভাইসে সংযুক্ত হয় এবং এর নির্ভুলতা ক্রমবর্ধমান হয়।
কম্পিউটার ভিশন অ্যাপ্লিকেশনগুলি শিল্পে ব্যবহৃত হতে শুরু করে, যেমন উপাদান পরিদর্শন এবং নিরাপত্তা ব্যবস্থা। এমনকি মেশিন অনুবাদ – যা ১৯৬০-এর দশকে AI-কে হতাশ করেছিল – উল্লেখযোগ্য অগ্রগতি করে, যেমন SYSTRAN সিস্টেম যা ইউরোপীয় ইউনিয়নের জন্য বহু ভাষার স্বয়ংক্রিয় অনুবাদ প্রদান করে।
আরেকটি গুরুত্বপূর্ণ ক্ষেত্র ছিল স্ট্যাটিস্টিক্যাল মেশিন লার্নিং এবং নিউরাল নেটওয়ার্ক যা বড় ডেটা বিশ্লেষণে ব্যবহৃত হয়। ১৯৯০-এর দশকের শেষে ইন্টারনেটের বিস্ফোরণ ঘটে, যা বিশাল পরিমাণ ডিজিটাল ডেটা তৈরি করে। ডেটা মাইনিং এবং মেশিন লার্নিং অ্যালগরিদম যেমন সিদ্ধান্ত গাছ, নিউরাল নেটওয়ার্ক, হিডেন মার্কভ মডেল ইত্যাদি ওয়েব ডেটা বিশ্লেষণ, অনুসন্ধান অপ্টিমাইজেশন এবং ব্যক্তিগতকৃত কন্টেন্টে ব্যবহৃত হয়।
“ডেটা সায়েন্স” শব্দটি তখন এতটা প্রচলিত ছিল না, তবে AI ইতিমধ্যে সফটওয়্যার সিস্টেমে প্রবেশ করেছে যা ব্যবহারকারীর ডেটা থেকে শেখে (যেমন: ইমেইল স্প্যাম ফিল্টার, ই-কমার্স প্রোডাক্ট রিকমেন্ডেশন)। এই ছোট কিন্তু কার্যকর সাফল্যগুলি AI-এর প্রতি ব্যবসা ও সমাজের আস্থা ফিরিয়ে আনে।
সুতরাং, ১৯৯০-এর দশক ছিল AI-এর নীরব কিন্তু দৃঢ় প্রবেশ জীবনে। বড় বড় বুদ্ধিমত্তার দাবি না করে, বিকাশকারীরা বিশেষায়িত সমস্যাগুলোর সমাধানে মনোযোগ দেন। ফলস্বরূপ, ২০শ শতকের শেষের দিকে AI অনেক প্রযুক্তি পণ্যে উপস্থিত ছিল যা ব্যবহারকারীরা প্রায়ই চিনতেন না – গেম, সফটওয়্যার থেকে ইলেকট্রনিক ডিভাইস পর্যন্ত। এই সময় AI-এর জন্য ডেটা ও অ্যালগরিদমের একটি গুরুত্বপূর্ণ ভিত্তি তৈরি হয় যা পরবর্তী বিস্ফোরণের জন্য প্রস্তুতি দেয়।
২০০০-এর দশক: মেশিন লার্নিং এবং বড় ডেটার যুগ
২১শ শতকে প্রবেশের সাথে সাথে, AI ইন্টারনেট এবং বড় ডেটার যুগে প্রবলভাবে প্রবাহিত হয়। ২০০০-এর দশকে ব্যক্তিগত কম্পিউটার, ইন্টারনেট নেটওয়ার্ক এবং সেন্সর ডিভাইসের বিস্ফোরণ ঘটে, যা বিশাল পরিমাণ ডেটা তৈরি করে। মেশিন লার্নিং – বিশেষ করে পর্যবেক্ষণাধীন শেখার পদ্ধতি – এই ডেটা থেকে “তেল খনন” করার প্রধান হাতিয়ার হয়ে ওঠে।
“ডেটা হল নতুন তেল” স্লোগানটি জনপ্রিয় হয়, কারণ বেশি ডেটা থাকলে AI অ্যালগরিদম আরও সঠিক হয়। বড় প্রযুক্তি কোম্পানিগুলো ব্যবহারকারীর ডেটা সংগ্রহ ও শেখার সিস্টেম তৈরি করতে শুরু করে, যেমন: গুগল উন্নত সার্চ ইঞ্জিন, অ্যামাজন ব্যবহারকারীর আচরণ অনুযায়ী প্রোডাক্ট সাজেশন, নেটফ্লিক্স সিনেমার প্রস্তাব ইত্যাদি। AI ক্রমশ ডিজিটাল প্ল্যাটফর্মের “নীরব মস্তিষ্ক” হয়ে ওঠে।
২০০৬ সালে একটি গুরুত্বপূর্ণ ঘটনা ঘটে: ফেই-ফেই লি, স্ট্যানফোর্ড বিশ্ববিদ্যালয়ের অধ্যাপক, ImageNet প্রকল্প শুরু করেন – যা ১৪ মিলিয়নেরও বেশি লেবেলযুক্ত ছবি নিয়ে একটি বিশাল ডেটাসেট। ২০০৯ সালে পরিচিত হওয়া ImageNet দ্রুত কম্পিউটার ভিশন অ্যালগরিদম প্রশিক্ষণ ও মূল্যায়নের মানদণ্ড হয়ে ওঠে, বিশেষ করে বস্তু সনাক্তকরণে।
ImageNet কে “ডোপিং” হিসেবে বর্ণনা করা হয় যা পরবর্তীতে গভীর শিক্ষার (deep learning) গবেষণাকে ত্বরান্বিত করে, কারণ এটি জটিল গভীর নিউরাল নেটওয়ার্ক মডেল প্রশিক্ষণের জন্য পর্যাপ্ত ডেটা সরবরাহ করে। ২০১০ সাল থেকে শুরু হওয়া বার্ষিক ImageNet চ্যালেঞ্জ একটি গুরুত্বপূর্ণ প্রতিযোগিতা হয়ে ওঠে যেখানে গবেষকরা সেরা ছবি সনাক্তকরণ অ্যালগরিদম তৈরি করে প্রতিযোগিতা করেন। ২০১২ সালে এই প্রতিযোগিতায় একটি ঐতিহাসিক পরিবর্তন ঘটে (দেখুন ২০১০-এর দশকের অংশ)।
২০০০-এর দশকে AI আরও অনেক গুরুত্বপূর্ণ অ্যাপ্লিকেশন অর্জন করে:
- ২০০৫ সালে, স্ট্যানফোর্ডের স্বচালিত গাড়ি (যার ডাকনাম “স্ট্যানলি”) DARPA গ্র্যান্ড চ্যালেঞ্জ জিতে – ২১২ কিমি মরুভূমি পথ। স্ট্যানলি ৬ ঘণ্টা ৫৩ মিনিটে পথ শেষ করে, যা স্বচালিত গাড়ির যুগের সূচনা করে এবং পরবর্তীতে গুগল, উবারের বিনিয়োগ আকর্ষণ করে।
- মোবাইলে ভার্চুয়াল অ্যাসিস্ট্যান্ট আবির্ভাব: ২০০৮ সালে গুগল ভয়েস সার্চ iPhone-এ ভয়েস সার্চ চালু করে; এবং ২০১১ সালে অ্যাপল সিরি (Apple Siri) আসে – যা ভয়েস কমান্ডে কাজ করে। সিরি স্বয়ংক্রিয় ভাষা চিন্তা, প্রাকৃতিক ভাষা বোঝা এবং ওয়েব সার্ভিসের মাধ্যমে ব্যবহারকারীর প্রশ্নের উত্তর দেয়, যা AI-এর প্রথম বৃহৎ জনগোষ্ঠীর কাছে প্রবেশ।
- ২০১১ সালে, সুপারকম্পিউটার IBM Watson আমেরিকার টেলিভিশন গেম শো Jeopardy!-তে দুই চ্যাম্পিয়নকে পরাজিত করে। Watson জটিল ইংরেজি প্রশ্ন বুঝতে এবং বিশাল তথ্যভাণ্ডার থেকে উত্তর খুঁজে পেতে সক্ষম, যা প্রাকৃতিক ভাষা প্রক্রিয়াকরণ ও তথ্য অনুসন্ধানে AI-এর শক্তি প্রদর্শন করে।
- সোশ্যাল মিডিয়া ও ওয়েব: ফেসবুক ২০১০-এর দিকে স্বয়ংক্রিয় মুখ সনাক্তকরণ চালু করে, যা ব্যবহারকারীর ছবিতে ট্যাগ দেয়। ইউটিউব ও গুগল AI ব্যবহার করে কন্টেন্ট ফিল্টারিং ও ভিডিও সাজেশন করে। মেশিন লার্নিং প্রযুক্তি নীরবে প্ল্যাটফর্ম চালায়, যা ব্যবহারকারীর অভিজ্ঞতা উন্নত করে যদিও তারা তা বুঝতে পারে না।
সুতরাং, ২০০০-এর দশকে AI-এর মূল চালিকা শক্তি ছিল ডেটা ও অ্যাপ্লিকেশন। প্রচলিত মেশিন লার্নিং অ্যালগরিদম যেমন রিগ্রেশন, SVM, সিদ্ধান্ত গাছ ইত্যাদি বড় পরিসরে ব্যবহৃত হয় এবং বাস্তব ফলাফল দেয়।
AI গবেষণা থেকে শিল্পে প্রবাহিত হয়: “ব্যবসার জন্য AI” একটি জনপ্রিয় বিষয় হয়ে ওঠে, যেখানে অনেক কোম্পানি AI সমাধান সরবরাহ করে ব্যবস্থাপনা, অর্থনীতি, বিপণন ইত্যাদিতে। ২০০৬ সালে “এন্টারপ্রাইজ AI” শব্দটি পরিচিত হয়, যা AI ব্যবহার করে ব্যবসায়িক দক্ষতা ও সিদ্ধান্ত গ্রহণ উন্নত করার ওপর জোর দেয়।
২০০০-এর দশকের শেষের দিকে গভীর শিক্ষার বিপ্লবের সূচনা হয়। বহুস্তরীয় নিউরাল নেটওয়ার্ক গবেষণা এগিয়ে যায়। ২০০৯ সালে অ্যান্ড্রু এনজি এবং তার দল স্ট্যানফোর্ডে GPU ব্যবহার করে নিউরাল নেটওয়ার্ক প্রশিক্ষণ করেন, যা CPU থেকে ৭০ গুণ দ্রুত।
GPU-এর সমান্তরাল গণনার ক্ষমতা নিউরাল নেটওয়ার্কের ম্যাট্রিক্স গণনার জন্য উপযুক্ত, যা ২০১০-এর দশকে বড় গভীর শিক্ষার মডেল তৈরির পথ প্রশস্ত করে। বড় ডেটা, শক্তিশালী হার্ডওয়্যার, উন্নত অ্যালগরিদম – এই তিনটি উপাদান তখন প্রস্তুত ছিল এবং AI-এর নতুন বিপ্লবের অপেক্ষায় ছিল।
২০১০-এর দশক: গভীর শিক্ষার বিপ্লব (Deep Learning)
যদি AI-এর এমন একটি সময়কাল বেছে নিতে হয় যখন এটি সত্যিই “উড়ে ওঠে”, তবে তা ২০১০-এর দশক। আগের দশকের ডেটা ও হার্ডওয়্যার ভিত্তির ওপর ভিত্তি করে, কৃত্রিম বুদ্ধিমত্তা গভীর শিক্ষার যুগে প্রবেশ করে – বহুস্তরীয় নিউরাল নেটওয়ার্ক মডেল অসাধারণ সাফল্য অর্জন করে এবং বিভিন্ন AI কাজের রেকর্ড ভেঙে দেয়। মানুষের মস্তিষ্কের মতো শেখার মেশিনের স্বপ্ন কিছুটা বাস্তবায়িত হয়।
২০১২ সালে একটি ঐতিহাসিক ঘটনা ঘটে, যখন জেফ্রি হিন্টন এবং তার ছাত্ররা (অ্যালেক্স ক্রিজেভস্কি, ইলিয়া সুটস্কেভার) ImageNet চ্যালেঞ্জে অংশ নেন। তাদের মডেল – যা AlexNet নামে পরিচিত – একটি ৮-স্তরীয় কনভলিউশনাল নিউরাল নেটওয়ার্ক যা GPU-তে প্রশিক্ষিত। ফলাফল ছিল অসাধারণ: AlexNet দ্বিতীয় স্থান অধিকারী দলের তুলনায় দ্বিগুণ কম ভুলের হার দেখায়।
এই প্রভাবশালী জয় কম্পিউটার ভিশন সম্প্রদায়কে বিস্মিত করে এবং AI-তে “গভীর শিক্ষার উন্মাদনা” শুরু করে। পরবর্তী কয়েক বছরে, প্রচলিত ছবি সনাক্তকরণ পদ্ধতিগুলো প্রায় সবই গভীর শিক্ষার মডেল দ্বারা প্রতিস্থাপিত হয়।
AlexNet-এর সাফল্য প্রমাণ করে যে পর্যাপ্ত ডেটা (ImageNet) এবং গণনা (GPU) থাকলে গভীর নিউরাল নেটওয়ার্ক অন্যান্য AI পদ্ধতির চেয়ে অনেক এগিয়ে যেতে পারে। হিন্টন ও তার সহকর্মীরা দ্রুত গুগলে যোগ দেন এবং গভীর শিক্ষা AI গবেষণার সবচেয়ে জনপ্রিয় বিষয় হয়ে ওঠে।
গভীর শিক্ষা শুধু কম্পিউটার ভিশন নয়, বরং ভয়েস প্রক্রিয়াকরণ, ভাষা প্রক্রিয়াকরণ এবং অন্যান্য ক্ষেত্রেও বিস্তার লাভ করে। ২০১২ সালে, গুগল ব্রেন (অ্যান্ড্রু এনজি ও জেফ ডিনের প্রকল্প) একটি গভীর নিউরাল নেটওয়ার্ক তৈরি করে যা ইউটিউব ভিডিও থেকে “বিড়াল” ধারণাটি স্বয়ংক্রিয়ভাবে আবিষ্কার করে, যা লেবেল ছাড়াই শেখে।
২০১১ থেকে ২০১৪ সালের মধ্যে, ভার্চুয়াল অ্যাসিস্ট্যান্ট যেমন সিরি, গুগল নাও (২০১২), এবং মাইক্রোসফট কর্টানা (২০১৪) চালু হয়, যা উন্নত ভয়েস রিকগনিশন ও প্রাকৃতিক ভাষা বোঝার সুবিধা নেয়। উদাহরণস্বরূপ, মাইক্রোসফটের ভয়েস রিকগনিশন ২০১৭ সালে মানুষের সমতুল্য নির্ভুলতা অর্জন করে, যা গভীর নিউরাল নেটওয়ার্ক ব্যবহার করে। অনুবাদে, ২০১৬ সালে গুগল ট্রান্সলেট নিউরাল মেশিন ট্রান্সলেশন (NMT) প্রযুক্তিতে সরে আসে, যা পূর্বের পরিসংখ্যানভিত্তিক পদ্ধতির তুলনায় অনেক উন্নত।
আরেকটি গুরুত্বপূর্ণ ঘটনা ছিল গো খেলার AI জয় – যা আগে অনেক দূরবর্তী মনে করা হত। ২০১৬ সালের মার্চে, DeepMind-এর AlphaGo বিশ্ব সেরা গো খেলোয়াড় লি সেডলকে ৪-১ ব্যবধানে পরাজিত করে। গো দাবার চেয়ে অনেক বেশি জটিল, যেখানে সম্ভাব্য চালের সংখ্যা এত বেশি যে ব্রুট ফোর্স পদ্ধতি ব্যবহার করা যায় না। AlphaGo গভীর শিক্ষা ও মন্টে কার্লো ট্রি সার্চ অ্যালগরিদম ব্যবহার করে, মানুষের কোটি কোটি খেলা থেকে শেখে এবং নিজেই খেলতে পারে।
এই জয় Deep Blue-কাসপারভ ম্যাচের সমতুল্য হিসেবে বিবেচিত হয়, যা প্রমাণ করে AI এখন এমন ক্ষেত্রেও মানুষের চেয়ে উন্নত হতে পারে যা ইন্দ্রিয় ও অভিজ্ঞতার ওপর নির্ভর করে। AlphaGo-এর পর DeepMind AlphaGo Zero (২০১৭) তৈরি করে, যা সম্পূর্ণ নিজে থেকে শিখে এবং আগের সংস্করণকে ১০০-০ ব্যবধানে পরাজিত করে। এটি রিইনফোর্সমেন্ট লার্নিং ও গভীর শিক্ষার সমন্বয়ের সম্ভাবনা প্রদর্শন করে।
২০১৭ সালে ভাষা প্রক্রিয়াকরণে একটি বিপ্লব ঘটে: ট্রান্সফরমার আর্কিটেকচার। গুগলের গবেষকরা “Attention Is All You Need” প্রবন্ধে ট্রান্সফরমার মডেল উপস্থাপন করেন, যা সেল্ফ-অ্যাটেনশন ব্যবহার করে বাক্যের শব্দগুলোর সম্পর্ক শেখে ক্রমবদ্ধতা ছাড়াই।
ট্রান্সফরমার বড় ভাষা মডেল (LLM) প্রশিক্ষণে আগের RNN/LSTM ভিত্তিক মডেলগুলোর তুলনায় অনেক বেশি কার্যকর। এর পর থেকে BERT (গুগল, ২০১৮) এবং বিশেষ করে OpenAI-এর GPT (Generative Pre-trained Transformer) ২০১৮ সালে প্রথম প্রকাশ পায়।
এই মডেলগুলো ভাষা সম্পর্কিত বিভিন্ন কাজ যেমন শ্রেণীবিভাগ, প্রশ্নোত্তর এবং লেখালেখিতে অসাধারণ ফলাফল দেয়। ট্রান্সফরমার AI ভাষা মডেলের যুগের ভিত্তি স্থাপন করে যা ২০২০-এর দশকে ব্যাপক প্রতিযোগিতার জন্ম দেয়।
২০১০-এর দশকের শেষের দিকে সৃষ্টিশীল AI (generative AI) আবির্ভাব ঘটে – AI মডেল যা স্বয়ংক্রিয়ভাবে নতুন বিষয়বস্তু তৈরি করতে পারে। ২০১৪ সালে ইয়ান গুডফেলো এবং সহকর্মীরা GAN (Generative Adversarial Network) আবিষ্কার করেন, যা দুটি প্রতিদ্বন্দ্বী নিউরাল নেটওয়ার্ক ব্যবহার করে বাস্তবসম্মত নকল ডেটা তৈরি করে।
GAN দ্রুত নকল মানুষের মুখের ছবি (deepfake) তৈরিতে জনপ্রিয় হয়। পাশাপাশি, ভেরিয়েশনাল অটোএনকোডার (VAE) এবং স্টাইল ট্রান্সফার মডেলও বিকশিত হয়, যা ছবি ও ভিডিওকে নতুন শৈলীতে রূপান্তর করতে সক্ষম।
২০১৯ সালে OpenAI GPT-2 প্রকাশ করে – ১.৫ বিলিয়ন প্যারামিটার বিশিষ্ট একটি টেক্সট জেনারেশন মডেল যা মানুষের মতো সাবলীল লেখা তৈরি করতে পারে। এটি স্পষ্ট করে যে AI এখন শুধু শ্রেণীবিভাগ বা পূর্বাভাস নয়, বরং সৃজনশীল লেখাও করতে পারে।
২০১০-এর দশকে AI অসাধারণ অগ্রগতি করে, যেখানে আগে অসম্ভব মনে হওয়া কাজগুলো যেমন ছবি সনাক্তকরণ, ভয়েস রিকগনিশন, অনুবাদ এবং জটিল খেলা খেলা AI এখন মানুষের সমতুল্য বা তারও বেশি দক্ষতা অর্জন করে।
সবচেয়ে গুরুত্বপূর্ণ, AI দৈনন্দিন জীবনে প্রবেশ করে: স্মার্টফোন ক্যামেরা স্বয়ংক্রিয় মুখ সনাক্তকরণ, স্মার্ট স্পিকার ভার্চুয়াল অ্যাসিস্ট্যান্ট (অ্যালেক্সা, গুগল হোম), এবং সোশ্যাল মিডিয়ার কন্টেন্ট প্রস্তাবনা AI দ্বারা পরিচালিত হয়। এটি সত্যিই একটি AI বিস্ফোরণ, যা অনেককে মনে করিয়ে দেয় যে “AI হল নতুন বিদ্যুৎ” – একটি মৌলিক প্রযুক্তি যা প্রতিটি শিল্পকে পরিবর্তন করছে।
২০২০-এর দশক: সৃষ্টিশীল AI বিস্ফোরণ ও নতুন প্রবণতা
মাত্র কয়েক বছরের মধ্যে ২০২০-এর দশকে, AI অভূতপূর্ব গতিতে বিস্ফোরিত হয়, প্রধানত সৃষ্টিশীল AI (Generative AI) এবং বড় ভাষা মডেল (LLM) এর উত্থানের কারণে। এই সিস্টেমগুলো AI-কে সরাসরি শত কোটি ব্যবহারকারীর কাছে পৌঁছে দেয় এবং একটি সৃষ্টিশীল অ্যাপ্লিকেশন তরঙ্গ সৃষ্টি করে, যা ব্যাপক সামাজিক আলোচনাও উস্কে দেয় AI-এর প্রভাব নিয়ে।
২০২০ সালের জুনে OpenAI GPT-3 প্রকাশ করে – ১৭৫ বিলিয়ন প্যারামিটার বিশিষ্ট একটি বিশাল ভাষা মডেল, যা আগের বৃহত্তম মডেলের দশ গুণ। GPT-3 বিস্ময়করভাবে মানবসদৃশ লেখা, প্রশ্নোত্তর, কবিতা, প্রোগ্রামিং কোড তৈরি করতে পারে, যদিও মাঝে মাঝে বাস্তব ভুলও করে। GPT-3-এর শক্তি দেখায় যে মডেলের আকার এবং প্রশিক্ষণ ডেটার পরিমাণ ভাষা দক্ষতায় গুরুত্বপূর্ণ ভূমিকা রাখে। GPT-3 ভিত্তিক অ্যাপ্লিকেশন দ্রুত তৈরি হয়, যেমন মার্কেটিং কন্টেন্ট লেখা, ইমেইল সহায়তা এবং প্রোগ্রামিং সহায়তা।
২০২২ সালের নভেম্বর মাসে AI জনসাধারণের সামনে আসে ChatGPT – OpenAI-এর GPT-3.5 ভিত্তিক একটি ইন্টারেক্টিভ চ্যাটবট। মাত্র ৫ দিনে ChatGPT ১ মিলিয়ন ব্যবহারকারী পায়, এবং ২ মাসে ১০০ মিলিয়ন ব্যবহারকারী ছাড়িয়ে যায়, যা ইতিহাসের দ্রুততম বর্ধনশীল ভোক্তা অ্যাপ্লিকেশন হিসেবে পরিচিত।
ChatGPT সাবলীলভাবে বিভিন্ন প্রশ্নের উত্তর দিতে পারে, যেমন লেখা তৈরি, গণিত সমাধান, পরামর্শ প্রদান ইত্যাদি, যা ব্যবহারকারীদের “বুদ্ধিমত্তা” এবং নমনীয়তা দ্বারা মুগ্ধ করে। ChatGPT-এর জনপ্রিয়তা AI-এর প্রথম বৃহৎ পরিসরে সৃষ্টিশীল কন্টেন্ট তৈরির সরঞ্জাম হিসেবে ব্যবহারের সূচনা করে এবং বড় প্রযুক্তি কোম্পানির AI প্রতিযোগিতা শুরু করে।
২০২৩ সালের শুরুতে, মাইক্রোসফট GPT-4 (OpenAI-এর পরবর্তী মডেল) Bing সার্চে সংযুক্ত করে, এবং গুগল তাদের নিজস্ব LaMDA মডেল ভিত্তিক চ্যাটবট Bard চালু করে। এই প্রতিযোগিতা সৃষ্টিশীল AI প্রযুক্তির বিস্তার ও দ্রুত উন্নয়ন ত্বরান্বিত করে।
টেক্সটের পাশাপাশি, সৃষ্টিশীল AI ছবি ও শব্দ ক্ষেত্রেও উল্লেখযোগ্য অগ্রগতি করে। ২০২২ সালে টেক্সট-টু-ইমেজ মডেল যেমন DALL-E 2 (OpenAI), Midjourney এবং Stable Diffusion ব্যবহারকারীদের টেক্সট বর্ণনা থেকে ছবি তৈরি করতে দেয়। ছবির গুণমান এতটাই বাস্তবসম্মত ও সৃজনশীল যে এটি ডিজিটাল কন্টেন্ট সৃষ্টির নতুন যুগের সূচনা করে।
তবে, এটি কপিরাইট ও নৈতিকতার চ্যালেঞ্জও সৃষ্টি করে, কারণ AI শিল্পীদের কাজ থেকে শেখে এবং অনুরূপ কাজ তৈরি করে। শব্দ ক্ষেত্রে, নতুন টেক্সট-টু-স্পিচ মডেলগুলি মানুষের মতো স্বর তৈরি করতে পারে, এমনকি বিখ্যাত ব্যক্তিদের কণ্ঠস্বর নকল করতে পারে, যা deepfake ভয় বাড়ায়।
২০২৩ সালে প্রথমবারের মতো AI প্রশিক্ষণের জন্য ব্যবহৃত ডেটার কপিরাইট নিয়ে মামলা হয় – যেমন Getty Images Stability AI-কে (Stable Diffusion নির্মাতা) মামলা করে কারণ তারা অনুমতি ছাড়া কোটি কোটি কপিরাইটযুক্ত ছবি ব্যবহার করেছে। এটি AI বিস্ফোরণের অন্ধকার দিক তুলে ধরে: আইনি, নৈতিক ও সামাজিক সমস্যা বেড়ে উঠছে এবং তা গুরুত্ব সহকারে মোকাবেলা করা দরকার।
AI-এর উন্মাদনার মাঝে, ২০২৩ সালে প্রযুক্তি নেতারা শক্তিশালী AI-এর ঝুঁকি নিয়ে উদ্বেগ প্রকাশ করেন। ১,০০০-এরও বেশি প্রযুক্তি ব্যক্তিত্ব (যেমন এলন মাস্ক, স্টিভ ওজনিক, AI গবেষকরা) একটি খোলা চিঠিতে GPT-4-এর চেয়ে বড় AI মডেল প্রশিক্ষণ ৬ মাসের জন্য স্থগিত করার আহ্বান জানান, কারণ দ্রুত উন্নয়ন নিয়ন্ত্রণের বাইরে চলে যেতে পারে।
একই বছর, গভীর শিক্ষার “পিতা” জেফ্রি হিন্টনও মানুষের নিয়ন্ত্রণের বাইরে AI যাওয়ার ঝুঁকি নিয়ে সতর্ক করেন। ইউরোপীয় ইউনিয়ন দ্রুত AI আইন (EU AI Act) প্রণয়ন করে – যা বিশ্বের প্রথম ব্যাপক AI নিয়ন্ত্রণ বিধিমালা, ২০২৪ থেকে প্রযোজ্য হবে। এই আইন অগ্রহণযোগ্য ঝুঁকিপূর্ণ AI সিস্টেম (যেমন ব্যাপক নজরদারি, সামাজিক স্কোরিং) নিষিদ্ধ করে এবং AI মডেলের স্বচ্ছতা দাবি করে।
যুক্তরাষ্ট্রের বিভিন্ন রাজ্যও সংবেদনশীল ক্ষেত্রে AI ব্যবহারে বিধিনিষেধ আরোপ করে (যেমন নিয়োগ, অর্থ, নির্বাচনী প্রচারণা)। স্পষ্ট যে, বিশ্ব দ্রুত AI-এর জন্য আইনি ও নৈতিক কাঠামো তৈরি করছে, যা প্রযুক্তির বিস্তৃত প্রভাবের জন্য অপরিহার্য।
সার্বিকভাবে, ২০২০-এর দশক AI-র জন্য প্রযুক্তিগত ও জনপ্রিয়তার বিস্ফোরণ। নতুন AI সরঞ্জাম যেমন ChatGPT, DALL-E, Midjourney ইত্যাদি পরিচিত হয়ে উঠেছে, যা কোটি কোটি মানুষকে সৃজনশীল ও কার্যকরী কাজ করতে সাহায্য করছে এমন উপায়ে যা আগে কখনো হয়নি।
একই সঙ্গে, AI-তে বিনিয়োগের প্রতিযোগিতা তীব্র হচ্ছে: পূর্বাভাস অনুযায়ী, AI-ভিত্তিক ব্যবসায়িক খরচ আগামী বছরগুলোতে ১ ট্রিলিয়ন ডলার ছাড়িয়ে যাবে। AI ক্রমশ বিভিন্ন ক্ষেত্রে প্রবেশ করছে: স্বাস্থ্যসেবা (চিত্র নির্ণয়, নতুন ওষুধ অনুসন্ধান), অর্থনীতি (ঝুঁকি বিশ্লেষণ, প্রতারণা সনাক্তকরণ), শিক্ষা (ভার্চুয়াল শিক্ষক, ব্যক্তিগতকৃত শিক্ষাসামগ্রী), পরিবহন (উচ্চ স্তরের স্বচালিত গাড়ি), রক্ষণাবেক্ষণ (কৌশলগত সিদ্ধান্ত গ্রহণ) ইত্যাদি।
সংক্ষেপে, AI এখন বিদ্যুৎ বা ইন্টারনেটের মতো একটি প্রযুক্তি অবকাঠামো, যা প্রতিটি ব্যবসা ও সরকার ব্যবহার করতে চায়। অনেক বিশেষজ্ঞ আশাবাদী যে সঠিক উন্নয়ন ও নিয়ন্ত্রণের মাধ্যমে AI আরও বড় অগ্রগতি এবং জীবনমান উন্নতিতে অবদান রাখবে।
১৯৫০-এর দশক থেকে আজ পর্যন্ত, AI-এর উন্নয়নের ইতিহাস একটি বিস্ময়কর যাত্রা – যা উচ্চাকাঙ্ক্ষা, হতাশা এবং পুনরুজ্জীবনের গল্প। ছোট একটি ডার্টমাউথ ১৯৫৬ কর্মশালা থেকে শুরু করে, AI দুইবার “শীতকাল” অতিক্রম করেছে অতিরিক্ত প্রত্যাশার কারণে, কিন্তু প্রতিবারই বৈজ্ঞানিক ও প্রযুক্তিগত অগ্রগতির মাধ্যমে শক্তিশালী হয়ে উঠেছে। বিশেষ করে গত ১৫ বছরে AI অসাধারণ অগ্রগতি করেছে, পরীক্ষাগার থেকে বাস্তব জগতে প্রবেশ করে গভীর প্রভাব ফেলেছে।
বর্তমানে, AI প্রায় প্রতিটি ক্ষেত্রে উপস্থিত এবং ক্রমশ বুদ্ধিমান ও বহুমুখী হয়ে উঠছে। তবে, সাধারণ AI – অর্থাৎ মানুষের মতো নমনীয় বুদ্ধিমত্তা – এখনও দূর ভবিষ্যত।
বর্তমান AI মডেলগুলি যদিও চিত্তাকর্ষক, তবে তারা সাধারণত প্রশিক্ষিত কাজের মধ্যে সীমাবদ্ধ এবং মাঝে মাঝে ভুলও করে (যেমন ChatGPT কখনও কখনও “ভুল তথ্য” আত্মবিশ্বাসের সঙ্গে প্রদান করে)। নিরাপত্তা ও নৈতিকতা বিষয়ক চ্যালেঞ্জও গুরুত্বপূর্ণ, যা AI-কে নিয়ন্ত্রিত, স্বচ্ছ এবং মানবজাতির সর্বোত্তম স্বার্থে উন্নয়ন করার প্রয়োজনীয়তা নির্দেশ করে।
AI-এর পরবর্তী পথচলা অত্যন্ত রোমাঞ্চকর হবে। বর্তমান অগ্রগতির আলোকে দেখা যায় AI আরও গভীরভাবে জীবনে প্রবেশ করবে: যেমন AI ডাক্তার মানুষের স্বাস্থ্যসেবা সহায়তা করবে, AI আইনজীবী আইনি তথ্য অনুসন্ধান করবে, এবং AI বন্ধু শিক্ষায় ও মানসিক সমর্থনে সঙ্গী হবে।
নিউরোমরফিক কম্পিউটিং এর মতো প্রযুক্তি মানুষের মস্তিষ্কের কাঠামো অনুকরণ করে নতুন প্রজন্মের AI তৈরি করার গবেষণা চলছে, যা আরও কার্যকর এবং প্রাকৃতিক বুদ্ধিমত্তার কাছাকাছি হতে পারে। যদিও মানব বুদ্ধিমত্তা ছাড়িয়ে যাওয়া AI নিয়ে বিতর্ক রয়েছে, তবে স্পষ্ট যে AI অবিরত উন্নতি করবে এবং মানবজাতির ভবিষ্যতকে গভীরভাবে প্রভাবিত করবে।
AI-এর গঠন ও উন্নয়নের ইতিহাসে আমরা দেখতে পাই মানুষের অবিরাম ধৈর্য ও সৃজনশীলতার গল্প। প্রাথমিক গণনামূলক যন্ত্র থেকে শুরু করে মানুষকে দাবা খেলা, গাড়ি চালানো, বিশ্ব সনাক্তকরণ এবং এমনকি শিল্পকর্ম সৃষ্টিতে সক্ষম করার যাত্রা। কৃত্রিম বুদ্ধিমত্তা ইতিমধ্যে এবং ভবিষ্যতেও আমাদের সীমাবদ্ধতা ছাড়িয়ে যাওয়ার প্রমাণ।
গুরুত্বপূর্ণ হল আমরা ইতিহাস থেকে শিখি – সঠিক প্রত্যাশা স্থাপন এবং দায়িত্বশীল AI উন্নয়ন – যাতে AI মানবজাতির জন্য সর্বোচ্চ সুবিধা নিশ্চিত করে পরবর্তী যাত্রায়।