ஏஐ சாட்பாட்கள் என்பது மனித உரையாடலைப் போல செயல்படும் மென்பொருள் திட்டங்கள் ஆகும். அவை பயனர் உள்ளீடுகளை இயற்கை மொழியில் (உரை அல்லது பேச்சு) எடுத்துக்கொண்டு உதவிகரமான பதில்களை வழங்க முயல்கின்றன. மைக்ரோசாஃப்ட் கூறுவதன்படி, ஏஐ சாட்பாட்கள் என்பது "மனித உரையாடல்களைப் பின்பற்றியும் புரிந்துகொள்கின்ற பயன்பாடுகள்" ஆகும்.

உதாரணமாக, சாட்பாட்கள் கேள்விகளுக்கு பதிலளிக்க, பரிந்துரைகள் வழங்க, அல்லது நேர்காணல் முன்பதிவுகள் போன்ற பணிகளை தானாகச் செய்ய முடியும். ஐபிஎம் கூறுவது போல, சாட்பாட் "மனித உரையாடலைப் பின்பற்றுகிறது" என்றும், நவீன சாட்பாட்கள் இயற்கை மொழி செயலாக்கத்தைப் பயன்படுத்தி கேள்விகளைப் புரிந்து பதில்களை உருவாக்குகின்றன என்றும் குறிப்பிடுகிறது. சுருக்கமாக, ஏஐ சாட்பாட்கள் மனித பேச்சும் இயந்திர தர்க்கமும் இடையேயான இடைவெளியை நிரப்பி, சாதாரண மொழியால் கணினிகளுடன் தொடர்பு கொள்ள உதவுகின்றன.

முக்கிய ஏஐ தொழில்நுட்பங்கள்

ஏஐ சாட்பாட்கள் பல முன்னேற்றப்பட்ட ஏஐ தொழில்நுட்பங்களை இணைக்கின்றன:

  • இயற்கை மொழி செயலாக்கம் (NLP): சாட்பாட் உரை அல்லது பேச்சு உள்ளீடுகளை பகுப்பாய்வு செய்து புரிந்துகொள்ள உதவுகிறது. உதாரணமாக, NLP ஆல்கொரிதம்கள் ஒரு வாக்கியத்தை சொற்கள் அல்லது சொற்றொடர்களாக பிரித்து, இலக்கணம் மற்றும் சூழலைப் புரிந்துகொள்ள உதவுகின்றன.
  • இயந்திரக் கற்றல் மற்றும் ஆழ்ந்த கற்றல்: சாட்பாட் மொழி மற்றும் உரையாடல் உதாரணங்களிலிருந்து கற்றுக்கொண்டு, காலத்துடன் தனது பதில்களை மேம்படுத்துகிறது. உண்மையான உரையாடல்கள் மற்றும் எழுத்து உரைகளில் பயிற்சி பெற்று, பொதுவான கேள்விகள் மற்றும் அவற்றுக்கு எப்படி பதிலளிக்க வேண்டும் என்பதைக் கற்றுக்கொள்கிறது.
  • பெரிய மொழி மாதிரிகள் (LLMs): பெரும் அளவிலான உரை தரவுத்தொகுப்புகளில் பயிற்சி பெற்ற மிகப்பெரிய நியூரல் நெட்வொர்க்குகள் (அதிகமாக டிரான்ஸ்ஃபார்மர் கட்டமைப்புகளில்). LLMகள் பில்லியன் கணக்கான அளவுருக்களை கொண்டுள்ளன மற்றும் மனிதனைப் போன்ற உரையை புரிந்து, உருவாக்க முடியும். அவை மொழி மற்றும் துறைகளுக்கு இடையேயான மொழியியல் மாதிரிகளை திறம்படப் பிடிக்கின்றன.

இந்த தொழில்நுட்பங்கள் ஒன்றிணைந்து சாட்பாட்கள் சுதந்திரமான கேள்விகளை கையாளவும் இயற்கையான பதில்களை உருவாக்கவும் உதவுகின்றன.

முக்கிய ஏஐ தொழில்நுட்பங்கள்

சாட்பாட்கள் பயனர்களை எப்படி புரிந்துகொள்கின்றன

நீங்கள் ஒரு செய்தியை அனுப்பும் போது, சாட்பாட் அதற்கு இயற்கை மொழி புரிதல் (NLU) முறையைப் பயன்படுத்துகிறது. அது உள்ளீட்டை துண்டுகளாக (tokens) பிரித்து, பயனரின் நோக்கம் (பயனர் என்ன விரும்புகிறார்) மற்றும் தொடர்புடைய உருப்படிகள் (பெயர்கள், தேதிகள் அல்லது இடங்கள் போன்ற முக்கிய விவரங்கள்) ஆகியவற்றை அடையாளம் காண்கிறது.

உதாரணமாக, "நாளை பாரிஸில் வானிலை எப்படி இருக்கும்?" என்ற கேள்வி வந்தால், சாட்பாட் நோக்கத்தை (வானிலை முன்னறிவிப்பு கேள்வி) அறிந்து, உருப்படிகளை ("பாரிஸ்" மற்றும் "நாளை") எடுத்துக்கொள்கிறது. நவீன ஏஐ சாட்பாட்கள் ஆழ்ந்த கற்றலைப் பயன்படுத்தி, உரையாடல் முறைகள் அசட்டையானவையாக இருந்தாலும், குழப்பமானவையாக இருந்தாலும் அல்லது தவறான எழுத்துக்களுடன் இருந்தாலும் பொருளை புரிந்து கொள்ள முடியும்.

சாட்பாட்கள் பயனர்களை எப்படி புரிந்துகொள்கின்றன

ஏஐ சாட்பாட்களை பயிற்சி செய்வது

ஏஐ சாட்பாட்கள் பெரும் அளவிலான உரை தரவுகளில் பயிற்சி பெற்ற மொழி மாதிரிகளால் இயக்கப்படுகின்றன. பயிற்சியின் போது, மாதிரி வாக்கியத்தில் அடுத்த வார்த்தையை சூழலின் அடிப்படையில் முன்னறிவிக்க தனது உள்ளக அளவுருக்களை சரிசெய்கிறது.

வாசிப்பில், மாதிரிக்கு மிகப்பெரிய உரை தொகுப்புகள் (உதாரணமாக, விக்கிப்பீடியா முழுவதும் அல்லது இணையம்) வழங்கப்பட்டு, இலக்கணம், உண்மைகள் மற்றும் பொதுவான சொற்றொடர்களை கற்றுக்கொள்கிறது.

பயிற்சிக்குப் பிறகு, சாட்பாட் கற்றுக்கொண்ட மாதிரிகளை அடிப்படையாகக் கொண்டு ஒரு வார்த்தையைத் தொடர்ந்து முன்னறிவித்து புதிய பதில்களை உருவாக்க முடியும். முக்கியமாக, மாதிரி உரையை சொடுக்கி நினைவில் வைக்காது; அது அறிவை தனது அளவுருக்களில் மறைமுகமாக குறிக்கிறது.

இதனால், நன்கு பயிற்சி பெற்ற சாட்பாட், பயிற்சியில் நேரடியாக பார்த்திராத கேள்விகளுக்கும் கற்றுக்கொண்ட மாதிரிகளின் அடிப்படையில் பதில்களை உருவாக்கி வழங்க முடியும்.

ஏஐ சாட்பாட்களை பயிற்சி செய்வது

டிரான்ஸ்ஃபார்மர்கள் மற்றும் பெரிய மொழி மாதிரிகள்

படம்: ஒரு டிரான்ஸ்ஃபார்மர் நெட்வொர்க் கட்டமைப்பு (இடது பக்கம் என்கோடர், வலது பக்கம் டிகோடர்). என்கோடர் உள்ளீட்டை செயலாக்கி, டிகோடர் வெளியீட்டை உருவாக்குகிறது. நவீன சாட்பாட்கள் தங்களின் அடிப்படையாக டிரான்ஸ்ஃபார்மர்கள் ஐப் பயன்படுத்துகின்றன.

ஒரு டிரான்ஸ்ஃபார்மர் நெட்வொர்க் சொற்களை எண்கணித வெக்டர்களாக மாற்றி, பல தலை கவனம் (multi-head attention) முறையைப் பயன்படுத்தி ஒரு வாக்கியத்தில் உள்ள ஒவ்வொரு சொல்லையும் மற்ற எல்லா சொற்களுடனும் ஒரே நேரத்தில் தொடர்புபடுத்துகிறது. இதனால் மாதிரி முழு உள்ளீட்டின் சூழலைப் பிடிக்க முடிகிறது.

பழைய தொடர் மாதிரிகள் (RNN போன்றவை) போல அல்லாமல், டிரான்ஸ்ஃபார்மர்கள் அனைத்து சொற்களையும் ஒரே நேரத்தில் செயலாக்கி, வேகமாக பயிற்சி பெறுகின்றன. பல டிரான்ஸ்ஃபார்மர் அடுக்குகளை சேர்த்து, GPT-4 அல்லது கூகுளின் PaLM போன்ற பெரிய மொழி மாதிரிகள் உருவாகின்றன. இவை மிகப்பெரிய அளவில் மொழியை புரிந்து, உருவாக்க பயிற்சி பெறப்பட்டுள்ளன, மேலும் மொழிபெயர்ப்பு, சுருக்கம் அல்லது கேள்விகளுக்கு பதிலளிப்பது போன்ற பணிகளையும் செய்ய முடியும்.

டிரான்ஸ்ஃபார்மர்கள் மற்றும் பெரிய மொழி மாதிரிகள்

பதில்களை உருவாக்குதல்

பதிலளிக்கும் போது, ஏஐ சாட்பாட் இரண்டு முறைகளில் ஒன்றை பயன்படுத்தலாம்:

  • திரட்டல் அடிப்படையிலானது: சாட்பாட் ஒரு நிர்ணயிக்கப்பட்ட பதில்கள் தொகுப்பில் இருந்து பதிலை தேர்ந்தெடுக்கிறது (FAQ தரவுத்தளத்துடன் போன்றது). ஆரம்ப கால சாட்பாட்கள் இவ்வாறு செயல்பட்டன. ஒரு அறியப்பட்ட கேள்விக்கு, சாட்பாட் சேமிக்கப்பட்ட பதிலைத் தருகிறது. இது விரைவானதும் நம்பகமானதும் ஆகும், ஆனால் தரவுத்தளத்தில் இல்லாத கேள்விகளை கையாள முடியாது.
  • உருவாக்கும் (ஏஐ) மாதிரிகள்: சாட்பாட் தனது மொழி மாதிரியைப் பயன்படுத்தி வார்த்தை வார்த்தையாக புதிய பதிலை உருவாக்குகிறது. ஒவ்வொரு கட்டத்திலும் உரையாடலின் முன்னேற்றத்தைப் பொருத்து அடுத்த மிகச் சாத்தியமான வார்த்தையை முன்னறிவிக்கிறது. இதனால் சாட்பாட் தனித்துவமான பதில்களை உருவாக்கி, முன்பு பார்த்திராத கேள்விகளுக்கும் பதிலளிக்க முடியும். ஆனால், இது கற்றுக்கொண்ட சாத்தியக்கூறுகளின் அடிப்படையில் செயல்படுவதால், சில நேரங்களில் தவறான அல்லது பொருளற்ற பதில்களை வழங்கலாம்.

பதில்களை உருவாக்குதல்

மனித கருத்து மற்றும் உரையாடல் சூழல்

ஆரம்ப பயிற்சிக்குப் பிறகு, சாட்பாட்கள் மனித கருத்துக்களால் நன்கு மேம்படுத்தப்படுகின்றன. பயிற்சியாளர்கள் சாட்பாட் வெளியீடுகளை மதிப்பாய்வு செய்து, நல்ல பதில்களை ஊக்குவித்து, தவறானவற்றை திருத்தி வழிகாட்டுகின்றனர். இந்த செயல்முறை, மனித கருத்துக்களிலிருந்து ஊக்கக் கற்றல் (RLHF) என அழைக்கப்படுகிறது, இது தவறான அல்லது பாகுபாடான உள்ளடக்கங்களைத் தவிர்க்க உதவுகிறது. உதாரணமாக, மனிதர்கள் ஒரு பதிலை "அபாயகரமான" அல்லது "தலைப்புக்கு பொருந்தாத" என குறிக்கலாம், இதனால் மாதிரி அத்தகைய பதில்களைத் தவிர்க்க கற்றுக்கொள்கிறது.

ஏஐ சாட்பாட்கள் உரையாடல் சூழலைவும் கவனிக்கின்றன. அவை உரையாடலின் முந்தைய பகுதிகளை நினைவில் வைத்து, அதன்படி பதில்களை ஒழுங்குபடுத்துகின்றன. உதாரணமாக, நீங்கள் தொடர்ச்சியான கேள்விகளை கேட்டால், சாட்பாட் முந்தைய தலைப்பை நினைவில் வைத்து பதிலளிக்கும். இந்த நிலையான சூழல் பல முறை உரையாடல்களையும் இயற்கையான தொடர்புகளையும் சாத்தியமாக்குகிறது.

மனித கருத்து மற்றும் உரையாடல் சூழல்

ஏஐ சாட்பாட்களின் உதாரணங்கள்

பல பரிச்சயமான மெய்நிகர் உதவியாளர்கள் ஏஐ சாட்பாட்களாகும். ஆப்பிளின் சிரி மற்றும் அமேசானின் அலெக்சா குரல் கட்டளைகளுக்கு பதிலளிக்கின்றன, கூகுளின் ஜெமினி மற்றும் ஓபன்ஏஐயின் சாட்ஜிபிடி உரையாடல் மூலம் பதிலளிக்கின்றன. வணிக நிறுவனங்களும் வலைத்தளங்கள் மற்றும் செயலிகளில் சாட்பாட்களை பயன்படுத்தி வாடிக்கையாளர் கேள்விகளுக்கு பதிலளிக்க, நேர்காணல் முன்பதிவுகளை செய்ய அல்லது வாங்கும் வழிகாட்டுதல்களை வழங்குகின்றன. இவை அனைத்தும் மொழியை செயலாக்கி பதில்களை உருவாக்க ஒரே அடிப்படை ஏஐ தொழில்நுட்பங்களைப் பயன்படுத்துகின்றன.

ஏஐ சாட்பாட்களின் உதாரணங்கள்

சவால்கள் மற்றும் வரம்புகள்

ஏஐ சாட்பாட்கள் சக்திவாய்ந்தவை ஆனால் முழுமையானவை அல்ல. அவை எப்போதும் பதிலளிக்க முயற்சிப்பதால், சில நேரங்களில் பொய் தகவல்களை நம்பிக்கையுடன் வழங்கக்கூடும். ஒரு நிபுணர் கூறுவது போல, சாட்பாட் என்பது "கணக்கீடுகளைச் செய்யும் இயந்திரம்" ஆகும்; அது மனிதன் போல பொருள் அல்லது நோக்கத்தை உணராது.

இதனால், ஒரே கேள்விக்கு வெவ்வேறு நேரங்களில் வெவ்வேறு பதில்களை வழங்கக்கூடும், மற்றும் குழப்பமான அல்லது சிக்கலான கேள்விகளை தவறாக புரிந்துகொள்ளக்கூடும். முக்கியமான தகவல்களுக்கு, பயனர்கள் சாட்பாட் வெளியீடுகளை இருமுறை சரிபார்க்க வேண்டும், குறிப்பாக அவசர சூழல்களில்.

>>> மேலும் அறிய கிளிக் செய்யவும்:

Machine Learning என்றால் என்ன?

பெரிய மொழி மாதிரி என்றால் என்ன?

சவால்கள் மற்றும் வரம்புகள் ஏஐ சாட்பாட்கள்


ஏஐ சாட்பாட்கள் இயற்கை மொழி செயலாக்கம், இயந்திரக் கற்றல் மற்றும் பெரிய அளவிலான மொழி மாதிரிகளை இணைத்து செயல்படுகின்றன. அவை பயனர் உள்ளீடுகளை பகுப்பாய்வு செய்து நோக்கத்தை கண்டறிந்து, பின்னர் நிர்ணயிக்கப்பட்ட பதிலைத் திரட்டவோ அல்லது பயிற்சி பெற்ற மாதிரியைப் பயன்படுத்தி புதிய பதிலை உருவாக்கவோ செய்கின்றன.

நவீன சாட்பாட்கள் டிரான்ஸ்ஃபார்மர் அடிப்படையிலான LLMகளைப் பயன்படுத்தி, மிகப்பெரிய உரை தரவுத்தொகுப்புகளில் பயிற்சி பெற்று, மனிதனைப் போன்ற திறமையுடன் பல்வேறு தலைப்புகளில் உரையாட முடியும். இந்த மாதிரிகள் மேலும் தரவுகளும் சிறந்த பயிற்சியும் பெறுவதால், ஏஐ சாட்பாட்கள் இன்னும் திறமையானவையாக மாறும் - ஆனால் அவை அடிப்படையில் புள்ளிவிவர கருவிகள் என்பதால், மனித கண்காணிப்பு அவசியமாகவே உள்ளது.

External References
This article has been compiled with reference to the following external sources: