நீண்ட ஆவணங்களை சுருக்க AI பயன்படுத்தும் குறிப்புகள்

கைபேசி நுண்ணறிவு (AI) தகவலை கையாளும் முறையை மாற்றி, விரைவான மற்றும் துல்லியமான சுருக்க திறன்களுடன் வாசிப்பு மற்றும் பகுப்பாய்வில் மணிநேரங்களை சேமிக்கிறது. இந்த கட்டுரை நீண்ட ஆவணங்களை திறம்பட சுருக்க AI பயன்படுத்துவதற்கான நடைமுறை குறிப்புகளை பகிர்கிறது — உரையை துண்டாக்குதல் மற்றும் புத்திசாலி கேள்விகளை உருவாக்குதல் முதல் ChatGPT, Claude அல்லது Google Gemini போன்ற சரியான கருவிகளை தேர்வு செய்வது வரை — உங்களுக்கு சுருக்கமான, இயல்பான மற்றும் எளிதில் புரிந்துகொள்ளக்கூடிய சுருக்கங்களை உருவாக்க உதவுகிறது.

AI மூலம் மிகவும் நீண்ட உரைகளை சுருக்குவது நேரத்தை சேமிக்க உதவுகிறது, ஆனால் அதற்கு சில திட்டமிடல் தேவை. AI அடிப்படையிலான சுருக்கம் பொதுவாக இரண்டு வகைகளாக இருக்கும்: எடுக்கப்பட்ட (மூல உரையிலிருந்து முக்கிய வாக்கியங்களை தேர்வு செய்தல்) மற்றும் சுருக்கப்பட்ட (கருத்துக்களின் சுருக்கமான மறுபிரதிபலிப்பு உருவாக்குதல்). நடைமுறையில், நவீன AI (GPT அல்லது Claude போன்றவை) இரண்டையும் செய்ய முடியும். இருப்பினும், பெரும்பாலான மாதிரிகளுக்கு உள்ளீட்டு நீளம் வரம்பு உள்ளது, ஆகவே நீண்ட ஆவணத்தை பகுதிகளாக பிரித்து முடிவுகளை இணைக்க வேண்டும். கீழே இதை திறம்பட செய்ய சிறந்த நடைமுறைகள் மற்றும் குறிப்புகள் உள்ளன.

உள்ளடக்கங்கள் பட்டியலிடப்பட்டது

ஆவணங்களை துண்டுகளாக பிரிக்கவும் (Map/Reduce)

AI மாதிரிகளுக்கு ஒரு வரம்பான சூழல் ஜன்னல் உள்ளது, ஆகவே நீண்ட ஆவணத்தை சுருக்குவதற்கு முன் அதை நிர்வகிக்கக்கூடிய துண்டுகள் (உதாரணமாக, பிரிவு, அத்தியாயம் அல்லது தர்க்கமான பகுதி) ஆக பிரிக்க வேண்டும். ஒரு பயனுள்ள திட்டமிடல் map/reduce முறையாகும்:

Map/Reduce திட்டம்

ஒவ்வொரு துண்டும் மாதிரியின் உள்ளீட்டு ஜன்னலுக்கு பொருந்துமாறு உரையை பிரிக்கவும். ஒவ்வொரு துண்டையும் தனித்தனியாக சுருக்கவும் ("map" படி), பின்னர் அனைத்து இடைநிலை சுருக்கங்களையும் ஒன்றாக இணைத்து ஒரே சுருக்கத்தை உருவாக்கவும் ("reduce" படி). வேகமான முடிவுகளுக்கு துண்டுகளை தனித்தனியாக அல்லது ஒரே நேரத்தில் செயலாக்கலாம்.

துண்டாக்கலுடன் விவரத்தை சரிசெய்க

இறுதி சுருக்கத்தில் உள்ள விவர அளவு நீங்கள் உரையை எவ்வாறு துண்டாக்குகிறீர்களோ அதன்படி இருக்கும். சிறிய மற்றும் அதிகமான துண்டுகள் பொதுவாக விரிவான சுருக்கத்தை தரும். துண்டுகளின் எண்ணிக்கை மற்றும் அளவை மாற்றுவதன் மூலம் நீங்கள் வெளியீட்டின் நீளம் அல்லது விவரத்தை கட்டுப்படுத்தலாம்.

மீண்டும் மீண்டும் மேம்படுத்தல்

முதல் பிரிவை சுருக்கி, அடுத்த பிரிவை முந்தைய சுருக்கத்தை சூழலாக கொண்டு சுருக்கவும். ஒவ்வொரு படியும் புதிய விவரங்களுடன் வளர்ந்து வரும் சுருக்கத்தை "மேம்படுத்தும்". பல படிகளுக்கு பிறகு, இது முழு ஆவணத்தின் ஒருங்கிணைந்த கண்ணோட்டத்தை தரும்.
முக்கிய குறிப்பு: ஒரு முறையான மாதிரிக்கு ஒரே நேரத்தில் 20,000 வார்த்தைகள் கொண்ட முழு ஆவணத்தை வழங்க முயன்றால், நீளம் வரம்பை தாண்டவோ அல்லது மிகக் குறுகிய சுருக்கத்தைப் பெறவோ செய்யலாம். மிகவும் நீண்ட ஆதாரங்களுக்கு துண்டாக்கல் (map/reduce அல்லது iterative) அவசியம்.
ஆவண துண்டாக்கல் Map Reduce
ஆவண துண்டாக்கல் map reduce பணிமுறை

தெளிவான கேள்விகளை உருவாக்கவும்

மாதிரியை எப்படி சுருக்கச் சொல்லுவது மிகவும் முக்கியம். நல்ல கேள்வி வடிவமைப்பு AI-யை பயனுள்ள சுருக்கங்களை உருவாக்க வழிநடத்தும். பொதுவான வழிகாட்டுதல்கள்:

1

சுருக்க வேண்டிய உரையை சேர்க்கவும்

நீங்கள் சுருக்க விரும்பும் உண்மையான உள்ளடக்கத்தை (அல்லது அதன் ஒரு பகுதியை) எப்போதும் வழங்கவும் (அல்லது பதிவேற்றவும்). AI உங்களுக்கு கொடுத்ததை மட்டுமே சுருக்க முடியும்.

2

பணியை தெளிவாக வரையறுக்கவும்

உதாரணமாக, "பின்வரும் உரையை சுருக்கவும்: [உங்கள் உரை]" அல்லது "கொடுக்கப்பட்ட கட்டுரையின் சுருக்கமான சுருக்கத்தை தயார் செய்யவும்…" என்று தொடங்கவும். இது நீங்கள் சுருக்கம் வேண்டும் என்பதைக் தெளிவாகக் காட்டும், வேறு மாற்றம் அல்ல.

3

சூழல் அல்லது பங்கு கொடுக்கவும்

சூழலை சேர்ப்பது சுருக்கத்தை கவனமாக்க உதவும். உதாரணமாக, "நீங்கள் செயற்கை நுண்ணறிவு மற்றும் அதன் சுகாதாரத்தில் பங்கு பற்றிய கட்டுரையைப் பெற்றுள்ளீர்கள்" என்று கூறுவது மாதிரிக்கு தலைப்பை அறிய உதவும்.

4

வடிவம் மற்றும் நீளத்தை குறிப்பிடவும்

நீங்கள் புள்ளிவிவரங்கள், ஒரு பத்தி அல்லது குறிப்பிட்ட வார்த்தை எண்ணிக்கை வேண்டும் என்றால், அதைப் பறைசாற்றவும். உதாரணமாக: "5 புள்ளிவிவரங்களில், 100 வார்த்தைகளைத் தாண்டாமல் சுருக்கம் எழுதவும்: [உரை]". வார்த்தை அல்லது வாக்கிய வரம்பு அமைத்தால் மிக நீண்ட பதில்களைத் தடுக்கும்.

திறமையான கேள்விகள் இவ்வாறு இருக்கலாம்: "இந்த [அறிக்கை/கட்டுரை/அத்தியாயம்] சுருக்கி முக்கிய கண்டுபிடிப்புகளை 3–4 புள்ளிவிவரங்களில் பட்டியலிடவும் (அதிகபட்சம் 150 வார்த்தைகள்)." குறிக்கோள் மற்றும் வடிவத்தை தெளிவாகக் கூறுவதால், AI சுருக்கமான, துல்லியமான சுருக்கங்களை உருவாக்க உதவும்.

திறமையான பரிந்துரை: முதல் வெளியீடு சரியாக இல்லையெனில், கேள்வியை மாற்றவும் (உதாரணமாக, குறுகிய புள்ளிவிவரங்களை கேட்கவும் அல்லது தவறவிட்ட பகுதிகளை உள்ளடக்கவும்).
தெளிவான கேள்விகள் உருவாக்குதல்
சிறந்த முடிவுகளுக்காக தெளிவான கேள்விகள் உருவாக்குதல்

மீண்டும் மீண்டும் சுருக்கும் முறைகளை பயன்படுத்தவும்

மிக நீண்ட அல்லது சிக்கலான ஆவணங்களுக்கு, இரண்டு கட்ட அல்லது பல கட்ட அணுகுமுறை பொதுவாக சிறந்தது. ஒரு பொதுவான முறை:

முதல் சுற்று

துண்டு சுருக்கங்கள்

ஒவ்வொரு பிரிவையும் அல்லது துண்டையும் தனித்தனியாக சுருக்கவும். விருப்பமாக, முந்தைய பிரிவுகளின் சுருக்கத்தை சூழலாக மாதிரிக்கு வழங்கலாம்.

  • ஒவ்வொரு பகுதியையும் தனித்தனியாக செயலாக்கவும்
  • முந்தைய பிரிவுகளின் சூழலை பராமரிக்கவும்
  • உதாரணம்: "(சூழலுக்காக, முதல் N பகுதிகளின் சுருக்கம்: [இப்போது வரை சுருக்கம்]. இப்போது அடுத்த பகுதியை சுருக்கவும்…)"
இரண்டாம் சுற்று

சுருக்கங்களை இணைத்தல்

அனைத்து துண்டு சுருக்கங்களும் தனித்தனியாக கிடைத்த பிறகு, அவற்றை ஒன்றாக இணைத்து இறுதி சுருக்கத்தை உருவாக்க AI-யை கேட்கவும்.

  • அனைத்து துண்டு சுருக்கங்களையும் இணைக்கவும்
  • ஒற்றுமையான ஒருங்கிணைந்த வெளியீட்டை உருவாக்கவும்
  • உதாரணம்: "பின்வரும் புள்ளி சுருக்கங்களை ஒருங்கிணைந்த சுருக்கமாக இணைக்கவும்: [துண்டு சுருக்கங்களின் பட்டியல்]"

இந்த பிரித்து-பின்னர்-இணைக்கும் திட்டம் (சில சமயங்களில் அடுக்குமுறை அல்லது மறுபடியும் சுருக்கம் என அழைக்கப்படும்) ஆவணத்தின் எந்த பகுதியும் தவறவிடப்படாமல் உறுதி செய்கிறது. நடைமுறையில், நீங்கள் சுருக்கச் சுற்றை இவ்வாறு இயக்கலாம்: துண்டு 1-ஐ சுருக்கி, பின்னர் துண்டு 2-ஐ (துண்டு 1 சுருக்கத்தை உள்ளீடாக கொண்டு) சுருக்கி, இதுபோல் தொடரவும்; இறுதியில், அனைத்து துண்டு சுருக்கங்களையும் ஒருங்கிணைக்க மாதிரியை கேட்கவும்.

சிறந்த நடைமுறைகள்: 15,000-டோக்கன் உரையை துண்டாக்கி சுருக்கும்போது, இறுதி சுருக்கம் ஒரே நேரத்தில் சுருக்கியதைவிட 10–20 மடங்கு நீளமாகவும் விரிவாகவும் இருக்கும் என்று பரிசோதனைகள் காட்டுகின்றன.

சுருக்கப்பட்ட-சுருக்கப்பட்ட குழாய்

LLM-களை map/reduce முறையில் பயன்படுத்துதல்: ஒவ்வொரு துண்டையும் LLM மூலம் சுருக்கி, பின்னர் அந்த சுருக்கங்களை மீண்டும் LLM-க்கு வழங்கி இறுதி சுருக்கத்தை மேம்படுத்துதல்.

தானியங்கி பணிமுறைகள்

LangChain போன்ற நூலகங்கள் "map" மற்றும் "reduce" பணிமுறையை தானாகச் செயற்படுத்தி, செயலாக்கத்தை எளிதாக்குகின்றன.

மீண்டும் மீண்டும் சுருக்கும் பணிமுறை
மீண்டும் மீண்டும் சுருக்கும் பணிமுறை செயல்முறை

சரியான மாதிரிகள் மற்றும் கருவிகளை பயன்படுத்தவும்

தகுந்த AI மாதிரி அல்லது கருவியை தேர்வு செய்வது முக்கியம். பல விருப்பங்கள் உள்ளன:

பெரிய சூழல் ஜன்னல்களுடன் பெரிய LLMகள்

புதிய மாதிரிகள் அதிக உள்ளீட்டை கையாள முடியும். உதாரணமாக, Anthropic-இன் Claude 3 மற்றும் OpenAI-யின் GPT-4 Turbo மிக நீண்ட சூழல்களை (பதினாயிரக்கணக்கான டோக்கன்கள்) ஆதரிக்கின்றன. API அல்லது Amazon Bedrock, Google Vertex, Azure OpenAI போன்ற சேவைகள் மூலம் அணுகல் இருந்தால், அவை குறைவான கைமுறை துண்டாக்கலை தேவைப்படுத்தலாம்.

Claude 3

விரிவான சூழல் ஜன்னல் ஆதரவு கொண்ட Anthropic மாதிரி

GPT-4 Turbo

பதினாயிரக்கணக்கான டோக்கன்களை கையாளும் OpenAI மாதிரி

சிறப்பு சுருக்க மாதிரிகள்

Hugging Face-இன் BART அல்லது Pegasus போன்ற மாதிரிகள் சுருக்கத்திற்கு சிறப்பாக பயிற்சி பெற்றவை. அவை மிதமான நீள உரைகளுக்கு உயர்தர சுருக்கங்களை வழங்கும், ஆனால் குறைந்த டோக்கன் வரம்புகள் (~1024 டோக்கன்கள்) கொண்டவை. உங்கள் ஆவணம் மிக நீண்டதல்ல என்றால் இவை விரைவான தீர்வாக இருக்கலாம்.

BART

உயர்தர சுருக்க பணிகளுக்கு சிறப்பாக பயிற்சி பெற்றது

Pegasus

மிதமான நீள உரை சுருக்கத்திற்கு சிறப்பாக வடிவமைக்கப்பட்டது

AI சேவைகள் மற்றும் நூலகங்கள்

சில தளங்களில் உள்ளடக்கப்பட்ட சுருக்க முடிவுகள் உள்ளன. குறியீடு எழுதும் போது, LangChain போன்ற கட்டமைப்புகள் map/reduce பணிமுறையை செயல்படுத்தும் சுருக்க சங்கிலிகளை வழங்குகின்றன. வணிக கருவிகளிலும் ஒரே கிளிக் சுருக்கிகள் இருக்கலாம்.

  • Google Vertex AI - PaLM/Gemini உடன் சுருக்கம்
  • Azure AI - அர்ப்பணிக்கப்பட்ட சுருக்க கருவிகள்
  • LangChain - தானியங்கி map/reduce சங்கிலிகள்
  • ஆவண AI தயாரிப்புகள் - ஒரே கிளிக் சுருக்கிகள்
திறமையான பரிந்துரை: சில AI கருவிகள் சுருக்க வகையை தானாகத் தேர்வு செய்கின்றன. உதாரணமாக, ஒரு சுருக்கி சுருக்கப்பட்ட முறைகளை (உள்ளடக்கத்தை மறுபிரதிபலித்தல்) கதை கட்டுரைகளுக்கு மற்றும் எடுக்கப்பட்ட முறைகளை (உரை மேற்கோள்களை எடுத்தல்) தொழில்நுட்ப அறிக்கைகளுக்கு பயன்படுத்தலாம். உள்ளடக்கத்திற்கு ஏற்ப உங்கள் அணுகுமுறையை அமைக்கவும்: சுருக்கப்பட்ட சுருக்கங்கள் அதிக சுதந்திரமும் பாய்ச்சலும் கொண்டவை, எடுக்கப்பட்ட சுருக்கங்கள் மூல வார்த்தைகளுக்கு நம்பகமானவை.
சுருக்கப்பட்ட

உள்ளடக்கத்தை மறுபிரதிபலித்தல்

  • மேலும் சுதந்திரமான மற்றும் பாய்ச்சலானது
  • முக்கிய கருத்துக்களை மறுபடி சொல்கிறது
  • கதை கட்டுரைகளுக்கு சிறந்தது
எடுக்கப்பட்ட

உரை மேற்கோள்களை எடுத்தல்

  • மூல வார்த்தைகளுக்கு நம்பகமானது
  • முக்கிய வாக்கியங்களை தேர்வு செய்கிறது
  • தொழில்நுட்ப அறிக்கைகளுக்கு சிறந்தது
முக்கிய குறிப்பு: பெரிய மாதிரிகள் (குறைந்த செலவு அல்ல) அல்லது சிறப்பு APIகளை பயன்படுத்துவது சிறந்த முடிவுகளை தரலாம், ஆனால் செலவு அதிகம். வேகமும், செலவும், தரமும் சமநிலைப்படுத்தும் சிறிய பகுதியை முதலில் சோதிக்கவும்.
AI சுருக்க மாதிரிகள் மற்றும் கருவிகள்
AI சுருக்க மாதிரிகள் மற்றும் கருவிகள் ஒப்பீடு

சுருக்கத்தை மதிப்பாய்வு செய்து மேம்படுத்தவும்

AI வெளியீடுகள் பிழையற்றவை அல்ல. எப்போதும் AI உருவாக்கிய சுருக்கத்தை வாசித்து மூல உரையுடன் ஒப்பிடவும். குறிப்பாக சிக்கலான ஆவணங்களில் AI சில நேரங்களில் தவறான விவரங்களை உருவாக்கலாம் அல்லது நுணுக்கங்களை தவறவிடலாம். நீங்கள் செய்ய வேண்டியவை:

1

உண்மைத்தன்மையை சரிபார்க்கவும்

அனைத்து முக்கிய அம்சங்களும் உள்ளதா என உறுதி செய்யவும். ஏதேனும் தவறவிட்டால், மாதிரியை "அந்த தலைப்பை விரிவாக்கவும்" என்று கேட்டு அல்லது தவறவிட்ட பகுதியை கவனத்தில் கொண்டு சுருக்கத்தை மீண்டும் இயக்கலாம்.

2

எளிமையாக்கவும் அல்லது மறுபடி சொல்வதற்காக

சுருக்கம் மிக தொழில்நுட்பமானது அல்லது நீளமானதாக இருந்தால், மாதிரியை மீண்டும் குறைக்க அல்லது புள்ளிவிவரமாக மாற்ற சொல்லலாம்.

3

கருத்துக்களை கைமுறையாக இணைக்கவும்

சில நேரங்களில் மாதிரியின் வெவ்வேறு துண்டு சுருக்கங்கள் ஒத்துப்போகாமல் அல்லது முரண்படலாம்; ஒரு விரைவான கைமுறை திருத்தம் அல்லது இறுதி கேள்வி "இந்த அம்சங்களை தெளிவான, ஒருங்கிணைந்த சுருக்கமாக மாற்றவும்" உதவும்.

சிறந்த நடைமுறைகள்: கேள்விகளை மேம்படுத்தி அல்லது குறிப்பிட்ட பகுதிகளில் மீண்டும் இயக்கி திருத்துவது தரத்தை மேம்படுத்தும். AI-யை ஒரு உதவியாளராக பயன்படுத்தி, கருத்துக்களை வழிநடத்தி முடிவுகளை சரிபார்க்க வேண்டும்.
AI சுருக்கத்தை மதிப்பாய்வு செய்து மேம்படுத்துதல்
AI சுருக்கத்தை மதிப்பாய்வு செய்து மேம்படுத்தும் செயல்முறை

முக்கிய எடுத்துக்காட்டுகள்

துண்டுகளை அறிவாக பிரிக்கவும்

ஆவணத்தை மாதிரியின் உள்ளீட்டு வரம்புக்கு பொருந்தும் பகுதிகளாக பிரிக்கவும். ஒவ்வொன்றையும் சுருக்கி பின்னர் இணைக்கவும்.

தெளிவாக கேளுங்கள்

உங்கள் கேள்வியில் "சுருக்கவும்" என்று தெளிவாக கூறி, உரையும் எந்த கட்டுப்பாடுகளும் (நீளம், வடிவம்) சேர்க்கவும்.

கட்டமைக்கப்பட்ட பணிமுறைகளை பயன்படுத்தவும்

மிக நீண்ட உரையை கையாள map/reduce அல்லது இரண்டு-சுற்று முறைகளை (முதலில் சுருக்கி பின்னர் இணைத்தல்) பரிசீலிக்கவும்.

சரியான கருவியை தேர்வு செய்யவும்

பெரிய சூழல் கொண்ட மாதிரிகள் (எ.கா. GPT-4 Turbo, Claude) அல்லது சிறப்பு சுருக்கிகள் (BART/Pegasus) தேவைக்கேற்ப பயன்படுத்தவும்.

வெளியீட்டை மேம்படுத்தவும்

AI சுருக்கத்தை மதிப்பாய்வு செய்து, உண்மைத்தன்மையை சரிபார்த்து, தவறவிட்ட அம்சங்களை உள்ளடக்க மீண்டும் கேளுங்கள்.


இந்த திட்டங்களை பின்பற்றி — உரையை துண்டாக்கி, நல்ல கேள்விகளை எழுதி, மீண்டும் மீண்டும் மேம்படுத்தி — நீண்ட ஆவணங்களையும் AI மூலம் சுருக்கமான, துல்லியமான சுருக்கங்களை பெறலாம்.

வெளிப்புற குறிப்புகள்
இந்த கட்டுரையை பின்வரும் வெளி ஆதாரங்களின் உதவியுடன் தொகுத்தது:
96 உள்ளடக்க உருவாக்குநர் மற்றும் வலைப்பதிவு பங்களிப்பாளர்.
ரோசி ஹா Inviai இல் எழுத்தாளர் ஆவார், அவர் செயற்கை நுண்ணறிவு தொடர்பான அறிவு மற்றும் தீர்வுகளை பகிர்ந்து கொள்கிறார். வணிகம், உள்ளடக்க உருவாக்கம் மற்றும் தானியங்கி செயலாக்கம் போன்ற பல துறைகளில் AI ஆராய்ச்சி மற்றும் பயன்பாட்டில் அனுபவம் கொண்ட ரோசி ஹா, எளிதில் புரிந்துகொள்ளக்கூடிய, நடைமுறை மற்றும் ஊக்கமளிக்கும் கட்டுரைகளை வழங்குவார். ரோசி ஹாவின் பணி, அனைவரும் AI-யை திறம்பட பயன்படுத்தி உற்பத்தித்திறனை மேம்படுத்தி, படைப்பாற்றலை விரிவுபடுத்த உதவுவதாகும்.
தேடல்