نوشتن دستور برای خلق تصاویر خیرهکننده تولیدشده توسط هوش مصنوعی
تکنیکهای عملی برای نوشتن دستورهایی که تصاویر بصری خیرهکننده تولید میکنند را کشف کنید. این راهنما ساختار دستور، نکات خلاقانه و بهترین تولیدکنندههای تصویر مبتنی بر هوش مصنوعی را برای تمام کاربران توضیح میدهد.
نسلهای مدرن تولیدکنندهٔ تصویرِ هوش مصنوعی میتوانند تصاویری با وفاداری بالا از توصیفهای متنی ایجاد کنند. این سیستمها روی میلیونها جفت تصویر و کپشن آموزش دیدهاند و یاد میگیرند چگونه دستورهای توصیفی را به آثار هنری متناظر نگاشت کنند. OpenAI اشاره میکند که «هرچه دقیقتر باشید، تصویر مرتبطتری دریافت خواهید کرد.» این بدان معناست که یک دستور خوب فرمولهشده کلید بهدستآوردن تصاویر زنده و پرجزئیات است.
ساختار دستور: سوژه + توصیف + سبک
یک دستور عالی معمولاً سه عنصر اصلی را ترکیب میکند: سوژه (اسم اصلی)، یک توصیف (عمل، مکان، جزئیات) و یک سبک (زیباییشناسی یا رسانه). عناصر اصلی را ابتدا قرار دهید – هوش مصنوعی معمولاً به کلمات ابتدایی توجه بیشتری میکند.
سوژه
توصیف
سبک/زیباییشناسی
این روش ساختاری تضمین میکند که هوش مصنوعی تمرکز شما را دقیقاً بداند. برای مثال، «عکس حرفهای از راکون مشغول خواندن کتاب در یک کتابخانه، نمای نزدیک» صحنهای پیچیده و واقعی میدهد، در حالی که تنها «راکون که میخواند» کلی و نامشخص است.
افزودن جزئیات زنده و توصیفی
از صفتها و زمینه برای غنیتر کردن صحنه استفاده کنید. رنگها، بافتها و حالات را توصیف کنید. بهجای «قصر»، بگویید «قصر قرون وسطایی مهآلود با دیوارهای پوشیده از پیچک در طلوع آفتاب». Typeface.ai اشاره میکند که «هرچه در توصیف تصویر دقیقتر باشید، دریافت جزئیات منحصربهفرد آسانتر است.»
- در صحنه چه اتفاقی میافتد؟
- ظاهر بصری آن چگونه است؟
- حالوهوای کلی یا اتمسفر چیست؟
- چه جزئیات نورپردازی، آبوهوا یا اتمسفر اهمیت دارند؟
پسزمینه را هم برجسته کنید – جزئیات نور (درخشش هنگام غروب، نورهای نئونی)، آبوهوا (مهآلود، بارانی) و اتمسفر عمق میبخشند. برای مثال، «فنچ زرد روی شاخهٔ شکوفهٔ گیلاس، پسزمینهٔ بهار، نور نرم» بسیار توصیفپذیرتر از تنها «فنچ» است.

نوشتن دستورهای طبیعی و توصیفی
دستورهای روایتمحور و بهشکل جمله معمولاً از لیستهای کلمهای کوتاه مؤثرترند. تصور کنید صحنه را برای یک دوست توصیف میکنید. LetsEnhance متوجه شده که نوشتن به زبان ساده «تصاویر هوش مصنوعی بسیار evocative و با جزئیات بیشتر نسبت به فهرستهای کلمهای ساده تولید میکند».
کمتر مؤثر
«روباه، جنگل، پاییز، مهآلود، نور آفتاب، 8k، بهترین کیفیت»
خروجی قابل استفاده اما کلی و عمومی.
بیشتر مؤثر
«یک روباه قرمز کنجکاو در جنگل مهآلود پاییزی در سپیدهدم کاوش میکند. نور طلایی آفتاب از بین برگهای رنگی فیلتر شده و سایههای نقطهای روی زمین جنگل میاندازد.»
تصاویر بسیار پیچیدهتر و پرجزئیات تولید میکند.

آزمایش با طول دستور و تکرار
مدلهای مختلف AI ترجیحات متفاوتی دارند. Midjourney V6 تا 350 کلمه را پشتیبانی میکند اما اغلب «بهترین خروجیها از عبارات ساده و موجز حاصل میشوند». در مقابل، سیستمهای مبتنی بر GPT (مثل ChatGPT/GPT-4o) میتوانند از دستورهای طولانیتر و داستانگونه بهره ببرند.
LetsEnhance اشاره میکند که «ChatGPT (GPT-4o) با پاراگرافها و ویرایشهای چندمرحلهای بهتر کار میکند؛ Midjourney V7 عبارات کوتاه و پرسیگنال را بههمراه تصاویر مرجع ترجیح میدهد». برای بهینهسازی روش خود، نقاط قوت ابزار انتخابیتان را تحقیق کنید.

عناصر پیشرفتهٔ دستور
صحنههای پیچیده را به اجزا تقسیم کنید: عمل، محیط، نورپردازی، حالت و ترکیببندی. مشخص کردن هر عنصر کمک میکند تا هوش مصنوعی همهٔ آنها را وارد کند.
عمل
سوژه چه کاری انجام میدهد؟
محیط
این صحنه کجا رخ میدهد؟
نورپردازی
چگونه نورپردازی شده است؟
حالت
حالوهوای احساسی چیست؟
ترکیببندی
چگونه قاببندی شده است؟
مثال: برای تصویرسازی یک ببر، آن را تعریف کنید («یک ببر بنگال باشکوه با خز نارنجی زنده»)، محیطش («در جنگل بارانی سرسبز»), نورپردازی («نور نقطهای که از بین برگها میتابد»), حالت («تنشزا و متمرکز») و قاببندی («در گوشهٔ پایین-چپ قاب قرار گرفته»). با بیان صریح این موارد مطمئن میشوید که هوش مصنوعی تمام دید شما را دنبال میکند.

مشخص کردن آنچه نباید شامل شود
بیشتر مدلهای هوش مصنوعی هر آنچه توصیف کنید تولید میکنند، اما شما میتوانید عناصر ناخواسته را ممنوع کنید. از منفینویسیها بهصورت محدود استفاده کنید: مواردی را نام ببرید که نمیخواهید، مانند «بدون متن، بدون واترمارک، بدون اندام اضافی».
بسیاری از سامانهها از پرچم «no ____» پشتیبانی میکنند (Midjourney از --no استفاده میکند، Stable Diffusion اغلب از فیلد جداگانهای بهره میبرد) تا اشیاء را فیلتر کنند. برای مثال، ممکن است از "--no blurry, --no watermark" برای حذف آن عناصر استفاده کنید.

برترین تولیدکنندههای تصویر با هوش مصنوعی
ابزارهای مختلف نقاط قوت متفاوتی دارند. در اینجا چند گزینهٔ پیشرو آمده است:
ChatGPT (GPT-4o)
DALL·E 3
Midjourney
--ar (نسبت تصویر)، --stylize (خلاقیت) و --no (حذفها) پشتیبانی میکند. اشتراک لازم است.Stable Diffusion
Adobe Firefly
سایر ابزارهای قابلتوجه
نکات کلیدی
خلق تصاویر خیرهکنندهٔ هوش مصنوعی ترکیبی از هنر و مهندسی دستور است:
ساختار دستور خود را مشخص کنید
سوژه + توصیف + سبک
افزودن جزئیات زنده
رنگها، بافتها، حالات، نورپردازی
از زبان طبیعی استفاده کنید
جملات کامل بهتر از فهرست کلمات هستند
تکرار و پالایش
یک عنصر را در هر بار تغییر دهید
ابزار مناسب را انتخاب کنید
تولیدکننده را بر اساس سبک خود انتخاب کنید
به یاد داشته باشید، تمرین باعث پیشرفت است. هرچه بیشتر با دستورها و ابزارها آزمایش کنید، بهتر خواهید آموخت چگونه هوش مصنوعی را هدایت کنید. یک دستور خوب را با یک تولیدکنندهٔ قدرتمند ترکیب کنید تا هر ایدهای را به تصویری نفسگیر تبدیل کنید.
No comments yet. Be the first to comment!