Kuandika Maelekezo ya Kuunda Picha za AI Zinazovutia

Gundua mbinu za vitendo za kuandika maelekezo zinazozalisha picha za AI zenye mvuto. Mwongozo huu unaelezea muundo wa maelekezo, vidokezo vya ubunifu, na jenereta bora za picha za AI kwa watumiaji wote.

Vijenereta vya kisasa vya picha vya AI vinaweza kutengeneza maono yenye ubora wa juu kutokana na maelezo ya maandishi. Mifumo hii imefunzwa kwa mamilioni ya picha zilizounganishwa na maandishi yanayofafanua picha (captions), ikijifunza kugeuza maelezo ya uelezaji kuwa kazi za sanaa zinazofanana. OpenAI inasema kwamba "kadri unavyokuwa maalum zaidi, ndivyo maono yanayohusiana utakayopata." Hii inamaanisha kwamba maelekezo yaliyoandikwa vizuri ni muhimu ili kupata picha zenye rangi na undani.

Muundo wa Maelekezo: Mada + Maelezo + Mtindo

Maelekezo mazuri kawaida hujumuisha vipengele vitatu vya msingi: Mada (nomino kuu), Maelezo (kitendo, mazingira, undani), na Mtindo (estetiki au chombo). Weka vipengele vya msingi mwanzoni – AI huweka kipaumbele zaidi kwa maneno ya awali.

Mada

Tambua nani au nini kipo kwenye picha (kwa mfano, "golden retriever", "spaceship"). Tumia nomino thabiti na epuka dhana zisizo wazi.

Maelezo

Ongeza kitendo na muktadha—nini kinatokea, wapi, na jinsi. Jumuisha mazingira na hisia kwa undani.

Mtindo/Estetiki

Taja chombo cha kuona (picha, uchoraji wa mafuta, impressionist) na muundo wa ufunguzi (picha ya karibu, mwangaza wa sinema) kwa usahihi.
Mfano: "The Batmobile stuck in Los Angeles traffic, impressionist painting, wide shot" – Hapa "Batmobile" ndiyo mada, "LA traffic" ni mandhari, na "impressionist painting" ni mtindo.

Mbinu hii ya muundo inahakikisha AI inafahamu lengo lako kwa usahihi. Kwa mfano, "Professional photo of raccoon reading a book in a library, close shot" hutoa mandhari tata, halisi, wakati "raccoon reading" pekee ni jumla na haieleweki.

Ongeza Maelezo Angavu na Vielezi

Jumuisha vivumishi na muktadha ili kuimarisha mandhari. Elezea rangi, muundo, na hisia. Badala ya kusema "castle", sema "a misty medieval castle with ivy-covered walls at sunrise". Typeface.ai inabainisha kwamba "kadri unavyoelezea picha kwa undani zaidi, ndivyo itakuwa rahisi kupata undani wa kipekee unayotaka".

  • Nini kinatokea kwenye mandhari?
  • Inaonekana vipi kwa macho?
  • Ni hisia au mazingira ya jumla ni yapi?
  • Ni mwanga, hali ya hewa, au maelezo ya anga gani yanayofaa?

Tumiza uzoefu wa mandhari pia – maelezo ya mwanga (mwangaza wa machweo, taa za neon), hali ya hewa (kunyevunyevu, mvua), na mazingira huongeza undani. Kwa mfano, "Yellow finch perched on a cherry blossom branch, spring background, soft lighting" ni zaidi ya kuamsha hisia kuliko kusema tu "finch".

Ongeza Maelezo Angavu na Vielezi
Maelezo angavu na vielezi huimarisha taswira zinazotengenezwa na AI

Andika Maelekezo Asilia na Yanayofafanua

Maelekezo ya hadithi, kwa mtindo wa sentensi kwa kawaida huzaa matokeo bora kuliko orodha fupi ya maneno muhimu. Fikiria unavyoelezea mandhari kwa rafiki. LetsEnhance iligundua kwamba kuandika kwa lugha rahisi kunaleta "picha za AI zenye hisia na undani zaidi ikilinganishwa na orodha rahisi za maneno muhimu".

Orodha ya Maneno Muhimu

Si Bora

"Mbweha, msitu, vuli, ukungu, mwangaza wa jua, 8k, ubora bora"

Inafanya kazi lakini matokeo ni ya jumla.

Hadithi Asilia

Bora Zaidi

"Mbweha mwekundu mwenye udadisi akiangalia msitu wa vuli wenye ukungu alfajiri. Mwangaza wa dhahabu wa jua unapopita kupitia majani yenye rangi, ukiweka vivuli vinavyopenya juu ya sakafu ya msitu."

Hutoa picha zenye undani na muundo wa kina zaidi.

Mbinu bora: Tumia sentensi kamili au aya fupi, na jumuisha maelezo ya hisia (rangi, mwangaza, hisia). Hii inatumia uelewa wa lugha wa AI kwa kuunda maono bora.
Andika Maelekezo Asilia na Yanayofafanua
Maelekezo kwa lugha asilia huzaa matokeo tajiri zaidi na yenye undani

Jaribu Urefu wa Maelekezo na Marekebisho

Mifumo tofauti ya AI ina mapendeleo tofauti. Midjourney V6 inaunga mkono hadi maelekezo ya maneno 350 lakini mara nyingi "matokeo bora yanatokana na misemo rahisi, yenye msingi". Kwa upande mwingine, mifumo ya aina ya GPT (kama ChatGPT/GPT-4o) inaweza kutumia maelekezo marefu, yasiyo tofauti na hadithi.

Vidokezo vya kitaalamu: Kila mara jaribu mabadiliko: anza na maelekezo mafupi, kisha ongeza vivumishi au maelezo hatua kwa hatua ili kuona jinsi picha inavyobadilika. Rudia kwa kubadilisha kipengele kimoja kwa wakati – rangi, pembe ya kamera, au mkao wa mhusika – ili kuboresha picha polepole.

LetsEnhance inaonyesha kwamba "ChatGPT (GPT-4o) hufanya kazi vizuri zaidi na aya na marekebisho ya mizunguko mingi; Midjourney V7 inapendelea misemo mifupi yenye ishara za juu pamoja na picha za rejea". Fanya utafiti juu ya nguvu za zana unazochagua ili kuboresha mbinu yako.

Jaribu Urefu wa Maelekezo na Marekebisho
Marekebisho ya kurudia huongeza ufanisi wa maelekezo

Vipengele vya Juu vya Maelekezo

Gawa mandhari tata kuwa vipengele: Kitendo, Mazingira, Mwanga, Hisia, na Muundo. Kuainisha kila kipengele kunamsaidia AI kujumuisha yote.

Kitendo

Mhusika anafanya nini?

Mazingira

Inatokea wapi?

Mwanga

Inamulikwa vipi?

Hisia

Tonu la kihisia ni lipi?

Muundo

Imewekwa vipi katika fremu?

Mfano: Kuonyesha tiger, ifafanue ("a majestic Bengal tiger with vibrant orange fur"), mazingira yake ("in a lush rainforest"), mwanga ("dappled sunlight through leaves"), hisia ("tense and focused"), na uundaji ("placed in the lower-left of the frame"). Kwa kuainisha haya wazi, unahakikisha AI inafuata maono yako yote.

Vipengele vya Juu vya Maelekezo
Kugawanya maelekezo kuwa vipengele kunahakikisha uelewa wa kina wa AI

Kueleza Vitu Visivyopaswa Kujumuishwa

Mifumo mingi ya AI hutoa chochote unachokielezea, lakini unaweza pia kuzuia vipengele visivyohitajika. Tumia maelekezo hasi kwa kiasi: taja mambo usiyotaka, kama "hakuna maandishi, hakuna watermark, hakuna viungo vya ziada".

Kidokezo muhimu: Zingatia kwanza kile unachotaka; maagizo chanya mara nyingi hufanya kazi vizuri zaidi. Kisha ongeza maagizo hasi tu inapobidi kuondoa hitilafu au maelezo yasiyo ya lazima.

Mifumo mingi ina bendera ya "no ____" (Midjourney hutumia --no, Stable Diffusion mara nyingi hutumia uwanja tofauti) kuchuja vitu. Kwa mfano, unaweza kutumia "--no blurry, --no watermark" kuondoa vipengele hivyo.

Kueleza Vitu Visivyopaswa Kujumuishwa
Maelekezo hasi husaidia kuchuja vitu visivyohitajika

Jenereta Bora za Picha za AI

Zana tofauti zina nguvu tofauti. Hapa kuna chaguzi zinazoongoza:

ChatGPT (GPT-4o)

Modeli ya karibuni ya OpenAI inajumuisha jenereta ya picha ya juu. Ina "ustadi wa kuonyesha maandishi kwa usahihi" na inafuata kwa usahihi hata maelekezo tata. Unaweza kuboresha picha kwa mazungumzo ya muingiliano, ukitumia maarifa ya dunia ya GPT-4o kwa uthabiti (mfano, maandishi halisi kwenye alama).

DALL·E 3

Inapatika kupitia ChatGPT na API, DALL·E huunda mandhari za undani mkubwa na za uhalisia. Inafaidika na maelekezo mahususi sana, inaruhusu hadi takriban herufi 1000 (≈maneno 250), na inatoa uwiano mbalimbali wa sura. Kumbuka ina vizingiti vya maudhui (hakuna kuiga sura ya mtu halisi) lakini inatoa "maono ya kipekee, ya kweli" wakati maelekezo yameandikwa vizuri.

Midjourney

Midjourney ni zana inayojulikana ndani ya jamii inayotambulika kwa picha za kisanii na za ubunifu. Inaendesha kwenye Discord (na wavuti) na hujibu vyema kwa maneno makali ya kuvutia. Tumia misemo mifupi, yenye maelezo (mfano, "vivid watercolor of city at twilight"). Inaunga mkono bendera kama --ar (uwiano wa sura), --stylize (ubunifu), na --no (utoaji wa baadhi ya vitu). Inahitaji usajili wa kulipia.

Stable Diffusion

Mfano wa chanzo huria unaojulikana kwa uhalisia wa picha. Unaweza kuutumia kwa ndani ya tarakilishi au kupitia UI za wavuti kama DreamStudio. Unaunga mkono maelekezo ya maandishi na picha, maelezo marefu sana, na maelekezo hasi. Unaweza kurekebisha au kufinyanga modeli au kujaribu matoleo (SDXL, SD3) kwa mitindo tofauti. Kuna zana nyingi za jamii na checkpoints zinazopatikana kwa uhuru.

Adobe Firefly

Zana ya sanaa ya AI ya Adobe iliyojengwa ndani ya Photoshop na programu za Adobe. Inalenga urahisi wa kuandika maelekezo kwa maandishi (kwa lugha zaidi ya 100) na pato la azimio la juu (2048×2048 kwa kawaida). Inatoa mapendekezo ya ubunifu na inashughulikia maelekezo pana vizuri. Haikujiunga na maelekezo hasi lakini inakuwezesha kubadilisha muundo kwa Generative Fill/Expand. Mpango wa bure unaweza kuweka watermark za Adobe.

Zana Nyingine Zinazofaa Kumbuka

Google's Imagen/Gemini, Ideogram (iliyoboreshwa kwa grafiki za maandishi), Leonardo AI, BlueWillow, StarryAI, Runway, na Canva's AI kila moja ina niche yake. Ideogram ni hodari kwa uwazi wa maandishi; Runway hutoa uundaji wa video. Fanya utafiti wa kulinganisha za sasa ili kuchagua zana inayofaa kwa mtindo wako.
Sifa ya ziada: Zana nyingi zinatoa upscaling ili kuimarisha sanaa ya AI. Huduma kama Let's Enhance zinaweza kuchukua uzalishaji wako na kuuongezea hadi 4K au azimio la kuchapisha bila kuifanya ififike.

Mambo Muhimu

Kuunda picha za kuvutia za AI ni mchanganyiko wa sanaa na uhandisi wa maelekezo:

1

Panga Maelekezo Yako

Mada + Maelezo + Mtindo

2

Ongeza Maelezo Angavu

Rangi, muundo, hisia, mwangaza

3

Tumia Lugha Asilia

Sentensi zinafaulu kuliko orodha za maneno muhimu

4

Rudia na Boresha

Badilisha kipengele kimoja kwa wakati

5

Chagua Zana Yako

Linganisha jenereta na mtindo wako

Kumbuka, mazoezi hufanya ukamilifu. Kadri unavyojaribu maelekezo na zana zaidi, ndivyo utakavyojifunza jinsi ya kuiongoza AI vizuri. Changanya maelekezo yaliyoandikwa vizuri na jenereta yenye nguvu, na unaweza kubadilisha wazo lolote kuwa picha ya kushangaza.

Marejeleo ya Nje
Makala hii imeandaliwa kwa marejeleo kutoka vyanzo vifuatavyo vya nje:
159 makala
Rosie Ha ni mwandishi wa Inviai, mtaalamu wa kushiriki maarifa na suluhisho kuhusu akili bandia. Kwa uzoefu wa kufanya utafiti na kutumia AI katika nyanja mbalimbali kama biashara, ubunifu wa maudhui, na uendeshaji wa kiotomatiki, Rosie Ha huleta makala zinazoweza kueleweka kwa urahisi, za vitendo na zenye kuhamasisha. Dhamira ya Rosie Ha ni kusaidia watu kutumia AI kwa ufanisi ili kuongeza uzalishaji na kupanua uwezo wa ubunifu.
Maoni 0
Weka Maoni

Hapajapatikana maoni. Kuwa wa kwanza kutoa maoni!

Search