การเขียนพรอมต์เพื่อสร้างภาพจาก AI ที่น่าทึ่ง

เรียนรู้เทคนิคเชิงปฏิบัติสำหรับการเขียนพรอมต์เพื่อสร้างภาพจาก AI ที่สวยงาม คู่มือนี้อธิบายโครงสร้างพรอมต์ เคล็ดลับเชิงสร้างสรรค์ และแนะนำเครื่องมือสร้างภาพด้วย AI ที่ดีที่สุดสำหรับผู้ใช้ทุกระดับ

ตัวสร้างภาพด้วย AI สมัยใหม่สามารถสร้าง ภาพความละเอียดสูงจากคำบรรยายข้อความ ได้ ระบบเหล่านี้ได้รับการฝึกด้วยภาพและคำบรรยายที่จับคู่กันเป็นล้าน ๆ ชุด ทำให้เรียนรู้การจับคู่พรอมต์เชิงบรรยายกับผลงานศิลปะที่ตรงกัน OpenAI ระบุว่า “ยิ่งคุณระบุรายละเอียดมากเท่าไร ภาพที่ได้ก็จะยิ่งตรงประเด็นมากขึ้นเท่านั้น” ซึ่งหมายความว่าพรอมต์ที่รังสรรค์อย่างดีเป็นกุญแจสำคัญในการได้ภาพที่ชัดเจนและมีรายละเอียด.

โครงสร้างพรอมต์: หัวข้อ + คำอธิบาย + สไตล์

พรอมต์ที่ดีมักรวมองค์ประกอบสำคัญสามอย่าง: the หัวข้อ (คำนามหลัก), a คำอธิบาย (การกระทำ, สถานที่, รายละเอียด), and a สไตล์ (อารมณ์หรือสื่อ) จัดวางองค์ประกอบหลักไว้ก่อน – AI จะให้ความสำคัญกับคำที่อยู่ตอนต้นมากกว่า.

หัวข้อ

ระบุว่าใครหรืออะไรอยู่ในภาพ (เช่น "golden retriever", "spaceship") ใช้คำนามที่จับต้องได้และหลีกเลี่ยงนามธรรมที่กำกวม.

คำอธิบาย

เพิ่มการกระทำและบริบท—เกิดอะไรขึ้น ที่ไหน และอย่างไร รวมถึงสภาพแวดล้อมและอารมณ์เพื่อให้ภาพมีมิติ.

สไตล์/อารมณ์ทางศิลป์

ระบุสื่อภาพ (photo, oil painting, impressionist) และการจัดเฟรม (close-up, cinematic lighting) เพื่อความแม่นยำ.
ตัวอย่าง: "บัทโมบิลติดการจราจรในลอสแองเจลิส, ภาพสไตล์อิมเพรสชันนิสม์, มุมกว้าง" – ที่นี่ "Batmobile" เป็นหัวข้อ, "LA traffic" เป็นฉาก, และ "impressionist painting" เป็นสไตล์.

วิธีการแบบมีโครงสร้างนี้ช่วยให้ AI เข้าใจจุดสนใจของคุณอย่างชัดเจน ตัวอย่างเช่น "Professional photo of raccoon reading a book in a library, close shot" จะให้ฉากที่ซับซ้อนและสมจริง ในขณะที่ "raccoon reading" เพียงอย่างเดียวจะดูทั่วไปและไม่ชัดเจน.

เพิ่มรายละเอียดชัดเจนและคำบรรยาย

ใส่ คุณศัพท์และบริบท เพื่อเติมเต็มฉาก อธิบายสีสัน พื้นผิว และอารมณ์ แทนที่จะใช้ "castle" ให้ใช้ "a misty medieval castle with ivy-covered walls at sunrise". Typeface.ai ระบุว่า "ยิ่งคุณระบุรายละเอียดในการอธิบายภาพมากเท่าไร ก็ยิ่งง่ายขึ้นที่จะได้รายละเอียดเฉพาะตัวตามที่ต้องการ".

  • เกิดอะไรขึ้นในฉาก?
  • ลักษณะทางสายตามันเป็นอย่างไร?
  • บรรยากาศหรืออารมณ์โดยรวมเป็นอย่างไร?
  • รายละเอียดเกี่ยวกับแสง อากาศ หรือบรรยากาศใดที่สำคัญ?

เน้นฉากหลังด้วย – รายละเอียดของแสง (sunset glow, neon lights), สภาพอากาศ (misty, rainy), และบรรยากาศจะช่วยเพิ่มมิติ ตัวอย่างเช่น "Yellow finch perched on a cherry blossom branch, spring background, soft lighting" จะสื่ออารมณ์ได้มากกว่าการใช้ "finch" เพียงอย่างเดียว.

เพิ่มรายละเอียดชัดเจนและคำบรรยาย
รายละเอียดและคำบรรยายที่ชัดเจนช่วยยกระดับภาพที่สร้างโดย AI

เขียนพรอมต์เชิงบรรยายอย่างเป็นธรรมชาติ

พรอมต์แบบเล่าเป็นประโยค มักให้ผลดีกว่าการใส่คำสำคัญแบบสั้นๆ ลองนึกถึงการอธิบายฉากให้เพื่อนฟัง LetsEnhance พบว่าการเขียนด้วยภาษาธรรมดาทำให้ได้ "ภาพจาก AI ที่สื่ออารมณ์และมีรายละเอียดมากกว่าการใช้รายการคำสำคัญแบบง่ายๆ".

รายการคำสำคัญ

ไม่ค่อยได้ผล

"สุนัขจิ้งจอก, ป่า, ฤดูใบไม้ร่วง, มีหมอก, แสงแดด, 8k, คุณภาพดีที่สุด"

ใช้ได้แต่ผลลัพธ์ค่อนข้างทั่วไป.

การบรรยายเป็นธรรมชาติ

ให้ผลดีกว่า

"จิ้งจอกแดงที่อยากรู้อยากเห็นกำลังสำรวจป่าที่มีหมอกในฤดูใบไม้ร่วงยามเช้า แสงแดดสีทองส่องผ่านใบไม้หลากสี ก่อเงาลายบนพื้นป่า"

สร้างภาพที่ซับซ้อนและมีรายละเอียดมากกว่าอย่างมาก.

แนวปฏิบัติที่ดีที่สุด: ใช้ประโยคเต็มหรือย่อหน้าสั้น ๆ และรวมรายละเอียดทางประสาทสัมผัส (สี แสง อารมณ์) วิธีนี้จะใช้ความสามารถด้านภาษาของ AI ให้สร้างภาพที่ดียิ่งขึ้น.
เขียนพรอมต์เชิงบรรยายอย่างเป็นธรรมชาติ
พรอมต์ภาษาธรรมชาติให้ผลลัพธ์ที่ลึกซึ้งและมีรายละเอียดมากขึ้น

ทดลองความยาวพรอมต์และการทำซ้ำ

โมเดล AI แต่ละตัวมีความชอบที่ต่างกัน Midjourney V6 รองรับพรอมต์ยาวถึง 350 คำ แต่บ่อยครั้ง "ผลลัพธ์ที่ดีที่สุดมาจากวลีสั้น ๆ ตรงประเด็น". ในทางกลับกัน ระบบที่ใช้ GPT (เช่น ChatGPT/GPT-4o) สามารถใช้ประโยชน์จากพรอมต์ที่ยาวขึ้นเป็นเรื่องเล่าได้.

เคล็ดลับมืออาชีพ: ทดสอบรูปแบบต่าง ๆ เสมอ: เริ่มจากพรอมต์สั้นกระชับ แล้วค่อยเพิ่มคุณศัพท์หรือรายละเอียดทีละน้อยเพื่อดูว่าภาพเปลี่ยนแปลงอย่างไร ทำการปรับซ้ำโดยแก้เพียงหนึ่งองค์ประกอบต่อครั้ง – สี มุมกล้อง หรือท่าทางของวัตถุ – เพื่อปรับแต่งภาพทีละน้อย.

LetsEnhance ระบุว่า "ChatGPT (GPT-4o) ให้ผลดีที่สุดกับย่อหน้าและการแก้ไขหลายรอบ; Midjourney V7 ชอบวลีสั้นที่มีสัญญาณสูงพร้อมภาพอ้างอิง". ค้นคว้าจุดแข็งของเครื่องมือที่คุณเลือกเพื่อปรับวิธีการของคุณให้เหมาะสม.

ทดลองความยาวพรอมต์และการทำซ้ำ
การปรับปรุงแบบวนซ้ำช่วยเพิ่มประสิทธิภาพพรอมต์

องค์ประกอบพรอมต์ขั้นสูง

แยกฉากที่ซับซ้อนเป็นส่วนประกอบ: การกระทำ, สิ่งแวดล้อม, แสง, อารมณ์, และองค์ประกอบภาพ. การระบุแต่ละองค์ประกอบช่วยให้ AI รวมทุกส่วนได้.

การกระทำ

วัตถุกำลังทำอะไร?

สิ่งแวดล้อม

เกิดขึ้นที่ไหน?

แสง

ส่องสว่างอย่างไร?

อารมณ์

โทนอารมณ์เป็นอย่างไร?

องค์ประกอบภาพ

จัดเฟรมอย่างไร?

ตัวอย่าง: ในการพรรณนารูปเสือ ให้กำหนดลักษณะของมัน ("a majestic Bengal tiger with vibrant orange fur"), สิ่งแวดล้อม ("in a lush rainforest"), แสง ("dappled sunlight through leaves"), อารมณ์ ("tense and focused"), และการจัดเฟรม ("placed in the lower-left of the frame"). การระบุเหล่านี้อย่างชัดเจนจะช่วยให้ AI ปฏิบัติตามวิสัยทัศน์ของคุณได้ครบถ้วน.

องค์ประกอบพรอมต์ขั้นสูง
การแบ่งพรอมต์เป็นส่วนช่วยให้ AI เข้าใจอย่างครบถ้วน

ระบุสิ่งที่ ไม่ ต้องการให้รวม

โมเดล AI ส่วนใหญ่จะสร้างสิ่งที่คุณอธิบาย แต่คุณยังสามารถ กำจัดองค์ประกอบที่ไม่ต้องการ ได้ ใช้ negative prompts อย่างประหยัด: ระบุสิ่งที่คุณไม่ต้องการ เช่น "no text, no watermark, no extra limbs".

ข้อควรทราบสำคัญ: ให้มุ่งเน้นที่สิ่งที่คุณต้องการก่อน; คำสั่งเชิงบวกมักได้ผลดีที่สุด แล้วเพิ่มคำสั่งเชิงลบเฉพาะเมื่อจำเป็นเพื่อกำจัดข้อผิดพลาดหรือรายละเอียดที่ไม่เกี่ยวข้อง.

หลายระบบรองรับแฟลก "no ____" (Midjourney ใช้ --no, Stable Diffusion มักจะมีช่องแยกต่างหาก) เพื่อกรองวัตถุออก ตัวอย่างเช่น คุณอาจใช้ "--no blurry, --no watermark" เพื่อไม่ให้รวมองค์ประกอบเหล่านั้น.

การระบุสิ่งที่ไม่ต้องการให้รวม
พรอมต์เชิงลบช่วยกรององค์ประกอบที่ไม่ต้องการ

เครื่องมือสร้างภาพด้วย AI ชั้นนำ

เครื่องมือต่าง ๆ มีจุดแข็งต่างกัน ต่อไปนี้คือทางเลือกชั้นนำ:

ChatGPT (GPT-4o)

โมเดลล่าสุดของ OpenAI รวมตัวสร้างภาพขั้นสูงไว้ด้วย มัน "โดดเด่นในการเรนเดอร์ข้อความอย่างแม่นยำ" และปฏิบัติตามพรอมต์ที่ซับซ้อนได้อย่างแม่นยำ คุณสามารถปรับภาพแบบอินเทอร์แอคทีฟในแชท โดยใช้ความรู้เชิงโลกของ GPT-4o เพื่อความสอดคล้อง (เช่น ข้อความบนป้ายที่สมจริง).

DALL·E 3

เข้าถึงได้ผ่าน ChatGPT และ API, DALL·E สร้างฉากที่มีรายละเอียดสูงและสมจริง เหมาะกับพรอมต์ที่ระบุชัดเจน รองรับความยาวประมาณ ~1000 ตัวอักษร (≈250 คำ) และมีหลายอัตราส่วนภาพ โปรดทราบว่ามีข้อจำกัดด้านเนื้อหา (ไม่อนุญาตภาพบุคคลจริง) แต่จะให้ "ภาพที่เป็นเอกลักษณ์และสมจริง" เมื่อได้รับพรอมต์ที่ดี.

Midjourney

เป็นเครื่องมือที่ชุมชนใช้งานอย่างแพร่หลายซึ่งมีชื่อเสียงด้าน ภาพศิลปะและจินตนาการ ทำงานบน Discord (และเว็บ) และตอบสนองได้ดีที่สุดกับคำสำคัญที่ชัดเจน เลือกใช้วลีสั้นที่บรรยายได้ดี (เช่น "vivid watercolor of city at twilight"). รองรับแฟลกเช่น --ar (อัตราส่วนภาพ), --stylize (ความคิดสร้างสรรค์), และ --no (การยกเว้น). ต้องสมัครสมาชิก.

Stable Diffusion

เป็นโมเดลโอเพนซอร์สที่รู้จักในด้าน ความสมจริงแบบภาพถ่าย สามารถรันแบบโลคอลหรือผ่าน UI บนเว็บอย่าง DreamStudio รองรับพรอมต์ทั้งข้อความและภาพ คำอธิบายยาว ๆ และพรอมต์เชิงลบ คุณสามารถปรับแต่งโมเดลหรือทดลองเวอร์ชันต่าง ๆ (SDXL, SD3) สำหรับสไตล์ที่ต่างกัน มีเครื่องมือจากชุมชนและจุดเช็คพอยท์ที่เผยแพร่อย่างเสรีมากมาย.

Adobe Firefly

เครื่องมือศิลปะ AI ของ Adobe ที่ฝังอยู่ใน Photoshop และแอปของ Adobe เน้นการป้อนพรอมต์ด้วยข้อความที่ง่าย (รองรับกว่า 100 ภาษา) และผลลัพธ์ความละเอียดสูง (2048×2048 โดยค่าเริ่มต้น) ให้ข้อเสนอแนะเชิงสร้างสรรค์และจัดการพรอมต์กว้าง ๆ ได้ดี ไม่รองรับพรอมต์เชิงลบ แต่ให้คุณปรับองค์ประกอบภาพด้วย Generative Fill/Expand แผนฟรีมีลายน้ำของ Adobe.

Other Notable Tools

เครื่องมืออื่น ๆ ที่น่าสังเกตได้แก่ Imagen/Gemini ของ Google, Ideogram (เหมาะสำหรับกราฟิกที่มีข้อความ), Leonardo AI, BlueWillow, StarryAI, Runway, และ AI ของ Canva แต่ละตัวมีจุดเด่นเฉพาะ Ideogram เด่นด้านความชัดของข้อความ; Runway เสนอการสร้างวิดีโอ ค้นคว้าเปรียบเทียบปัจจุบันเพื่อเลือกเครื่องมือที่เหมาะกับสไตล์ของคุณ.
ฟีเจอร์พิเศษ: หลายเครื่องมือมีฟังก์ชัน ย่อ/ขยายความละเอียด (upscaling) เพื่อทำให้ศิลปะจาก AI คมชัดขึ้น บริการอย่าง Let's Enhance สามารถนำงานที่คุณสร้างมาเพิ่มเป็นความละเอียด 4K หรือความละเอียดที่พิมพ์ได้โดยไม่ทำให้เบลอ.

ข้อสรุปสำคัญ

การสร้างภาพจาก AI ที่น่าทึ่งเป็นการผสมผสานระหว่างศิลปะและการออกแบบพรอมต์:

1

จัดโครงสร้างพรอมต์

หัวข้อ + คำอธิบาย + สไตล์

2

เพิ่มรายละเอียดที่ชัดเจน

สี, พื้นผิว, อารมณ์, แสง

3

ใช้ภาษาธรรมชาติ

การใช้ประโยคดีกว่าการใช้รายการคำสำคัญ

4

ทำซ้ำและปรับแต่ง

ปรับทีละองค์ประกอบ

5

เลือกเครื่องมือของคุณ

จับคู่เครื่องมือกับสไตล์ของคุณ

จำไว้ว่า การฝึกฝนย่อมนำไปสู่ความชำนาญ. ยิ่งคุณทดลองกับพรอมต์และเครื่องมือต่าง ๆ มากเท่าไร คุณก็จะยิ่งเรียนรู้วิธีแนะนำ AI ได้ดีขึ้น ผสานพรอมต์ที่รังสรรค์อย่างดีเข้ากับตัวสร้างภาพที่ทรงพลัง แล้วคุณจะเปลี่ยนไอเดียใด ๆ ให้เป็นภาพที่น่าทึ่งได้.

External References
This article has been compiled with reference to the following external sources:
175 articles
Rosie Ha เป็นผู้เขียนบทความที่ Inviai เชี่ยวชาญในการแบ่งปันความรู้และแนวทางแก้ไขเกี่ยวกับปัญญาประดิษฐ์ ด้วยประสบการณ์ในการวิจัยและประยุกต์ใช้ AI ในหลายสาขา เช่น ธุรกิจ การสร้างสรรค์เนื้อหา และระบบอัตโนมัติ Rosie Ha มุ่งมั่นนำเสนอเนื้อหาที่เข้าใจง่าย ใช้งานได้จริง และสร้างแรงบันดาลใจ ภารกิจของ Rosie Ha คือช่วยให้ทุกคนใช้ AI อย่างมีประสิทธิภาพเพื่อเพิ่มผลผลิตและขยายขีดความสามารถในการสร้างสรรค์
Comments 0
Leave a Comment

No comments yet. Be the first to comment!

Search