LoRA เป็นเครื่องมือที่ช่วยให้เราสามารถสร้างคาแรกเตอร์หรือโมเดลเฉพาะที่สามารถเจนซ้ำได้เรื่อยๆ จะเจนเปลี่ยนท่าทาง หรือปรับรายละเอียดของภาพ LoRA จะยังคงลักษณะของคาแรกเตอร์ที่เราเทรนไว้ได้ ถึงแม้ว่าในปัจจุบันจะมีช่องทางที่จะช่วยให้เราเทรน LoRA ได้ง่ายมากขึ้น แต่ความเข้าใจพื้นฐานในค่า Parameter ต่างๆ จะช่วยให้เราปรับแต่ง LoRA ได้ดั่งใจมากขึ้นและใช้เวลาน้อยลง บทความนี้จะพาไปทำความเข้าใจการตั้งค่าที่สำคัญในกรเทรน LoRA Model
ControlNet คือเครื่องมือเด็ดใน Stable Diffusion ที่ช่วยให้เราควบคุมการสร้างภาพด้วย AI ได้แบบละเอียดยิบ บทความนี้เรามาทำความรู้จักกับการใช้ ControlNet ที่ใช้งานบ่อยๆ เช่น Canny, OpenPose, และ IP-Adapter ว่าจะช่วยให้การสร้างภาพของเราง่ายขึ่นยังไงบ้าง วีธีการใช้งาน Controlnet อ่านได้ที่นี่ 1. Canny Edge Detection Canny Edge
Flux เป็นโมเดล AI สร้างภาพที่พัฒนาโดยทีมงานจาก Black Forest Labs ซึ่งเป็นกลุ่มที่เคยทำงานในโปรเจค Stable Diffusion มาก่อน โดย Flux เปิดตัวในปี 2024 และเป็นโมเดลที่มีประสิทธิภาพสูงมาก สามารถเขียนตัวอักษรได้ดี ไม่แพ้ Midjourney หรือ DALL-E 3 เลยทีเดียว
ControlNet เป็นเครื่องมือทรงพลังสำหรับการสร้างภาพด้วย AI บน Stable Diffusion เราสามารถควบคุมการสร้างภาพได้อย่างละเอียด กำหนดโครงสร้างของภาพได้ดั่งใจ โดยไม่ต้องพึ่งแค่ Prompt เพียงอย่างเดียว
A1111 WebUI เป็นอินเตอร์เฟซที่นิยมใช้ในการสร้างและปรับแต่งภาพโดยใช้ Stable Diffusion Model ซึ่งการติดตั้งปลั๊กอินที่เหมาะสมสามารถช่วยเพิ่มประสิทธิภาพและขยายความสามารถในการใช้งานได้อย่างมาก ในบทความนี้ผมจะแนะนำปลั๊กอินพื้นฐานที่ผมใช้ประจำใน A1111 WebUI เพื่อช่วยให้การสร้างภาพง่ายและสะดวกยิ่งขึ้น
สรุปสั้นๆ ง่ายๆ ในการทำ Inpaint คือให้ตั้งค่าตามนี้
– เลือก Inpaint Area ไปที่ Only Masked (เฉพาะจุด)
– ปรับขนาด Resize to ไปที่ 768*768 หรือ 1024*1024
– ตั้งค่า Denoising Strength ที่ 0.4 – 0.5 จะให้ผลลัพธ์ที่ดีที่สุด (เพิ่มรายละเอียดโดยคงโครงสร้างเดิมไว้)
ส่วนรายละเอียดด้านล่างจะเป็นการอธิบายตัวเลือกต่างๆ ถ้าเข้าใจก็สามารถประยุกต์ใช้งานได้หลากหลายขึ้น
Img2Img (Image to Image) ตามชื่อเลย คือขั้นตอนการทำภาพให้เป็นภาพ อาจฟังดูงงๆ แต่จริงๆ แล้วนี่เป็นกระบวนการสำคัญที่เกิดขึ้นหลังจากที่เราได้ภาพร่างมาจาก Txt2Img แล้ว
ศึกษา SD ไปเรื่อยๆ สร้างสรรค์ภาพออกมาให้ได้ดั่งใจ ตอนนี้เรายังอยู่ในยุคเริ่มต้นของ AI แต่การพัฒนานั้นเป็นไปยิ่งกว่าก้าวกระโดด
ในบทความนี้ เราจะมาดูเรื่องของการใช้งาน Txt2Img หรือก็คือ Text to Image ซึ่งเป็นการสร้างภาพด้วย AI โดยการป้อนข้อมูลที่ต้องการผ่าน Prompt เช่น ถ้าต้องการภาพแมวอยู่ในกล่อง เราก็ใส่ Prompt ไปว่า “cat in the box” ตัว AI ก็จะแปลง Prompt นั้นออกมาในรูปแบบภาพ
เพื่อไม่ให้งงจะสรุปการเดินทางสั้นๆ ไว้ตรงนี้ คือ
เริ่มจากนั่งรถไฟจากหาดใหญ่ไปลงปาดังเบซาร์
ต่อรถไฟจากปาดังเบซาร์ไปบัตเตอร์เวอร์ธ
จากบัตเตอร์เวอร์ธ ต่อเรือเฟอร์รี่สู่เกาะปีนัง
ขากลับก็เดินทางเหมือนเดิมแต่ย้อนกลับ