RECAP Stable Diffusion ตลอดปี 2024

สวัสดีครับวันนี้มาดูกันว่า Stable Diffusion (และ Model อื่นๆ ที่ open source) ไปถึงในแล้วบ้างวันนี้มาย้อนเวลาไปตั้งแต่ต้นปีจนถึงสิ้นปีนี้ มีอะไรเกิดขึ้นบ้าง มาไล่เรียง Timeline ตลอดทั้งปี 2024 กันเลยนะครับ

Pony V6 cr. https://civitai.com/images/5706937

8 มกราคม กำเนิด Pony Diffusion V6 XL

Pony Diffusion V6 XL หรือที่เราเรียกกันว่า Pony เป็น Fine-Tuned Model ของ SDXL ตัวหนึ่งที่เก่ง 2D Anime และ รู้จักตัวละครระดับหนึ่ง ทำให้ถูกแพร่หลายไปอย่างรวดเร็ว พร้อมกับ LoRA ที่มหาศาลมากๆ ทำให้เป็น Model ตัวหนึ่งที่ยังคงใช้กันอยู่ในการทำภาพ 2D Anime และการ์ตูนอื่นๆ

SD3 cr. https://stability.ai/news/stable-diffusion-3

22 กุมภาพันธ์ เปิดตัว SD3 ปล่อยออกมาเหมือนจะดี

SD3 ออกแล้ว นี่แหล่ะโมเดลใหม่ที่ดีแน่ แต่… ปล่อยแต่ตัว Ultra ที่ให้ใช้กับ API เท่านั้น…

24 มีนาคม CEO StabilityAI ลาออก แถมวิกฤติอีก

หลังจาก CEO ลาออกเพื่อไปทำ Decentralize AI และ พนักงานบางส่วนลาออกอีก ทำให้บริษัทขาดเงินทุนในการดำเนินกิจการ และมีข่าวลือว่าต้องขายกิจการให้กับบริษัทอื่นๆ

SD3 medium cr. https://huggingface.co/stabilityai/stable-diffusion-3-medium

12 มิถุนายน StabilityAI ปล่อย SD3 Medium

SD3 Medium เป็นโมเดลขนาดกลางเหมาะสำหรับการทำงานบน PC ทั่วไปแต่ก็มีปัญหาเรื่องลิขสิทธิ์การใช้งาน และคุณภาพที่น่าผิดหวังสุดๆ ก็เลยทำให้แห้วไป แถมช่วงแรกโดน civitAI แบนอีก

Auraflow cr. https://huggingface.co/fal/AuraFlow

12 กรกฎาคม Fal เปิดตัว Auraflow โมเดลที่โลกลืม

โมเดลตัวใหม่ที่สิทธิ์การใช้งานที่อิสระ ยกเว้นการเปลี่ยนลิขสิทธิ์จากเดิมแค่นั้น แต่ใน ณ วันนั้นอาจจะยังไม่เข้าใจว่าเอาไปใช้ยังไง มีแค่ ComfyUI ที่ใช้งานได้ ณ ตอนนั้น แต่ก็บางทีมาก่อนก็ใช่ว่าจะดีเสมอไป

Flux.1 cr. https://blackforestlabs.ai/announcing-black-forest-labs/

1 สิงหาคม Black Forest Lab เปิดตัว Flux1

Black Forest Lab อดีตทีมสร้าง Stable Diffusion ได้เปิดตัว Flux1 โมเดลที่เรียกว่าเขย่าวงการการทำ AI Image ครั้งใหญ่ที่สุดเท่าที่เคยเห็นมา เพราะว่าเป็นโมเดลที่ทำภาพได้เทียบเท่า Midjourney ได้ และ Open Source ใน version Dev และ Schell สำหรับรุ่น Pro ใช้ผ่าน API เท่านั้น (หรือผ่านเว็บเจนภาพ)

Pony V7 Announcement cr. https://civitai.com/articles/6309/towards-pony-diffusion-v7-going-with-the-flow?imageId=25235745

23 สิงหาคม Pony V7 ประกาศแล้ว

เป็นการอธิบายแนวทางการสร้าง Model Pony ตัวใหม่ว่าจะใช้อะไร และ ออกมาคือใช้ Auraflow v0.2 ที่โลกลืมไปแล้ว และบอกสถานะของการทำโมเดล ณ ตอนนั้น (อ่านสรุปได้จาก link นี้)

illustriousXL v0.1 cr.https://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0

25 กันยายน Illustrious-XL โมเดลจากแดนโสมถือกำเนิด

หากเอารูป Anime 7.5 ล้านรูปจาก Danbooru มา fine-tuned SDXL จะเป็นยังไง ผลก็คือ… รู้จักทุกสิ่งทุกอย่างบนโลก anime แต่ก็… ทำให้ LoRA จาก SDXL, Pony พังหมดเลย ทำให้ถูกแยกออกมาเป็นหมวดใหม่เลย ว่ากันว่าโมเดลนี้จะมาล้ม PonyXL ได้ แต่จริงๆ มีร่างทอง 25 ล้านรูปอยู่แต่ไม่ปล่อย…

ComfyUI 1.0 https://blog.comfy.org/p/comfyui-v1-release

21 ตุลาคม ComfyUI ปล่อย version Desktop 1.0

ลงง่ายขึ้น, UI น่าใช้งานขึ้น ทำให้การเข้าถึงการทำ AI Image อาจจะทำให้แพร่หลายขึ้นได้ ดูเป็นรูปเป็นร่างมากกว่า UI ตัวอื่นๆ เพราะว่าเปรียบเสมือนโปรแกรมหนึ่งเลย ต่างกับตัวอื่นที่เปิดผ่าน web browser

SD3.5 cr. https://stability.ai/news/introducing-stable-diffusion-3-5

22 ตุลาคม StabilityAI เปิดตัว SD3.5

หลังจาก SD3 เปิดตัวไปแล้วผลตอบรับไม่ดี แก้เกมโดยการเปิดตัวใหม่พร้อมปล่อยโมเดลใหญ่ออกมาเลย SD3.5 และ SD3.5 Medium ซึ่งบางทีอาจจะช้าเกินไปเพราะว่าคนแห่ไปใช้ Flux หมดแล้ว

cr. https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/

6 พฤศจิกายน Flux1.1 Pro Ultra และ Raw เปิดตัว

เมื่อผลตอบรับ Flux1 มีเสียงตอบรับที่ดีทาง Black Forest Lab ได้ปล่อยตัว Flux Pro 1.1 ออกมาโดยเน้นคุณภาพดีขึ้น ไวขึ้น และ ภาพใหญ่ขึ้น

Pony V7 cr. https://www.youtube.com/watch?v=8pw1LwRUGY4

14 พฤศจิกายน AstraliteHeart มาอธิบาย Pony V7 ผ่าน live CivitAI

เป็นการบอกแพลนการปล่อยของ Pony V7 และแสดงภาพตัวอย่างคร่าวๆ ให้เห็นครั้งแรกพร้อมกัน ซึ่งดูรายละเอียดได้จาก live สดของ CivitAI (ผมสรุปไว้ให้แล้ว ที่ link นี้)

Flux Tools cr. https://blackforestlabs.ai/flux-1-tools/

21 พฤศจิกายน Black Forest Lab ปล่อยของอีก

FLUX.1 Fill, FLUX.1 Depth, FLUX.1 Canny, FLUX.1 Redux ให้ดาวน์โหลดใช้งานกันได้ แต่ละตัวก็มีคุณสมบัติแตกต่างกันไปเช่น inpaint, depth, canny, และ ip-adapter ซึ่งทำให้เกิดงานเฉพาะทางได้ง่ายขึ้น

NoobAI-XL cr. https://civitai.com/images/46921472

22 ธันวาคม NoobAI-XL แดนมังกรขอเอาบ้าง

จีนบอก ขอเติมรูปอีก 11 ล้านรูป และใช้ V-Prediction เพื่อ fine-tuned Illustrious-XL และได้ปล่อย version beta ออกมาเรื่อยๆ จนถึง v1.0 โมเดลนี้ความที่โหดมากๆแบบรู้จัก anime ทุกอย่างบนโลก และมีบางคนบอกอีกว่าโมเดลนี้ล้ม Illustrious-XL ได้แต่ก็ใช้ยากอีก… แถมยังเทรน LoRA ไม่ได้อีก

ในตลอดทั้งปีที่ผ่านมา AI Image Generation ถือกำเนิดของใหม่ๆ มาเยอะมากๆ จริงๆ มีเยอะกว่านี้แต่อยากเน้นไปในทางของ Stable Diffusion มากกว่าปีนี้ได้เห็นอะไรที่ทำให้เกิด Breakthrough ในการทำภาพ AI ขึ้นมา ทำให้เกิด use-case ใหม่ๆ ทลายข้อจำกัดเดิมๆ ออกไปได้อีก สุดท้ายก็ใกล้ส่งท้ายปีเก่าต้อนรับปีใหม่แล้ว ปี 2025 จะมีอะไรใหม่ๆ มาอีกมารอติดตามกันนะครับ

สวัสดีปีใหม่ 2025 นะครับ ขอบคุณครับ ขอให้สนุกกับการใช้งาน AI Image นะครับ