
RECAP Stable Diffusion ตลอดปี 2024
สวัสดีครับวันนี้มาดูกันว่า Stable Diffusion (และ Model อื่นๆ ที่ open source) ไปถึงในแล้วบ้างวันนี้มาย้อนเวลาไปตั้งแต่ต้นปีจนถึงสิ้นปีนี้ มีอะไรเกิดขึ้นบ้าง มาไล่เรียง Timeline ตลอดทั้งปี 2024 กันเลยนะครับ
8 มกราคม กำเนิด Pony Diffusion V6 XL
- Pony Diffusion V6 XL หรือที่เราเรียกกันว่า Pony เป็น Fine-Tuned Model ของ SDXL ตัวหนึ่งที่เก่ง 2D Anime และ รู้จักตัวละครระดับหนึ่ง ทำให้ถูกแพร่หลายไปอย่างรวดเร็ว พร้อมกับ LoRA ที่มหาศาลมากๆ ทำให้เป็น Model ตัวหนึ่งที่ยังคงใช้กันอยู่ในการทำภาพ 2D Anime และการ์ตูนอื่นๆ
22 กุมภาพันธ์ เปิดตัว SD3 ปล่อยออกมาเหมือนจะดี
- SD3 ออกแล้ว นี่แหล่ะโมเดลใหม่ที่ดีแน่ แต่… ปล่อยแต่ตัว Ultra ที่ให้ใช้กับ API เท่านั้น…
24 มีนาคม CEO StabilityAI ลาออก แถมวิกฤติอีก
- หลังจาก CEO ลาออกเพื่อไปทำ Decentralize AI และ พนักงานบางส่วนลาออกอีก ทำให้บริษัทขาดเงินทุนในการดำเนินกิจการ และมีข่าวลือว่าต้องขายกิจการให้กับบริษัทอื่นๆ
12 มิถุนายน StabilityAI ปล่อย SD3 Medium
- SD3 Medium เป็นโมเดลขนาดกลางเหมาะสำหรับการทำงานบน PC ทั่วไปแต่ก็มีปัญหาเรื่องลิขสิทธิ์การใช้งาน และคุณภาพที่น่าผิดหวังสุดๆ ก็เลยทำให้แห้วไป แถมช่วงแรกโดน civitAI แบนอีก
12 กรกฎาคม Fal เปิดตัว Auraflow โมเดลที่โลกลืม
- โมเดลตัวใหม่ที่สิทธิ์การใช้งานที่อิสระ ยกเว้นการเปลี่ยนลิขสิทธิ์จากเดิมแค่นั้น แต่ใน ณ วันนั้นอาจจะยังไม่เข้าใจว่าเอาไปใช้ยังไง มีแค่ ComfyUI ที่ใช้งานได้ ณ ตอนนั้น แต่ก็บางทีมาก่อนก็ใช่ว่าจะดีเสมอไป
1 สิงหาคม Black Forest Lab เปิดตัว Flux1
- Black Forest Lab อดีตทีมสร้าง Stable Diffusion ได้เปิดตัว Flux1 โมเดลที่เรียกว่าเขย่าวงการการทำ AI Image ครั้งใหญ่ที่สุดเท่าที่เคยเห็นมา เพราะว่าเป็นโมเดลที่ทำภาพได้เทียบเท่า Midjourney ได้ และ Open Source ใน version Dev และ Schell สำหรับรุ่น Pro ใช้ผ่าน API เท่านั้น (หรือผ่านเว็บเจนภาพ)
23 สิงหาคม Pony V7 ประกาศแล้ว
- เป็นการอธิบายแนวทางการสร้าง Model Pony ตัวใหม่ว่าจะใช้อะไร และ ออกมาคือใช้ Auraflow v0.2 ที่โลกลืมไปแล้ว และบอกสถานะของการทำโมเดล ณ ตอนนั้น (อ่านสรุปได้จาก link นี้)
25 กันยายน Illustrious-XL โมเดลจากแดนโสมถือกำเนิด
- หากเอารูป Anime 7.5 ล้านรูปจาก Danbooru มา fine-tuned SDXL จะเป็นยังไง ผลก็คือ… รู้จักทุกสิ่งทุกอย่างบนโลก anime แต่ก็… ทำให้ LoRA จาก SDXL, Pony พังหมดเลย ทำให้ถูกแยกออกมาเป็นหมวดใหม่เลย ว่ากันว่าโมเดลนี้จะมาล้ม PonyXL ได้ แต่จริงๆ มีร่างทอง 25 ล้านรูปอยู่แต่ไม่ปล่อย…
21 ตุลาคม ComfyUI ปล่อย version Desktop 1.0
- ลงง่ายขึ้น, UI น่าใช้งานขึ้น ทำให้การเข้าถึงการทำ AI Image อาจจะทำให้แพร่หลายขึ้นได้ ดูเป็นรูปเป็นร่างมากกว่า UI ตัวอื่นๆ เพราะว่าเปรียบเสมือนโปรแกรมหนึ่งเลย ต่างกับตัวอื่นที่เปิดผ่าน web browser
22 ตุลาคม StabilityAI เปิดตัว SD3.5
- หลังจาก SD3 เปิดตัวไปแล้วผลตอบรับไม่ดี แก้เกมโดยการเปิดตัวใหม่พร้อมปล่อยโมเดลใหญ่ออกมาเลย SD3.5 และ SD3.5 Medium ซึ่งบางทีอาจจะช้าเกินไปเพราะว่าคนแห่ไปใช้ Flux หมดแล้ว
6 พฤศจิกายน Flux1.1 Pro Ultra และ Raw เปิดตัว
- เมื่อผลตอบรับ Flux1 มีเสียงตอบรับที่ดีทาง Black Forest Lab ได้ปล่อยตัว Flux Pro 1.1 ออกมาโดยเน้นคุณภาพดีขึ้น ไวขึ้น และ ภาพใหญ่ขึ้น
14 พฤศจิกายน AstraliteHeart มาอธิบาย Pony V7 ผ่าน live CivitAI
- เป็นการบอกแพลนการปล่อยของ Pony V7 และแสดงภาพตัวอย่างคร่าวๆ ให้เห็นครั้งแรกพร้อมกัน ซึ่งดูรายละเอียดได้จาก live สดของ CivitAI (ผมสรุปไว้ให้แล้ว ที่ link นี้)
21 พฤศจิกายน Black Forest Lab ปล่อยของอีก
- FLUX.1 Fill, FLUX.1 Depth, FLUX.1 Canny, FLUX.1 Redux ให้ดาวน์โหลดใช้งานกันได้ แต่ละตัวก็มีคุณสมบัติแตกต่างกันไปเช่น inpaint, depth, canny, และ ip-adapter ซึ่งทำให้เกิดงานเฉพาะทางได้ง่ายขึ้น
22 ธันวาคม NoobAI-XL แดนมังกรขอเอาบ้าง
- จีนบอก ขอเติมรูปอีก 11 ล้านรูป และใช้ V-Prediction เพื่อ fine-tuned Illustrious-XL และได้ปล่อย version beta ออกมาเรื่อยๆ จนถึง v1.0 โมเดลนี้ความที่โหดมากๆแบบรู้จัก anime ทุกอย่างบนโลก และมีบางคนบอกอีกว่าโมเดลนี้ล้ม Illustrious-XL ได้แต่ก็ใช้ยากอีก… แถมยังเทรน LoRA ไม่ได้อีก
ในตลอดทั้งปีที่ผ่านมา AI Image Generation ถือกำเนิดของใหม่ๆ มาเยอะมากๆ จริงๆ มีเยอะกว่านี้แต่อยากเน้นไปในทางของ Stable Diffusion มากกว่าปีนี้ได้เห็นอะไรที่ทำให้เกิด Breakthrough ในการทำภาพ AI ขึ้นมา ทำให้เกิด use-case ใหม่ๆ ทลายข้อจำกัดเดิมๆ ออกไปได้อีก สุดท้ายก็ใกล้ส่งท้ายปีเก่าต้อนรับปีใหม่แล้ว ปี 2025 จะมีอะไรใหม่ๆ มาอีกมารอติดตามกันนะครับ
สวัสดีปีใหม่ 2025 นะครับ ขอบคุณครับ ขอให้สนุกกับการใช้งาน AI Image นะครับ
Reference
- https://www.blognone.com/node/138354
- https://www.blognone.com/node/138876
- https://blog.fal.ai/auraflow/
- https://blackforestlabs.ai/flux-1-tools/
- https://blackforestlabs.ai/flux-1-1-ultra/
- https://blackforestlabs.ai/announcing-black-forest-labs/
- https://civitai.com/models/257749/pony-diffusion-v6-xl
- https://stability.ai/news/stable-diffusion-3-medium
- https://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0
- https://civitai.com/models/833294/noobai-xl-nai-xl