logo
Stable Diffusion History ตอนที่ 1 จาก Latent Diffusion ไปสู่ต้นกำเนิด Stable Diffusion

Stable Diffusion History ตอนที่ 1 จาก Latent Diffusion ไปสู่ต้นกำเนิด Stable Diffusion

  • ในช่วงปี 2021 Latent Diffusion เป็น project ที่กำเนิดจากนักวิจัย 5 คนใน Lab CompVis ของ Heidelberg University ในประเทศเยอรมัน และ RunwayML
  • Latent Diffusion คือ การแปลงข้อความเป็นรูปภาพ (Image Synthesis) ออกมาได้ความละเอียดที่สูง และ ใช้ทรัพยากรน้อยลงไปมาก ด้วยเทคนิค Diffusion Model
  • ต่อมา บริษัท StabilityAI ได้ให้เงินลงทุนกับ Lab ComVis ไปพัฒนา Latent Diffusion ของตัวเอง และได้ปล่อยออกมาเป็น version แรกชื่อ Stable Diffusion 1.1
  • แต่ทั้งหมดนี้ก็ยังคงปล่อยในนาม CompVis จนไปถึง Stable Diffusion 1.4 ซึ่งในแต่ละ version เน้นไปที่การปรับแต่ง dataset และ parameters ต่างๆ แต่เรื่องก็เกิดขึ้นเมื่อ StabilityAI กำลังจะปล่อย Stable Diffusion 1.5 แต่ดันมีบริษัท RunwayML ปล่อยออกมาก่อน

เมื่อ RunwayML (เผลอ) ปล่อย Stable Diffusion 1.5 ออกมา

  • Stable Diffusion 1.5 ทำคือการ fine-tuned stable diffusion 1.2 ด้วย dataset ขนาด 512x512 pixel ซึ่งผลออกมาคือ คุณภาพที่เจนออกมาดีกว่า Stable Diffusion 1.4 ในเรื่องของการทำภาพแบบสมจริง
  • การที่ RunwayML ปล่อย Stable Diffusion 1.5 ออกมา เมื่อปล่อยออกมาแล้วก็โดนทาง StabilityAI ยื่นขอให้ทำการลบ model ทันที เพราะเรื่องปัญหาทางด้านลิขสิทธิ์โมเดล ง่าย ๆ คือ model หลุดออกมา แต่ CEO RunwayML ก็โต้กลับมาว่าไม่มีปัญหาเรื่องลิขสิทธิ์ใดๆ และ โมเดลนี้เป็นการต่อยอดจาก Latent Diffusion เดิมอยู่แล้ว และ ผู้พัฒนาก็เป็นคนของเราด้วย และก็ขอบคุณ StabilityAI สำหรับเงินบริจาคค่า train model ด้วยนะ แต่สุดท้ายก็ไม่ถูกลบและ model นี้ก็ยังคงอยู่ต่อไป
  • ในตอนแรก StabilityAI มี Stable Diffusion 1.5 ใน DreamStudio ซึ่งเป็นเว็บที่ให้เจนภาพของ StabilityAI เองอยู่แล้วแต่ยังไม่ปล่อย model เพราะว่ากังวลเรื่องของการเจนภาพ nsfw แต่ว่าโดน RunwayML ปล่อยออกมาแบบที่ยังไม่ได้มีการ filter ใดๆ เลย
  • การที่ปล่อย Stable Diffusion 1.5 นั้นเป็นจังหวะที่คนเริ่มรู้จักการเจนภาพมากขึ้นแล้ว ทำให้เกิดการ ปรับแต่ง Model ต่างๆ ไปในทางเฉพาะทาง และ เกิดเทคนิคใหม่ ๆ ขึ้นมา พร้อม ๆ กับมี Community เกิดขึ้นเช่น กลุ่มนี้เป็นต้น และ เว็บไซต์ civitai ก็เกิดช่วงใกล้ๆ กัน

จบตอนที่ 1 ไปแล้วนะครับ ตอนที่ 2 จะกล่าวถึง Stable Diffusion 2, XL และ 3 ไปจนถึง การกำเนิด Flux นะครับ ขอบคุณครับ