نسخه نرمافزاری Stable Diffusion XL با قابلیت افزایش 2 برابری وضوح تصاویر عرضه شد
ابزارهای تبدیل متن به تصویر، به یکی از کاربردیترین سرویسهایی تبدیل شدهاند که روزانه توسط میلیونها نفر مورداستفاده قرار میگیرند. در کنار نامها مشهوری مانند Midjourney و Dall.E 2، یک سرویس دیگر در تلاش است تا با توسعه الگوریتمهای مولد تصویر، جایگاه خود را در این فضای رقابتی بهبود ببخشد. Stable Diffusion از سال 2022 فعالیت خود را آغاز کرده و توانسته تا امروز باعرضه بهروزرسانیهای متعدد، عملکرد محصول خود را بهبود ببخشد. حال نوبت به نسخهStable Diffusion XL است تا گامی مهم در مسیر توسعه این سرویس مولد تصویر بردارد.
نخستین تغییر بزرگ SD، افزایش قابلتوجه وضوح و جزئیات تصاویر است. در بهروزرسانی قبلی این ابزار تحت عنوان Stable Diffusion 1.5، تصاویری با وضوح 512×512 در اختیار کاربر قرار میگرفت که همین نکته باعث میشد تا علیرغم بهینهسازی، تصویر خروجی از جزئیات بسیار کمی برخوردار باشد. بهروزرسانی StableDiffusion 2.x موفق شد این نسبت را به 768×768 افزایش دهد و حال در SD XL، نرخ وضوح به 1024×1024 پیکسل رسیده تا جزئیات بسیار بیشتری نسبت به خروجی مشابه در نسخه 1.5 به ثبت برسد.
آزادی بیشتر با قابلیت “Local control”
دومین قابلیت مهم نسخه XL، امکان استفاده از Stable Diffusion بر روی سیستمهای محلی است. ازاینپس، کاربران میتوانند با دانلود نرمافزار این ابزار بر روی رایانه شخصی، از قدرت پردازش سیستم خود برای تولید تصاویر بهره ببرند. نسخه محلی SD مزایای متنوعی را در اختیار مخاطبین خود قرار میدهد؛ در گام نخست، علاقهمندان میتوانند بدون پرداخت هزینه از این برنامه استفاده کنند و به خلق تصاویر گوناگون بپردازند. این در حالی است که استفاده از این مبدل متن به تصویر در قالب تحت وب، نیازمند پرداخت هزینه و ارائه «توکن» برای دریافت خروجی است.
کاهش محدودیتها و ممیزیها، ویژگی دیگری است که برای کاربران ماشینهای محلی فراهم است. اگر قصد داشته باشید با استفاده از نسخه تحت وب Stable Diffusion اقدام به خلق تصاویری با موضوعات سیاسی و یا اشخاص مشهور کنید، احتمالاً با قوانین سختگیرانه این ابزار مواجه میشوید؛ اما این محدودیتها در نسخه نرمافزاری به حداقل میرسد و کاربران میتوانند این مبدل را باتوجهبه نیازها و علایق خود، شخصیسازی کنند.
اگر از علاقهمندان هوش مصنوعی و تصاویر خلقشده به دست این فناوری باشید، احتمالاً با یکی از نقصهای بزرگ مولدهای تصویر آشنا هستید. دستان بدون فرم و عجیب همراه با انگشتانی غیرمتعارف، جزء جداییناپذیر تصاویر خروجی این ابزارها هستند و توسعهدهندگان بسیاری در تلاشاند تا عملکرد الگوریتمها را در ترسیم دست اشخاص بهبود ببخشند. Stable Diffusion XL موفق شده تا جهشی مثبت در این زمینه رقم بزند و تا جای ممکن، دستانی بیایراد و واقعی خلق کند.
قابلیتهای جدید Stable Diffusion XL و بهبودهای چشمگیر آن، ابزارهای مبدل متن به تصویر را یکم قدم دیگر به خلق تصاویری واقعگرایانه با نقطهضعفهای کمتر نزدیک میکند و به نظر میرسد که مرز تشخیص تصاویر حقیقی و غیرواقعی، بهسرعت در حال محوشدن است. نظر شما دراینرابطه چیست؟