شرکت Stability AI مدل هوش مصنوعی Stable Diffusion 3.5 معرفی کرد
شرکت Stability AI مدل هوش مصنوعی Stable Diffusion نسخه 3.5 را برای تبدیل متن به تصویر معرفی کرده است. این نسخه جدید شامل چندین مدل مختلف است که قابلیت اجرا روی سختافزارهای معمولی را دارند و تحت مجوز انعطافپذیر Stability AI Community برای استفادههای تجاری و غیرتجاری در دسترس هستند.
اکنون توسعهدهندگان میتوانند این مدلها را بدون نگرانی از مجوزهای محدودکننده، سفارشیسازی و یکپارچهسازی کنند. در واقع این موضوع آنها را برای طیف گستردهای از کاربردها ایدهآل میکند. نسخههای Large و Large Turbo برای دانلود در وبسایت Hugging Face در دسترس هستند.
چه چیزی جدید است؟
نسخه 3.5 استیبل دیفیوژن مجموعهای از مدلهای هوش مصنوعی برای کاربران مختلف از جمله محققان، استارتاپها و شرکتها است که کار تولید یا دستکاری در تصاویر را انجام میدهد.
مدل Stable Diffusion 3.5 Large دارای ۸ میلیارد پارامتر است و کیفیت تصاویری عالی و دقت بالایی در پاسخ به پرامپتها دارد. این مدل بهخوبی برای استفادههای حرفهای در وضوح ۱ مگاپیکسل مناسب است. همچنین، نسخه Turbo این مدل، سرعت بیشتری دارد و میتواند تصاویر با کیفیت بالا را تنها در ۴ مرحله تولید کند.
این شرکت اعلام کرده است که این مدل برای عملکرد بهینه روی سختافزارهای استاندارد مصرفکنندگان، بهویژه در نسخههای Medium و Turbo، بهینهسازی شده است. همچنین این مدلها تصاویری متنوع و فراگیر تولید میکنند که بهخوبی انواع رنگهای پوست و ویژگیهای مختلف افراد را بدون نیاز به توضیحات طولانی و پیچیده نشان میدهند.
مدلها بر روی زیرمجموعهای از دیتاست LAION-5b آموزش داده شدهاند که توسط تیم DeepFloyd ایجاد شده است. این دیتاست بهمنظور حذف محتوای نامناسب، از فیلتر NSFW استفاده میکند.
این مدل بهطور رایگان برای استفادههای غیرتجاری از جمله تحقیقات دانشگاهی، در دسترس است. استارتاپها، کسبوکارهای کوچک، کسبوکارهای متوسط و خالقان محتوا میتوانند این مدل را بهصورت رایگان برای مقاصد تجاری استفاده کنند، به شرطی که درآمد سالانه آنها کمتر از ۱ میلیون دلار باشد. همچنین کاربران بهطور کامل مالک محتوایی هستند که تولید میکنند و هیچ محدودیتی در مجوزها وجود ندارد.
گوگل تولید تصاویر با جیمنی را متوقف کرد
در همین حال، گوگل اعلام کرده که ویژگی تولید تصاویر هوش مصنوعی جیمنی را متوقف کرده است، زیرا این ویژگی در تولید تصاویر تاریخی دقت کافی ندارد.
تصاویر تولیدشده با جیمنی اخیراً در شبکههای اجتماعی به سرعت مورد توجه قرار گرفتند و این موضوع باعث ایجاد خنده و اعتراضات گستردهای شد. برخی از کاربران به شدت از گوگل انتقاد کردند و گفتند که این شرکت به جای تمرکز بر حقیقت و دقت، بیش از حد به مسائل اجتماعی اهمیت میدهد.
گوگل اعلام کرد: «ما اخیراً تصمیم گرفتیم تولید تصاویر افراد با جیمنی را متوقف کنیم تا بر روی بهبود دقت پاسخهای آن کار کنیم.»
کاربران شبکههای اجتماعی از اینکه هوش مصنوعی جیمنی تصاویر شخصیتهای تاریخی، مانند پدران بنیانگذار ایالات متحده را بهعنوان افرادی با رنگ پوست متفاوت تولید میکند، انتقاد کرده و آن را نادرست دانستهاند.