Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 شرکت Stability AI مدل هوش مصنوعی Stable Diffusion 3.5 معرفی کرد

شرکت Stability AI مدل هوش مصنوعی Stable Diffusion 3.5 معرفی کرد

زمان مطالعه: 2 دقیقه

شرکت Stability AI مدل هوش مصنوعی Stable Diffusion نسخه  3.5 را برای تبدیل متن به تصویر معرفی کرده است. این نسخه جدید شامل چندین مدل مختلف است که قابلیت اجرا روی سخت‌افزارهای معمولی را دارند و تحت مجوز انعطاف‌پذیر Stability AI Community برای استفاده‌های تجاری و غیرتجاری در دسترس هستند.

اکنون توسعه‌دهندگان می‌توانند این مدل‌ها را بدون نگرانی از مجوزهای محدودکننده، سفارشی‌سازی و یکپارچه‌سازی کنند. در واقع این موضوع آن‌ها را برای طیف گسترده‌ای از کاربردها ایده‌آل می‌کند. نسخه‌های Large و Large Turbo برای دانلود در وب‌سایت Hugging Face در دسترس هستند.

چه چیزی جدید است؟

نسخه  3.5 استیبل دیفیوژن مجموعه‌ای از مدل‌های هوش مصنوعی برای کاربران مختلف از جمله محققان، استارتاپ‌ها و شرکت‌ها است که کار تولید یا دستکاری در تصاویر را انجام می‌دهد.

مدل Stable Diffusion 3.5 Large دارای ۸ میلیارد پارامتر است و کیفیت تصاویری عالی و دقت بالایی در پاسخ به پرامپت‌ها دارد. این مدل به‌خوبی برای استفاده‌های حرفه‌ای در وضوح ۱ مگاپیکسل مناسب است. همچنین، نسخه Turbo این مدل، سرعت بیشتری دارد و می‌تواند تصاویر با کیفیت بالا را تنها در ۴ مرحله تولید کند.

این شرکت اعلام کرده است که این مدل برای عملکرد بهینه روی سخت‌افزارهای استاندارد مصرف‌کنندگان، به‌ویژه در نسخه‌های Medium و Turbo، بهینه‌سازی شده است. همچنین این مدل‌ها تصاویری متنوع و فراگیر تولید می‌کنند که به‌خوبی انواع رنگ‌های پوست و ویژگی‌های مختلف افراد را بدون نیاز به توضیحات طولانی و پیچیده نشان می‌دهند.

مدل‌ها بر روی زیرمجموعه‌ای از دیتاست LAION-5b آموزش داده شده‌اند که توسط تیم DeepFloyd ایجاد شده است. این دیتاست به‌منظور حذف محتوای نامناسب، از فیلتر NSFW استفاده می‌کند.

این مدل به‌طور رایگان برای استفاده‌های غیرتجاری از جمله تحقیقات دانشگاهی، در دسترس است. استارتاپ‌ها، کسب‌وکارهای کوچک، کسب‌وکارهای متوسط و خالقان محتوا می‌توانند این مدل را به‌صورت رایگان برای مقاصد تجاری استفاده کنند، به شرطی که درآمد سالانه آن‌ها کمتر از ۱ میلیون دلار باشد. همچنین کاربران به‌طور کامل مالک محتوایی هستند که تولید می‌کنند و هیچ محدودیتی در مجوزها وجود ندارد.

گوگل تولید تصاویر با جیمنی را متوقف کرد

در همین حال، گوگل اعلام کرده که ویژگی تولید تصاویر هوش مصنوعی جیمنی را متوقف کرده است، زیرا این ویژگی در تولید تصاویر تاریخی دقت کافی ندارد.

تصاویر تولیدشده با جیمنی اخیراً در شبکه‌های اجتماعی به سرعت مورد توجه قرار گرفتند و این موضوع باعث ایجاد خنده و اعتراضات گسترده‌ای شد. برخی از کاربران به شدت از گوگل انتقاد کردند و گفتند که این شرکت به جای تمرکز بر حقیقت و دقت، بیش از حد به مسائل اجتماعی اهمیت می‌دهد.

گوگل اعلام کرد: «ما اخیراً تصمیم گرفتیم تولید تصاویر افراد با جیمنی را متوقف کنیم تا بر روی بهبود دقت پاسخ‌های آن کار کنیم.»

کاربران شبکه‌های اجتماعی از اینکه هوش مصنوعی جیمنی تصاویر شخصیت‌های تاریخی، مانند پدران بنیان‌گذار ایالات متحده را به‌عنوان افرادی با رنگ پوست متفاوت تولید می‌کند، انتقاد کرده و آن را نادرست دانسته‌اند.

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]