OpenAI امکان تولید تصاویر هوش مصنوعی را به طور مستقیم در ChatGPT فعال کرد
شرکت OpenAI قابلیت تولید تصویر را بهطور مستقیم در پلتفرم ChatGPT معرفی کرده است. این ویژگی با استفاده از مدل مولتیمودال پیشرفته این شرکت، یعنی GPT-4o فعال شده و به کاربران اجازه میدهد تا مستقیماً از طریق رابط چت، تصاویر موردنظر خود را ایجاد کنند.
در مرحله نخست، این قابلیت برای کاربران نسخههای ChatGPT Plus، Pro، Team و همچنین نسخه رایگان در دسترس خواهد بود. کاربران نسخههای سازمانی (Enterprise) و آموزشی (Education) هم بهزودی به این قابلیت دسترسی پیدا خواهند کرد.
سم آلتمن، مدیرعامل OpenAI، در ابتدای یک پخش زنده در روز سهشنبه اعلام کرد: «امروز یکی از سرگرمکنندهترین و جذابترین قابلیتهایی را عرضه کردهایم که تاکنون داشتهایم؛ امکان تولید تصویر بهصورت مستقیم در ChatGPT.» او تأکید کرد که این ویژگی مدتها مورد انتظار کاربران بوده است، بهویژه از زمانی که رقبایی مانند Google Gemini از اواسط سال ۲۰۲۴ قابلیت تولید تصویر یکپارچه را ارائه دادهاند.
اکنون ChatGPT این توانایی را دارد که بر اساس دستورات متنی، مکالمات انجامشده در چت و فایلهای آپلودشده، تصویر تولید کند. کاربران میتوانند تصاویر کاملا جدید خلق کرده یا تصاویر موجود را تغییر دهند. OpenAI اعلام کرده است که آگاهی «جهانی» (world knowledge) که در مدل GPT-4o آموزش داده شده است، به این ابزار کمک میکند تا زمینههای استفاده از تصاویر را بهتر درک کند. همچنین این مدل در دنبال کردن دقیق دستورها و تولید متن داخل تصاویر عملکرد بهتری دارد.
کاربران میتوانند با استفاده از زبان طبیعی، تصویر نهایی را اصلاح و دقیقتر کنند. برای مثال، مدل قادر است که هنگام طراحی یک شخصیت در بازی ویدیویی، در طی تکرارهای مختلف و اصلاحات کاربر، هماهنگی و یکپارچگی بصری تصویر را حفظ کند.
OpenAI انتظار دارد کاربران از این ابزار برای تولید تصاویر مرتبط با کار که نیاز به دقت بالا دارند (مانند نمودارها، اینفوگرافیکها و محتوای برند دار)، تصاویر دارای متن زیاد (مانند پوسترهای آموزشی و کارتهای ویزیت)، تصاویر واقعگرایانه با نورپردازی و بافت دقیق و همچنین تصاویری که از بستر گفتوگوی متنی بهره میبرند، استفاده کنند.
OpenAI با سادهسازی فرآیند تولید تصویر از طریق یک مدل چندحالته واحد که تمام وظایف مرتبط با تصویرسازی را انجام میدهد، در حال تبدیل ChatGPT به یک ابزار جامع و کاربردی برای تولید تصویر در کاربردهای شخصی و حرفهای است.