Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش خبری
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
خطرات هوش مصنوعی
دیتاست
مدل‌های بنیادی
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
پیاده‌سازی هوش مصنوعی
گزارش
مصاحبه
هوش مصنوعی در عمل
 عکاس و طراح گرافیک شما، چت‌جی‌پی‌تی!

نگاهی اجمالی به قابلیت‌های تولید تصویر چت‌جی‌پی‌تی و کاربردهای آن در کسب‌وکارها

عکاس و طراح گرافیک شما، چت‌جی‌پی‌تی!

زمان مطالعه: 5 دقیقه

در هفته‌های گذشته و با اعمال به‌روزرسانی جدیدی در بخش تولید تصویر چت‌جی‌پی‌تی، شاهد قابلیت‌های جدید و شگفت‌انگیز این ابزار بودیم. برخی از این قابلیت‌ها، مانند تبدیل تصاویر به سبک‌های مختلف، از جمله مواردی بود که در این مدت به ترندهای روز دنیا تبدیل شدند. این مقاله تلاش دارد تا ضمن نگاهی اجمالی به جنبه‌های مختلفی که این به‌روزرسانی با خود آورده، تمثیل‌هایی از کاربردهای آنها را نیز ذکر کند.

حدود سه هفته پیش بود که «سم آلتمن»، مدیرعامل شرکت OpenAI در نشست خبری از آپدیت‌های جدید برای بخش تولید تصویر چت‌جی‌پی‌تی خبر داد. طبق اعلام او، آخرین مدل ارائه شده توسط این شرکت یعنی «GPT-4o» از آن پس می‌توانست کار تولید تصویر را انجام دهد؛ با قدرتی بسیار بیشتر از قبل!

همین امر هم موجب شد تا در مدت زمانی که از معرفی توانایی‌های جدید چت‌جی‌پی‌تی در تولید تصویر می‌گذرد، بسیاری با بررسی و آزمون‌وخطا، خط اتصال جدیدی بین آن و مشاغل و حرفه‌های گوناگون پیدا کنند.

 واقعیت این است که این توانایی جدید حالا می‌تواند در بسیاری از حوزه‌ها به عنوان دستیاری حرفه‌ای عمل کند؛ هرچند که شاید به زودی بشود درباره جایگزین‌ شدن آن با نیروهای انسانی طبق آمار دنیای واقعی بحث بیشتری کرد.

تولید تصویر چت‌جی‌پی‌تی بهتر از همیشه درخواست شما را می‌فهمد

بسیاری از کاربران شبکه‌های اجتماعی در طول بررسی و کار کردن با بخش تصویر چت‌جی‌پی‌تی، با توانایی‌ها و نقاط قوت و ضعف این ابزار آشنا شده‌اند و آن را به اشتراک گذاشته‌اند. حتی بسیاری از آنها سعی کرده‌اند از این توانایی‌های چت‌جی‌پی‌تی در مشاغل و کسب‌وکارهای خود بهره ببرند و نتایج و کیفیت آن را در معرض دید بگذارند. در ادامه نگاهی اجمالی به برخی از این توانایی‌ها و کاربردهای آن خواهیم داشت.

شاید مهم‌ترین نکته درباره به‌روزرسانی‌های اخیر قابلیت تولید تصویر چت‌جی‌پی‌تی، راحت‌تر شدن نحوه ارتباط کاربر با آن و تسریع در گرفتن نتیجه دلخواه است. به نظر می‌رسد که برای رسیدن به تصویری که می‌خواهید، دیگر چندان نیازی به نوشتن درخواست‌های (پرامپت‌‌ها) پیچیده و دقیق ندارید؛ بلکه حتی با لحنی ساده هم می‌توان درخواست تولید تصویر کرد و همچنان نتیجه‌ای مطلوب گرفت.

این قابلیت موجب می‌شود تا کاربر حتی بتواند درخواست خود را به صورت صوتی به چت‌جی‌پی‌تی ارائه بدهد. سناریویی را تصور کنید که در آن در حال پرورش جهانی فانتزی در تخیلات خود هستید و برای اینکه بتوانید تخیل خود را به اثری واقعی تبدیل کنید، به صورت فی‌البداهه ایده‌های خود را برای این هوش مصنوعی توضیح می‌دهید و چند ثانیه بعد، نسخه اولیه ایده شما به تصویری واقعی تبدیل شده است.

آنچه که این به‌روزرسانی را جذاب‌تر از همیشه می‌کند، قابلیت ویرایش تصاویر تولید شده است. همچنان سناریوی قبل را تصور کنید؛ حالا پس از تولید تصویر اولیه، می‌توانید بازخورد خود را به چت‌جی‌پی‌تی بدهید و از او بخواهید تا جزئیات آن را تغییر دهد و مواردی را حذف یا اضافه کند. در واقع فرایند تولید تصویر به فرایندی تعاملی و گفت‌وگو محور تبدیل شده است.

این تصویر توسط هوش مصنوعی تولید شده است.

این قابلیت ویرایش تصویر کاربردهای دیگری هم دارد. کاربران می‌توانند تصاویر خود را به این مدل هوش مصنوعی بدهند و مواردی را از پس‌زمینه آن حذف کنند. یا حتی می‌توان افراد و اشیا را از پس‌زمینه جدا کرد و از آنها در ساخت استیکر و گرافیک‌ها بهره برد.

آیا طراحان گرافیک باید به دنبال شغل جدیدی باشند؟

شاید هنوز برای پاسخ قطعی به این سوال زود باشد، اما به نظر می‌رسد که روند کسب‌وکارها به سمت جایگزینی هوش مصنوعی با نیروی انسانی در بخش‌های مختلف از جمله طراحی برود. هرچند که نظارت نیروی انسانی هنوز بخشی حیاتی و جدایی ناپذیر خواهد بود و در واقع میزان انطباق نیروها با این فناوری است که می‌تواند آینده شغلی آنان را تضمین کند.

در یک کلام، توانایی‌های جدید چت‌جی‌پی‌تی در نقش یک دستیار حرفه‌ای طراح گرافیک بی‌نظیر است. از بازاریابی و تولید محتوا گرفته، تا تولید بازی‌های رومیزی و حتی تبدیل داده‌های خام به نمودارهای بصری زیبا تنها بخش کوچکی از حوزه‌هایی هستند که سیطره این فناوری روی خود را احساس می‌کنند.

با استفاده از فناوری جدید، می‌توان تنها با یک تصویر از محصول، آن را در سناریوهای بی‌نهایت متنوع شبیه‌سازی کرد. این روش نیاز به مدل‌سازی سه‌بعدی و عکاسی‌های پرهزینه را از بین می‌برد.

در عرض چند ثانیه، می‌توان طرح‌ها را روی آیتم‌هایی با ظاهر واقعی مانند تلفن همراه، آی‌پد یا لپ‌تاپ پیاده‌سازی کرد. این قابلیت برای نمایش طرح‌ها در زمینه‌های مختلف از جمله بیلبوردها، تیشرت‌ها یا سایر کالاها بسیار کاربردی است.

استفاده از فونت‌های واقعی و جذاب و قرار دادن متن روی تصویر بدون هیچ اشتباهی از دیگر مواردی است که به‌روزرسانی اخیر به ارمغان آورده. حالا با استفاده از این ابزار، تولید منو رستوران می‌تواند کاری ساده و سریع باشد.

مدل جدید این امکان را فراهم کرده که کل یک وب‌سایت، اپلیکیشن یا رابط کاربری به‌صورت کامل طراحی شود؛ آن هم تنها با وارد کردن دستوراتی ساده.

این مدل توانایی بالایی در رندر کردن دقیق متن دارد. به کمک آن می‌توان نوع، فرم و محتوای دقیق متن مورد نظر برای وب‌سایت یا دیگر طرح‌ها را به‌روشنی مشخص کرد.

حتی مشاغلی مانند مشاورین املاک یا طراحان داخلی هم می‌توانند از این ابزار به طور ویژه‌ای استفاده کنند. کافی است عکس یک اتاق را به چت‌جی‌پی‌تی بدهید و مدل‌های مختلف چیدمان یا طراحی آن اتاق را مشاهده کنید؛ بدون اینکه نیاز باشد در واقعیت حتی جای یک گلدان را تغییر دهید.

تصویرسازی از داده‌های خام و خسته کننده دیگر قابلیت جدی ارائه شده در این به‌روزرسانی جدید است. هرچند که در مواردی مشاهده شده که نتیجه نهایی از دقت کافی برخوردار نبوده و توصیه می‌شود تا نمودارهای تولید شده با داده‌های اصلی مقایسه شوند تا از بروز مغایرت‌های احتمالی جلوگیری به عمل آید.

با همه این اوصاف، چت‌جی‌پی‌تی می‌تواند ایده‌ها را تا بخش قابل قبولی پرورش دهد؛ اما گرفتن نتایجی که شما را در بازار مطرح کند و در رقابت با سایر رقبا اثرگذار باشد، همچنان نیازمند نظارت و رتوش کردن طرح‌های نهایی توسط طراحان گرافیک انسانی متخصص است.

کاربردهایی سرگرم کننده و تعاملی

یکی از بزرگ‌ترین ترندهای چند وقت اخیر اینترنت، تبدیل تصاویر به سبک‌های مختلف، مثل سبک استودیو «جیبلی» به کمک چت‌جی‌پی‌تی بود. تبدیل تصویر حیوانات خانگی به انسانی مطابق با ویژگی‌ آنها نیز یکی دیگر از موضوعات داغ مرتبط با توانایی‌های تولید تصویر چت‌جی‌پی‌تی است.

تبدیل عکس حیوانات خانگی به انسان

اما جدا از این موارد، این ابزار قابلیت‌های کاربردی‌تری را هم ارائه می‌دهد. به طور مثال شما می‌توانید تصویر خودتان و همچنین تصویر لباسی که قصد خریدش را دارید بارگذاری کنید. سپس چت‌جی‌پی‌تی تصویری می‌سازد که در آن این لباس بر تن شماست و حالا می‌توانید تصمیم بهتری در خرید خود بگیرید.

می‌توان این قابلیت را به انجام عمل زیبایی، زدن یا پاک کردن تتو از روی بدن و موارد این چنینی تعمیم داد.

تولید کمیک‌بوک از دیگر قابلیت‌های جالب این ابزار است. چت‌جی‌پی‌تی می‌تواند بر اساس توصیفی کوتاه، کمیک‌بوک‌های جذابی را تولید کند. همچنین می‌توان با استفاده از این توانایی‌های جدید بازی‌های رومیزی (Board Game) طراحی کرد. به طوری که جزئیات و حتی متن‌هایی که نیاز است روی صفحه این بازی باشند به طور دقیقی طراحی و تولید خواهند شد.

چالش‌های تولید تصویر در چت‌جی‌پی‌تی

بسیاری از کاربران با محدودیت‌های شدید این مدل جدید در تولید تصویر درگیر هستند. این مدل بسیاری از درخواست‌ها را حساس یا نامناسب تشخیص می‌دهد و از تولید آنها خودداری می‌کند؛ در صورتی که بسیاری از این درخواست‌ها واقعا نامناسب نیستند.

به طور مثال چندی پیش این هوش مصنوعی از تولید تصویری از «یک شوالیه با زره سیاه» خودداری کرده و آن را به عنوان محتوای حساس شناخته بود.

با همه این اوصاف، راهکارهایی برای غلبه بر این چالش‌ها معرفی شده‌اند. یکی از این راه‌حل‌ها، باز کردن یک چت جدید در هنگام بروز چنین خطاهایی است. ممکن است با تغییر جمله‌بندی درخواست در چت جدید، تصویر درخواست برای شما تولید شود.

تلاش برای متقاعد کردن هوش مصنوعی با پدید آوردن بحث‌های منطقی (Gaslighting) از دیگر کارهایی است که برای دور زدن این محدودیت‌ می‌توانید از آن استفاده کنید. به طور مثال در صورتی که چت‌جی‌پی‌تی از تولید محتوایی سر باز زد، به طوری که این محتوا واقعا حساسیت خاصی را نداشت، می‌توانید با آن وارد بحث شوید و بگویید که این کار او بر خلاف حق آزادی بیان است! سپس ممکن است به نتیجه دلخواه خود برسید. البته که این روش همیشه جوابگو نیست.

یکی از نگرانی‌های عمده درباره توسعه این‌گونه مدل‌های تولید و پردازش تصویر، داده‌هایی است که در تمرین و توسعه مدل‌های زبانی آن استفاده شده. رعایت حق کپی رایت هنرمندان و رضایت آنها در استفاده از آثارشان برای تعلیم مدل‌های زبانی از موارد داغ این روزهاست.

البته که طبق اعلام شرکت OpenAI در صورت عدم رضایت هنرمندان، این شرکت از آثار آنها استفاده نخواهد کرد.

پیشرفت این فناوری خیره کننده است. با این وجود رقبای زیادی در بازار هستند که همچنان در سطح بالایی به رقابت با چت‌جی‌پی‌تی می‌پردازند و می‌توانند خدمات مشابه، یا شاید بهتری، در زمینه تولید و ویرایش تصویر ارائه دهند. همین هم می‌تواند یکی از عوامل شتاب توسعه این فناوری باشد.

سوال بزرگی اما باقی می‌ماند؛ با توسعه چنین فناوری‌هایی، چگونه باید مرز بین خلاقیت انسانی و هوش مصنوعی را مشخص کرد و به راستی، این مرز کجاست؟

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]