نگاهی اجمالی به قابلیتهای تولید تصویر چتجیپیتی و کاربردهای آن در کسبوکارها
عکاس و طراح گرافیک شما، چتجیپیتی!
در هفتههای گذشته و با اعمال بهروزرسانی جدیدی در بخش تولید تصویر چتجیپیتی، شاهد قابلیتهای جدید و شگفتانگیز این ابزار بودیم. برخی از این قابلیتها، مانند تبدیل تصاویر به سبکهای مختلف، از جمله مواردی بود که در این مدت به ترندهای روز دنیا تبدیل شدند. این مقاله تلاش دارد تا ضمن نگاهی اجمالی به جنبههای مختلفی که این بهروزرسانی با خود آورده، تمثیلهایی از کاربردهای آنها را نیز ذکر کند.
حدود سه هفته پیش بود که «سم آلتمن»، مدیرعامل شرکت OpenAI در نشست خبری از آپدیتهای جدید برای بخش تولید تصویر چتجیپیتی خبر داد. طبق اعلام او، آخرین مدل ارائه شده توسط این شرکت یعنی «GPT-4o» از آن پس میتوانست کار تولید تصویر را انجام دهد؛ با قدرتی بسیار بیشتر از قبل!
همین امر هم موجب شد تا در مدت زمانی که از معرفی تواناییهای جدید چتجیپیتی در تولید تصویر میگذرد، بسیاری با بررسی و آزمونوخطا، خط اتصال جدیدی بین آن و مشاغل و حرفههای گوناگون پیدا کنند.
واقعیت این است که این توانایی جدید حالا میتواند در بسیاری از حوزهها به عنوان دستیاری حرفهای عمل کند؛ هرچند که شاید به زودی بشود درباره جایگزین شدن آن با نیروهای انسانی طبق آمار دنیای واقعی بحث بیشتری کرد.
تولید تصویر چتجیپیتی بهتر از همیشه درخواست شما را میفهمد
بسیاری از کاربران شبکههای اجتماعی در طول بررسی و کار کردن با بخش تصویر چتجیپیتی، با تواناییها و نقاط قوت و ضعف این ابزار آشنا شدهاند و آن را به اشتراک گذاشتهاند. حتی بسیاری از آنها سعی کردهاند از این تواناییهای چتجیپیتی در مشاغل و کسبوکارهای خود بهره ببرند و نتایج و کیفیت آن را در معرض دید بگذارند. در ادامه نگاهی اجمالی به برخی از این تواناییها و کاربردهای آن خواهیم داشت.
شاید مهمترین نکته درباره بهروزرسانیهای اخیر قابلیت تولید تصویر چتجیپیتی، راحتتر شدن نحوه ارتباط کاربر با آن و تسریع در گرفتن نتیجه دلخواه است. به نظر میرسد که برای رسیدن به تصویری که میخواهید، دیگر چندان نیازی به نوشتن درخواستهای (پرامپتها) پیچیده و دقیق ندارید؛ بلکه حتی با لحنی ساده هم میتوان درخواست تولید تصویر کرد و همچنان نتیجهای مطلوب گرفت.
این قابلیت موجب میشود تا کاربر حتی بتواند درخواست خود را به صورت صوتی به چتجیپیتی ارائه بدهد. سناریویی را تصور کنید که در آن در حال پرورش جهانی فانتزی در تخیلات خود هستید و برای اینکه بتوانید تخیل خود را به اثری واقعی تبدیل کنید، به صورت فیالبداهه ایدههای خود را برای این هوش مصنوعی توضیح میدهید و چند ثانیه بعد، نسخه اولیه ایده شما به تصویری واقعی تبدیل شده است.
آنچه که این بهروزرسانی را جذابتر از همیشه میکند، قابلیت ویرایش تصاویر تولید شده است. همچنان سناریوی قبل را تصور کنید؛ حالا پس از تولید تصویر اولیه، میتوانید بازخورد خود را به چتجیپیتی بدهید و از او بخواهید تا جزئیات آن را تغییر دهد و مواردی را حذف یا اضافه کند. در واقع فرایند تولید تصویر به فرایندی تعاملی و گفتوگو محور تبدیل شده است.
این قابلیت ویرایش تصویر کاربردهای دیگری هم دارد. کاربران میتوانند تصاویر خود را به این مدل هوش مصنوعی بدهند و مواردی را از پسزمینه آن حذف کنند. یا حتی میتوان افراد و اشیا را از پسزمینه جدا کرد و از آنها در ساخت استیکر و گرافیکها بهره برد.
آیا طراحان گرافیک باید به دنبال شغل جدیدی باشند؟
شاید هنوز برای پاسخ قطعی به این سوال زود باشد، اما به نظر میرسد که روند کسبوکارها به سمت جایگزینی هوش مصنوعی با نیروی انسانی در بخشهای مختلف از جمله طراحی برود. هرچند که نظارت نیروی انسانی هنوز بخشی حیاتی و جدایی ناپذیر خواهد بود و در واقع میزان انطباق نیروها با این فناوری است که میتواند آینده شغلی آنان را تضمین کند.
در یک کلام، تواناییهای جدید چتجیپیتی در نقش یک دستیار حرفهای طراح گرافیک بینظیر است. از بازاریابی و تولید محتوا گرفته، تا تولید بازیهای رومیزی و حتی تبدیل دادههای خام به نمودارهای بصری زیبا تنها بخش کوچکی از حوزههایی هستند که سیطره این فناوری روی خود را احساس میکنند.
با استفاده از فناوری جدید، میتوان تنها با یک تصویر از محصول، آن را در سناریوهای بینهایت متنوع شبیهسازی کرد. این روش نیاز به مدلسازی سهبعدی و عکاسیهای پرهزینه را از بین میبرد.
در عرض چند ثانیه، میتوان طرحها را روی آیتمهایی با ظاهر واقعی مانند تلفن همراه، آیپد یا لپتاپ پیادهسازی کرد. این قابلیت برای نمایش طرحها در زمینههای مختلف از جمله بیلبوردها، تیشرتها یا سایر کالاها بسیار کاربردی است.
استفاده از فونتهای واقعی و جذاب و قرار دادن متن روی تصویر بدون هیچ اشتباهی از دیگر مواردی است که بهروزرسانی اخیر به ارمغان آورده. حالا با استفاده از این ابزار، تولید منو رستوران میتواند کاری ساده و سریع باشد.
مدل جدید این امکان را فراهم کرده که کل یک وبسایت، اپلیکیشن یا رابط کاربری بهصورت کامل طراحی شود؛ آن هم تنها با وارد کردن دستوراتی ساده.
این مدل توانایی بالایی در رندر کردن دقیق متن دارد. به کمک آن میتوان نوع، فرم و محتوای دقیق متن مورد نظر برای وبسایت یا دیگر طرحها را بهروشنی مشخص کرد.
حتی مشاغلی مانند مشاورین املاک یا طراحان داخلی هم میتوانند از این ابزار به طور ویژهای استفاده کنند. کافی است عکس یک اتاق را به چتجیپیتی بدهید و مدلهای مختلف چیدمان یا طراحی آن اتاق را مشاهده کنید؛ بدون اینکه نیاز باشد در واقعیت حتی جای یک گلدان را تغییر دهید.
تصویرسازی از دادههای خام و خسته کننده دیگر قابلیت جدی ارائه شده در این بهروزرسانی جدید است. هرچند که در مواردی مشاهده شده که نتیجه نهایی از دقت کافی برخوردار نبوده و توصیه میشود تا نمودارهای تولید شده با دادههای اصلی مقایسه شوند تا از بروز مغایرتهای احتمالی جلوگیری به عمل آید.
با همه این اوصاف، چتجیپیتی میتواند ایدهها را تا بخش قابل قبولی پرورش دهد؛ اما گرفتن نتایجی که شما را در بازار مطرح کند و در رقابت با سایر رقبا اثرگذار باشد، همچنان نیازمند نظارت و رتوش کردن طرحهای نهایی توسط طراحان گرافیک انسانی متخصص است.
کاربردهایی سرگرم کننده و تعاملی
یکی از بزرگترین ترندهای چند وقت اخیر اینترنت، تبدیل تصاویر به سبکهای مختلف، مثل سبک استودیو «جیبلی» به کمک چتجیپیتی بود. تبدیل تصویر حیوانات خانگی به انسانی مطابق با ویژگی آنها نیز یکی دیگر از موضوعات داغ مرتبط با تواناییهای تولید تصویر چتجیپیتی است.
اما جدا از این موارد، این ابزار قابلیتهای کاربردیتری را هم ارائه میدهد. به طور مثال شما میتوانید تصویر خودتان و همچنین تصویر لباسی که قصد خریدش را دارید بارگذاری کنید. سپس چتجیپیتی تصویری میسازد که در آن این لباس بر تن شماست و حالا میتوانید تصمیم بهتری در خرید خود بگیرید.
میتوان این قابلیت را به انجام عمل زیبایی، زدن یا پاک کردن تتو از روی بدن و موارد این چنینی تعمیم داد.
تولید کمیکبوک از دیگر قابلیتهای جالب این ابزار است. چتجیپیتی میتواند بر اساس توصیفی کوتاه، کمیکبوکهای جذابی را تولید کند. همچنین میتوان با استفاده از این تواناییهای جدید بازیهای رومیزی (Board Game) طراحی کرد. به طوری که جزئیات و حتی متنهایی که نیاز است روی صفحه این بازی باشند به طور دقیقی طراحی و تولید خواهند شد.
چالشهای تولید تصویر در چتجیپیتی
بسیاری از کاربران با محدودیتهای شدید این مدل جدید در تولید تصویر درگیر هستند. این مدل بسیاری از درخواستها را حساس یا نامناسب تشخیص میدهد و از تولید آنها خودداری میکند؛ در صورتی که بسیاری از این درخواستها واقعا نامناسب نیستند.
به طور مثال چندی پیش این هوش مصنوعی از تولید تصویری از «یک شوالیه با زره سیاه» خودداری کرده و آن را به عنوان محتوای حساس شناخته بود.
با همه این اوصاف، راهکارهایی برای غلبه بر این چالشها معرفی شدهاند. یکی از این راهحلها، باز کردن یک چت جدید در هنگام بروز چنین خطاهایی است. ممکن است با تغییر جملهبندی درخواست در چت جدید، تصویر درخواست برای شما تولید شود.
تلاش برای متقاعد کردن هوش مصنوعی با پدید آوردن بحثهای منطقی (Gaslighting) از دیگر کارهایی است که برای دور زدن این محدودیت میتوانید از آن استفاده کنید. به طور مثال در صورتی که چتجیپیتی از تولید محتوایی سر باز زد، به طوری که این محتوا واقعا حساسیت خاصی را نداشت، میتوانید با آن وارد بحث شوید و بگویید که این کار او بر خلاف حق آزادی بیان است! سپس ممکن است به نتیجه دلخواه خود برسید. البته که این روش همیشه جوابگو نیست.
یکی از نگرانیهای عمده درباره توسعه اینگونه مدلهای تولید و پردازش تصویر، دادههایی است که در تمرین و توسعه مدلهای زبانی آن استفاده شده. رعایت حق کپی رایت هنرمندان و رضایت آنها در استفاده از آثارشان برای تعلیم مدلهای زبانی از موارد داغ این روزهاست.
البته که طبق اعلام شرکت OpenAI در صورت عدم رضایت هنرمندان، این شرکت از آثار آنها استفاده نخواهد کرد.
پیشرفت این فناوری خیره کننده است. با این وجود رقبای زیادی در بازار هستند که همچنان در سطح بالایی به رقابت با چتجیپیتی میپردازند و میتوانند خدمات مشابه، یا شاید بهتری، در زمینه تولید و ویرایش تصویر ارائه دهند. همین هم میتواند یکی از عوامل شتاب توسعه این فناوری باشد.
سوال بزرگی اما باقی میماند؛ با توسعه چنین فناوریهایی، چگونه باید مرز بین خلاقیت انسانی و هوش مصنوعی را مشخص کرد و به راستی، این مرز کجاست؟