40 گام به سوی آینده‌ای هوشمند - مجموعه وبینارهای رایگان در حوزه هوش مصنوعی
Filter by دسته‌ها
chatGTP
اخبار
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
کاربردهای هوش مصنوعی
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 با هوش مصنوعی بصری نپکین

داستان‌گویی تجاری خودکار

با هوش مصنوعی بصری نپکین

نپکین یک ابزار مبتنی بر هوش مصنوعی برای داستان‌گویی بصری است که به افراد برای اهداف تجاری کمک می‌کند تا با استفاده از هوش مصنوعی مولد، به ارائه‌های خود جان ببخشد. در ادامه بخشی از گفتگو هم‌بنیان‌گذاران نپکین را که با venturebeat انجام شده را می‌خوانیم.

چرا نپکین؟

این ابزار ساخته «پرامود شارما»، کهنه‌کار سیلیکون‌ولی در حوزه هوش مصنوعی، و «جروم شولر» است که بیش از یک دهه پیش شرکت اُسمو را برای استفاده از هوش مصنوعی برای زنده کردن بازی‌های کودکان راه‌اندازی کرد. نپکین (Napkin)، در لغت به معنی همان دستمال‌سفره‌ای است که در بسیاری از رستوران‌ها بخشی از تشریفات سرو غذا محسوب می‌شود.

سؤالی که مطرح می‌شود این است که چرا باید اسم این ابزار نپکین باشد؟

در واقع بسیاری از ایده‌های تجاری در جریان یک قرار شام یا نهار متولد شدند. نوشتن روی دستمال‌های سفره برای توضیح ایده یا کشیدن شکل‌ها برای متقاعدکردن طرف مقابل هرچند به نظر عجیب می‌رسد؛ اما یک روش معمول بین بنیان‌گذاران استارت‌آپ‌های سیلیکون‌ولی بوده.

نپکین، ابزاری ایجاد کرده است که به شما قدرت می‌دهد تا بدون هیچ تلاشی ایده‌های خود را بصری توضیح دهید. شما متن ارائه تجاری خود را می‌نویسید و با استفاده از هوش مصنوعی بصری، آن را به سرعت به تصاویر، نمودارها و… تبدیل می‌کند و سبک، رنگ‌ها، فونت‌ها، شکل‌ها و طراحی را برای بهبود تأثیر داستان‌گویی شما تنظیم می‌کند.

در حال حاضر در نسخه بتا نپکین منتشر شده  و این نسخه با گردش کار فعلی شما در گوگل داکز، اسلاید، کانوا، اسلک، ورد، پاورپوینت، ایمیل، متن و موارد دیگر کار می‌کند. دیگر نیازی نیست منتظر کسی باشید که بداند چگونه نسخه اولیه ارائه‌های شما را تولید کند. نپکین دائماً سبک‌ها و طرح‌های جدیدی را برای برآورده‌کردن نیازهای داستان‌گویی شما معرفی می‌کند.

شارما در مصاحبه‌ای با VentureBeat گفت که همه ما ایده‌هایی داریم، اما برقراری ارتباط مؤثر با آن‌ها و جلب نظر مردم کار آسانی نیست. با کاهش مدت توجه و برخورد با اوج بار اطلاعات، چگونه می‌توانیم بهترین روش برای برقراری ارتباط با ایده‌های پیچیده را پیدا کنیم؟ نپکین متن شما را بدون نیاز به فکر کردن در مورد پیچیدگی‌های طراحی وقت‌گیر به تصاویر تبدیل می‌کند.

«پرامود شارما»، سمت راست و «جروم شولر» سمت چپ

نپکین هوش مصنوعی بصری پیشگامانه‌ای است که تأثیر و سرگرمی را به داستان‌گویی تجاری می‌آورد. این ابزار برای میلیون‌ها حرفه‌ای که ایده‌ها، نویسندگان، معلمان و سازندگان محتوا را می‌فروشند طراحی شده است، نپکین به شما کمک می‌کند تا پتانسیل بصری را در محتوای متنی خود آزاد کنید. و این برای کسانی از ما است که ممکن است نویسندگان خوبی باشیم؛ اما در گرافیک، ارائه یا هنر ضعیف هستیم.

شارما می‌گوید: «با آیفون، اپل عکاسی را برای هر کسی بسیار ساده کرد. ما قصد داریم همین کار را با گرافیک انجام دهیم. تصاویر قدرتمند هستند و ما نپکین را طوری طراحی کرده‌ایم که هر کسی بتواند به راحتی ایده‌های خود را از طریق بصری‌سازی ارتباط برقرار کند.»

این فقط در مورد از بین بردن مشاغل یا حذف طراحان گرافیک نیست. در عوض، شارما می‌گوید که این بیشتر در مورد دسترسی‌پذیرتر کردن طراحی است، به شما امکان می‌دهد ایده‌های خود را بدون صرف ساعت‌ها برای ایجاد تصویر مناسب و ساختن آن از ابتدا توضیح دهید.

نحوه کار نپکین

نپکین چگونه به شما در داستان‌گویی بصری کمک می‌کند؟

  • متن خود را وارد کنید: محتوای متنی موجود خود را کپی کنید یا از طریق یک دستور هوش مصنوعی، متن موردنظر خودتان را ایجاد کنید.
  • ایجاد تصاویر: روی نماد جرقه در هر قسمت از متن کلیک کنید، نپکین محتوای شما را به تصاویر پیشنهادی تبدیل می‌کند. ظرف چند ثانیه، طیف وسیعی از تصاویر برای انتخاب خواهید داشت.
  • سفارشی‌سازی: با ابزار ویرایش داخلی نپکین، می‌توانید فونت، رنگ، شکل، طرح و موارد دیگر را برای مطابقت با سبک یا دستورالعمل‌های برند خود تنظیم کنید.
  • جاسازی در گردش کار شما: به سادگی با کپی و پیست کردن، می‌توانید تصاویر نپکین را به هر مکان دلخواه خود ببرید: اسلایدها/اسناد گوگل، مایکروسافت ورد/پاورپوینت، ساب‌استک، مدیوم، اسلک، نوتین، کانوا، لینکدین، اینستاگرام و موارد دیگر.
  • از آن در موارد مختلف استفاده کنید: تصاویر باکیفیت را برای ارائه‌ها، وبلاگ‌ها، ارائه‌های فروش، محتوای اجتماعی، خبرنامه‌ها، گزارش‌های داده و تحقیق، ارتباطات با مشتری و موارد دیگر ایجاد کنید.

بازخورد کاربران

جیسون میلر، مدیر ارشد عملیات Sprouts.ai می‌گوید: «به عنوان کسی که بدون مهارت طراحی، نپکین فوق‌العاده آسان و راحت است. چه به یک نمودار سریع برای یک پست وبلاگ نیاز داشته باشم یا یک نمودار برای یک ارائه، نپکین ظرف چند ثانیه دقیقاً همان چیزی را که به دنبالش هستم تولید می‌کند. بل از نپکین، در مورد اینکه به چه گرافیک‌هایی می‌توانیم دسترسی داشته باشیم محدود بودیم. اکنون، با نپکین، یک طراح در نوک انگشتان خود داریم که دسترسی نامحدودی را برای ارتقای داستان‌سرایی کسب‌وکار ما با تصاویر در عین حال صرفه‌جویی قابل‌توجه در هزینه و زمان ارائه می‌دهد.»

توانایی‌های نپکین

  • تصاویر فوری برای تقویت داستان‌گویی: کاتالوگ طراحی گسترده نپکین در حال حاضر شامل بیش از ۳۰ دسته طراحی بصری مانند نقشه‌های ذهنی، نمودارهای جریان، نمودارهای ون، نمودارهای میله‌ای و موارد دیگر است.
  • تیم توسعه‌دهنده قوی: تیم توسعه‌دهنده NLP، هوش مصنوعی و بینایی کامپیوتر نپکین که از آمازون، آزمایشگاه تحقیقاتی مایکروسافت، گیت‌هاب، گوگل و Osmo می‌آیند، سخت در تلاش برای پشتیبانی از سفارشی‌سازی‌های قدرتمندتر و دسته‌های منحصربه‌فرد هستند که در هفته‌ها و ماه‌های آینده به عرضه آن‌ها ادامه خواهند داد.
  • تجربه بنیان‌گذاران: اسکولر و شارما شرکت قبلی خود، Osmo را فروختند که هوش مصنوعی بازتابی آن‌ها توسط میلیون‌ها کودک و کلاس درس استفاده می‌شود و در محصولاتی با دیزنی و هات ویلز ماتل ادغام شده است. Byju’s آن را در سال ۲۰۱۹ به قیمت ۱۲۰ میلیون دلار خریداری کرد.

انگیزه همراه نپکین ای‌آی

در یک پست وبلاگی، شارما گفت که ارتباط مؤثر در محیط کار بسیار مهم است، چه در حال ارائه یک ایده، توضیح مفاهیم پیچیده یا طوفان فکری برای استراتژی‌های جدید باشید. چگونه مطمئن می‌شوید که دیدگاه شما توسط دیگران درک و قدردانی می‌شود؟ این چالش تیم را برای ساخت نپکین ای‌آی الهام بخشید.

شارما نوشت: «همه ما ایده‌های خوبی داریم، اما به اشتراک‌گذاری مؤثر آن‌ها می‌تواند دشوار باشد. در اُسمو، یک شرکت بازی‌سازی مبتنی بر هوش مصنوعی که من و جروم تقریباً یک دهه پیش تأسیس کردیم، با سرگرم‌کننده کردن یادگیری، میلیون‌ها کودک را خوشحال کردیم.» با این حال، به عنوان رهبران، اغلب خودمان را در دریایی از اسناد، ارائه‌های ۱۰۰ اسلایدی و مقالات تحقیقاتی طولانی غرق می‌دیدیم. گاهی اوقات، با یک تصویر نادر مواجه می‌شدیم که واقعاً جوهرهٔ یک ایده را می‌گرفت و آن لحظات “آها” روشن‌بینی را ایجاد می‌کرد. متوجه شدیم که تصاویر ابزارهای ارتباطی قدرتمندی هستند، اما به ندرت استفاده می‌شوند.»

او افزود: «ما شروع کردیم به تعجب که چرا افراد کمی از تصاویر به عنوان ابزارهای قدرتمند ارتباطی استفاده می‌کنند. نظریه ما این است که از سنین پایین، ما آموزش می‌بینیم که به نوشتن تکیه کنیم. ویرایشگرهای متن همکاری و به اشتراک‌گذاری افکار را برای همه آسان می‌کنند. با این حال، ایجاد تصاویر وقت‌گیر است و نیاز به مهارت‌هایی دارد که بسیاری از ما نداریم. در نتیجه، اکثر مردم به نوشتن پایبند هستند، حتی اگر تصاویر بتوانند دیدگاه واضح‌تر و تأثیرگذارتر از یک ایده را ارائه دهند. این امر به ویژه در محیط‌های حرفه‌ای که ارتباط مؤثر بسیار مهم است صادق است.»

او گفت: «متوجه شدیم که ساختن تصاویر خوب از چیزهایی که در مورد آن‌ها صحبت می‌کنید بسیار سخت است. اکثر مردم از هوش مصنوعی مولد برای رسانه‌های اجتماعی استفاده کرده‌اند. به نظر می‌رسد که همه در ابتدا به سمت آن گرایش داشتند.»

اما بنیان‌گذاران فکر می‌کردند کسب‌وکار کوچک و شرکت مناسب برای استفاده از تصاویر هوش مصنوعی هستند. گرافیک‌ها می‌توانند با تعامل بسیار پیچیده شوند. می‌توانید قبل از ارسال ایده به هوش مصنوعی، مرزهای آنچه می‌خواهید را مشخص کنید.

شارما گفت: «متوجه شدیم که اکثر مردم می‌دانند چگونه بنویسند اما نمی‌دانند چگونه یک تصویر یا فرم بصری ایجاد کنند.»

شارما می‌گوید: «متوجه شدیم که اکثر مردم لایه خلاقیت یا زمان لازم برای ارائه چیزی را ندارند. افراد بسیار کمی می‌توانند واقعاً از ابتدا شروع کنند. و تنها در نسل سوم ما متوجه شدیم که مردم واقعاً به هوش مصنوعی نیاز دارند.»

شارما گفت: «این بسیار سخت است. ما در حال ساخت چیزی شبیه به یک موتور بصری هستیم. من به شما اطلاعات زیادی می‌دهم و شما گرافیک مناسب را ایجاد می‌کنید و به صورت پویا گرافیک ایجاد می‌کنید. ما سعی می‌کنیم محتوای نوشتاری را تکمیل کنیم.»

اولین نسخه از یک ابزار هوش مصنوعی به شکل یک ابزار طراحی برای ساخت نمودارهای ساده با ماوس بود. با این حال، تیم به سرعت متوجه شد که حتی با بهترین هوش مصنوعی که در پس‌زمینه کمک می‌کند، کاربران نمی‌خواهند به صورت زنده با ماوس طرح‌ریزی کنند.

در نسخه دوم، سازندگان یک پایگاه‌داده از چارچوب‌های بصری مانند نمودارهای ون و دایره‌ای معرفی کردند. کاربران می‌توانستند روی یافتن یک تصویر بصری برای استفاده مطابق با ایده‌های خود تمرکز کنند، نه طراحی. اما آن‌ها کشف کردند که بسیاری از مردم نمی‌دانند از کدام تصاویر استفاده کنند یا چگونه از آن‌ها به طور مؤثر استفاده کنند، حتی اگر به آن‌ها دسترسی داشته باشند.

در نهایت، معرفی مدل‌های بزرگ زبانی (LLM) مکمل کاملی برای تلاش‌های تیم فراهم کرد. آنها بر تبدیل خودکار متن به تصاویر تمرکز کردند و کاربران را در جایی که راحت‌تر هستند، یعنی نوشتن متن، ملاقات کردند. این تولد نپکین ای‌آی را که امروز می‌بینید رقم زد.

آینده نپکین

همان‌طور که آیفون عکاسی باکیفیت را برای همه آسان کرد، مأموریت نپکین ای‌آی نیز این است که ارتباط بصری را برای همه آسان و در دسترس قرار دهد، همان‌طور که شارما نوشت.

«ما می‌دانیم که این یک مشکل واقعاً سخت است و تازه شروع کرده‌ایم، اما از پیشرفت‌هایی که تاکنون داشته‌ایم هیجان‌زده هستیم. ما معتقدیم که می‌توانیم با تمرکز بر دو اصل اساسی به مأموریت خود دست یابیم: درک عمیق محتوای متنی و ایجاد طیف گسترده‌ای از تصاویر مرتبط و باکیفیت.»

منبع

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]