40 گام به سوی آینده‌ای هوشمند - مجموعه وبینارهای رایگان در حوزه هوش مصنوعی
Filter by دسته‌ها
chatGTP
اخبار
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
کاربردهای هوش مصنوعی
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 از میم‌ها (memes) تا تجسم‌های سینمایی

تأثیر Viggle AI بر صنعت تولید محتوا

از میم‌ها (memes) تا تجسم‌های سینمایی

شاید نام Viggle AI را نشنیده باشید، اما احتمالاً میم‌های وایرال شده که توسط  این سرویس ساخته شده را دیده‌اید. Viggle این امکان را به کاربران می‌دهد که ویدئوهایی کوتاهی را با کمک هوش مصنوعی بسازند. حتی شما می‌توانید از تصویر خودتان برای ساخت ویدئو استفاده کنید.

Viggle چیست؟

Viggle مبتنی بر یک مدل ویدئویی سه‌بعدی به نام JST-1 توسعه داده که به گفته این شرکت، دارای درک واقعی از فیزیک  است. «هانگ چو»، مدیرعامل Viggle، می‌گوید تفاوت اصلی بین Viggle و سایر مدل‌های ویدئویی هوش مصنوعی این است که Viggle به کاربران اجازه می‌دهد حرکت موردنظر خود را برای شخصیت‌ها مشخص کنند. دیگر مدل‌های ویدئویی هوش مصنوعی معمولاً حرکاتی غیرواقعی و خلاف قوانین فیزیک  برای شخصیت‌ها تولید می‌کنند، اما چو ادعا می‌کند که مدل‌های Viggle متفاوت هستند.

او در مصاحبه‌ای گفته: «ما در واقع یک نوع جدید از موتور گرافیکی می‌سازیم که بر پایه شبکه‌های عصبی است. مدل ما به‌طور کامل با تولیدکننده‌های ویدئویی موجود که عمدتاً مبتنی بر پیکسل هستند و ساختار و خواص فیزیک را درک نمی‌کنند، متفاوت است. مدل ما طوری طراحی شده که چنین درکی را داشته باشد و به همین دلیل از لحاظ کنترل‌پذیری و کارایی تولید، بسیار بهتر عمل می‌کند.»

Viggle چیست؟

برای ساخت ویدئویی در این پلتفرم می‌توانید تصویر خودتان یا سوژه موردنظرتان را به همراه یک ویدئو به آن بدهید تا این سیستم تصویر شما را مشابه ویدئویی که به آن داده‌اید به حرکت در آورد. کاربران همچنین می‌توانند تصاویر شخصیت‌ها را با پیام‌های متنی شامل دستورالعمل‌هایی درباره نحوه حرکت آن‌ها آپلود کنند، یا حتی شخصیت‌های انیمیشن را تنها با پرامپت‌های متنی از ابتدا ایجاد کنند.

Viggle چیست؟

ابزاری برای خلاقیت

با این حال، میم‌ها تنها بخش کوچکی از کاربردهای Viggle را تشکیل می‌دهند. هانگ چو می‌گوید که این مدل به عنوان ابزاری برای تجسم ایده‌ها برای طراحان و خلاقان نیز مورد استقبال گسترده قرار گرفته است. اگرچه ویدیوها هنوز بی‌نقص نیستند (آن‌ها گاهی لرزان‌اند و چهره‌ها بی‌هویت هستند) اما این مدل برای فیلمسازان، انیماتورها و طراحان بازی‌های ویدئویی در تبدیل ایده‌هایشان به چیزی بصری، کارآمد بوده است. در حال حاضر، مدل‌های Viggle تنها شخصیت‌ها را ایجاد می‌کنند، اما هانگ چو امیدوار است که در آینده ویدیوهای پیچیده‌تری را هم بتواند بسازد.

Viggle در حال حاضر یک نسخه رایگان و محدود از مدل هوش مصنوعی خود را در Discord و اپلیکیشن وب خود ارائه می‌دهد. این شرکت همچنین اشتراک با پرداخت را برای افزایش ظرفیت ارائه می‌دهد و به برخی سازندگان دسترسی ویژه اعطا می‌کند. مدیرعامل می‌گوید Viggle در حال مذاکره با استودیوهای فیلم و بازی برای صدور مجوز استفاده از این فناوری است، و همچنین شاهد استقبال آن توسط انیماتورهای مستقل و سازندگان محتوا بوده است.

جذب سرمایه

Viggle اعلام کرده که یک دور سرمایه‌گذاری به ارزش 19 میلیون دلار با رهبری Andreessen Horowitz و مشارکت دو شرکت کوچک‌تر جذب کرده است. این استارتاپ می‌گوید که این سرمایه‌گذاری به Viggle کمک می‌کند تا مقیاس خود را افزایش دهد، توسعه محصول را تسریع کند و تیم خود را گسترش دهد. Viggle گفته است که با Google Cloud و دیگر ارائه‌دهندگان خدمات ابری برای آموزش و اجرای مدل‌های هوش مصنوعی همکاری می‌کند. این همکاری‌ها با Google Cloud اغلب شامل دسترسی به خوشه‌های GPU و TPU می‌شود، اما معمولاً شامل ویدیوهای یوتیوب برای آموزش مدل‌های هوش مصنوعی نیست.

Viggle

Viggle و داده‌های آموزشی: یک مسئله حقوقی

هنگامی که از هانگ چو درباره داده‌های آموزشی مدل‌های ویدئویی هوش مصنوعی Viggle پرسیده شد، او پاسخ داد: «تاکنون ما به داده‌هایی که به صورت عمومی در دسترس بوده‌اند تکیه کرده‌ایم.» این پاسخی مشابه به چیزی است که «میرا موراتی»، مدیر فنی OpenAI، درباره داده‌های آموزشی Sora ارائه داده بود.

هنگامی که پرسیده شد آیا مجموعه‌داده‌های آموزشی Viggle شامل ویدیوهای یوتیوب می‌شود، چو به‌طور واضح پاسخ داد: «بله.»

این مسئله می‌تواند مشکل‌ساز باشد. در ماه آوریل، نیل موهان، مدیرعامل یوتیوب، به بلومبرگ گفت که استفاده از ویدیوهای یوتیوب برای آموزش یک مولد متن به ویدئو هوش مصنوعی، نقض آشکار شرایط خدمات این پلتفرم است. این نظرات در زمینه احتمال استفاده OpenAI از ویدیوهای یوتیوب برای آموزش Sora مطرح شده بود.

موهان توضیح داد که گوگل، مالک یوتیوب، ممکن است با برخی از سازندگان قراردادهایی داشته باشد تا از ویدیوهای آن‌ها در مجموعه داده‌های آموزشی برای Gemini گوگل DeepMind استفاده کند. با این حال، طبق گفته موهان و شرایط خدمات یوتیوب، بدون اخذ مجوز از شرکت، استفاده از ویدیوهای یوتیوب برای این منظور ممنوع است.

این استارتاپ به جمع دیگرانی که از یوتیوب به عنوان داده آموزشی استفاده می‌کنند و بنابراین در یک منطقه خاکستری فعالیت می‌کنند، می‌پیوندد. گزارش شده است که بسیاری از توسعه‌دهندگان مدل‌های هوش مصنوعی (از جمله Nvidia، اپل و Anthropic) از رونویسی‌ها یا کلیپ‌های ویدئویی یوتیوب برای آموزش استفاده می‌کنند. این راز کثیف در سیلیکون‌ولی است که چندان مخفی نیست: احتمالاً همه این کار را می‌کنند. چیزی که واقعاً نادر است، گفتن آن با صدای بلند است.

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]