تأثیر Viggle AI بر صنعت تولید محتوا
از میمها (memes) تا تجسمهای سینمایی
شاید نام Viggle AI را نشنیده باشید، اما احتمالاً میمهای وایرال شده که توسط این سرویس ساخته شده را دیدهاید. Viggle این امکان را به کاربران میدهد که ویدئوهایی کوتاهی را با کمک هوش مصنوعی بسازند. حتی شما میتوانید از تصویر خودتان برای ساخت ویدئو استفاده کنید.
Viggle چیست؟
Viggle مبتنی بر یک مدل ویدئویی سهبعدی به نام JST-1 توسعه داده که به گفته این شرکت، دارای درک واقعی از فیزیک است. «هانگ چو»، مدیرعامل Viggle، میگوید تفاوت اصلی بین Viggle و سایر مدلهای ویدئویی هوش مصنوعی این است که Viggle به کاربران اجازه میدهد حرکت موردنظر خود را برای شخصیتها مشخص کنند. دیگر مدلهای ویدئویی هوش مصنوعی معمولاً حرکاتی غیرواقعی و خلاف قوانین فیزیک برای شخصیتها تولید میکنند، اما چو ادعا میکند که مدلهای Viggle متفاوت هستند.
او در مصاحبهای گفته: «ما در واقع یک نوع جدید از موتور گرافیکی میسازیم که بر پایه شبکههای عصبی است. مدل ما بهطور کامل با تولیدکنندههای ویدئویی موجود که عمدتاً مبتنی بر پیکسل هستند و ساختار و خواص فیزیک را درک نمیکنند، متفاوت است. مدل ما طوری طراحی شده که چنین درکی را داشته باشد و به همین دلیل از لحاظ کنترلپذیری و کارایی تولید، بسیار بهتر عمل میکند.»
برای ساخت ویدئویی در این پلتفرم میتوانید تصویر خودتان یا سوژه موردنظرتان را به همراه یک ویدئو به آن بدهید تا این سیستم تصویر شما را مشابه ویدئویی که به آن دادهاید به حرکت در آورد. کاربران همچنین میتوانند تصاویر شخصیتها را با پیامهای متنی شامل دستورالعملهایی درباره نحوه حرکت آنها آپلود کنند، یا حتی شخصیتهای انیمیشن را تنها با پرامپتهای متنی از ابتدا ایجاد کنند.
ابزاری برای خلاقیت
با این حال، میمها تنها بخش کوچکی از کاربردهای Viggle را تشکیل میدهند. هانگ چو میگوید که این مدل به عنوان ابزاری برای تجسم ایدهها برای طراحان و خلاقان نیز مورد استقبال گسترده قرار گرفته است. اگرچه ویدیوها هنوز بینقص نیستند (آنها گاهی لرزاناند و چهرهها بیهویت هستند) اما این مدل برای فیلمسازان، انیماتورها و طراحان بازیهای ویدئویی در تبدیل ایدههایشان به چیزی بصری، کارآمد بوده است. در حال حاضر، مدلهای Viggle تنها شخصیتها را ایجاد میکنند، اما هانگ چو امیدوار است که در آینده ویدیوهای پیچیدهتری را هم بتواند بسازد.
Viggle در حال حاضر یک نسخه رایگان و محدود از مدل هوش مصنوعی خود را در Discord و اپلیکیشن وب خود ارائه میدهد. این شرکت همچنین اشتراک با پرداخت را برای افزایش ظرفیت ارائه میدهد و به برخی سازندگان دسترسی ویژه اعطا میکند. مدیرعامل میگوید Viggle در حال مذاکره با استودیوهای فیلم و بازی برای صدور مجوز استفاده از این فناوری است، و همچنین شاهد استقبال آن توسط انیماتورهای مستقل و سازندگان محتوا بوده است.
جذب سرمایه
Viggle اعلام کرده که یک دور سرمایهگذاری به ارزش 19 میلیون دلار با رهبری Andreessen Horowitz و مشارکت دو شرکت کوچکتر جذب کرده است. این استارتاپ میگوید که این سرمایهگذاری به Viggle کمک میکند تا مقیاس خود را افزایش دهد، توسعه محصول را تسریع کند و تیم خود را گسترش دهد. Viggle گفته است که با Google Cloud و دیگر ارائهدهندگان خدمات ابری برای آموزش و اجرای مدلهای هوش مصنوعی همکاری میکند. این همکاریها با Google Cloud اغلب شامل دسترسی به خوشههای GPU و TPU میشود، اما معمولاً شامل ویدیوهای یوتیوب برای آموزش مدلهای هوش مصنوعی نیست.
Viggle و دادههای آموزشی: یک مسئله حقوقی
هنگامی که از هانگ چو درباره دادههای آموزشی مدلهای ویدئویی هوش مصنوعی Viggle پرسیده شد، او پاسخ داد: «تاکنون ما به دادههایی که به صورت عمومی در دسترس بودهاند تکیه کردهایم.» این پاسخی مشابه به چیزی است که «میرا موراتی»، مدیر فنی OpenAI، درباره دادههای آموزشی Sora ارائه داده بود.
هنگامی که پرسیده شد آیا مجموعهدادههای آموزشی Viggle شامل ویدیوهای یوتیوب میشود، چو بهطور واضح پاسخ داد: «بله.»
این مسئله میتواند مشکلساز باشد. در ماه آوریل، نیل موهان، مدیرعامل یوتیوب، به بلومبرگ گفت که استفاده از ویدیوهای یوتیوب برای آموزش یک مولد متن به ویدئو هوش مصنوعی، نقض آشکار شرایط خدمات این پلتفرم است. این نظرات در زمینه احتمال استفاده OpenAI از ویدیوهای یوتیوب برای آموزش Sora مطرح شده بود.
موهان توضیح داد که گوگل، مالک یوتیوب، ممکن است با برخی از سازندگان قراردادهایی داشته باشد تا از ویدیوهای آنها در مجموعه دادههای آموزشی برای Gemini گوگل DeepMind استفاده کند. با این حال، طبق گفته موهان و شرایط خدمات یوتیوب، بدون اخذ مجوز از شرکت، استفاده از ویدیوهای یوتیوب برای این منظور ممنوع است.
این استارتاپ به جمع دیگرانی که از یوتیوب به عنوان داده آموزشی استفاده میکنند و بنابراین در یک منطقه خاکستری فعالیت میکنند، میپیوندد. گزارش شده است که بسیاری از توسعهدهندگان مدلهای هوش مصنوعی (از جمله Nvidia، اپل و Anthropic) از رونویسیها یا کلیپهای ویدئویی یوتیوب برای آموزش استفاده میکنند. این راز کثیف در سیلیکونولی است که چندان مخفی نیست: احتمالاً همه این کار را میکنند. چیزی که واقعاً نادر است، گفتن آن با صدای بلند است.