برترین متخصصین

از سراسر دنیا

مجموعه وبینارهای مدل‌های بزرگ زبانی (LLM)

Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش خبری
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
خطرات هوش مصنوعی
دیتاست
مدل‌های بنیادی
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
پیاده‌سازی هوش مصنوعی
گزارش
مصاحبه
هوش مصنوعی در عمل
 هوش مصنوعی FantasyTalking رونمایی شد: تولید ویدیوهای سخنگو از یک تصویر   

هوش مصنوعی FantasyTalking رونمایی شد: تولید ویدیوهای سخنگو از یک تصویر   

زمان مطالعه: < 1 دقیقه

هوش مصنوعی FantasyTalking، توسعه‌یافته توسط محققان چینی، توانایی تولید ویدیوهای واقع‌گرایانه از یک تصویر پرتره ثابت و فایل صوتی را دارد.

این مدل با بهره‌گیری از معماری Video Diffusion Transformer و استراتژی دو مرحله‌ای، در مرحله اول حرکات کلی چهره، بدن و پس‌زمینه را با صدا هماهنگ می‌کند و در مرحله دوم، با استفاده از ماسک‌های خاص، حرکات لب‌ها را فریم‌به‌فریم تنظیم می‌کند تا هماهنگی دقیقی با صدا داشته باشد.

این ویژگی‌ها باعث شده تا FantasyTalking در تولید آواتارهای سخنگو با کیفیت بالا و حفظ هویت چهره عملکردی برجسته داشته باشد.

این مدل از ماژول‌های کنترلی برای تنظیم شدت حرکات چهره و بدن استفاده می‌کند و امکان تولید ویدیوهایی با زوایای متنوع (نزدیک، نیم‌تنه، تمام‌قد)، استایل‌های گرافیکی مختلف (واقع‌گرایانه یا کارتونی) و حتی متحرک‌سازی حیوانات را فراهم می‌آورد.

در مقایسه با روش‌های پیشرفته مانند OmniHuman-1، FantasyTalking از نظر واقع‌گرایی، انسجام حرکتی و تطابق صوتی-تصویری برتری دارد و به دلیل استفاده از مکانیزم‌های مبتنی‌بر چهره، نتایجی طبیعی‌تر ارائه می‌دهد.

این فناوری گامی بزرگ در حوزه گرافیک و بینایی ماشین محسوب می‌شود.

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]