Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش خبری
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
خطرات هوش مصنوعی
دیتاست
مدل‌های بنیادی
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
پیاده‌سازی هوش مصنوعی
گزارش
مصاحبه
هوش مصنوعی در عمل
 Veo 3 گوگل: انقلابی در تولید ویدئو، مشابه کاری که ChatGPT با متن انجام داد

Veo 3 گوگل: انقلابی در تولید ویدئو، مشابه کاری که ChatGPT با متن انجام داد

زمان مطالعه: 3 دقیقه

گوگل در کنفرانس I/O 2025، با رونمایی از مدل جدید تولید ویدئو خود به نام Veo 3، بار دیگر در دنیای فناوری غوغا به پا کرد. این مدل نه‌تنها قادر به تولید ویدئوهای باکیفیت است، بلکه برای اولین بار امکان افزودن صدا را نیز فراهم کرده است؛ قابلیتی که تاکنون هیچ‌یک از مدل‌های مشابه، از جمله ابزارهای شرکت‌هایی مانند OpenAI، Meta، Stability AI و Runway ML، از آن برخوردار نبودند.

Veo 3  می‌تواند صدای ترافیک در یک خیابان شهری، آواز پرندگان در پارک، و حتی مکالمات بین شخصیت‌ها را تولید کند. این ویژگی، نقطه عطفی در فناوری تولید ویدئو محسوب می‌شود که بسیاری از کارشناسان و کاربران آن را «لحظه AGI برای ویدئو» نامیده‌اند.

غوغای Veo 3 در شبکه‌های اجتماعی

پس از معرفی Veo 3، شبکه‌های اجتماعی مملو از کلیپ‌هایی شدند که با استفاده از این فناوری تولید شده‌اند. کاربران از توانایی‌های این مدل در بازآفرینی فیزیک واقعی و هماهنگ کردن صدا و تصویر، از جمله حرکت آب، صدای قدم زدن روی برف، و حتی لب‌خوانی دقیق، شگفت‌زده شده‌اند.

یکی از کاربران در شبکه اجتماعی ایکس (X) ویدئویی منتشر کرد که در آن فیثاغورس، فیلسوف یونانی، در حال توضیح قضیه فیثاغورس در یونان باستان است. کلیپ دیگری نشان می‌داد مردی در حال اجرای یک استندآپ کمدی است که حتی موفق شده مخاطبان را بخنداند.

Veo 3  اکنون برای مشترکان Ultra در آمریکا از طریق اپلیکیشن Gemini و Flow و همچنین برای کاربران سازمانی از طریق Vertex AI در دسترس است.

تغییرات بزرگ در صنعت فیلم‌سازی

گوگل با معرفی ابزار جدیدی به نام Flow برای فیلم‌سازان، اعلام کرد که فرآیند تولید فیلم به‌طور کلی دگرگون خواهد شد. این ابزار به کاربران اجازه می‌دهد صحنه‌های سینمایی را تولید، دارایی‌ها را در شات‌های مختلف ادغام، و عناصر خلاقانه را با زبان ساده مدیریت کنند.

گوگل توضیح داده که Flow با الهام از لحظاتی طراحی شده است که زمان به‌نظر کندتر می‌گذرد و فرآیند خلق، پر از امکانات و بدون فشار است.

Flow  قابلیت‌هایی مانند کنترل دوربین، ساخت صحنه برای ویرایش و گسترش شات‌های موجود، و ابزارهای مدیریت دارایی را ارائه می‌دهد. همچنین بخشی به نام  Flow TV شامل کلیپ‌ها و کانال‌هایی است که با Veo تولید شده‌اند و دقیقاً تکنیک‌ها و دستورات استفاده‌شده برای تولید آن‌ها را نمایش می‌دهد.

آینده فیلم‌سازی با هوش مصنوعی

کارشناسان معتقدند که Veo 3 می‌تواند تولید فیلم‌های بلند را با هزینه و زمان بسیار کمتر ممکن سازد. دریا اونوتماز، استاد آزمایشگاه جکسون، پیش‌بینی می‌کند که به زودی فیلم‌هایی با کیفیت Toy Story تنها در چند روز و با هزینه‌ای چند هزار دلاری تولید شوند، در حالی که ساخت Toy Story اصلی چهار سال زمان برد و ۳۰ میلیون دلار هزینه داشت.

برخی کاربران نیز پیش‌بینی کرده‌اند که در آینده نزدیک، فیلم‌های کوتاه و حتی فیلم‌های بزرگ با بودجه بالا، به‌طور گسترده از هوش مصنوعی برای تولید صحنه‌های خاص و جلوه‌های بصری استفاده خواهند کرد.

گوگل همچنین همکاری خود را با Primordial Soup، یک پروژه داستان‌سرایی جدید به رهبری دارن آرونوفسکی، کارگردان مشهور، آغاز کرده است. در این همکاری، سه فیلم کوتاه با استفاده از ابزارهای هوش مصنوعی، از جمله Veo، تولید خواهند شد. هر فیلم توسط یک فیلم‌ساز نوظهور کارگردانی می‌شود و آرونوفسکی نقش مربی را ایفا خواهد کرد.

Imagen 4؛ انقلابی در تولید تصاویر

گوگل علاوه بر Veo 3، مدل جدید تولید تصویر خود به نام Imagen 4 را نیز معرفی کرد. این مدل با سرعت و دقت بالا، تصاویر با جزئیات خیره‌کننده‌ای مانند پارچه‌های پیچیده، قطرات آب و خز حیوانات تولید می‌کند و در سبک‌های واقع‌گرایانه و انتزاعی عملکرد فوق‌العاده‌ای دارد.

Imagen 4  می‌تواند تصاویر را با رزولوشن 2K  تولید کند و از نسبت‌های مختلف ابعاد پشتیبانی می‌کند، که این ویژگی برای چاپ و ارائه بسیار مناسب است. همچنین بهبود قابل‌توجهی در تایپوگرافی و املای متن‌ها دارد و امکان استفاده در کارت‌های تبریک، پوسترها و کمیک‌های شخصی‌سازی‌شده را فراهم می‌کند.

این مدل اکنون در اپلیکیشن Gemini، ابزار Whisk، Vertex AI و مجموعه Workspace گوگل، شامل Slides، Vids و Docs، در دسترس است و مستقیماً با مدل تولید تصویر OpenAI رقابت می‌کند.

جمع‌بندی

گوگل با معرفی Veo 3 و Imagen 4 نشان داد که در رقابت هوش مصنوعی همچنان پیشتاز است. Veo 3 با توانایی تولید ویدئوهای باکیفیت همراه با صدا، انقلابی در صنعت فیلم‌سازی ایجاد کرده و ابزار Flow نیز فرآیند تولید محتوا را برای فیلم‌سازان ساده‌تر کرده است.

از سوی دیگر، Imagen 4 با دقت و سرعت بالا در تولید تصاویر، کاربردهای جدیدی را در طراحی، تبلیغات و ارائه‌های حرفه‌ای فراهم کرده است.

این نوآوری‌ها نه‌تنها آینده تولید محتوا را دگرگون می‌کنند، بلکه مرزهای خلاقیت را به سطح جدیدی می‌رسانند. گوگل بار دیگر ثابت کرده که در مسیر پیشرفت هوش مصنوعی، هیچ رقیبی توانایی توقف آن را ندارد.

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]