خلاصهسازی ویدئو با استفاده از هوش مصنوعی
استقبال کاربران اینترنت از محتوای ویدئویی روزبهروز درحال افزایش است و کسانی که قصد دارند راجعبه موضوعی خاص اطلاع کسب کنند، ترجیح میدهند که بهجای مطالعه چندین صفحه مطلب نوشتاری، یک ویدئوی چنددقیقهای را مشاهده کنند. به گفته گوگل، بیش از 50 درصد کسانی که قصد خرید کالای مورد نظر خود را دارند، ابتدا ویدئوهای مرتبط با آن را در اینترنت مشاهده میکنند و سپس تصمیم میگیرند که آیا خرید خود را نهایی کنند یا خیر. بااینکه در سالیان گذشته جریان اصلی محتوای وبسایتها و شبکههای اجتماعی بهسمت ویدئوها در حرکت بوده است، برطبق آمار، روند رشد محتوای ویدئویی در سالیان پیشرو همچنان مثبت بوده و افراد بیشتری به تولید و مشاهده محتوای ویدئویی رو میآوردند.
افزایش روزافزون حجم محتوای ویدئویی اما یک چالش قابلتوجه با خود به همراه میآورد: زمان محدود مخاطبان. امروزه با سیل عظیمی از ویدئوها مواجه هستیم که مشتاقیم بخش زیادی از آنها را مشاهده کنیم، اما ازآنجاییکه بهناچار مجبوریم زمان خود را مدیریت کنیم، ترجیح میدهیم که ویدئوهای بیشتر اما کوتاهتری را مشاهده کنیم. برای مثال، اگر وقت ما اجازه نمیدهد که 90 دقیقه از بازی فوتبال تیم محبوبمان را تماشا کنیم، میتوانیم با دیدن یک ویدئوی کوتاه 2 الی 3 دقیقهای، از مهمترین و جذابترین لحظات بازی باخبر شویم. خلاصهسازی ویدئو در حوزههای مختلف آموزشی، سرگرمی، ورزشی، هنری و… کاربرد فراوانی دارد و به بیننده اجازه میدهد تا فقط آن بخش از ویدئو را مشاهده کند که به آن نیاز دارد و زمان خود را با دیدن قسمتهایی از ویدئو که موردنیاز اون نیست، هدر ندهد. خلاصهسازی ویدئو را میتوانیم بهصورت زیر تعریف کنیم:
«فرایند تقطیع و فشردهسازی یک ویدئوی خام بهصورتی که اطلاعات مهم آن از بین نرود»
دانشگاه جیائو تونگ شانگهای
کاربرد خلاصهسازی در تدوین ویدئو
حتی اگر بهصورت حرفهای فعالیت تدوین ویدئو را دنبال نکردید و یا دانش گستردهای راجعبه هوش مصنوعی ندارید، احتمالا از امکانات هوش مصنوعی در شبکههای اجتماعی خود استفاده کردهاید. فیلترهای واقعیت افزوده بخش استوری اینستاگرام، کمک به یافتن ویدئوهای مورد علاقه شما در بخش Explorer، زیرنویس خودکار ویدئوهای یوتیوب و… تنها بخشی از کاربرد هوش مصنوعی در بهبود تعامل ما با محتواهای ویدئویی است که روزانه با آن سروکار داریم. هوش مصنوعی نقشی مهم و تاثیرگذار در افزایش کیفیت و اثرگذاری ویدئوها دارد و این اثرگذاری در آینده نیز بیش از پیش افزایش پیدا میکند. طی دو سال گذشته، تعدادی از شاخصترین شرکتهای فعال در زمینه توسعه برنامههای تدوین تصاویر ازجمله Adobe و Blackmagic Design از قابلیتهای هوش مصنوعی در نرمافزارهای خود استفاده کردند تا بهوسیله آن، کیفیت صوتی و بصری ویدئوها را افزایش دهند.
انواع خلاصهسازی ویدئو
خلاصهسازی ویدئو به دو صورت انجام میشود که در ادامه به بررسی آنها خواهیم پرداخت:
1. خلاصهسازی بر اساس کلیدواژه
احتمالا تا بهحال سؤالی را در گوگل مطرح کردهاید و یا به دنبال یادگیری مطلب آموزشی خاصی بودهاید و پس از جستوجو، ویدئوهای متعددی در دسترس شما قرار گرفتهاست. با پیشرفت هوش مصنوعی، نتایجی که به شما پیشنهاد میشود نیز متفاوت است و بهجای اینکه برای دریافت پاسخ سؤال خود لازم باشد یک ویدئو چندین دقیقهای را مشاهده کنید، تا از محتوای بخش کوتاهی از آن استفاده کنید، تنها بخشی که موردتوجه شماست نمایش داده میشود. در این عمل، هوش مصنوعی با استفاده از الگوریتمهای یادگیری عمیق، ویدئو را آنالیز کرده و میفهمد که هربخشی از ویدئو به چه موضوعی میپردازد. از همین رو، ویدئو را به بخشهای مختلفی تقسیم کرده و براساس نیاز بیننده، بخش خاصی را به او نمایش میدهد. انتخاب کلیدواژه مناسب توسط تهیهکننده ویدئو در تکنیک خلاصهسازی براساس کلیدواژه، نقش مهمی در بهبود عملکرد هوش مصنوعی در این فرایند ایفا میکند. برای مثال، شما یک ویدئو آموزش ریاضی تهیه کردید که در آن به تدریس موضوعاتی همچون انتگرال، مشتق و مثلثات میپردازید. اگر با انتخاب کلیدواژه مناسب، ویدئو خود را به سه بخش مجزا تقسیم کنید، هنگامیکه مخاطب در جستوجوی خود به دنبال یادگیری مبحث انتگرال میگردد، این بخش از ویدئو در دسترس او قرار میگیرد و با استفاده از تکنیک خلاصهسازی ویدئو، دیگر نیاز نیست که به تماشای کل ویدئو بنشیند.
2. خلاصهسازی براساس تصاویر
در این مدل از خلاصهسازی، ویدئو براساس ویژگیهای هر اسلاید ازجمله نور، رنگ، المانهای تصویر و… توسط هوش مصنوعی مورد بررسی قرار میگیرد و با حذف اسلایدهای مشابه و تکراری، خلاصهای از ویدئو ارائه میشود که زمان کمتری نسبت به ویدئو خام اولیه دارد و درعینحال، به مفهوم کلی محتوا آسیبی وارد نمیشود و تمامی نکات مهم و کلیدی بیان میشود. خلاصهسازی نظارتشده و غیرنظارتشده، دو روش متفاوت از خلاصهسازی براساس تصاویر هستند که در ادامه به آنها خواهیم پرداخت.
خلاصهسازی نظارتشده
این روش مستلزم آموزش الگوریتم هوش مصنوعی به کمک ویدئوهای آزمایشی است. در این مورد، ویدئوی نمونه براساس الگوهای مورد نظر نشانهگذاری میشود و ماشین از این الگوها جهت یادگیری استفاده میکند. این روش در بسیاری از ویدئوها ازجمله ویدئوهای ورزشی بسیار خوب عمل میکند. شما میتوانید لحظات بهثمررسیدن گل در بازی فوتبال را الگوگذاری کنید و به ماشین ارائه دهید. پس از ارائه چند ویدئو، ماشین میآموزد که چه زمانی گل به ثمر میرسد و ویدئوهای دریافتی را برایناساس خلاصهسازی میکند.
خلاصهسازی نظارتنشده
مدل خلاصهسازی بدون نظارت، فرایند پیچیدهتری را نسبت به مدل نظارتشده طی میکند. این روش از بافتهای تصویری جهت شناسایی و خلاصهسازی استفاده میکند و زمانی کاربرد بیشتری دارد که ویدئو از تصاویر متفاوتی استفاده شده باشد. برای مثال، در تصاویر شاهد فیلمبرداری طی زمانها و مکانهای مختلفی باشیم تا هوش مصنوعی قادر باشد تفاوت آنها را بهسادگی تشخیص دهد. در این روش از ترفند خوشهبندی تصاویر استفاده میشود.
طبق این روش، برای هر تصویر مشابه خوشهای در نظر گرفته میشود و تصاویر در خوشههای مختلف طبقهبندی میشوند. در تصویر بالا، تمامی تصاویر فردی که لباس سبز بر تن دارد، در یک خوشه قرار گرفته است و با حذف اسلایدهای اضافه، تنها بخشی از این خوشه در ویدئوی نهایی استفاده میشود. دو بخش دیگر نیز از همین منوال پیروی میکنند و درنهایت شاهد آن هستیم که تمامی بخشهای مهم ویدئوی خام اولیه در ویدئوی نهایی حفظ شده، در عین حال که بخش زیادی از تصاویر مشابه و قابل حذف، خلاصهسازی شده است.
هوش مصنوعی و تاثیر آن در خلاصهسازی ویدئو
یکی از جدید ترین کاربردهای هوش مصنوعی، خلاصهسازی ویدئو است که تاثیر مثبت زیادی بر تعامل مخاطب و محتوای ویدئویی موردنظر او دارد. با استفاده از قابلیت خلاصهسازی خودکار، بینندگان وقت کمتری را صرف رسیدن به محتوای موردنظر خود میکنند. تولیدکنندگان ویدئو نیز از این ویژگی نهایت استفاده را میبرند، چراکه مخاطبان بیشتری جذب ویدئوهای آنها میشود. خلاصهسازی ویدئو یکی از دشوارترین فعالیتهای مبتنی بر هوش مصنوعی است. آنالیز عکس و اعمال تغییر بر آن فرایند بسیار سادهتری برای ماشینها است چونکه تنها با دو بعد ثابت سروکار دارند اما زمانی که بُعد سوم و فاکتور حرکت به تصویر افزوده میشود، سختی کار چندین برابر افزایش مییابد؛ زیرا کامپیوتر باید تصاویر را به گونهای تجزیهوتحلیل کند که هر فریم از نظر نور، رنگ و فاکتورهای دیگر با فریم بعدی خود یکسان باشد. قابلیت خلاصهسازی ویدئو روزبهروز درحال پیشرفت و توسعه است و قطعا مواردی که امروزه بهعنوان خلاصهسازی با استفاده از هوش مصنوعی میشناسیم با آنچه در آینده انتظار ما را میکشد، بسیار تفاوت خواهد داشت.