فرارزولوشن هوش مصنوعی، تصاویرِ ویدئویی را بهبود می‌بخشد

تیم تحریریه
۴ مهر ۱۴۰۱

زمان مطالعه: 6 دقیقه

فرارزولوشن هوش مصنوعی از الگوریتم‌های یادگیری ماشینی استفاده می‌کند، تا تعداد پیکسل‌ها و در نتیجه، کیفیت این تصاویر را بهبود بخشد؛ چراکه تصاویر دیجیتالی تعداد ثابتی پیکسل در یک شبکه دوبُعدی دارند. به بیان دیگر، این فناوری «فرارزولوشن هوش مصنوعی» نسخه‌ای از تصویر را تولید می‌کند که جزئیات بیشتری را نشان می‌دهد و الگوریتم‌ها بهترین رنگ‌های ممکن را به پیکسل‌های اضافه‌شده اختصاص می‌دهند.

در فرارزولوشن، الگوریتم‌های یادگیری ماشینی برای ارتقای تصاویر و ویدئوهای دیجیتال به‌کار می‌روند. برای مثال، بسیاری از تلویزیون‌ها می‌توانند شبکه‌ای 3840×2160 پیکسلی را نمایش دهند که تحت عنوان 4K یا UHD نیز نامیده می‌شود (4K تعداد حدودی پیکسل‌های افقی است). این در حالی است که بیشتر سیگنال‌های تلویزیونی تنها با شبکه‌‌های 1920×1080 یا همان 1080p منتشر می‌شوند. در فرارزولوشن، الگوریتم‌های هوش مصنوعی هریک از پیکسل‌های سیگنال 1080p را به یک شبکه چهار پیکسلی تبدیل می‌کنند، تا بدین ترتیب، اطلاعات بیشتری تولید کرده و کیفیت تصویر را بالا ببرند.

فهرست مقاله پنهان

1 برنامه‌های تلویزیونی

2 تصویربرداری ماهواره‌ای

3 پزشکی

4 دوربین‌های امنیتی

5 فرارزولوشن هوش مصنوعی چطور کار می‌کند؟

6 انواع فرارزولوشن چه هستند؟

7 بزرگ‌ترین ارائه‌دهندگان فرارزولوشن هوش مصنوعی چه شرکت‌هایی هستند؟

8 ارزش حقیقی فرارزولوشن چقدر است؟

کاربردهای فرارزولوشن فراوانند؛ چراکه الگوریتم‌ها، فرارزولوشن هوش مصنوعی را در هر تصویر دیجیتالی بهبود می‌بخشند و تصاویر دیجیتالی در همه‌جا کاربرد دارند. از نمایشگرهای خانگی بگیر تا تلسکوپ‌های ناسا؛ همچنین الگوریتم‌های فرارزولوشن در دوربین‌های دیجیتال و ابزارهای پزشکی نیز به کار می‌روند و با تولید رزولوشن بالاتر، به آن دسته از عملیات‌های مهندسی، ساخت‌وساز، جراحی و غیره کمک می‌کنند که برای جمع‌آوری اطلاعات دقیق به دوربین‌ متکی هستند.

از عمده کاربردهای فرارزولوشن هوش مصنوعی می‌توان به موارد زیر اشاره کرد. در حال حاضر، فرارزولوشن هوش مصنوعی به صورت عمده در حوزه‌های زیر به‌کار می‌رود:

برنامه‌های تلویزیونی

همان‌طور که در ابتدای مقاله ذکر شد، متداول‌ترین کاربردهای فرارزولوشن در بیش‌نمونه‌برداری سیگنال‌های ویدئویی برای نمایش روی صفحات رزولوشن‌بالای تلویزیون‌هاست. نسل فعلی صفحات نمایشی، در تلویزیون‌های خانگی و در تلفن‌های همراه، رزولوشن بالاتری از تصاویر قدیمی فراهم می‌آورند. اما قبل از نمایش تصاویر، سخت‌افزارهای ویدئویی باید بیش‌نمونه‌برداری انجام دهند. برای جلوگیری از تولید پیکسل‌های مجزا و تصاویر منقطع، الگوریتم فرارزولوشن هوش مصنوعی می‌بایست تصویر ورودی را به شیوه‌ای هوشمندانه پردازش کند.

تصویربرداری ماهواره‌ای

بسیاری از ماهواره‌ها تصاویری از زمین می‌گیرند که رزولوشن چندان بالایی ندارند. حتی جدیدترین تصاویر دریافتی نیز کیفیت لازم را نشان نمی‌دهند. گاهی اوقات، متخصصان باید با داده‌های قدیمی کار کنند که با رزولوشن پایین‌تر ثبت شده‌اند. تکمیل جزئیات این تصاویر می‌تواند نقشی حیاتی در پژوهش‌ها ایفا کند. بیشتر داده‌های موجود در تصاویر ماهواره‌ای طیف گسترده‌ای از رنگ‌ها و طول‌ موج‌های گوناگون دارند که برخی با چشم غیرمسلح قابل رؤیت نیستند. الگوریتم فرارزولوشن هوش مصنوعی می‌تواند از تمام این اطلاعات استفاده کند تا آن‌چه در طیف بینایی انسان‌ها قرار دارد را ارتقاء دهد و بر کاربردهای فرارزولوشن بیفزاید.

پزشکی

با این‌که بسیاری از الگوریتم‌های فرارزولوشن با نورهای مرئی کار می‌کنند، در ارتقای جزئیات تصاویر جمع‌آوری‌شده از سایر حسگرها، همچون MRI، CT، ایکس‌ری و سونوگرافی نیز می‌توان از آن‌ها استفاده کرد.

دوربین‌های امنیتی

یکی از کاربردهای فرارزولوشن مبارزه با جرم و جنایت است. رزولوشن تصاویر دوربین‌های امنیتی باید در حد کفایت باشند، تا بتوانند در بررسی جرائم به پلیس کمک کنند. بیشتر اوقات، دوربین‌های امنیتی تصاویر ویدئویی را ضبط می‌کنند و الگوریتم‌های فرارزولوشن نیز با تکیه بر تکنیک‌های چندتصویری، رزولوشن آن‌ها را ارتقاء می‌دهند.

فرارزولوشن هوش مصنوعی چطور کار می‌کند؟

خروجی الگوریتم‌های فرارزولوشن، که با نام «بیش‌نمونه‌برداری» نیز شناخته می‌شوند، بسته به نوع الگوریتم در فرارزولوشن هوش مصنوعی متفاوت است. ساده‌ترین نوع الگوریتم‌ها به استخراج جزئیات بیشتر نمی‌پردازد و صرفاً هر پیکسل را با چهار پیکسل با همان رنگ جایگزین می‌کند. در این صورت، شبکه‌ تولیدشده بزرگ‌تر می‌شود، اما به جزئیات آن اضافه نمی‌شود.

در فرارزولوشن هوش مصنوعی، الگوریتم‌های پیشرفته‌تر مقداری جزئیات هم به این شبکه می‌افزایند. برخی الگوریتم‌های فرارزولوشن با توجه به پیکسل‌های اطراف، پیکسل‌های جدید را به شیوه‌ای جایگذاری می‌کنند که بین آن‌ها تناسب وجود داشته باشد. این الگوریتم‌ها توابع خطی را روی پیکسل‌های محلی برازش می‌دهند. سایر الگوریتم‌های فرارزولوشن نیز به دنبال تغییرات شدید رنگی بوده و با پررنگ‌تر کردن این تفاوت‌ها، تصویر را شاداب‌تر (پرحرارت‌تر) نشان می‌دهند.

در فرارزولوشن هوش مصنوعی، برخی الگوریتم‌ها تصاویر ویدئوها را رهگیری می‌کنند و با تکیه بر تغییرات جزئی فریم‌ها، اطلاعات و جزئیات بیشتری استخراج می‌کنند. بدین ترتیب، تصویر نهایی رزولوشن بالاتری داشته و در عین حال، با تصاویر متوالی ویدئوی اصلی همخوانی دارد.

فرارزولوشن یکی از موضوعات پژوهشی داغ این روزها به شمار می‌رود. بعضی از شرکت‌ها نسخه‌هایی از این فناوری را به همراه دوربین‌های خاص تولید می‌کنند و برخی دیگر به دنبال توسعه الگوریتم‌های جدید برای تازه‌ترین کاربردهای فرارزولوشن هستند.

انواع فرارزولوشن چه هستند؟

انواع فرارزولوشن را چگونه می‌توان دسته‌بندی کرد؟ برای ساخت تصاویر جدید با رزولوشن بالاتر می‌توان از رویکردهای مختلف کمک گرفت. ساده‌ترین رویکرد به افزایش پیکسل‌های تصویر می‌پردازد.

در فرارزولوشن، بسیاری از الگوریتم‌ها رزولوشن تصویر را در جهت هر محور دو برابر افزایش می‌دهند، تا در نهایت، تعداد کل پیکسل‌ها چهار برابر شود. مثالی که پیش‌تر از نمایش سیگنال‌های 1080p تلویزیونی در صفحات UHD ذکر شد نیز نمونه‌ای از همین کارکردِ فرارزولوشن است. با این حال، ابعاد تصویر لزوماً نباید دو برابر شوند.

انواع فرارزولوشن پنج گونه اصلی دارد:

الگوریتم‌ها می‌توانند هر تعداد پیکسل جدید که می‌خواهند تولید کنند. طیف گسترده‌ای از الگوریتم‌ها که اغلب در GPUها به کار می‌روند، مقیاس تصاویر را ارتقاء می‌دهند.
برخی از الگوریتم‌های تک‌تصویری، با تکیه بر یادگیری ماشینی، به بیش‌نمونه‌برداری شبکه‌ای از پیکسل‌ها (یا برآورد رزلوشن بالاتر) می‌پردازند. این الگوریتم‌ها لبه‌ها و تغییرات برجسته را شناسایی کرده و سپس با انتخاب پیکسل‌های جدید، این ویژگی‌ها را ارتقاء می‌دهند. راهکارهای درون‌یابیِ خطی ممکن است تصاویر را مات کنند، اما الگوریتم‌های پیشرفته‌تر تصاویر پرطراوت‌تر و با جزئیات بیشتری تولید می‌کنند.
برخی از الگوریتم‌های فراتفکیک‌پذیری از مجموعه‌ای حسگر استفاده می‌کنند که از چشم‌اندازهای نسبتاً متفاوت به تصویر می‌نگرند. علاوه بر حسگرها، این الگوریتم‌ها از چندین منبع نوری یا صوتی نیز استفاده می‌کنند که متناسب با طول موج مربوطه، به مقادیر جزئی، تغییر می‌کنند. این الگوریتم‌ها معمولاً در سیستم‌های فاصله‌یابی راداری و حسگرهای فراصوت، که متکی بر امواج رادیویی هستند، به کار می‌روند.
رویکرد به‌کاررفته در تصاویر ماهواره‌ای خروجی رنگ‌ها و طول ‌موج‌های مختلف را با هم ترکیب می‌کند. با توجه به این‌که رنگ‌ها خواص نوری متفاوتی دارند، این فرارزولوشن چندباندی رزولوشن تصاویر را افزایش می‌دهد. در حالت عادی، این تفاوت‌ها به وسیله‌ لنزها و حسگرهای مخصوص کاهش می‌یابند، اما الگوریتم‌های فرارزولوشن هوش مصنوعی از این تفاوت‌ها برای ارتقای کیفیت تصویر خروجی استفاده می‌کنند.
برخی از الگوریتم‌های فرارزولوشن با تصاویر چندگانه کار می‌کنند که ممکن است به صورت مستقل و به یک‌باره ثبت شده باشند و یا از سیگنال‌های ویدئویی بازیابی شده باشند. ترکیب و انطباق این تصاویر به تشخیص تغییرات شدید رنگ یا شدت کمک می‌کنند.

یکی از چالش‌های بزرگ الگوریتم‌های انواع فرارزولوشن چندتصویری، انطباق زیرپیکسلی است. تصاویر چندگانه به‌ندرت به صورت کامل با یکدیگر منطبق می‌شوند. برخی متخصصان معتقدند لرزش دوربین به این الگوریتم‌ها کمک می‌کند، چون تصاویری را به توالی اضافه می‌کند که با یکدیگر تفاوت‌های بسیار جزئی دارند؛ این تغییرات زیرپیکسلی تولید پیکسل‌های جدید را تسهیل می‌کنند.

بزرگ‌ترین ارائه‌دهندگان فرارزولوشن هوش مصنوعی چه شرکت‌هایی هستند؟

ارائه‌دهندگان فرارزولوشن متفاوتند. هم شرکت‌های بزرگ و قدیمی و هم استارتاپ‌های جدید، انواع ابزارهای فرارزولوشن هوش مصنوعی را ارائه می‌دهند و از ارائه‌دهندگان فرارزولوشن هستند. از جمله‌ قدیمی‌ترین فروشندگان و ارائه‌دهندگان فرارزولوشن می‌توان به این شرکت‌ها اشاره کرد:

شرکت گوگل از سردمداران عرصه فرارزولوشن محسوب می‌شود. فناوری‌های این شرکت با نرم‌افزارهای بینایی ماشینی همراه هستند که در گوشی‌های همراهِ پیشرفته‌ شرکت، همچون Pixel 6، نیز دیده می‌شوند. این نرم‌افزارها اطلاعات چندین تصویر را با هم ادغام می‌کنند تا به برترین فرارزولوشن ممکن دست یابند. به علاوه، یکی از پروژه‌های جدید گوگل قصد دارد با تکیه بر مدل‌های مختلف یادگیری ماشینی، پیکسل تصاویر را با ضریب 4، 16 یا حتی 64 افزایش دهد.
یکی از مهم‌ترین ارائه‌دهندگان فرارزولوشن، شرکت اپل است. با این‌که شرکت اپل الگوریتم‌های فرارزولوشن را در گوشی‌های همراهش به نمایش نگذاشته است، اختراعاتی در این حوزه به ثبت رسانده که نشان می‌دهند در آینده‌ای نزدیک، از این الگوریتم‌ها استفاده خواهد کرد. در یکی از این محصولات جدید، عملیات‌های تثبیت تصویر برای ثبت و ترکیب تصاویر چندگانه‌ای به کار می‌روند که تفاوت‌های زیرپیکسلی دارند.
شرکت ادوب در محصولات Lightroom و Photoshop خود از الگوریتم‌های فرارزولوشن در هوش مصنوعی استفاده می‌کند تا از طریق یادگیری ماشینی، بیش‌نمونه‌برداری انجام دهد. پژوهشگران شرکت ادوب توانسته‌اند با استفاده از میلیون‌ها جفت تصویر که با رزولوشن پایین و بالا ثبت شده‌اند، الگوریتمی را آموزش بدهند تا ساختارهای پیکسلی استاندارد را شناسایی کند. این الگوریتم می‌تواند رزولوشن خطی را دوبرابر کند (یا تعداد پیکسل‌ها را به چهاربرابر افزایش دهد). با این‌که این رویکرد روی تمام فرمت‌های تصویری قابل اجراست، در فایل‌های خام بیشترین اثربخشی را دارد.
شرکت‌های AMD و Nvidia در درایورهای ویدئویی خود از فناوری فرارزولوشن استفاده می‌کنند تا صفحه‌نمایش برخی از بازی‌ها را ارتقاء دهند. شیوه کارکرد این الگوریتم‌ها از سایر نمونه‌های مطرح‌شده در این مقاله متفاوت است: به جای این‌که رزولوشن خروجی دوربین‌ها را ارتقاء دهند، عملکرد سخت‌افزارهای سازنده بازی‌ها را بهبود می‌بخشند.

از نقش استارتاپ‌ها به‌عنوان ارائه‌دهندگان فرارزولوشن نیز نباید غافل شد:

شرکت Entropix پلتفرمی ساخته است که می‌تواند با استفاده از فریم‌های ویدئوها، رزولوشن تصاویر را تا 9 برابر افزایش دهد. این شرکت بر ارتقای دقت الگوریتم‌های بینایی ماشینی تمرکز دارد و در این راستا، رزولوشن تصاویری را که توسط دوربین‌های ارزان‌قیمت ثبت شده‌اند، افزایش می‌دهد. این راهکارها می‌توانند دقت خودروهای خودران، مدیریت خودکار فهرست‌های کالا و سایر موارد مشابه را با تکیه بر داده‌های خام حاصل از الگوریتم‌های بینایی ماشینی ارتقاء دهند.
شرکت Eikon Therapeutics الگوریتم‌هایی در فرارزولوشن هوش مصنوعی ساخته است که رزولوشن میکروسکوپی را در حوزه‌ داروسازی، برای مثال در فرایند کشف دارو، افزایش می‌دهند. افزایش رزولوشن به قابلیت میکروسکوپ‌ها در تشخیص اشیاء و مولکول‌های کوچک‌تر کمک می‌کند. به گفته‌ شرکت، پژوهشگران می‌توانند با کمک این فناوری، آن‌چه را تاکنون غیرممکن بوده است، مشاهده کنند.
استارتاپ‌های Photobear، DeepAI و VanceAI نرم‌افزارها و APIهای وبی می‌سازند که به عکاس‌ها کمک می‌کنند مقیاس یا کیفیت تصاویرشان را افزایش دهند. APIهای وب به عکاسان حرفه‌ای اجازه می‌دهند تا رزولوشن تصاویر را ارتقاء ببخشند و به فرارزولوشن برسند.
شرکت Phased Array (TPAC) حسگرهایی دارد که داده‌هایی خارج از طیف مرئی را جمع‌آوری می‌کنند. الگوریتم‌های فرارزولوشن این شرکت داده‌های حاصل از حسگرهای مذکور را ارتقاء می‌دهند. برای مثال، خروجی حسگرهای فراصوت به شناسایی نواقص موجود در ساختارهای فلزی و سازه‌های معماری و مکانیکی کمک می‌کنند.
شرکت‌های KP Labs و Mapscaping از فرارزولوشن برای ارتقای تصاویر ماهواره‌ای استفاده می‌کنند. فناوری این شرکت طول عمر سخت‌افزارهای قدیمی را افزایش داده و به کیفیت داده‌های قدیمی می‌افزاید.

ارزش حقیقی فرارزولوشن چقدر است؟

برخی نسبت به ارزش حقیقی فرارزولوشن تردید دارند. آیا می‌توان مطمئن بود جزئیاتی که این الگوریتم‌ها به تصاویر اضافه می‌کنند، صحیح هستند؟ حتی اگر خروجی الگوریتم‌ها مطابق با انتظارات باشد، می‌توان از دقت آن اطمینان داشت؟

علی‌رغم روش‌های علمی که پژوهشگران به کار گرفته‌اند، این ابهامات همچنان به چشم می‌خورند و ارزش حقیقی فرارزولوشن را زیر سؤال می‌برند. این آزمایشات با در دست داشتن تصاویر رزولوشن‌بالا آغاز می‌شوند. سپس رزولوشن تصاویر کاهش پیدا می‌کند و تصویر خروجی به الگوریتم‌های فرارزولوشن تغذیه می‌شود. پژوهشگران از طریق مقایسه خروجی رزولوشن‌بالای الگوریتم‌ها با تصویر رزولوشن‌بالای اصلی می‌توانند عملکرد این فناوری را مورد بررسی قرار دهند. به بیان دیگر، الگوریتم‌های فرارزولوشن بدون دسترسی به تصاویر اصلی (که رزولوشن بالا داشته‌اند)، خروجی خاصی را تولید می‌کنند. با این حال، نتایج این مقایسه‌ها مربوط به محیط آزمایشگاهی هستند و هنوز نمی‌توان مطمئن بود که این فناوری در دنیای واقعی چه عملکردی از خود نشان می‌دهد و نمی‌توان ارزش حقیقی فرارزولوشن را ندید گرفت.

این ابهامات بازتاب دانش ناکافی ما از دنیای داده‌ها و تصویربرداری است. برخی معتقدند که این الگوریتم‌ها نسخه‌ای غیرواقعی از دنیا تولید می‌کنند و با این‌که خروجی‌ها مطابق با انتظارات هستند، باید به خاطر داشته باشیم که تاکنون داده‌های واقعی از آن‌ها پشتیبانی نکرده‌اند.

با این حال، الگوریتم‌ها و مدل‌های یادگیری ماشینی خروجی تخیلی و غیرواقعی تولید نمی‌کنند، چون متکی بر قوانینی هستند که از میلیون‌ها و یا حتی میلیاردها تصویر آموزشی استخراج کرده‌اند. برای مثال، اگر الگوریتم بخواهد جزئیات تصویر موی یک نفر را اضافه کند، این کار را بر اساس آن‌چه قبلاً در مورد شکل و ساختار مو یاد گرفته است انجام می‌دهد. در واقع، خروجی الگوریتم‌ها حاصل دانش و تخصصی است که طی یک فرایند آموزشی طولانی به دست آورده‌اند و همین ارزش حقیقی فرارزولوشن را روشن می‌کند. این فناوری‌های فرارزولوشن دانشی عمیق از دنیا دارند و از آن‌ استفاده می‌کنند، تا تصمیمات آگاهانه بگیرند.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید