فرارزولوشن هوش مصنوعی، تصاویرِ ویدئویی را بهبود میبخشد
فرارزولوشن هوش مصنوعی از الگوریتمهای یادگیری ماشینی استفاده میکند، تا تعداد پیکسلها و در نتیجه، کیفیت این تصاویر را بهبود بخشد؛ چراکه تصاویر دیجیتالی تعداد ثابتی پیکسل در یک شبکه دوبُعدی دارند. به بیان دیگر، این فناوری «فرارزولوشن هوش مصنوعی» نسخهای از تصویر را تولید میکند که جزئیات بیشتری را نشان میدهد و الگوریتمها بهترین رنگهای ممکن را به پیکسلهای اضافهشده اختصاص میدهند.
در فرارزولوشن، الگوریتمهای یادگیری ماشینی برای ارتقای تصاویر و ویدئوهای دیجیتال بهکار میروند. برای مثال، بسیاری از تلویزیونها میتوانند شبکهای 3840×2160 پیکسلی را نمایش دهند که تحت عنوان 4K یا UHD نیز نامیده میشود (4K تعداد حدودی پیکسلهای افقی است). این در حالی است که بیشتر سیگنالهای تلویزیونی تنها با شبکههای 1920×1080 یا همان 1080p منتشر میشوند. در فرارزولوشن، الگوریتمهای هوش مصنوعی هریک از پیکسلهای سیگنال 1080p را به یک شبکه چهار پیکسلی تبدیل میکنند، تا بدین ترتیب، اطلاعات بیشتری تولید کرده و کیفیت تصویر را بالا ببرند.
کاربردهای فرارزولوشن فراوانند؛ چراکه الگوریتمها، فرارزولوشن هوش مصنوعی را در هر تصویر دیجیتالی بهبود میبخشند و تصاویر دیجیتالی در همهجا کاربرد دارند. از نمایشگرهای خانگی بگیر تا تلسکوپهای ناسا؛ همچنین الگوریتمهای فرارزولوشن در دوربینهای دیجیتال و ابزارهای پزشکی نیز به کار میروند و با تولید رزولوشن بالاتر، به آن دسته از عملیاتهای مهندسی، ساختوساز، جراحی و غیره کمک میکنند که برای جمعآوری اطلاعات دقیق به دوربین متکی هستند.
از عمده کاربردهای فرارزولوشن هوش مصنوعی میتوان به موارد زیر اشاره کرد. در حال حاضر، فرارزولوشن هوش مصنوعی به صورت عمده در حوزههای زیر بهکار میرود:
برنامههای تلویزیونی
همانطور که در ابتدای مقاله ذکر شد، متداولترین کاربردهای فرارزولوشن در بیشنمونهبرداری سیگنالهای ویدئویی برای نمایش روی صفحات رزولوشنبالای تلویزیونهاست. نسل فعلی صفحات نمایشی، در تلویزیونهای خانگی و در تلفنهای همراه، رزولوشن بالاتری از تصاویر قدیمی فراهم میآورند. اما قبل از نمایش تصاویر، سختافزارهای ویدئویی باید بیشنمونهبرداری انجام دهند. برای جلوگیری از تولید پیکسلهای مجزا و تصاویر منقطع، الگوریتم فرارزولوشن هوش مصنوعی میبایست تصویر ورودی را به شیوهای هوشمندانه پردازش کند.
تصویربرداری ماهوارهای
بسیاری از ماهوارهها تصاویری از زمین میگیرند که رزولوشن چندان بالایی ندارند. حتی جدیدترین تصاویر دریافتی نیز کیفیت لازم را نشان نمیدهند. گاهی اوقات، متخصصان باید با دادههای قدیمی کار کنند که با رزولوشن پایینتر ثبت شدهاند. تکمیل جزئیات این تصاویر میتواند نقشی حیاتی در پژوهشها ایفا کند. بیشتر دادههای موجود در تصاویر ماهوارهای طیف گستردهای از رنگها و طول موجهای گوناگون دارند که برخی با چشم غیرمسلح قابل رؤیت نیستند. الگوریتم فرارزولوشن هوش مصنوعی میتواند از تمام این اطلاعات استفاده کند تا آنچه در طیف بینایی انسانها قرار دارد را ارتقاء دهد و بر کاربردهای فرارزولوشن بیفزاید.
پزشکی
با اینکه بسیاری از الگوریتمهای فرارزولوشن با نورهای مرئی کار میکنند، در ارتقای جزئیات تصاویر جمعآوریشده از سایر حسگرها، همچون MRI، CT، ایکسری و سونوگرافی نیز میتوان از آنها استفاده کرد.
دوربینهای امنیتی
یکی از کاربردهای فرارزولوشن مبارزه با جرم و جنایت است. رزولوشن تصاویر دوربینهای امنیتی باید در حد کفایت باشند، تا بتوانند در بررسی جرائم به پلیس کمک کنند. بیشتر اوقات، دوربینهای امنیتی تصاویر ویدئویی را ضبط میکنند و الگوریتمهای فرارزولوشن نیز با تکیه بر تکنیکهای چندتصویری، رزولوشن آنها را ارتقاء میدهند.
فرارزولوشن هوش مصنوعی چطور کار میکند؟
خروجی الگوریتمهای فرارزولوشن، که با نام «بیشنمونهبرداری» نیز شناخته میشوند، بسته به نوع الگوریتم در فرارزولوشن هوش مصنوعی متفاوت است. سادهترین نوع الگوریتمها به استخراج جزئیات بیشتر نمیپردازد و صرفاً هر پیکسل را با چهار پیکسل با همان رنگ جایگزین میکند. در این صورت، شبکه تولیدشده بزرگتر میشود، اما به جزئیات آن اضافه نمیشود.
در فرارزولوشن هوش مصنوعی، الگوریتمهای پیشرفتهتر مقداری جزئیات هم به این شبکه میافزایند. برخی الگوریتمهای فرارزولوشن با توجه به پیکسلهای اطراف، پیکسلهای جدید را به شیوهای جایگذاری میکنند که بین آنها تناسب وجود داشته باشد. این الگوریتمها توابع خطی را روی پیکسلهای محلی برازش میدهند. سایر الگوریتمهای فرارزولوشن نیز به دنبال تغییرات شدید رنگی بوده و با پررنگتر کردن این تفاوتها، تصویر را شادابتر (پرحرارتتر) نشان میدهند.
در فرارزولوشن هوش مصنوعی، برخی الگوریتمها تصاویر ویدئوها را رهگیری میکنند و با تکیه بر تغییرات جزئی فریمها، اطلاعات و جزئیات بیشتری استخراج میکنند. بدین ترتیب، تصویر نهایی رزولوشن بالاتری داشته و در عین حال، با تصاویر متوالی ویدئوی اصلی همخوانی دارد.
فرارزولوشن یکی از موضوعات پژوهشی داغ این روزها به شمار میرود. بعضی از شرکتها نسخههایی از این فناوری را به همراه دوربینهای خاص تولید میکنند و برخی دیگر به دنبال توسعه الگوریتمهای جدید برای تازهترین کاربردهای فرارزولوشن هستند.
انواع فرارزولوشن چه هستند؟
انواع فرارزولوشن را چگونه میتوان دستهبندی کرد؟ برای ساخت تصاویر جدید با رزولوشن بالاتر میتوان از رویکردهای مختلف کمک گرفت. سادهترین رویکرد به افزایش پیکسلهای تصویر میپردازد.
در فرارزولوشن، بسیاری از الگوریتمها رزولوشن تصویر را در جهت هر محور دو برابر افزایش میدهند، تا در نهایت، تعداد کل پیکسلها چهار برابر شود. مثالی که پیشتر از نمایش سیگنالهای 1080p تلویزیونی در صفحات UHD ذکر شد نیز نمونهای از همین کارکردِ فرارزولوشن است. با این حال، ابعاد تصویر لزوماً نباید دو برابر شوند.
انواع فرارزولوشن پنج گونه اصلی دارد:
- الگوریتمها میتوانند هر تعداد پیکسل جدید که میخواهند تولید کنند. طیف گستردهای از الگوریتمها که اغلب در GPUها به کار میروند، مقیاس تصاویر را ارتقاء میدهند.
- برخی از الگوریتمهای تکتصویری، با تکیه بر یادگیری ماشینی، به بیشنمونهبرداری شبکهای از پیکسلها (یا برآورد رزلوشن بالاتر) میپردازند. این الگوریتمها لبهها و تغییرات برجسته را شناسایی کرده و سپس با انتخاب پیکسلهای جدید، این ویژگیها را ارتقاء میدهند. راهکارهای درونیابیِ خطی ممکن است تصاویر را مات کنند، اما الگوریتمهای پیشرفتهتر تصاویر پرطراوتتر و با جزئیات بیشتری تولید میکنند.
- برخی از الگوریتمهای فراتفکیکپذیری از مجموعهای حسگر استفاده میکنند که از چشماندازهای نسبتاً متفاوت به تصویر مینگرند. علاوه بر حسگرها، این الگوریتمها از چندین منبع نوری یا صوتی نیز استفاده میکنند که متناسب با طول موج مربوطه، به مقادیر جزئی، تغییر میکنند. این الگوریتمها معمولاً در سیستمهای فاصلهیابی راداری و حسگرهای فراصوت، که متکی بر امواج رادیویی هستند، به کار میروند.
- رویکرد بهکاررفته در تصاویر ماهوارهای خروجی رنگها و طول موجهای مختلف را با هم ترکیب میکند. با توجه به اینکه رنگها خواص نوری متفاوتی دارند، این فرارزولوشن چندباندی رزولوشن تصاویر را افزایش میدهد. در حالت عادی، این تفاوتها به وسیله لنزها و حسگرهای مخصوص کاهش مییابند، اما الگوریتمهای فرارزولوشن هوش مصنوعی از این تفاوتها برای ارتقای کیفیت تصویر خروجی استفاده میکنند.
- برخی از الگوریتمهای فرارزولوشن با تصاویر چندگانه کار میکنند که ممکن است به صورت مستقل و به یکباره ثبت شده باشند و یا از سیگنالهای ویدئویی بازیابی شده باشند. ترکیب و انطباق این تصاویر به تشخیص تغییرات شدید رنگ یا شدت کمک میکنند.
یکی از چالشهای بزرگ الگوریتمهای انواع فرارزولوشن چندتصویری، انطباق زیرپیکسلی است. تصاویر چندگانه بهندرت به صورت کامل با یکدیگر منطبق میشوند. برخی متخصصان معتقدند لرزش دوربین به این الگوریتمها کمک میکند، چون تصاویری را به توالی اضافه میکند که با یکدیگر تفاوتهای بسیار جزئی دارند؛ این تغییرات زیرپیکسلی تولید پیکسلهای جدید را تسهیل میکنند.
بزرگترین ارائهدهندگان فرارزولوشن هوش مصنوعی چه شرکتهایی هستند؟
ارائهدهندگان فرارزولوشن متفاوتند. هم شرکتهای بزرگ و قدیمی و هم استارتاپهای جدید، انواع ابزارهای فرارزولوشن هوش مصنوعی را ارائه میدهند و از ارائهدهندگان فرارزولوشن هستند. از جمله قدیمیترین فروشندگان و ارائهدهندگان فرارزولوشن میتوان به این شرکتها اشاره کرد:
- شرکت گوگل از سردمداران عرصه فرارزولوشن محسوب میشود. فناوریهای این شرکت با نرمافزارهای بینایی ماشینی همراه هستند که در گوشیهای همراهِ پیشرفته شرکت، همچون Pixel 6، نیز دیده میشوند. این نرمافزارها اطلاعات چندین تصویر را با هم ادغام میکنند تا به برترین فرارزولوشن ممکن دست یابند. به علاوه، یکی از پروژههای جدید گوگل قصد دارد با تکیه بر مدلهای مختلف یادگیری ماشینی، پیکسل تصاویر را با ضریب 4، 16 یا حتی 64 افزایش دهد.
- یکی از مهمترین ارائهدهندگان فرارزولوشن، شرکت اپل است. با اینکه شرکت اپل الگوریتمهای فرارزولوشن را در گوشیهای همراهش به نمایش نگذاشته است، اختراعاتی در این حوزه به ثبت رسانده که نشان میدهند در آیندهای نزدیک، از این الگوریتمها استفاده خواهد کرد. در یکی از این محصولات جدید، عملیاتهای تثبیت تصویر برای ثبت و ترکیب تصاویر چندگانهای به کار میروند که تفاوتهای زیرپیکسلی دارند.
- شرکت ادوب در محصولات Lightroom و Photoshop خود از الگوریتمهای فرارزولوشن در هوش مصنوعی استفاده میکند تا از طریق یادگیری ماشینی، بیشنمونهبرداری انجام دهد. پژوهشگران شرکت ادوب توانستهاند با استفاده از میلیونها جفت تصویر که با رزولوشن پایین و بالا ثبت شدهاند، الگوریتمی را آموزش بدهند تا ساختارهای پیکسلی استاندارد را شناسایی کند. این الگوریتم میتواند رزولوشن خطی را دوبرابر کند (یا تعداد پیکسلها را به چهاربرابر افزایش دهد). با اینکه این رویکرد روی تمام فرمتهای تصویری قابل اجراست، در فایلهای خام بیشترین اثربخشی را دارد.
- شرکتهای AMD و Nvidia در درایورهای ویدئویی خود از فناوری فرارزولوشن استفاده میکنند تا صفحهنمایش برخی از بازیها را ارتقاء دهند. شیوه کارکرد این الگوریتمها از سایر نمونههای مطرحشده در این مقاله متفاوت است: به جای اینکه رزولوشن خروجی دوربینها را ارتقاء دهند، عملکرد سختافزارهای سازنده بازیها را بهبود میبخشند.
از نقش استارتاپها بهعنوان ارائهدهندگان فرارزولوشن نیز نباید غافل شد:
- شرکت Entropix پلتفرمی ساخته است که میتواند با استفاده از فریمهای ویدئوها، رزولوشن تصاویر را تا 9 برابر افزایش دهد. این شرکت بر ارتقای دقت الگوریتمهای بینایی ماشینی تمرکز دارد و در این راستا، رزولوشن تصاویری را که توسط دوربینهای ارزانقیمت ثبت شدهاند، افزایش میدهد. این راهکارها میتوانند دقت خودروهای خودران، مدیریت خودکار فهرستهای کالا و سایر موارد مشابه را با تکیه بر دادههای خام حاصل از الگوریتمهای بینایی ماشینی ارتقاء دهند.
- شرکت Eikon Therapeutics الگوریتمهایی در فرارزولوشن هوش مصنوعی ساخته است که رزولوشن میکروسکوپی را در حوزه داروسازی، برای مثال در فرایند کشف دارو، افزایش میدهند. افزایش رزولوشن به قابلیت میکروسکوپها در تشخیص اشیاء و مولکولهای کوچکتر کمک میکند. به گفته شرکت، پژوهشگران میتوانند با کمک این فناوری، آنچه را تاکنون غیرممکن بوده است، مشاهده کنند.
- استارتاپهای Photobear، DeepAI و VanceAI نرمافزارها و APIهای وبی میسازند که به عکاسها کمک میکنند مقیاس یا کیفیت تصاویرشان را افزایش دهند. APIهای وب به عکاسان حرفهای اجازه میدهند تا رزولوشن تصاویر را ارتقاء ببخشند و به فرارزولوشن برسند.
- شرکت Phased Array (TPAC) حسگرهایی دارد که دادههایی خارج از طیف مرئی را جمعآوری میکنند. الگوریتمهای فرارزولوشن این شرکت دادههای حاصل از حسگرهای مذکور را ارتقاء میدهند. برای مثال، خروجی حسگرهای فراصوت به شناسایی نواقص موجود در ساختارهای فلزی و سازههای معماری و مکانیکی کمک میکنند.
- شرکتهای KP Labs و Mapscaping از فرارزولوشن برای ارتقای تصاویر ماهوارهای استفاده میکنند. فناوری این شرکت طول عمر سختافزارهای قدیمی را افزایش داده و به کیفیت دادههای قدیمی میافزاید.
ارزش حقیقی فرارزولوشن چقدر است؟
برخی نسبت به ارزش حقیقی فرارزولوشن تردید دارند. آیا میتوان مطمئن بود جزئیاتی که این الگوریتمها به تصاویر اضافه میکنند، صحیح هستند؟ حتی اگر خروجی الگوریتمها مطابق با انتظارات باشد، میتوان از دقت آن اطمینان داشت؟
علیرغم روشهای علمی که پژوهشگران به کار گرفتهاند، این ابهامات همچنان به چشم میخورند و ارزش حقیقی فرارزولوشن را زیر سؤال میبرند. این آزمایشات با در دست داشتن تصاویر رزولوشنبالا آغاز میشوند. سپس رزولوشن تصاویر کاهش پیدا میکند و تصویر خروجی به الگوریتمهای فرارزولوشن تغذیه میشود. پژوهشگران از طریق مقایسه خروجی رزولوشنبالای الگوریتمها با تصویر رزولوشنبالای اصلی میتوانند عملکرد این فناوری را مورد بررسی قرار دهند. به بیان دیگر، الگوریتمهای فرارزولوشن بدون دسترسی به تصاویر اصلی (که رزولوشن بالا داشتهاند)، خروجی خاصی را تولید میکنند. با این حال، نتایج این مقایسهها مربوط به محیط آزمایشگاهی هستند و هنوز نمیتوان مطمئن بود که این فناوری در دنیای واقعی چه عملکردی از خود نشان میدهد و نمیتوان ارزش حقیقی فرارزولوشن را ندید گرفت.
این ابهامات بازتاب دانش ناکافی ما از دنیای دادهها و تصویربرداری است. برخی معتقدند که این الگوریتمها نسخهای غیرواقعی از دنیا تولید میکنند و با اینکه خروجیها مطابق با انتظارات هستند، باید به خاطر داشته باشیم که تاکنون دادههای واقعی از آنها پشتیبانی نکردهاند.
با این حال، الگوریتمها و مدلهای یادگیری ماشینی خروجی تخیلی و غیرواقعی تولید نمیکنند، چون متکی بر قوانینی هستند که از میلیونها و یا حتی میلیاردها تصویر آموزشی استخراج کردهاند. برای مثال، اگر الگوریتم بخواهد جزئیات تصویر موی یک نفر را اضافه کند، این کار را بر اساس آنچه قبلاً در مورد شکل و ساختار مو یاد گرفته است انجام میدهد. در واقع، خروجی الگوریتمها حاصل دانش و تخصصی است که طی یک فرایند آموزشی طولانی به دست آوردهاند و همین ارزش حقیقی فرارزولوشن را روشن میکند. این فناوریهای فرارزولوشن دانشی عمیق از دنیا دارند و از آن استفاده میکنند، تا تصمیمات آگاهانه بگیرند.
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید