
الگوریتم های بینایی کامپیوتری با داده های محدود و روشی که به آموزش آنها کمک میکند
محققان Skoltech روش جدیدی برای آموزش الگوریتم های بینایی کامپیوتری با داده های محدود یافتهاند تا بتوانند تصاویر ماهوارهای از سطح زمین را با دقت بیشتری پردازش کنند. این امر باعث میشود مسائل مختلف در حوزه سنجش از دور را برای ماشینها راحتتر شده و درنتیجه استفاده از داده ها آنها نیز تسهیل شود. مقالهای که به تشریح نتایج جدید این روش میپردازد در مجله Remote Sensing منتشر شد.
مدتی است که محققان از تکنیکهای بینایی کامپیوتر و یادگیری ماشین برای کمک به نظارت بر محیط استفاده میکنند. حل مسائلی که ممکن است خستهکننده به نظر برسند و احتمال خطای انسانی در آنها بالا باشد، معمولاً برای الگوریتمها بسیار آسان هستند. اما قبل از آن که شبکه عصبی بتواند با تفاوت بین انواع درختان در یک منطقه جنگلی را تشخیص دهد، باید آموزش ببیند و اینجاست که با چالش مواجه میشویم.
رزولوشن محدود تصاویر ماهوارهای
تصاویر ماهوارهای عکسهای معمولی گرفتهشده با تلفن همراه نیستند و نمیتوان در هر ثانیه دهها عکس گرفت. از هر مدار میتوان بینهایت عکس گرفت اما رزولوشن این تصاویر محدود است و ابرهایی که همیشه در آسمان وجود دارند میتوانند مانع عکسبرداری شوند. بنابراین، به دست آوردن تصاویر دارای برچسب خوب و به تعداد کافی برای آموزش شبکه عصبی میتواند زمانبر و دردسرساز باشد. به همین دلیل نیز دانشمندان و مهندسان راهحلهایی برای دادهافزایی طراحی میکنند تا بتوان تصاویر بیشتری ایجاد کرد.
سرگئی نستروک، دانشجوی دکترا در موسسه Skoltech و نویسنده مقاله آموزش الگوریتم های بینایی کامپیوتری با داده های محدود توضیح میدهد: « شبکههای عصبی بسیار قدرتمند هستند، اما برای دستیابی به نتایج عالی، دادههای آموزشی زیادی میطلبند. متأسفانه، در عمل، ما معمولاً داده کافی نداریم. برای غلبه بر این مسئله، دانشمندان داده از تکنیکهای مختلفی استفاده میکنند که به طور مصنوعی حجم دیتاست را افزایش میدهند. یکی از محبوبترین این روشها، افزایش تصویر نام دارد. این روش تصاویر تبدیل میکند تا تنوع بیشتری در دیتاست ایجاد شود.»
پروفسور Skoltech ایوان اوسلدتس و همکارانش یک روش دادهافزایی به نام MixChannel برای تصاویر ماهوارهای چند طیفی طراحی کردندهاند که باندهای تصویر اصلی را با همان باندها از تصاویری که در تاریخ دیگری از همان منطقه گرفته شدهاند، جایگزین میکند.
MixChannel، روش جدید دادهافزایی
اسوتلانا الاریونوا که یکی از نویسندگان مقاله آموزش الگوریتم های بینایی کامپیوتری با داده های محدود است، میگوید: «استفاده از روشهای تصویرافزایی برای تصاویر RGB عمومی آسان است. دادههای چند طیفی بسیار پیچیدهاند و تا به حال، هیچ روش کارآمدی برای افزایش شمار آنها وجود نداشته است. اما MixChannel روشی جدید برای دادهافزایی است که برای کار با دادههای چند طیفی طراحی شده است»
تیم طراح این روش برای آموزش یک شبکه عصبی کانولوشنی که هدفش دستهبندی این جنگلهاست از تصاویر ماهوارهای Sentinel-2 که از جنگلهای مخروطی در منطقه آرخانگلسک در روسیه تهیه شده بود، استفاده کردند: «روشی ساده برای آموزش مدل دستهبندی CNN، جمعآوری مجموعهای از تصاویر ماهوارهای موجود از یک قلمرو معین در طی یک دوره پوشش گیاهی فعال است. دیتاست آموزشی با استفاده از یک بستهداده تصادفی از یک تصویر بزرگ ساخته میشود. اگر برای آزمون مدل حاصله از تصویری که در تاریخی گرفته شده که در دیتاست آموزشی موجود نیست، استفاده کنیم، ممکن است دقت مدل به طور چشمگیری کاهش یابد.»
از آنجا که در منطقه آرخانگلسک هوا کاملاً ابری است، تعداد تصاویر ماهوارهای رضایتبخش محدود بود و محققین در نهایت شش عکس قابلقبول در دست داشتند. اما با وجود حجم کم نمونه، وقتی سه شبکه عصبی مختلف این رویکرد جدید آزمون شدند، عملکرد بهتری نسبت به راهحلهای پیشرفته قبلی نشان دادند و همانطور که نویسندگان خاطرنشان کردهاند، با ادغام این روش با روشهای دیگر دادهافزایی میتوان دادههای آموزشی بیشتری نیز تولید کرد.
سایر مسائل مرتبط با سنجش از راه دور که این روش میتواند در حل آنها کمک کند عبارتند از: مطالعات زیست محیطی و کشاورزی دقیق. اساساً هر زمان که دادههای ماهوارهای دردسترس شما رزولوشن مکانی متوسط داشته باشند و تصاویر زیادی نداشته باشید، این روش به کار شما خواهد آمد.
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید