چالش بینایی ماشین پیش روی توسعه هوش مصنوعی
رانندگیکردن، قدمزدن در یک جنگل و خواندن یک روزنامه، برای ما کار چندان دشواری نیست و در طول روز، فعالیتهای مختلفی را بهطور همزمان انجام میدهیم بدون اینکه با کوچکترین چالشی مواجه شویم. این روند اما برای ماشینها تا حدودی متفاوت است و انجام یک مورد از کارهای اشارهشده برای ماشینها بسیار دشوار است. طبیعی است که ما در درک دنیای اطراف خودمان بهتر از ماشینها عمل کنیم و بخش عمدهای از این تفاوت عملکرد متوجه یکی از حسهای پنجگانه انسان یعنی بینایی است.
در سالیان گذشته شاهد پیشرفت چشمگیری پیرامون فناوری «بینایی ماشین» بودهایم و بااینکه کامپیوترها توانستهاند به درک نسبی از دنیای اطراف خود برسند، اما هنوز تا رسیدن به درک محیطی همپای انسانها، راه درازی در پیش دارند. بنا به تحقیقات انجامشده، بیش از 80 درصد درک ما از دنیای اطراف توسط بینایی صورت میگیرد و تنها 20 درصد شامل 4 حس دیگر میشود و این خود بهتنهایی، اهمیت حس بینایی در درک محیط را نشان میدهد. محققان زیادی در سراسر دنیا در تلاشند تا با گسترش فناوری بینایی مصنوعی برای ماشینها، بستری را فراهم کنند تا کامپیوترها بتوانند به درک مناسبی از دنیای اطراف خود برسند.
یکی از این محققین، مایکل فلسبرگ، استاد دانشگاه لینکوپینگ و یکی از برجستهترین محققان سوئدی در بینایی کامپیوتر و هوش مصنوعی (AI) است. وی در اینباره میگوید: «فهم محیطی برای انسانها کار بسیار سادهای است، زیرا مغز انسان میتواند در کسری از ثانیه تصاویری را که از طریق چشم دریافت میکند، پردازش و به اطلاعات قابلفهم تبدیل کند و این شامل مواردی است که ما در تلاشیم برای ماشینها شبیهسازی کنیم. امروزه سیستمهایی توسعه یافتهاند که میتوانند در انجام یک عمل خاص مفید ظاهر شوند، مانند هوشهای مصنوعی بهکاررفته در خودروهای خودران که میتوانند بهخوبی راهها و اشیاء موجود در محیط را آنالیز کنند، اما در شناسایی موارد دیگر مانند متنها کاربردی ندارند. ما اگر بخواهیم در آینده با رباتهای مبتنی بر هوش مصنوعی همکاری کنیم، باید مطمئن شویم که ماشینها دقیقاً به درکی مشابه ما رسیدهباشند.»
در اواسط قرن بیستم، زمانی که مبحث بینایی ماشین مطرح شد، بسیاری از صاحبنظران معتقد بودند که درک ماشینها از محیط اطراف خود بهسادگی قابل دستیابی است و با تعبیه یک دوربین، میتوان به آنها قدرت بینایی بخشید. حال اما 60 سال از شروع تحقیقات بینایی ماشین میگذرد و این فناوری هنوز یکی از بزرگترین چالشهای پیش روی محققان هوش مصنوعی است.
مایکل فلسبرگ و همکارانش در آزمایشگاه خود تحقیقات مختلفی بر روی بینایی ماشین رباتها انجام میدهند. برای مثال، با تعبیه دوربین و حسگر بر روی ماشینهای خودران و پهپادها و قراردادن آنها در محیطی با دیوارهای بزرگ شیشهای، در تلاشند تا درک ماشینها از شیشه و محیط پشت آن را بهبود ببخشند. فلسبرگ معتقد است: «دوربین ماشینها تنها متشکل از لنزهایی است که نور را به سنسور منتقل میکند و کار اصلی پردازش در کدنویسی و الگوریتم نهفته در پردازنده ماشینهاست. درست مانند چشم انسان که تنها نور را دریافت و انتقال میدهد و پردازش تصویر در مغز انجام میشود. امروزه از روش یادگیری عمیق برای بهبود عملکرد بینایی ماشین در کامپیوترها استفاده میشود. در این روش مقدار زیادی داده در اختیار سیستم قرار میگیرد و از تجزیه، تحلیل و پردازش این تصاویر برای آموزش ماشین استفاده میشود. واقعیت آن است که ما نمیدانیم این عمل دقیقاً به چه صورت انجام میشود، همانطور که نمیدانیم یک فکر چگونه در مغز انسان شکل میگیرد. ما فقط میدانیم که ماشین امکان یادگیری از طریق دسترسی به دادههای عظیم را دارد اما اینکه چگونه این کار را انجام میدهد بر ما پوشیده است.»
اما چرا درک محیط توسط ماشین تا این حد دشوار است؟ پاسخ در قابلیت ما در انطباق سریع محیطهای مختلف و حلقه بازخورد بین قابلیت بینایی و توانایی شناختی ماست. برای مثال، ما بلافاصله بعد از دیدن یک پنجره کثیف، میتوانیم تصاویر بیرون را از آلودگیهای شیشه تفکیک کنیم و به درک درستی از منظره پشت پنجره برسیم؛ اما یک ماشین پس از فوکوس بر روی پنجره، نمیتواند منظره را بهدرستی تشخیص دهد، چراکه بخشی از تصویر توسط گردوغبار شیشه مسدود شده است.
فلسبرگ معتقد است در بعضی از موارد مانند تشخیص نور، دما و تشخیص فواصل، ماشینها از انسان توانمندتر هستند و میتواند مکمل بینایی انسان باشد اما هنوز تا زمانی که بینایی ماشین به انعطافپذیری و دقت بینایی انسان برسد، مسیر طولانی باقی مانده است. علم یک فرایند است و هر مقالهای که درباره هوش مصنوعی منتشر میشود، قطعهای از پازل بینایی ماشین را تکمیل میکند تا هدف دستیابی به ماشینهایی با درک انسانی و فراتر از آن را محقق کنند.
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید