گام بعدی هوش مصنوعی: استدلال عمیق
اندازۀ استوانهای که در سمت چپ جسم فلزی قهوهای قرار دارد، چقدر است؟حتی یک کودک شش ساله هم میتواند به سادگی به این پرسش پاسخ دهد، اما این قبیل از پرسشها خارج از محدودۀ مدلهای یادگیری عمیق سنتی هستند.
چرا یادگیری عمیق کافی نیست؟
مدلهای یادگیری عمیق عملکرد خوبی در درک روابط میان خروجیها و ورودیها دارند، اما انتظار نمیرود از این سطح برود. چه یادگیری تقویتی باشد چه یادگیری نظارتشده، ورودیها و خروجیها به روشنی تعریف میشوند و درک آنها برای مدل آسان است. اگر محققان در نظر دارند تا مدلهای هوش مصنوعی قابلیت تصمیمگیری داشته و از عقل سلیم استفاده کنند، باید زمینه را برای گسترش قوه استدلال در آنها فراهم کنند. گام بعدی هوش مصنوعی باید قابلیت تفکر انتزاعی داشته باشد.
[irp posts=”12025″]استدلال عمیق
استدلال عمیق به حوزهای اطلاق میشود که در آن، ماشینها قابلیت درک روابط تلویحی میان مفاهیم مختلف را به دست میآورند. این مثال را در نظر بگیرید: «همه حیوانات آب مینوشند. گربهها حیوان هستند.» در این مثال، رابطه تلویحی این است که همه گربهها آب مینوشند، اما این برداشت بهطور صریح ذکر نشده است. انسانها این نوع استدلال منطقی و ارتباط چیزهای مختلف با یکدیگر را به خوبی درک میکنند، اما رایانهها که بر اساس قوانین سخت و صریح عمل میکنند، به این سادگی این نوع روابط را درک نمیکنند.
پس چطور میتوان رایانهها را به قوه استدلال مجهز کرد؟
در این مقاله، محققان شرکت DeepMind توضیح میدهند که چطور توانستند یک مدل یادگیری عمیق را مجاب به پاسخگویی به برخی پرسشهای دشوار کنند. این مدل توانست با میزان دقت 96 درصد به پرسشها جواب دهد. اقدامات زیر با استفاده از سه شبکه به انجام رسید:
• 1. یک شبکه حافظه طولانی_کوتاه Long-Short-Term-Memory LSTM مدت برای پردازش پرسش
• 2. شبکه عصبی پیچشی Convolutional Neural Network برای پردازش تصاویر
• 3. شبکه رابطه Relation Network برای درک ارتباط میان اشیای مختلف
اکنون میخواهیم نقش هر کدام از اجزای فوق را در حل مسئله بررسی کنیم.
[irp posts=”10968″]پردازش زبان
شبکههای LSTM به دلیل قابلیتشان در بخاطر سپردن بخشهای قبلیِ توالی، عملکرد خوبی در درک توالیها دارند. این قابلیت میتواند در پاسخگویی به پرسشها و در کل زبان مفید باشد زیرا ابتدایِ جمله میتواند معنا یا اهمیت پایان جمله را تحت تاثیر قرار دهد. شبکههای حافظه طولانی کوتاهمدت مجموعهای از پرسشها را گردآوری کرده و کار را برای RN آسانتر میکند.
[irp posts=”20237″]پردازش تصویر
CNN عملکرد درخشانی در شناسایی ویژگی تصاویر دارند. به همین منظور، محققان از CNN برای استخراج انواع مختلف ویژگی تصاویر در قالب بردارهای نقشه ویژگی استفاده کردند. بردارهای نقشه ویژگی اجسام را بهتر و کارآمدتر از پیکسلها به نمایش میگذارند و کار را برای RN آسانتر میکنند.
درک منطقی
به محض اینکه مدل پرسش و تصویر را پردازش کرد، میتواند روابط میان اشیاء را در تصویر درک کند. این مدل میتواند از آن روابط برای جواب دادن به پرسش مورد نظر استفاده کند. شبکه RN با در نظر گرفتن روابط بالقوه میان جفت اشیاء (مثل استوانه قرمز و مکعب آبی)، یاد بگیرد که در خصوص روابط استنتاج کند. سپس این خروجیها در اختیار شبکه ادراک چندلایه Multi-Layer Perceptron قرار داده میشوند. این خروجیها خلاصه شده و به شبکۀ ادراک چندلایه نهایی ارسال میشوند تا از پاسخ خروجی گرفته شود.
شاید این فرایند قدری گیجکننده باشد. نمودار زیر مراحل مختلف این مدل را نشان میدهد.
اگرچه این مدل ساختار نسبتاً سادهای دارد، اما گامی موثر در راستای هوش مصنوعی عمومی است و زمینه را برای ماشینها فراهم میکند تا مثل انسانها فکر کنند.
[irp posts=”10909″]کاربردها
اکنون به برخی از کاربردهای بالقوه مدلهای یادگیری عمیق در صورت انجامِ استدلال توجه کنید:
1. اگر عاملها بتوانند نحوه ارتباط بخشهای مختلف محیط را درک کنند، آنها قادر خواهند بود به شکل هوشمندانهتری رفتار کنند.
2. مدلسازی شبکههای اجتماعی
3. حل مسائل انتزاعی
کلام آخر
• استدلال عمیق این فرصت را به هوش مصنوعی میدهد تا روابط انتزاعی میان چیزهای مختلف را درک کند.
• امکان تعبیۀ یک ماژول شبکه RN در مدل یادگیری عمیق نیز وجود دارد. با این کار، مدل میتواند قابلیت استدلال رابطهای داشته باشد.
• استدلال عمیق ما را یک گام به هوش مصنوعی عمومی artificial general intelligence نزدیکتر میکند.