رباتیک عصبی-تکاملی: راهی برای پر کردن شکاف بین شبیهسازی و واقعیت
رباتیک عصبی-تکاملی Neuro-Evolutionary robotics چشماندازی جدید به مطالعه رفتارهای جمعی رباتهای گروهی فراهم میآورد. این حوزه پژوهشهای فراوانی به خود اختصاص داده است و روشها و ایدههای زیادی برای کمک به آن مطرح شدهاند؛ با این وجود، ارزیابیهای تجربی و تحلیلهای مقایسهای تا کنون نادر بودهاند.
مارو بیراتاری و همکارانش در مرکز پژوهشی IRICIA (دانشکده پلیتکنیک دانشگاه آزاد دوبروکسل Ecloe Polytechnique de Bruxelles , Universite Libre de Bruxelles) در مقالهای که در ژورنال Nature Communications منتشر کردهاند، چند مورد از محبوبترین و پیشرفتهترین روشهای عصبی-تکاملی که برای طراحی آفلاین تودههای رباتی به کار میروند را با هم مقایسه میکنند.
مارو بیراتاری در این راستا توضیح میدهد: «به کمک این روشها میتوان رفتارهای شبهانسانی در رباتها ایجاد کرد، اما تا جایی که من میدانم، رباتیک عصبی-تکاملی هنوز در دنیای واقعی به کار نرفته است.»
در همهی این فرآیندها، از الگوریتمهای تکاملی برای ساخت شبکهای عصبی تولید میشود که رباتها را کنترل میکند؛ رباتها، شبکه های عصبی هستند که ورودیشان، دریافتی سنسورها و خروجیشان، دستورات راهاندازی است. این روشها با تکیه بر شبیهسازیهای کامپیوتری، متناسب با مأموریت خاص رباتها، شبکههای عصبی تولید کنند. سپس این شبکهی عصبی را روی رباتهای فیزیکی نصب کرده و به آزمایش میگذارند.
مشکل بیشبرازش
محققان هنگام مقایسه روشهای مختلف، متوجه مشکل «بیشبرازش» شدند؛ بیشبرازش زمانی رخ میدهد که فرآیند طراحی در محیط شبیهسازی بیش از حد تخصصی میشود و شبکهی عصبی تولیدشده نمیتواند به دنیای واقعی تعمیمپذیری داشته باشد. در نتیجه، یک «شکاف واقعیتی» به وجود میآید که به تفاوت بین واقعیت و شبیهساز به کاررفته اشاره دارد. فارغ از دقت بالای شبیهساز، این شکافها اجتنابناپذیر هستند.
مارو بیراتاری توضیح میدهد: «برای مثال، اگر وظیفهی رباتها عقب و جلو رفتن بین دو ناحیه باشد، یکی از راهکارهای فرآیند تکاملی در شبیهسازی تولید شبکهای عصبی است که ربات را وامیدارد در یک مسیر دایرهای که هر دو ناحیه را پوشش میدهد، حرکت کند. این راهکار خارقالعاده است و در شبیهسازی کارآیی بالایی دارد. اما با اجرا روی رباتها، با شکست روبرو میشود؛ برای مثال، اگر شعاع واقعی (یکی از) چرخهای ربات فقط کمی با شعاع اسمی تفاوت داشته باشد، شعاع مسیر تغییر کرده و ربات دیگر نمیتواند به شکل دلخواه و پیشبینی شده در شبیهسازی، مسیر را طی کند.»
برای حل این مشکل، راهکاری وجود دارد که شاید در نگاه اول، چندان منطقی به نظر نرسد: کاهش قدرت روش طراحی. منظور به کارگیری روشی است که رفتارهای محدودی تولید میکند. محققان باید بپذیرند که با استفاده از این راهکار، نتایج کارشان در شبیهسازی افت میکند. عملکرد این روش در سطح روشهای «قدرتمند» نیست، چون نمیتواند همهی ویژگیهای شبیهساز را به کار ببرد؛ با این حال، نتیجهی نهایی عمومیتر بوده و کمتر مخصوص شبیهساز است. به همین دلیل، احتمال تعمیمپذیری آن به واقعیت بیشتر خواهد بود.
روش شکلات
روش «شکلات» مصداق خوبی از این رویکرد است. فرآیند «شکلات»، چندین سال پیش، توسط مرکز IRIDIA ارائه شد. این روش مربوط به حوزهی رباتیک عصبی-تکاملی نیست؛ اما تحت شرایط مشابه میتواند همچون روشهای تکامل عصبی، به صورت خودکار نرمافزار کنترلی برای رباتها تولید کند. «شکلات» روی ماژول نرمافزارهایی کار میکند که از قبل وجود داشته و مربوط به رفتارهای ساده هستند (برای مثال، حرکت به سمت نور، توقف، عبور از همردهها). این روش ربات را وا میدارد از یک رفتار ساده به رفتار سادهی دیگری حرکت کند (برای مثال، احاطه شدن توسط همردهها، رنگ سطح زمین).
در واقع، کاری که روش «شکلات» انجام میدهد این است که به جای کار با شبکه عصبی بسیار قدرتمندی که طیفی گسترده از رفتارهای گوناگون تولید میکند، با بلوکهای سازندهی از پیش تعریف شدهای سروکار دارد که پیچیدگی نسبتاً کمتری دارند. مفروضهی زیربنایی «شکلات» این است که فرآیند مذکور، احتمال بیشبرازش را کاهش میدهد.
به نظر شما بهترین و مفیدترین رفتاری که یک ربات میتواند آنرا مانند انسان داشته باشد، چیست؟