معرفی یک روبات چهارپایی که راه رفتن را یکساعته میآموزد
نوزادان زرافه یا اسب مجبورند که هرچه زودتر راه رفتن را یاد بگیرند، تا از شکارچیان دوری کنند. حیوانات در بدو تولد، شبکههایی برای هماهنگی عصبی در نخاع خود دارند. با این حال، یادگیری هماهنگی دقیق عضلات و تاندونهای پا، به زمان بیشتری نیاز دارد. در ابتدا، نوزاد حیوانات وابستگی زیادی به رفلکسهای ناشی از نخاع دارد. رفلکسهای کنترل حرکت، هرچند ابتدایی، به حیوان کمک میکنند، تا به زمین نیفتد و یا در تلاش برای راه رفتن، به خودش آسیب نرساند. حیوان آنقدر باید به تمرین کنترل دقیق عضلاتش ادامه دهد، تا سیستم عصبی بالاخره با عضلات و تاندونهای پاهایش سازگار شود. بدین ترتیب است که حیوان میتواند پابهپای حیوانات بزرگسال، راه برود و دیگر تلوتلو نخورد. پژوهشگران مؤسسه سیستمهای هوشمند مکسپلانک (MPI-IS) واقع در اشتوتگارت آلمان، نحوه راه رفتن حیوانات را مورد مطالعه قرار دادهاند. پژوهشگران روبات چهارپایی در ابعاد یک سگ ساختهاند، تا در کشف جزئیات به آنها کمک کند.
فلیکس روپرت، نویسنده اصلی مقاله و دانشجوی اسبق دکتری در گروه پژوهشی لوکوموسین دینامیک MPI-IS، توضیح میدهد: «بهعنوان مهندس و متخصص روباتیک، تصمیم گرفتیم برای یافتن پاسخ، روباتی بسازیم که رفلکسهایی شبیه حیوانات از خود نشان میدهد و از اشتباهاتش میآموزد. اگر روبات یک بار تلوتلو بخورد، اشتباهی نکرده است؛ اما اگر تکرار شود، نشاندهنده عملکرد ضعیف اوست.»
مقاله مذکور تحت عنوان Learning Plastic Matching of Robot Dynamics in Closed-loop Central Pattern Generators در ژورنال Nature Machine Learning چاپ شده است.
بهینهسازی نخاع مجازی با الگوریتم یادگیری
روبات چهارپایی که پژوهشگران ساختهاند، پس از تنها یک ساعت یادگیری، میتواند بهخوبی از مکانیک پیچیده پاهایش استفاده کند. یادگیری بر عهده یک الگوریتم بهینهسازی بیزی است: اطلاعات حسگرهای موجود در پا، با دادههای هدف تطبیق مییابند. دادههای هدف از نخاع مجازی به دست آمده و بهعنوان برنامه روبات چهارپایی عمل میکنند. روبات برای راه رفتن، اطلاعات حسی مورد انتظار و اطلاعات ارسالشده را مدام مقایسه و حلقههای رفلکس را اجرا میکند و الگوهای کنترل حرکتش را بر همین اساس تطبیق میدهد.
الگوریتم یادگیری پارامترهای کنترلی یک مولد الگوی مرکزی (CPG) را به کار میگیرد. در انسانها و حیوانات، این مولدهای مرکزی شبکههایی نورونی در نخاع هستند که بدون دریافت ورودی از مغز، به صورت دورهای، عضلات را به انقباض در میآورند. CPGها به تولید مسائل ریتمیک، همچون راه رفتن، پلک زدن یا هضم غذا کمک میکنند. رفلکسها اقداماتی غیرعمدی هستند که از مسیرهای عصبی شروع شده و حرکات را کنترل میکنند؛ این مسیرهای عصبی راه ارتباطی حسگرهای موجود در پا و نخاع هستند.
تا زمانی که نوزاد حیوان روی سطح صاف قدم بردارد، CPGها برای کنترل سیگنالهای حرکتی ناشی از نخاع کافی هستند. با این حال، یک دستانداز کافی است، تا اوضاع را تغییر دهد. رفلکسها وارد کار میشوند و الگوهای حرکتی را بهنحوی تغییر میدهند، تا حیوان به زمین نیفتد. این تغییرات لحظهای که در سیگنالهای حرکتی رخ میدهند، الاستیک یا به عبارتی، قابل ارتجاع هستند. به بیان دیگر، بعد از اختلال پیشآمده، الگوهای حرکتی به حالت اولیه خود بر میگردند. اگر علیرغم رفلکسها، حیوان در تعداد زیادی چرخه حرکتی همچنان به تلوتلو خوردن ادامه دهد، الگوهای حرکتی باید دوباره آموخته شوند و پلاستیک یا غیر قابل ارتجاع گردند. در حیوانات تازه متولدشده، CPGها در ابتدا به اندازه کافی سازگار نشدهاند و حیوان، چه روی سطح صاف و چه بامانع، تلوتلو میخورد؛ اما حیوانات خیلی زود یاد میگیرند CPG و رفلکسهایشان چطور عضلات و تاندونهای پایشان را کنترل کنند.
روبات مورتی، ساخته دیگر پژوهشگران
این نکته در مورد مورتی، روبات جدید پژوهشگران، نیز صدق میکند. روبات مورتی الگوهای حرکتیاش را سریعتر از حیوانات، یعنی تنها در عرض یک ساعت، بهینه میکند. CPG مورتی روی کامپیوتری سبک و کوچک شبیهسازی شده است که حرکت پاهای روبات را کنترل میکند. این نخاع مجازی بر پشت این روبات چهارپایی واقع شده است. طی یک ساعتی که روبات راه رفتن را میآموزد، دادههای ناشی از حسگرهای موجود در پاهای روبات مدام با دادههای پیشبینیشده در CPG مقایسه میشوند. اگر روبات تلوتلو بخورد، الگوریتم یادگیری دامنه حرکت پاها، سرعت حرکت آنها و مدت زمانی را که هر یک از پاها روی زمین قرار میگیرند، تغییر میدهد. اینکه روبات چطور میتواند از مکانیزم پاهایش استفاده کند نیز تحت تأثیر این حرکات اصلاحشده قرار میگیرد. در طول این فرایند، CPG سیگنالهای حرکتی تطبیقیافته را ارسال میکند، تا روبات نحوه راه رفتنش را بهینه کند. در این چارچوب، نخاع مجازی هیچ دانش آشکاری از طراحی پاها، موتورها و فنرهای روبات ندارد. از آنجایی که هیچ دانشی در مورد فیزیک ماشین ندارد، گفته میشود فاقد «مدل» روبات است.
روپرت توضیح میدهد: «روبات مورتی در واقع هیچ چیزی در مورد آناتومی و کارکرد پاهایش نمیداند. CPG به مانند یک هوش داخلی خودکار میماند که برای راه رفتن به کار میرود. سیگنالهای کامپیوتر، حرکات پاها را کنترل میکنند. روبات در ابتدا راه میرود و تلوتلو میخورد. دادهها از حسگرها به سمت نخاع مجازی جاری میشوند؛ نخاع مجازی دادههای حسگرها و دادههای CPG را مقایسه میکند. اگر دادههای حسگر با دادههای مورد انتظار تطبیق نداشته باشند، الگوریتم یادگیری الگو را تغییر میدهد، تا وقتی روبات بتواند بهدرستی راه برود. تغییر خروجی CPG، در حین فعال نگه داشتن رفلکسها و نظارت بر حرکت روبات، هسته اصلی فرایند یادگیری است.»
بازدهی بالای روبات مورتی با مصرف انرژی کمتر
روبات مورتی در فرایند راه رفتن، تنها 5 وات مصرف انرژی دارد و در واقع بازدهی بالای روبات مورتی چشمگیر است. روبات چهارپای صنعتی از تولیدکنندگان برجسته که با کمک کنترلگرهای پیچیده دویدن را میآموزد، مصرف انرژی بسیار بالاتری دارد. این کنترلگرها با دانش مربوط به حجم و شکل دقیق بدن روبات کدگذاری میشوند. به همین دلیل، دهها تا صدها وات انرژی نیاز دارند. هر دو نوع روبات قادرند به صورت کارآمد و پویا بدوند، اما مصرف انرژی محاسباتی در مدل پژوهشگران اشتوتگارت به مقدار چشمگیری پایینتر است. به علاوه، این دستاورد اطلاعات مهمی در مورد آناتومی حیوانات نیز فراهم آورده است.
الکساندر بادری- اسپرویتز، یکی از نویسندگان مقاله و سرپرستان گروه Dynamic Locomotion Research، اضافه میکند: «مطالعه و پژوهش در مورد نخاع حیوانات زنده کار آسانی نیست، اما میتوانیم این نخاع را در روباتها مدلسازی کنیم. آنچه میدانیم این است که CPGها در بسیاری از حیوانات وجود دارند. میدانیم رفلکسها هم نقش مهمی ایفا میکنند. اما چطور میتوانیم آنها را بهنحوی ادغام کنیم که حیوانات حرکت را با تکیه بر هر دو بیاموزند؟ این موضوع پژوهشی بنیادین، موضوعی میانرشتهای بین حوزههای روباتیک و زیستشناسی است. مدل روباتیک میتواند پاسخ به سؤالاتی را پیدا کند که علوم زیستی بهتنهایی قادر به حلشان نیستند.»
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید