یادگیری روبات با تقلید در محیط‌های واقعی

تیم تحریریه
۸ مرداد ۱۴۰۱

زمان مطالعه: 2 دقیقه

یک روبات، فردی را در حال باز کردن در یخچال تماشا کرد؛ سپس با تحلیل داده‌هایی که از حرکات فرد، باز شدن در، موقعیت یخچال و متغیرهای دیگر به دست آورده بود، آماده‌ تقلید شد. البته در ابتدا، روبات چند باری دستگیره را اشتباه گرفت یا در را با زاویه نادرست کشید؛ اما در نهایت، پس از چند ساعت تمرین، موفق شد در یخچال را باز کند.

شیکهر بال، دانشجوی دکتری دانشگاه کارنگی‌ ملون، توضیح می‌دهد: «تقلید راه خوبی برای یادگیری است. یکی از مسائل حل‌نشده در حوزه روباتیک، این است که کاری کنیم روبات‌ها مستقیماً با تماشای انسان‌ها کاری را بیاموزند؛ پژوهش ما گام بزرگی در راستای تحقق این مهم برداشته است.»

بال، با همکاری دیپاک پتک و ابیناو گوپتا، استادان دانشگاه، روش جدیدی به نام WHIRL برای یادگیری روبات‌ توسعه دهد؛ نام این روش، مخفف یادگیری روبات‌ با تقلید از رفتارهای زنده یا طبیعی انسان‌ها است. WHIRL الگوریتمی کارآمد برای تقلید دیداری وان‌شات است. این الگوریتم با تکیه بر ویدئوهایی که انسان‌ها در آن حضور دارند، آموزش می‌بیند و اطلاعاتش را به مسائل جدید تعمیم می‌دهد. روش WHIRL به روبات‌ها اجازه می‌دهد، تا انجام کارهای خانه را بیاموزند: روبات افراد را در حین انجام کارها مشاهده می‌کند و سپس، داده‌های ویدئوی موردنیاز را جمع‌آوری می‌کند، تا در نهایت، شیوه‌ انجام کار را یاد بگیرد.

پژوهشگران، الگوریتم مذکور و یک دوربین را در روباتی تعبیه کردند. این روبات توانست 20 مسئله را بیاموزد (از جمله باز و بسته کردن وسایلی مثل یخچال، کابینت و کشو، گذاشتن در ظروف، هل دادن صندلی پشت میز و حتی بیرون آوردن کیسه زباله از سطل). برای اینکه یادگیری روبات در مورد هر یک از این مسائل تقویت شود، روبات فردی را در حال انجام آن کار مشاهده کرد و سپس، مشغول تمرین و یادگیری شد. این پژوهش را در کنفرانس Robotics: Science and Systems منتشر کردند.

پتک می‌گوید: «این پروژه راه را برای ورود روبات‌ها به خانه‌ها هموار می‌کند. دیگر نیازی نیست صبر کنیم، تا روبات‌ها برنامه‌نویسی شوند یا برای انجام مسائل گوناگون آموزش ببینند؛ با تکیه بر این فناوری می‌توانیم یادگیری روبات‌ را در خود محیط، آموزش و ارتقاء دهیم.»

یادگیری تقلیدی و یادگیری تقویتی روبات

در حال حاضر، برای یادگیری روبات‌ از روش یادگیری تقلیدی یا یادگیری تقویتی روبات استفاده می‌شود. در یادگیری تقلیدی، انسان‌ها به شکل دستی یک روبات را به عمل وا می‌دارند و به آن یاد می‌دهند. این فرایند را برای آموزش هر مسئله‌ جدیدی باید چندین بار تکرار کرد، تا روبات بالاخره موفق شود. در یادگیری تقویتی روبات، روبات روی میلیون‌ها نمونه آموزش می‌بیند و سپس، این آموزش را با شرایط دنیای واقعی انطباق می‌دهد.

هر دو رویکرد یادگیری تقلیدی و یادگیری تقویتی روبات برای یادگیری روبات‌ در محیط‌های ساختاریافته مفید هستند، اما گسترش مقیاس کاربردشان کار آسانی نیست. روش WHIRL از روی ویدئوهایی یاد می‌گیرد که در آن‌ها، افراد کار خاصی را انجام می‌دهند. این روش قابل ‌بسط است و محدود به یک مسئله‌ خاص نیست. به علاوه، قابلیت کاربرد در محیط‌ خانه را نیز دارد. پژوهشگران مشغول کار روی نسخه‌ای از WHIRL هستند که بر اساس ویدئوهای یوتیوب و Flickr آموزش دیده است.

پیشرفت‌های اخیر در عرصه بینایی کامپیوتری این دستاورد را میسر ساخته‌اند. کامپیوترها اکنون می‌توانند با استفاده از مدل‌هایی که روی داده‌های اینترنتی آموزش دیده‌اند، حرکت در فضای سه‌بعدی را درک و مدلسازی کنند. پژوهشگران نیز با تکیه بر این مدل‌ها، حرکات انسان‌ها را درک و آموزش WHIRL را آسان‌تر کرده‌اند.

یادگیری تقلیدی و یادگیری تقویتی روبات در رویکرد WHIRL به روبات‌ها اجازه می‌دهد مسائل مختلف را در محیط‌های طبیعی به انجام برسانند. هیچ‌کدام از وسایل و موقعیت‌هایی که در آزمایشات استفاده شدند (وسایل خانه، درها، کشوها، درب ظروف، صندلی‌ها و کیسه‌های زباله)، به‌نحوی دستکاری نشده بودند، تا در خصوص یادگیری روبات، متناسب با شرایط روبات باشند. اولین تلاش‌های روبات در انجام مسائل به شکست منتهی شد، اما بعد از تمرین، روبات بر آن‌ها مسلط شد. شاید روبات نتواند تمام کارها را با حرکات شبه‌انسانی تقلید کرده و انجام دهد، اما نباید فراموش کنیم که هدف هم این نبوده است. انسان‌ها و روبات‌ها هر یک اجزای متفاوتی دارند و به طرق گوناگون حرکت می‌کنند. آنچه اهمیت دارد این است که نتیجه‌ نهایی یکی باشد و مسئله‌ موردنظر با موفقیت به انجام برسد.

پتک در انتها اضافه می‌کند: «برای گسترش مقیاس کاربرد علوم روباتیک در دنیای واقعی، اعتبار و ثبات داده‌ها می‌بایست ارتقا یابد. خود روبات‌ها نیز باید با تمرین، عملکردشان را در این محیط‌ها بهتر کنند.»

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید