یادگیری روبات با تقلید در محیطهای واقعی
یک روبات، فردی را در حال باز کردن در یخچال تماشا کرد؛ سپس با تحلیل دادههایی که از حرکات فرد، باز شدن در، موقعیت یخچال و متغیرهای دیگر به دست آورده بود، آماده تقلید شد. البته در ابتدا، روبات چند باری دستگیره را اشتباه گرفت یا در را با زاویه نادرست کشید؛ اما در نهایت، پس از چند ساعت تمرین، موفق شد در یخچال را باز کند.
شیکهر بال، دانشجوی دکتری دانشگاه کارنگی ملون، توضیح میدهد: «تقلید راه خوبی برای یادگیری است. یکی از مسائل حلنشده در حوزه روباتیک، این است که کاری کنیم روباتها مستقیماً با تماشای انسانها کاری را بیاموزند؛ پژوهش ما گام بزرگی در راستای تحقق این مهم برداشته است.»
بال، با همکاری دیپاک پتک و ابیناو گوپتا، استادان دانشگاه، روش جدیدی به نام WHIRL برای یادگیری روبات توسعه دهد؛ نام این روش، مخفف یادگیری روبات با تقلید از رفتارهای زنده یا طبیعی انسانها است. WHIRL الگوریتمی کارآمد برای تقلید دیداری وانشات است. این الگوریتم با تکیه بر ویدئوهایی که انسانها در آن حضور دارند، آموزش میبیند و اطلاعاتش را به مسائل جدید تعمیم میدهد. روش WHIRL به روباتها اجازه میدهد، تا انجام کارهای خانه را بیاموزند: روبات افراد را در حین انجام کارها مشاهده میکند و سپس، دادههای ویدئوی موردنیاز را جمعآوری میکند، تا در نهایت، شیوه انجام کار را یاد بگیرد.
پژوهشگران، الگوریتم مذکور و یک دوربین را در روباتی تعبیه کردند. این روبات توانست 20 مسئله را بیاموزد (از جمله باز و بسته کردن وسایلی مثل یخچال، کابینت و کشو، گذاشتن در ظروف، هل دادن صندلی پشت میز و حتی بیرون آوردن کیسه زباله از سطل). برای اینکه یادگیری روبات در مورد هر یک از این مسائل تقویت شود، روبات فردی را در حال انجام آن کار مشاهده کرد و سپس، مشغول تمرین و یادگیری شد. این پژوهش را در کنفرانس Robotics: Science and Systems منتشر کردند.
پتک میگوید: «این پروژه راه را برای ورود روباتها به خانهها هموار میکند. دیگر نیازی نیست صبر کنیم، تا روباتها برنامهنویسی شوند یا برای انجام مسائل گوناگون آموزش ببینند؛ با تکیه بر این فناوری میتوانیم یادگیری روبات را در خود محیط، آموزش و ارتقاء دهیم.»
یادگیری تقلیدی و یادگیری تقویتی روبات
در حال حاضر، برای یادگیری روبات از روش یادگیری تقلیدی یا یادگیری تقویتی روبات استفاده میشود. در یادگیری تقلیدی، انسانها به شکل دستی یک روبات را به عمل وا میدارند و به آن یاد میدهند. این فرایند را برای آموزش هر مسئله جدیدی باید چندین بار تکرار کرد، تا روبات بالاخره موفق شود. در یادگیری تقویتی روبات، روبات روی میلیونها نمونه آموزش میبیند و سپس، این آموزش را با شرایط دنیای واقعی انطباق میدهد.
هر دو رویکرد یادگیری تقلیدی و یادگیری تقویتی روبات برای یادگیری روبات در محیطهای ساختاریافته مفید هستند، اما گسترش مقیاس کاربردشان کار آسانی نیست. روش WHIRL از روی ویدئوهایی یاد میگیرد که در آنها، افراد کار خاصی را انجام میدهند. این روش قابل بسط است و محدود به یک مسئله خاص نیست. به علاوه، قابلیت کاربرد در محیط خانه را نیز دارد. پژوهشگران مشغول کار روی نسخهای از WHIRL هستند که بر اساس ویدئوهای یوتیوب و Flickr آموزش دیده است.
پیشرفتهای اخیر در عرصه بینایی کامپیوتری این دستاورد را میسر ساختهاند. کامپیوترها اکنون میتوانند با استفاده از مدلهایی که روی دادههای اینترنتی آموزش دیدهاند، حرکت در فضای سهبعدی را درک و مدلسازی کنند. پژوهشگران نیز با تکیه بر این مدلها، حرکات انسانها را درک و آموزش WHIRL را آسانتر کردهاند.
یادگیری تقلیدی و یادگیری تقویتی روبات در رویکرد WHIRL به روباتها اجازه میدهد مسائل مختلف را در محیطهای طبیعی به انجام برسانند. هیچکدام از وسایل و موقعیتهایی که در آزمایشات استفاده شدند (وسایل خانه، درها، کشوها، درب ظروف، صندلیها و کیسههای زباله)، بهنحوی دستکاری نشده بودند، تا در خصوص یادگیری روبات، متناسب با شرایط روبات باشند. اولین تلاشهای روبات در انجام مسائل به شکست منتهی شد، اما بعد از تمرین، روبات بر آنها مسلط شد. شاید روبات نتواند تمام کارها را با حرکات شبهانسانی تقلید کرده و انجام دهد، اما نباید فراموش کنیم که هدف هم این نبوده است. انسانها و روباتها هر یک اجزای متفاوتی دارند و به طرق گوناگون حرکت میکنند. آنچه اهمیت دارد این است که نتیجه نهایی یکی باشد و مسئله موردنظر با موفقیت به انجام برسد.
پتک در انتها اضافه میکند: «برای گسترش مقیاس کاربرد علوم روباتیک در دنیای واقعی، اعتبار و ثبات دادهها میبایست ارتقا یابد. خود روباتها نیز باید با تمرین، عملکردشان را در این محیطها بهتر کنند.»
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید