بهبود عملکرد رباتها با دادههای کمتر با تکنیک جدید محققان MIT و استنفورد
محققان MIT و دانشگاه استنفورد یک تکنیک جدید یادگیری ماشینی برای کنترل رباتهایی مانند پهپادها و اتومبیلهای خودران معرفی کردهاند، تا این وسایل بتوانند در محیطهایی که همواره در حال تغییر هستند، بهتر عمل نمایند.
به گزارش هوشیو، محققان نظریه کنترل و یادگیری ماشین را برای ایجاد روشی جدید بهمنظور کنترل کارآمدتر و مؤثرتر یک سیستم ترکیب کردند. این کار به آنها اجازه داد تا نحوه عملکرد سیستم را بهتر درک کنند و سیستمهای کنترلی بهتری را برای پایدارتر کردن آن طراحی نمایند.
هسته اصلی این تکنیک، ادغام ساختارهای کنترل محور در فرایند یادگیری مدل است. به این صورت که آنها کامپیوتر را وادار کردند تا ساختارهای تخصصی برای کنترل یک سیستم را بیاموزد و در عین حال نحوه عملکرد سیستم را نیز یاد بگیرد. آنها با ترکیب این اطلاعات، کنترلکنندههایی ایجاد کردند که در موقعیتهای واقعی عملکرد قابلتوجهی دارند.
در روشهای سنتی، مراحل جداگانه و خاصی برای یادگیری نحوه کنترل سیستم موردنیاز است، اما با این رویکرد، کامپیوتر بلافاصله و بهصورت خودکار یک کنترلر مؤثر را از آموختههای خود استخراج میکند. علاوه بر این، این تکنیک میتواند حتی با دادههای کمتر نیز عملکرد خوبی داشته باشد و به ویژه در محیطهایی که وضعیت بهسرعت در حال تغییر است، بسیار مفید واقع گردد.
رباتیکها میتوانند با استفاده از علم فیزیک مدلهای سادهای از رباتها بسازند، اما وقتی سیستم بیش از حد پیچیده میشود، به یادگیری ماشین روی میآورند. متأسفانه، رویکرد یادگیری ماشینی ساختارهای مهم مبتنی بر کنترل را که برای بهینهسازی عملکرد ربات مهم هستند، نادیده میگیرد.
تیم MIT و استنفورد توانستند با استفاده از ساختارهای کنترل محور در طول فرایند یادگیری ماشین بر این محدودیت غلبه کنند. این تکنیک به آنها اجازه داد تا مستقیماً کنترلکنندههایی را بر اساس آموختههای ماشین ایجاد نمایند که روشی برای درک فیزیک سیستم با یادگیری ماشینی را با یکدیگر ترکیب میکرد.
این تکنیک همچنین در استفاده از دادهها بسیار کارآمد بود و حتی زمانی که دادههای زیادی برای کار با آنها وجود نداشت نیز به عملکرد فوقالعادهای دست یافت. در مقابل، روشهای دیگری که از چندین مؤلفه آموخته شده استفاده میکردند، زمانی که دادههای زیادی در دسترس نبود، نمیتوانستند عملکرد خوبی از خود نشان دهند.