پیش بینی موقعیت های چند عاملی توسط خودروهای هوشمند
بهتازگی پیش بینی موقعیت های چندعاملی توسط خودروهای هوشمند، محقق شده است؛ خودروهای خودران، با کمک سیستم جدید یادگیری ماشینی، میتوانند حرکات بعدی رانندگان خودروهای اطراف، عابران پیاده و دوچرخه/موتورسواران را در لحظه پیشبینی کنند.
برجستهترین مانعی که پیش روی حرکت خودروهای تماماً خودران در سطح شهر وجود دارد، انسانها هستند.
اگر رباتی بخواهد با حفظ ایمنی، خودرو را در مرکز شهری شلوغ و بزرگ براند، باید بتواند حرکت بعدی رانندگان، عابران پیاده و دوچرخه/موتورسواران اطراف را پیشبینی کند. پیش بینی موقعیت های چندعاملی توسط خودروهای هوشمند، تنها راه اعتماد به آنها به عنوان سیستمهای خودکار است.
با اینحال، پیشبینی رفتار مسئلهی آسانی نیست. از طرف دیگر، راهکارهای کنونی هوش مصنوعی یا بسیار سادهانگارانه هستند (فرض را بر این میگذارند که عابران پیاده در مسیری مستقیم راه میروند)، یا بسیار محافظهکار (برای اجتناب از عابران پیاده، اصلاً ماشین را به حرکت در نمیآورند) و یا اینکه تنها حرکات یک عامل را پیشبینی میکنند (در حالیکه در هر لحظه، کاربران متعددی در مسیر حضور دارند).
برای رفع این چالش، پژوهشگران MIT راهکاری ساده ارائه دادهاند که طی آن، مسئله پیشبینی رفتار چندعاملی به مسائل کوچکتر تقسیم میشود و سپس، هر یک از آنها به صورت مجزا مورد بررسی قرار میگیرند؛ در نتیجه، کامپیوتر میتواند به صورت لحظهای مسئله را حل کند.
این چارچوب جدید در ابتدا روابط بین دو کاربر (دو عامل حاضر در جاده) را، در مورد اینکه حق تقدم با کیست، حدس میزند. سپس از این روابط برای پیشبینی موقعیت های چند عاملی توسط خودروهای هوشمند استفاده میکند.
نتیجه آزمایش این چارچوب روی دیتاست عظیم شرکت Waymo نشان داده است که دقت آن از سایر مدلهای یادگیری ماشینی بالاتر است. به علاوه، از آنجایی که مسئله به اجزای کوچکتر تقسیم میشود، حافظه کمتری لازم است.
چین سایرس هوانگ، یکی از نویسندگان ارشد مقاله، توضیح میدهد: «ایدهی زیربنایی خلق این تکنیک بسیار شهودی بوده است و با اینکه پیش از این به آن پرداخته نشده بود، اکنون دریافتهایم که نتایج خوبی به دست میدهد. سادگی این تکنیک نقطهقوت آن محسوب میشود. در حال حاضر، مشغول مقایسه با سایر مدلها هستیم، از جمله مدل Waymo که پیشروی این عرصه است و تا کنون، مدل ما برترین عملکرد را داشته است. پس میتوانیم بگوییم پتانسیل بالایی برای پیشرفت دارد.» هوانگ دانشجوی مقطع تحصیلات تکمیلی دانشکده هوانوردی و فضانوردی و دستیار پژوهشی برایان ویلیامز است که خود، استاد هوانوردی و فضانوردی و عضو آزمایشگاه علوم کامپیوتر و هوش مصنوعی (CSAIL) میباشد.
سایر پژوهشگرانی که در این مقاله با هوانگ و ویلیامز همکاری داشتهاند، عبارتاند از: کیائو سان، جانرو گوو و هانگ ژائو از دانشگاه چینهوا هستند. این پژوهش در کنفرانس «بینایی کامپیوتری و تشخیص الگو» ارائه خواهد شد.
چندین مدل کوچک
تکنیک جدید، که N2I نام دارد، دو ورودی دریافت میکند: مسیر قبلی خودروها، عابران پیاده و دوچرخه/موتورسواران حاضر در جریان ترافیک که در نقاطی همچون چهارراهها با هم تعامل دارند و همچنین، نقشهای با موقعیت مکانی خیابانها و غیره.
یک مدل پیشبین روابط با تکیه بر این اطلاعات، استنتاج میکند کدام یکی از دو عامل حق تقدم را دارند. بدین ترتیب، یکی از عاملها کسی است که اجازه عبور به دیگری میدهد و دیگری کسی است که عبور میکند. سپس یک مدل پیشبین نهایی، مسیر عاملی که عبور کرده است را پیشبینی میکند، چون رفتارش مستقل است. با استفاده از این مدل، پیش بینی موقعیت چند عاملی توسط خودروهای هوشمند، محقق خواهد شد.
یک مدل پیشبین شرطی پیشبینی میکند عاملی که به دیگری اجازه عبور داده است، چه رفتاری از خود نشان میدهد. سیستم چندین مسیر متفاوت برای هر دو عامل پیشبینی و احتمال هریک از این مسیرها را به صورت مستقل محاسبه میکند؛ سپس، شش موردی که محتملتر هستند را انتخاب میکند.
خروجی M2I، پیشبینی نحوه حرکت عاملها در طول هشت ثانیه بعدی است. طی یک آزمایش، M2I باعث شد خودرو سرعتش را کاهش دهد تا عابر پیاده بتواند از خیابان رد شود و سپس با خالی شدن مسیر، سرعتش را بالا ببرد. در نمونهای دیگر، خودرو قبل از ورود به خیابان اصلی، منتظر ماند تا چند خودرو عبور کنند.
پژوهش مقدماتی بر تعاملات بین دو عامل تمرکز داشته است؛ با این حال، M2I توانست روابط میان چندین عامل را استنتاج کرده و سپس با ایجاد ارتباط میان چندین پیشبین نهایی و شرطی، مسیر عاملها را حدس بزند.
آزمایش در شرایط واقعی
پژوهشگران برای آموزش مدل از دیتاست Waymo Open Motion استفاده کردهاند که شامل میلیونها موقعیت واقعی با حضور خودرو، عابر پیاده و دوچرخه/موتورسوار میباشد. ثبت این تصاویر بر عهده حسگرهای لیدار و دوربینهای نصب شده روی خودروهای خودران این شرکت است. مدل با تمرکز بر موقعیتهای چندعاملی آزمایش شده است.
پیش بینی موقعیت های چند عاملی توسط خودروهای هوشمند، با استفاده از مدل M21 تاکنون موفق عمل کرده است. برای تعیین میزان دقت مدل، شش نمونه پیشبینی آن (همراه سطح اطمینان) با مسیر واقعی خودروها، دوچرخه/موتورسواران و عابران پیاده مقایسه شد. نتایج آزمایش از دقت بالای این مدل و برتری آن نسبت به مدلهای خط پایه حکایت داشتند. M2I کمترین نرخ همپوشانی را داشت؛ اگر دو مسیر همپوشانی داشته باشند، تصادف رخ میدهد.
هوانگ میگوید: «در این پژوهش، به جای ساخت مدلهای پیچیدهتر، سعی کردیم رویکردی را در پیش بگیریم که به نحوه تفکر و استدلال انسانها هنگام تعامل با دیگران شباهت بیشتری داشته باشد. انسانها همهی ترکیبهایی ممکن از موقعیتها و رفتارهای آینده را در تصمیمات و استدلال خود دخیل نمیکنند و به همین دلیل است که با سرعت تصمیم میگیرند.»
مزیت دیگر M2I این است که با تجزیهی مسائل به قطعات کوچکتر، درک تصمیمگیری مدل برای کاربران را آسانتر میکند. در نتیجه، در بلندمدت، اعتماد کاربران به خودروهای خودران بیشتر میشود.
پیش بینی موقعیت های چندعاملی توسط خودروهای هوشمند در مسیر پیشرفت قرار دارد و ممکن است پس از این همه محدودیتهای استفاده از آن برطرف شود. مثلاً چارچوب مذکور نمیتواند در موقعیتهایی که در آنها دو عامل به صورت دوطرفه بر یکدیگر تأثیر میگذارند، کاربرد داشته باشد؛ به عنوان مثال میتوان به موقعیتی اشاره کرد که در چهارراه، دو خودرو به آرامی رو به جلو حرکت میکنند، چون رانندگان نمیدانند چه کسی باید به دیگری اجازه عبور دهد. پژوهشگران قصد دارند این محدودیت را رفع کرده و مدل را برای شبیهسازی تعاملات واقعگرایانه بین کاربران مسیرها استفاده کنند؛ این قابلیت در اعتبارسنجی الگوریتمهای برنامهریزی برای خودروهای خودران و همچنین در ایجاد دیتاستهای ساختگی بزرگ کاربرد خواهد داشت.
ماسایوشی تامیزوکا، استاد مهندسی مکانیک دانشگاه کالیفرنیا و وی ژان، طی ایمیلی بیان کردهاند: «پیشبینی مسیر و تصمیمات چند عاملی که در جادهها با هم تعامل دارند، امری بسیار چالشبرانگیز است و با اینکه تا به حال به اندازهی کافی مورد توجه قرار نگرفته است، برای خودکارسازی کامل خودروها در موقعیتهای پیچیده ضروری است. M2I روشی بسیار امیدوارکننده برای پیشبینی ارائه میدهد که در آن، مدل پیشبین روابط عاملها را (به صورت نهایی یا شرطی) از یکدیگر تمیز میدهد و بدین ترتیب، مسئله را به حد قابلملاحظهای سادهتر میکند. این مدل قابلیت ثبت ارتباطات درونی و تعاملات عاملها را نیز دارد.» لازم به ذکر است، تامیزوکا و ژان در این پژوهش نقشی نداشتهاند.
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید