LOKI ؛ دیتاستی برای آموزش مدلها و پیشبینی مسیر حرکت عابرین پیاده و وسایل نقلیه
فرایند تصمیمگیری در انسان، فرایندی سلسله مراتبی است. این فرایند شامل چندین سطح از استدلال و استراتژیهای مختلف برنامهریزی میشود که همگی آنها به طور همزمان و در جهت دستیابی به اهداف طولانی مدت و کوتاه مدت عمل میکنند.
طی چند دهه اخیر، تعدادی از دانشمندان کامپیوتر، که البته تعداد آنها رو به افزایش است، تلاش کردند ابزارها و تکنیکهایی محاسباتی ایجاد کنند که بتوانند فرایند تصمیمگیری در انسان را تقلید کنند؛ در چنین حالتی، رباتها، وسایل نقلیه خودران و دیگر دستگاهها میتوانند سریعتر و بهتر تصمیمگیری کنند. توانایی تصمیمگیری سریع به ویژه برای سیستمهای رباتیکی (برای مثال، وسایل نقلیه خودران) اهمیت دارد که اقدامات آنها مستقیماً بر ایمنی انسانها تأثیر دارد.
دیتاست LOKI
به تازگی پژوهشگرانی از مؤسسه تحقیقاتی هوندا، شرکت تحقیق و توسعه هوندا و دانشگاه کالیفرنیا، برکلی دیتاست LOKI را ایجاد کردهاند. از این دیتاست میتوان برای آموزش مدلهایی استفاده کرد که مسیر حرکت عابرین پیاده و وسایل نقلیه را در جاده پیشبینی میکنند. این پژوهشگران در مقالهای که نسخه پیشچاپ آن را در arXiv منتشر کردهاند به معرفی این دیتاست پرداختهاند و قرار است آن را در کنفرانس بینالمللی بینایی کامپیوتر ICCV conference (2021) ارائه دهند. LOKI شامل تصاویری از عاملهای حاضر در خیابان (برای مثال، عابرین پیاده، دوچرخه، خودرو و غیره) است که به دقت برچسبگذاری شدهاند و از زاویهی دید راننده ثبت شدهاند.
[irp posts=”4081″]
چیهو چوی، یکی از محققان این پژوهش به TechXplore گفت: «در مقاله اخیر خود گفتیم که یکی از روشهای پیشبینی مسیرهای آتی استدلال در مورد اهداف بلندمدت و کوتاهمدت عاملان است. منظور ما از هدف طولانی مدت، موقعیت نهایی است که عامل قصد دارد در یک بازه زمانی مشخص به آن برسد. در مقابل، منظور از اهداف کوتاهمدت، نحوهی نیل عامل به آن مقصد است.»
چوی و همکاران فرض را بر این گذاشتهاند که تکنیکهای یادگیری ماشین برای پیشبینی هر چه بهتر مسیر حرکت عاملها باید سلسله مراتبی پیچیده از اهداف کوتاهمدت و بلند مدت را در نظر بگیرند. مدل بر مبنای حرکات پیشبینیشده عامل میتواند به نحوی کارآمد مسیرهای حرکت ربات و یا وسایل نقلیه را برنامهریزی کند.
بدین ترتیب، این پژوهشگران تصمیم گرفتند معماریای توسعه دهند که به منظور برآورد مقصد در هر فریم اهداف کوتاهمدت و اهداف طولانیمدت را در نظر بگیرد. چنین عملی بر ماژول پیشبینی مسیر مدل تأثیر داشت.
جزئیات پژوهش
چوی در توضیح این پژوهش میگوید:«وسیله نقلیهای را در نظر بگیرید که سر تقاطع است و قصد دارد برای رسیدن به مقصد نهایی به سمت چپ بپیچد. در زمان استدلال راجع به حرکت عامل، یعنی گردش به چپ، مهم است که علاوه بر حرکات عامل، تغییراتی که در نتیجه عوامل مختلف در هدف ایجاد میشوند را در نظر بگیریم: 1) خواست شخصی عامل، 2) تعاملات اجتماعی، 3) محدودیتهای محیطی، 4) نشانههای زمینهای».
دیتاست LOKI از صدها تصویر RGB تشکیل شده است که نمایانگر عاملهای مختلف در ترافیک هستند. هر کدام از این تصاویر با نقطه LiDAR مربوطه همراه هستند. در ضمن، تصاویر این دیتاست در هر فریم به طور دقیق و برای تک تک عاملها برچسبگذاری شدهاند.
این دیتاست از سه دسته برچسب تشکیل میشود. اولین دسته برچسبهای هدف هستند که نشان میدهند یک عامل برای رسیدن به مقصد «چگونه» تصمیمگیری میکند. دومین دسته برچسبهای محیطی هستند که شامل اطلاعاتی راجع به محیطی است که بر نحوه تصمیمگیری عامل تأثیر میگذارد (برای مثال، موقعیت خروجی یا ورودی جاده ، چراغ راهنمایی، تابلوهای راهنمایی و رانندگی، اطلاعات باند و غیره). سومین دسته شامل برچسبهای زمینهای است که میتوانند بر رفتارهای بعدی عامل تأثیر بگذارند. از جمله این عوامل میتوان به اطلاعات مربوط به آبوهوا، وضعیت جادهها، جنسیت و سن عابرین پیاده و غیره اشاره کرد.
[irp posts=”8983″]
دستاورد LOKI
به گفته چوی، «پژوهش ما بینش عمیقی در مورد چگونگی تغییر اهداف در یک افق زمانی طولانیمدت ارائه میدهد. LOKI اولین دیتاستی است که میتوان از آن به عنوان معیاری برای شناخت اهداف عاملهای نامتجانس ترافیک (خودرو، کامیون، دوچرخه، عابرین پیاده و غیره) استفاده کرد».
دسته | موقعیت | نمونهها | توصیف |
برچسبهای هدف (وسیله نقلیه)
|
متوقف شده | 130743 | وسیله نقلیه متوقف شده است. وسیله نقلیه ممکن است به دلایل مختلفی متوقف شود، برای مثال، توقف پشت چراغ قرمز، گردش به یک سمت تقاطع، عبور عابر پیاده و غیره. |
پارک شده | 127150 | وسیاه نقلیه در کنار خیابان و یا پارکینگ پارک شده است. | |
تغییر به باند چپ | 2120 | وسیله نقلیه در حال ورود به باند دیگری است. | |
تغییر به باند راست | 2087 | ||
سبقت از چپ | 347 | وسیله نقلیه در حال سبقت گرفتن است. | |
سبقت از راست | 736 | ||
گردش به چپ | 15190 | وسیله نقلیه در حال گردش است (برای مثال، در تقاطع یا به سمت رمپ بزرگراه. | |
گردش به راست | 13171 | ||
در حال حرکت/ سایر | 206243 | وسیله نقلیه در حال حرکت به سمت جلو یا اقدام دیگری است که در برچسبهای دیگر ثبت نشده است. | |
برچسبهای هدف (عابر پیاده) |
متوقف شده | 32538 | عابر پیاده در کنار خیابان ایستاده است. |
در حال حرکت | 241889 | عابر پیاده در حال قدم زدن است ( برای مثال، در امتداد خیابان). | |
در حال انتظار برای عبور | 49576 | عابر پیاده در حال عبور از تقاطع است. | |
در حال عبور از خیابان | 64870 | عابر پیاده در حال عبور از خیابان است. | |
مقصد احتمالی | 67862 | مقصد احتمالی که ممکن است عابرپیاده به آنجا قدم بگذارد. | |
برچسبهای محیطی |
اطلاعات باند | 440338 | اقدامی که وسیله نقلیه میتواند بر مبنای باندی که در آن قرار گرفته انجام دهد (برای مثال، گردش به راست، گردش به چپ، حرکت به جلو، دور زدن، تغییر باند ممنوع). توجه داشته باشید که بسته به موقعیت میتوان چندین گزینه انتخاب کرد. برای مثال، یک وسیله نقلیه میتوان در باندی که مستقیم میرود بماند و یا به سمت چپ بپیچد. در دیتاست ما، اگر امکان تغییر باند وجود داشته باشد 1 و چنانچه امکان تغییر باند وجود نداشته باشد، گزینه 0 را انتخاب میکنیم. برخی اوقات، اگر وسیله نقلیه خارج از فریم قرار گرفته باشد و امکان استخراج اطلاعات باند وجود نداشته باشد، آن را با 1- برچسبگذاری میکنیم. |
چراغ راهنمایی | 42476 | وضعیت فعلی چراغ راهنمایی | |
تابلو راهنمایی و رانندگی | 39066 | نوع تابلو راهنمایی و رانندگی ( ایست، فقط گردش به چپ مجاز است، ورود ممنوع) | |
خروجی/ ورودی جاده | 126889 | ||
برچسبهای زمینهای |
سن | 166874 | سن تخمینی عابرین (کودک، بزرگسال، مسن) |
جنسیت | 166874 | جنسیت عابر پیاده (مذکر/مونث)/ | |
آبوهوا | 644 | وضعیت آبوهوا( آفتابی، گرگومیش، ابری، شب). | |
وضعیت جاده | 644 | وضعیت سطح جاده (خیس/ خشک). |
مدلی برای بررسی LOKI
چوی و همکاران علاوه بر جمعآوری دیتاست LOKI، مدلی توسعه دادهاند که تأثیر عوامل مورد نظر LOKI را بر رفتارهای بعدی عاملها بررسی میکند. این مدل میتواند با دقت بالایی اهداف و مسیرهای حرکت عاملهای مختلفی که در جاده قرار دارند را پیشبینی کند. این مدل تأثیرات 1) خواست شخصی عامل، 2) تعاملات اجتماعی، 3) محدودیتهای محیطی و 4) اطلاعات زمینهای را بر اقدامات کوتاهمدت و بلندمدت و فرایند تصمیمگیری مد نظر قرار میدهد.
این پژوهشگران عملکرد مدل خود را به آزمایش گذاشتند و دریافتند عملکرد مدل آنها نسبت به پیشرفتهترین متدهای پیشبینی مسیر 27 درصد برتر است. در آینده میتوان از این مدل برای ارتقای ایمنی و عملکرد وسایل نقلیه خودران استفاده کرد. علاوه بر این، سایر تیمهای پژوهشی میتوانند با استفاده از دیتاست LOKI مدلهای خود را در زمینه پیشبینی مسیر حرکت عابرین پیاده و وسایل نقلیه آموزش دهند.
چوی میگوید، «ما سایر پژوهشهایی را که بر استدلال در مورد اهداف و مسیرهای حرکت تمرکز دارند و در عین حال، عوامل بیرونی و درونی، از جمله، خواست عامل، تعاملات اجتماعی و عوامل محیطی را در نظر میگیرند، مورد مطالعه و بررسی قرار دادهایم. هدف ما این است که حیطه پیشبینی بر مبنای هدف را نه تنها برای مسیرها بلکه به پیشبینی حرکات و رفتارهای کلی انسانها گسترش دهیم. در حال حاضر، بر روی گسترش LOKI متمرکز هستیم و معتقدیم این دیتاست که انعطافپذیری بالایی نیز دارد، افرادی که در حوزه پیشبینی فعالیت دارند را به پیشبرد این عرصه تشویق میکند.»