40 گام به سوی آینده‌ای هوشمند - مجموعه وبینارهای رایگان در حوزه هوش مصنوعی
Filter by دسته‌ها
chatGTP
آموزش هوش مصنوعی و انواع آن
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
پایتون و ابزارهای یادگیری عمیق
کتابخانه‌ های یادگیری عمیق
یادگیری با نظارت
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
اخبار
تیتر یک
رسانه‌ها
آموزش پردازش زبان طبیعی
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
رویدادها
کاربردهای هوش مصنوعی
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 LOKI ؛ دیتاستی برای آموزش مدل‌ها و پیش‌بینی مسیر حرکت عابرین پیاده و وسایل نقلیه

LOKI ؛ دیتاستی برای آموزش مدل‌ها و پیش‌بینی مسیر حرکت عابرین پیاده و وسایل نقلیه

فرایند تصمیم‌گیری در انسان، فرایندی سلسله مراتبی است. این فرایند شامل چندین سطح از استدلال و استراتژی‌های مختلف برنامه‌ریزی می‌شود که همگی آن‌ها به طور همزمان و در جهت دست‌یابی به اهداف طولانی مدت و کوتاه مدت عمل می‌کنند.

طی چند دهه اخیر، تعدادی از دانشمندان کامپیوتر، که البته تعداد آن‌ها رو به افزایش است، تلاش کردند ابزارها و تکنیک‌هایی محاسباتی ایجاد کنند که بتوانند فرایند تصمیم‌گیری در انسان را تقلید کنند؛ در چنین حالتی، ربات‌ها، وسایل نقلیه خودران و دیگر دستگاه‌ها می‌توانند سریع‌تر و بهتر تصمیم‌گیری کنند. توانایی تصمیم‌گیری سریع به ویژه برای سیستم‌های رباتیکی (برای مثال، وسایل نقلیه خودران) اهمیت دارد که اقدامات آن‌ها مستقیماً بر ایمنی انسان‌ها تأثیر دارد.

LOKI
پژوهشگران بر این باورند که استدلال راجع به اهداف طولانی‌مدت و اهداف کوتاه‌مدت نقش بسزایی در پیش‌بینی مسیر حرکت دارد. آنان با توجه به نبودِ یک معیار جامع در این حیطه، دیتاست جدیدی برای پیش‌بینی اهداف و مسیرهای حرکت ارائه دادند. در تصویر فوق، یکی از موارد کاربرد این دیتاست نشان داده‌ شده است: الف) تیم پژوهشی مسیر حرکت وسیله نقلیه را پیش‌بینی می‌کند، ب) اهداف طولانی مدت بر مبنای حرکت عامل برآورد می‌شوند، ج) تعاملات و محدودیت‌های محیطی همچون توپولوژی جاده و محدودیت‌های مسیر د) بر اهداف کوتاه‌مدت و در نتیجه مسیرهای آتی عامل تأثیر می‌گذارد. ژیراس و همکاران

دیتاست LOKI

به تازگی پژوهشگرانی از مؤسسه تحقیقاتی هوندا، شرکت تحقیق و توسعه هوندا و دانشگاه کالیفرنیا، برکلی دیتاست LOKI را ایجاد کرده‌اند. از این دیتاست می‌توان برای آموزش مدل‌هایی استفاده کرد که مسیر حرکت عابرین پیاده و وسایل نقلیه را در جاده پیش‌بینی می‌کنند. این پژوهشگران در مقاله‌ای که نسخه پیش‌چاپ آن را در arXiv منتشر کرده‌اند به معرفی این دیتاست پرداخته‌اند و قرار است آن را در کنفرانس بین‌المللی بینایی کامپیوتر ICCV conference (2021) ارائه دهند. LOKI شامل تصاویری از عامل‌های حاضر در خیابان (برای مثال، عابرین پیاده، دوچرخه، خودرو و غیره) است که به دقت برچسب‌گذاری شده‌اند و از زاویه‌ی دید راننده ثبت شده‌اند.
[irp posts=”4081″]

چیهو چوی، یکی از محققان این پژوهش به TechXplore گفت: «در مقاله اخیر خود گفتیم که یکی از روش‌های پیش‌بینی مسیرهای آتی استدلال در مورد اهداف بلند‌مدت و کوتاه‌مدت عاملان است. منظور ما از هدف طولانی مدت، موقعیت نهایی است که عامل قصد دارد در یک بازه زمانی مشخص به آن برسد. در مقابل، منظور از اهداف کوتاه‌مدت، نحوه‌ی نیل عامل به آن مقصد است.»

LOKI
مصورسازی سه نوع برچسب: (1الف – 1ب) برچسب‌های هدف برای عابرین پیاده؛ (2الف – 2ب) برچسب‌های هدف برای وسایل نقلیه؛ و (3الف – 3ب) برچسب‌های محیطی. تصاویر سمت چپ توسط اسکن لیزری و تصاویر سمت راست توسط دوربین ثبت شده‌اند. در (1الف) موقعیت فعلی عابر پیاده «انتظار برای عبور» است و مقصد بالقوه نمایان‌گر هدف عابر پیاده است. در (3الف) پیکان آبی نشان‌دهنده مسیرهای احتمالی جاده‌ای است که وسیله نقلیه در آن قرار گرفته است. کلمات قرمز نشان‌دهنده باند حرکت خودرو هستند. ژیراس و همکاران.

چوی و همکاران فرض را بر این گذاشته‌اند که تکنیک‌های یادگیری ماشین برای پیش‌بینی هر چه بهتر مسیر حرکت عامل‌ها باید سلسله‌ مراتبی پیچیده از اهداف کوتاه‌مدت و بلند مدت را در نظر بگیرند. مدل بر مبنای حرکات پیش‌بینی‌شده عامل می‌تواند به نحوی کارآمد مسیرهای حرکت ربات و یا وسایل نقلیه را برنامه‌ریزی کند.

بدین ترتیب، این پژوهشگران تصمیم گرفتند معماری‌ای توسعه دهند که به منظور برآورد مقصد در هر فریم اهداف کوتاه‌مدت و اهداف طولانی‌مدت را در نظر بگیرد. چنین عملی بر ماژول پیش‌بینی مسیر مدل تأثیر داشت.

جزئیات پژوهش

چوی در توضیح این پژوهش می‌گوید:«وسیله نقلیه‌ای را در نظر بگیرید که سر تقاطع است و قصد دارد برای رسیدن به مقصد نهایی به سمت چپ بپیچد. در زمان استدلال راجع به حرکت عامل، یعنی گردش به چپ، مهم است که علاوه بر حرکات عامل، تغییراتی که در نتیجه عوامل مختلف در هدف ایجاد می‌شوند را در نظر بگیریم: 1) خواست شخصی عامل، 2) تعاملات اجتماعی، 3) محدودیت‌های محیطی، 4) نشانه‌های زمینه‌ای».

LOKI

دیتاست LOKI از صدها تصویر RGB تشکیل شده‌ است که نمایان‌گر عامل‌های مختلف در ترافیک هستند. هر کدام از این تصاویر با نقطه LiDAR مربوطه همراه هستند. در ضمن، تصاویر این دیتاست در هر فریم به طور دقیق و برای تک تک عامل‌ها برچسب‌گذاری شده‌اند.

این دیتاست از سه دسته برچسب تشکیل می‌شود. اولین دسته برچسب‌های هدف هستند که نشان می‌دهند یک عامل برای رسیدن به مقصد «چگونه» تصمیم‌گیری می‌کند. دومین دسته برچسب‌های محیطی هستند که شامل اطلاعاتی راجع به محیطی است که بر نحوه تصمیم‌گیری عامل تأثیر می‌گذارد (برای مثال، موقعیت خروجی یا ورودی جاده ، چراغ راهنمایی، تابلوهای راهنمایی و رانندگی، اطلاعات باند و غیره). سومین دسته شامل برچسب‌های زمینه‌ای است که می‌توانند بر رفتارهای بعدی عامل تأثیر بگذارند. از جمله این عوامل می‌توان به اطلاعات مربوط به آب‌وهوا، وضعیت جاده‌ها، جنسیت و سن عابرین پیاده و غیره اشاره کرد.
[irp posts=”8983″]

دستاورد LOKI

به گفته چوی، «پژوهش ما بینش عمیقی در مورد چگونگی تغییر اهداف در یک افق زمانی طولانی‌مدت ارائه می‌دهد. LOKI اولین دیتاستی است که می‌توان از آن به عنوان معیاری برای شناخت اهداف عامل‌های نامتجانس ترافیک (خودرو، کامیون، دوچرخه‌، عابرین پیاده و غیره) استفاده کرد».

دسته موقعیت نمونه‌ها توصیف
 

 

 

 

 

 

 

 

 

برچسب‌های هدف (وسیله نقلیه)

 

 

 

متوقف شده 130743 وسیله نقلیه متوقف شده است. وسیله نقلیه ممکن است به دلایل مختلفی متوقف شود، برای مثال، توقف پشت چراغ قرمز، گردش به یک سمت تقاطع، عبور عابر پیاده و غیره.
پارک شده 127150 وسیاه نقلیه در کنار خیابان و یا پارکینگ پارک شده است.
تغییر به باند چپ 2120 وسیله نقلیه در حال ورود به باند دیگری است.
تغییر به باند راست 2087
سبقت از چپ 347 وسیله نقلیه در حال سبقت‌ گرفتن است.
سبقت از راست 736
گردش به چپ 15190 وسیله نقلیه در حال گردش است (برای مثال، در تقاطع یا به سمت رمپ بزرگراه.
گردش به راست 13171
در حال حرکت/ سایر 206243 وسیله نقلیه در حال حرکت به سمت جلو یا اقدام دیگری است که در برچسب‌های دیگر ثبت نشده است.
 

 

 

 

برچسب‌های هدف (عابر پیاده)

متوقف شده 32538 عابر پیاده در کنار خیابان ایستاده است.
در حال حرکت 241889 عابر پیاده در حال قدم زدن است ( برای مثال، در امتداد خیابان).
در حال انتظار برای عبور 49576 عابر پیاده در حال عبور از تقاطع است.
در حال عبور از خیابان 64870 عابر پیاده در حال عبور از خیابان است.
مقصد احتمالی 67862 مقصد احتمالی که ممکن است عابرپیاده به آنجا قدم بگذارد.
 

 

 

برچسب‌های محیطی

اطلاعات باند 440338 اقدامی که وسیله نقلیه می‌تواند بر مبنای باندی که در آن قرار گرفته انجام دهد (برای مثال، گردش به راست، گردش به چپ، حرکت به جلو، دور زدن، تغییر باند ممنوع). توجه داشته باشید که بسته به موقعیت می‌توان چندین گزینه انتخاب کرد. برای مثال، یک وسیله نقلیه می‌توان در باندی که مستقیم می‌رود بماند و یا به سمت چپ بپیچد. در دیتاست ما، اگر امکان تغییر باند وجود داشته باشد 1 و چنانچه امکان تغییر باند وجود نداشته باشد، گزینه 0 را انتخاب می‌کنیم. برخی اوقات، اگر وسیله نقلیه خارج از فریم قرار گرفته باشد و امکان استخراج اطلاعات باند وجود نداشته باشد، آن را با 1- برچسب‌گذاری می‌کنیم.
چراغ راهنمایی 42476 وضعیت فعلی چراغ راهنمایی
تابلو راهنمایی و رانندگی 39066 نوع تابلو راهنمایی و رانندگی ( ایست، فقط گردش به چپ مجاز است، ورود ممنوع)
خروجی/ ورودی جاده 126889
 

 

 

برچسب‌های زمینه‌ای

سن 166874 سن تخمینی عابرین (کودک، بزرگسال، مسن)
جنسیت 166874 جنسیت عابر پیاده (مذکر/مونث)/
آب‌وهوا 644 وضعیت آب‌وهوا( آفتابی، گرگ‌ومیش، ابری، شب).
وضعیت جاده 644 وضعیت سطح جاده (خیس/ خشک).

مدلی برای بررسی LOKI

چوی و همکاران علاوه بر جمع‌آوری دیتاست LOKI، مدلی توسعه داده‌اند که تأثیر عوامل مورد نظر LOKI را بر رفتارهای بعدی عامل‌ها بررسی می‌کند. این مدل می‌تواند با دقت بالایی اهداف و مسیرهای حرکت عامل‌های مختلفی که در جاده قرار دارند را پیش‌بینی کند. این مدل تأثیرات 1) خواست شخصی عامل، 2) تعاملات اجتماعی، 3) محدودیت‌های محیطی و 4) اطلاعات زمینه‌‌ای را بر اقدامات کوتاه‌مدت و بلندمدت و فرایند تصمیم‌گیری مد نظر قرار می‌دهد.

این پژوهشگران عملکرد مدل خود را به آزمایش گذاشتند و دریافتند عملکرد مدل آن‌ها نسبت به پیشرفته‌ترین متدهای پیش‌بینی مسیر 27 درصد برتر است. در آینده می‌توان از این مدل برای ارتقای ایمنی و عملکرد وسایل نقلیه خودران استفاده کرد. علاوه بر این، سایر تیم‌های پژوهشی می‌توانند با استفاده از دیتاست LOKI مدل‌های خود را در زمینه پیش‌بینی مسیر حرکت عابرین پیاده و وسایل نقلیه آموزش دهند.

LOKI

چوی می‌گوید، «ما سایر پژوهش‌هایی را که بر استدلال در مورد اهداف و مسیرهای حرکت تمرکز دارند و در عین حال، عوامل بیرونی و درونی، از جمله، خواست عامل، تعاملات اجتماعی و عوامل محیطی را در نظر می‌گیرند، مورد مطالعه و بررسی قرار داده‌ایم. هدف ما این است که حیطه پیش‌بینی بر مبنای هدف را نه تنها برای مسیرها بلکه به پیش‌بینی حرکات و رفتارهای کلی انسان‌ها گسترش دهیم. در حال حاضر، بر روی گسترش LOKI متمرکز هستیم و معتقدیم این دیتاست که انعطاف‌پذیری بالایی نیز دارد، افرادی که در حوزه پیش‌بینی فعالیت دارند را به پیشبرد این عرصه تشویق می‌کند.»

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]