LOKI
آموزش‌های پیشرفته هوش مصنوعیبینایی ماشین

LOKI ؛ دیتاستی برای آموزش مدل‌ها و پیش‌بینی مسیر حرکت عابرین پیاده و وسایل نقلیه

    0
    مدت زمان مطالعه: ۶ دقیقه

    فرایند تصمیم‌گیری در انسان، فرایندی سلسله مراتبی است. این فرایند شامل چندین سطح از استدلال و استراتژی‌های مختلف برنامه‌ریزی می‌شود که همگی آن‌ها به طور همزمان و در جهت دست‌یابی به اهداف طولانی مدت و کوتاه مدت عمل می‌کنند.

    طی چند دهه اخیر، تعدادی از دانشمندان کامپیوتر، که البته تعداد آن‌ها رو به افزایش است، تلاش کردند ابزارها و تکنیک‌هایی محاسباتی ایجاد کنند که بتوانند فرایند تصمیم‌گیری در انسان را تقلید کنند؛ در چنین حالتی، ربات‌ها، وسایل نقلیه خودران و دیگر دستگاه‌ها می‌توانند سریع‌تر و بهتر تصمیم‌گیری کنند. توانایی تصمیم‌گیری سریع به ویژه برای سیستم‌های رباتیکی (برای مثال، وسایل نقلیه خودران) اهمیت دارد که اقدامات آن‌ها مستقیماً بر ایمنی انسان‌ها تأثیر دارد.

    LOKI

    پژوهشگران بر این باورند که استدلال راجع به اهداف طولانی‌مدت و اهداف کوتاه‌مدت نقش بسزایی در پیش‌بینی مسیر حرکت دارد. آنان با توجه به نبودِ یک معیار جامع در این حیطه، دیتاست جدیدی برای پیش‌بینی اهداف و مسیرهای حرکت ارائه دادند. در تصویر فوق، یکی از موارد کاربرد این دیتاست نشان داده‌ شده است: الف) تیم پژوهشی مسیر حرکت وسیله نقلیه را پیش‌بینی می‌کند، ب) اهداف طولانی مدت بر مبنای حرکت عامل برآورد می‌شوند، ج) تعاملات و محدودیت‌های محیطی همچون توپولوژی جاده و محدودیت‌های مسیر د) بر اهداف کوتاه‌مدت و در نتیجه مسیرهای آتی عامل تأثیر می‌گذارد. ژیراس و همکاران

    دیتاست LOKI

    به تازگی پژوهشگرانی از مؤسسه تحقیقاتی هوندا، شرکت تحقیق و توسعه هوندا و دانشگاه کالیفرنیا، برکلی دیتاست LOKI را ایجاد کرده‌اند. از این دیتاست می‌توان برای آموزش مدل‌هایی استفاده کرد که مسیر حرکت عابرین پیاده و وسایل نقلیه را در جاده پیش‌بینی می‌کنند. این پژوهشگران در مقاله‌ای که نسخه پیش‌چاپ آن را در arXiv منتشر کرده‌اند به معرفی این دیتاست پرداخته‌اند و قرار است آن را در کنفرانس بین‌المللی بینایی کامپیوتر ICCV conference (۲۰۲۱) ارائه دهند. LOKI شامل تصاویری از عامل‌های حاضر در خیابان (برای مثال، عابرین پیاده، دوچرخه، خودرو و غیره) است که به دقت برچسب‌گذاری شده‌اند و از زاویه‌ی دید راننده ثبت شده‌اند.

    چیهو چوی، یکی از محققان این پژوهش به TechXplore گفت: «در مقاله اخیر خود گفتیم که یکی از روش‌های پیش‌بینی مسیرهای آتی استدلال در مورد اهداف بلند‌مدت و کوتاه‌مدت عاملان است. منظور ما از هدف طولانی مدت، موقعیت نهایی است که عامل قصد دارد در یک بازه زمانی مشخص به آن برسد. در مقابل، منظور از اهداف کوتاه‌مدت، نحوه‌ی نیل عامل به آن مقصد است.»

    LOKI

    مصورسازی سه نوع برچسب: (۱الف – ۱ب) برچسب‌های هدف برای عابرین پیاده؛ (۲الف – ۲ب) برچسب‌های هدف برای وسایل نقلیه؛ و (۳الف – ۳ب) برچسب‌های محیطی. تصاویر سمت چپ توسط اسکن لیزری و تصاویر سمت راست توسط دوربین ثبت شده‌اند. در (۱الف) موقعیت فعلی عابر پیاده «انتظار برای عبور» است و مقصد بالقوه نمایان‌گر هدف عابر پیاده است. در (۳الف) پیکان آبی نشان‌دهنده مسیرهای احتمالی جاده‌ای است که وسیله نقلیه در آن قرار گرفته است. کلمات قرمز نشان‌دهنده باند حرکت خودرو هستند. ژیراس و همکاران.

    چوی و همکاران فرض را بر این گذاشته‌اند که تکنیک‌های یادگیری ماشین برای پیش‌بینی هر چه بهتر مسیر حرکت عامل‌ها باید سلسله‌ مراتبی پیچیده از اهداف کوتاه‌مدت و بلند مدت را در نظر بگیرند. مدل بر مبنای حرکات پیش‌بینی‌شده عامل می‌تواند به نحوی کارآمد مسیرهای حرکت ربات و یا وسایل نقلیه را برنامه‌ریزی کند.

    بدین ترتیب، این پژوهشگران تصمیم گرفتند معماری‌ای توسعه دهند که به منظور برآورد مقصد در هر فریم اهداف کوتاه‌مدت و اهداف طولانی‌مدت را در نظر بگیرد. چنین عملی بر ماژول پیش‌بینی مسیر مدل تأثیر داشت.

    جزئیات پژوهش

    چوی در توضیح این پژوهش می‌گوید:«وسیله نقلیه‌ای را در نظر بگیرید که سر تقاطع است و قصد دارد برای رسیدن به مقصد نهایی به سمت چپ بپیچد. در زمان استدلال راجع به حرکت عامل، یعنی گردش به چپ، مهم است که علاوه بر حرکات عامل، تغییراتی که در نتیجه عوامل مختلف در هدف ایجاد می‌شوند را در نظر بگیریم: ۱) خواست شخصی عامل، ۲) تعاملات اجتماعی، ۳) محدودیت‌های محیطی، ۴) نشانه‌های زمینه‌ای».

    LOKI

    دیتاست LOKI از صدها تصویر RGB تشکیل شده‌ است که نمایان‌گر عامل‌های مختلف در ترافیک هستند. هر کدام از این تصاویر با نقطه LiDAR مربوطه همراه هستند. در ضمن، تصاویر این دیتاست در هر فریم به طور دقیق و برای تک تک عامل‌ها برچسب‌گذاری شده‌اند.

    این دیتاست از سه دسته برچسب تشکیل می‌شود. اولین دسته برچسب‌های هدف هستند که نشان می‌دهند یک عامل برای رسیدن به مقصد «چگونه» تصمیم‌گیری می‌کند. دومین دسته برچسب‌های محیطی هستند که شامل اطلاعاتی راجع به محیطی است که بر نحوه تصمیم‌گیری عامل تأثیر می‌گذارد (برای مثال، موقعیت خروجی یا ورودی جاده ، چراغ راهنمایی، تابلوهای راهنمایی و رانندگی، اطلاعات باند و غیره). سومین دسته شامل برچسب‌های زمینه‌ای است که می‌توانند بر رفتارهای بعدی عامل تأثیر بگذارند. از جمله این عوامل می‌توان به اطلاعات مربوط به آب‌وهوا، وضعیت جاده‌ها، جنسیت و سن عابرین پیاده و غیره اشاره کرد.

    دستاورد LOKI

    به گفته چوی، «پژوهش ما بینش عمیقی در مورد چگونگی تغییر اهداف در یک افق زمانی طولانی‌مدت ارائه می‌دهد. LOKI اولین دیتاستی است که می‌توان از آن به عنوان معیاری برای شناخت اهداف عامل‌های نامتجانس ترافیک (خودرو، کامیون، دوچرخه‌، عابرین پیاده و غیره) استفاده کرد».

    دستهموقعیتنمونه‌هاتوصیف
     

     

     

     

     

     

     

     

     

    برچسب‌های هدف (وسیله نقلیه)

     

     

     

    متوقف شده۱۳۰۷۴۳وسیله نقلیه متوقف شده است. وسیله نقلیه ممکن است به دلایل مختلفی متوقف شود، برای مثال، توقف پشت چراغ قرمز، گردش به یک سمت تقاطع، عبور عابر پیاده و غیره.
    پارک شده۱۲۷۱۵۰وسیاه نقلیه در کنار خیابان و یا پارکینگ پارک شده است.
    تغییر به باند چپ۲۱۲۰وسیله نقلیه در حال ورود به باند دیگری است.
    تغییر به باند راست۲۰۸۷
    سبقت از چپ۳۴۷وسیله نقلیه در حال سبقت‌ گرفتن است.
    سبقت از راست۷۳۶
    گردش به چپ۱۵۱۹۰وسیله نقلیه در حال گردش است (برای مثال، در تقاطع یا به سمت رمپ بزرگراه.
    گردش به راست۱۳۱۷۱
    در حال حرکت/ سایر۲۰۶۲۴۳وسیله نقلیه در حال حرکت به سمت جلو یا اقدام دیگری است که در برچسب‌های دیگر ثبت نشده است.
     

     

     

     

    برچسب‌های هدف (عابر پیاده)

    متوقف شده۳۲۵۳۸عابر پیاده در کنار خیابان ایستاده است.
    در حال حرکت۲۴۱۸۸۹عابر پیاده در حال قدم زدن است ( برای مثال، در امتداد خیابان).
    در حال انتظار برای عبور۴۹۵۷۶عابر پیاده در حال عبور از تقاطع است.
    در حال عبور از خیابان۶۴۸۷۰عابر پیاده در حال عبور از خیابان است.
    مقصد احتمالی۶۷۸۶۲مقصد احتمالی که ممکن است عابرپیاده به آنجا قدم بگذارد.
     

     

     

    برچسب‌های محیطی

    اطلاعات باند۴۴۰۳۳۸اقدامی که وسیله نقلیه می‌تواند بر مبنای باندی که در آن قرار گرفته انجام دهد (برای مثال، گردش به راست، گردش به چپ، حرکت به جلو، دور زدن، تغییر باند ممنوع). توجه داشته باشید که بسته به موقعیت می‌توان چندین گزینه انتخاب کرد. برای مثال، یک وسیله نقلیه می‌توان در باندی که مستقیم می‌رود بماند و یا به سمت چپ بپیچد. در دیتاست ما، اگر امکان تغییر باند وجود داشته باشد ۱ و چنانچه امکان تغییر باند وجود نداشته باشد، گزینه ۰ را انتخاب می‌کنیم. برخی اوقات، اگر وسیله نقلیه خارج از فریم قرار گرفته باشد و امکان استخراج اطلاعات باند وجود نداشته باشد، آن را با ۱- برچسب‌گذاری می‌کنیم.
    چراغ راهنمایی۴۲۴۷۶وضعیت فعلی چراغ راهنمایی
    تابلو راهنمایی و رانندگی۳۹۰۶۶نوع تابلو راهنمایی و رانندگی ( ایست، فقط گردش به چپ مجاز است، ورود ممنوع)
    خروجی/ ورودی جاده۱۲۶۸۸۹
     

     

     

    برچسب‌های زمینه‌ای

    سن۱۶۶۸۷۴سن تخمینی عابرین (کودک، بزرگسال، مسن)
    جنسیت۱۶۶۸۷۴جنسیت عابر پیاده (مذکر/مونث)/
    آب‌وهوا۶۴۴وضعیت آب‌وهوا( آفتابی، گرگ‌ومیش، ابری، شب).
    وضعیت جاده۶۴۴وضعیت سطح جاده (خیس/ خشک).

    مدلی برای بررسی LOKI

    چوی و همکاران علاوه بر جمع‌آوری دیتاست LOKI، مدلی توسعه داده‌اند که تأثیر عوامل مورد نظر LOKI را بر رفتارهای بعدی عامل‌ها بررسی می‌کند. این مدل می‌تواند با دقت بالایی اهداف و مسیرهای حرکت عامل‌های مختلفی که در جاده قرار دارند را پیش‌بینی کند. این مدل تأثیرات ۱) خواست شخصی عامل، ۲) تعاملات اجتماعی، ۳) محدودیت‌های محیطی و ۴) اطلاعات زمینه‌‌ای را بر اقدامات کوتاه‌مدت و بلندمدت و فرایند تصمیم‌گیری مد نظر قرار می‌دهد.

    این پژوهشگران عملکرد مدل خود را به آزمایش گذاشتند و دریافتند عملکرد مدل آن‌ها نسبت به پیشرفته‌ترین متدهای پیش‌بینی مسیر ۲۷ درصد برتر است. در آینده می‌توان از این مدل برای ارتقای ایمنی و عملکرد وسایل نقلیه خودران استفاده کرد. علاوه بر این، سایر تیم‌های پژوهشی می‌توانند با استفاده از دیتاست LOKI مدل‌های خود را در زمینه پیش‌بینی مسیر حرکت عابرین پیاده و وسایل نقلیه آموزش دهند.

    LOKI

    چوی می‌گوید، «ما سایر پژوهش‌هایی را که بر استدلال در مورد اهداف و مسیرهای حرکت تمرکز دارند و در عین حال، عوامل بیرونی و درونی، از جمله، خواست عامل، تعاملات اجتماعی و عوامل محیطی را در نظر می‌گیرند، مورد مطالعه و بررسی قرار داده‌ایم. هدف ما این است که حیطه پیش‌بینی بر مبنای هدف را نه تنها برای مسیرها بلکه به پیش‌بینی حرکات و رفتارهای کلی انسان‌ها گسترش دهیم. در حال حاضر، بر روی گسترش LOKI متمرکز هستیم و معتقدیم این دیتاست که انعطاف‌پذیری بالایی نیز دارد، افرادی که در حوزه پیش‌بینی فعالیت دارند را به پیشبرد این عرصه تشویق می‌کند.»

    این مطلب چه میزان برای شما مفید بوده است؟
    [کل: ۱ میانگین: ۵]

    تردمیل خوشبختی ؛ عاملی که باعث شادی انسان با بالا رفتن سنش می‌شود

    مقاله قبلی

    الگوریتم بینایی ماشین در هوش مصنوعی با انرژی مصرفی یک یخچال اجرا می‌شود!

    مقاله بعدی

    شما همچنین ممکن است دوست داشته باشید

    نظرات

    پاسخ دهید

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *