بررسی جنبههای مختلف نرم افزار اتومبیل خودران NVIDIA
برای کاهش میزان پیچیدگی در توسعه نرمافزارهای اتومبیل خودران، باید کل این مسئله فنی را به اجزای کوچکتر تقسیم و سپس اقدام به تولید نرم افزار اتومبیل خودران کنیم. هر کدام از این اجزا نقشی حیاتی در تولید اتومبیلهای خودران امن داشته و کارکردهای مختلفی برای تحقق فناوری خودران دارند. ویدئوی منتشر شده توسط آزمایشگاه «NVIDIA DRIVE Labs» توضیحات جامعی در خصوص ماموریتها و روشهای لازم برای ساخت الگوریتمها ارائه میکند. این آزمایشگاه مهندسی بدون دخالت هیچ نهاد یا سازمان دیگری این ویدئوها را در دسترس عموم قرار داده و به دنبال ارائه راهحلهایی برای برخی از چالشهای فنی است. این چالشها در توسعه نرمافزارهای وسایل نقلیه خودران بازتاب مییابند. حالا بگذارید جزئیات فعالیتهای «NVIDIA DRIVE Labs» را بررسی کنیم:
درک/شناسایی مسیر
«ندا سویتیچ» مدیر ارشد بخش وسایل نقلیه خودران NVIDIA، چگونگی استفاده از مجموعه شبکه عصبی عمیق DNN برای شناسایی مسیرهای مناسبِ رانندگی را توضیح میدهد. برای دیدن فیلم به لینک زیر مراجعه کنید:
درک یا تشخیص مسیر یکی از چالشهای اساسی در سیستمهای Level 2+ است. آزمایش غیربرخط Offline (مثل تجزیه و تحلیل ویدئوهایِ از پیش ضبط شده) به این معناست که سیگنال درک مسیر همواره قابل مقایسه با مرجع کامل است. تنوع و افزونگی Redundancy از جمله مولفههاییاند که به نرم افزار اتومبیل خودران برای درک مسیر اضافه شدند. این کار با ترکیب چند سیگنال مختلف درک مسیر مثل خروجیهای سه شبکه عصبی عمیق مختلف و یک نقشه باکیفیت انجام شد. شبکه عصبی عمیق LaneNet DNN برای پیشبینی خطوط آموزش یافته است، در حالی که شبکه PathNet DNN با این هدف آموزش یافته که صرفنظر از وجود یا عدم وجود خطوط در جاده، لبههایی را که مسیرهای قابل حرکت را تعریف میکنند، پیشبینی کند.
افزون بر این، PathNet DNN برای پیشبینی مسیرها قابل حرکت مرکزی آموزش دیده و در این راستا از مسیرهایی که رانندگان در آن حرکت میکنند، استفاده میکند. ما خروجیهای مختلف درک مسیر را با استفاده از یک روش ویژه ترکیب کردیم. این روش یادگیری ماشین به ترکیبِ مدلهای گوناگون پرداخته و یک مدل پیشبینیکنندۀ کارآمد ارائه میکند. تجزیه و تحلیل سیگنالهای مختلف درک مسیر این فرصت را در اختیار ما گذاشت تا میزان اعتماد به درک مسیر را اندازه گرفته و به نتیجه مطلوبتری برسیم.
شناسایی تقاطع با استفاده از درک زنده و هوش مصنوعی
شناسایی تقاطع در نرم افزار اتومبیل خودران با استفاده از شبکه WaitNet DNN انجام میشود (رنگ زرد). شناسایی تابلوی توقف با رنگ آبی نمایش داده شده است. شناسایی و کنار هم قرار دادنِ تکتک ویژگیها از جمله تابلوهای توقف، چراغهای راهنمایی، خطوط روی جاده و غیره که نشان از هشدار توقف یا انتظار دارند، فرصت کافی را برای پیشبینی تقاطعهای بعدی فراهم میکند. با این حال، با داشتنِ WaitNet DNN، از رویکرد «درک صحنه بر اساس هوش مصنوعی» برای ادراک و طبقهبندی تقاطع استفاده میکنیم. فرایند شناسایی و طبقهبندی تقاطعِ WaitNet intersection detection and classification به شیوه شناساییِ تقاطع توسط انسان شباهت دارد. صحنه میتواند از بافتی با ویژگیهای گوناگون تشکیل شده باشد؛ مثل تابلوی توقف، چراغ راهنمایی یا وجود یا نبودِ خطوط در موقعیتهای غیرعادی. سیستم بیناییِ ما نیز به طور همزمان صحنه را زیر نظر دارد تا وجود یا عدم وجود تقاطع را شناسایی کند. این کار بدون استفاده از نقشه انجام میگیرد. با این اوصاف، نیازی نیست که به طور دستی تعیین کنیم کدام ویژگیها به شناسایی تقاطع مربوط هستند و کدام ویژگیها نامربوطاند. اگر بیش از حد به بررسی تکتک ویژگیها تکیه نکنیم، میتوانیم خطای شناسایی را تا حد زیادی کاهش دهیم.
توانمندتر کردن دوربینها با هوش مصنوعی
خروجی نمونه ClearSightNet. تصویر ورودی (سمت چپ) و تصویر ورودی پوشیده شده با ماسک خروجی overlaid (سمت راست). برای دیدن فیلم به لینک زیر مراجعه کنید:
در این مورد، 84 درصدِ پیکسل تصاویر تحت تاثیر انسداد (occlusion) قرار میگیرند؛ انسداد ناقص و انسداد کامل به ترتیب با رنگهای سبز و قرمز نشان داده میشوند. عوامل محیطی از قبیل باران، برف یا سایر موانع بر بیناییِ دوربین وسایل نقلیه خودران و بینایی ماشین تاثیر میگذارند. هر سیستم شناساییِ قوی، علاوه بر استدلال منطقی درباره محیط پیرامون، باید قابلیت استدلال در خصوص اعتبار و درستی دادههای حاصل validity of the data از حسگرهای مختلف را نیز داشته باشد. در همین راستا، شبکه عصبی عمیق ClearSightNet با هدفِ ارزیابی توان دوربین در دیدنِ واضح تصاویر ساخته شده است. این شبکه نقش مفیدی در شناسایی دلایل واقعیِ انسدادها و کاهش بینایی نیز دارد. این شبکه تصاویرِ دوربین را در دو نوع دستهبندی میکند: انسداد و کاهش دید occlusion and reduction in visibility. سپس از ماسکی خروجی میگیرد که میتواند روی تصویر ورودی قرار گیرد. مناطقی که به طور کامل از دید خارج شدهاند، با رنگ قرمز نشان داده میشوند. اما مناطقی که به صورت نصفه و نیمه مسدود شده و کاهش دید دارند، با رنگ سبز به نمایش در آمدهاند. علاوه بر این، شبکه عصبی عمیق ClearSightNet از یک نسبت یا درصدی هم خروجی میگیرد. این نسبت یا درصد به آن دسته از تصاویر ورودی اشاره میکند که تحت تاثیر انسداد یا کاهش دید قرار گرفتهاند. این اطلاعات میتواند فواید مختلفی داشته باشد. برای مثال، وقتی میزان دید خیلی پایین است، وسیلهنقلیه میتواند از گزینه خودران خودداری کرده و به کاربر هشدار دهد که لنز دوربین یا شیشه جلوی اتومبیل را تمیز کند.
ارائه راهحل برای قابلیت خودرانیِ امن
دادههایی مورد استفاده برای توسعه اجزای الگوریتمی که در فوق به آنها اشاره شد، با استفاده از حسگرهای کیت DRIVE Hyperion جمعآوری شده است. ویژگیها در پلتفرم DRIVE AP2X مورد بررسی قرار میگیرند. شبکه ClearSightNet DNN یکی از اجزای مهمِ نرمافزار تشخیص موانع به شمار میآید. شناسایی تقاطع با استفاده از WaitNet بخشی از کارکرد شناساییِ شرایط انتظار با دوربین است.