آموزش قایم باشک به ربات ها
اخبارویدیویادگیری تقویتی

آموزش قایم باشک به ربات ها ؛ کلید دستیابی به نسل بعدی AI

    0

    آموزش قایم باشک به ربات ها کلید دستیابی به نسل بعدی AI می باشد.
    هوش مصنوعی عمومی (AGI) شاخه‌ای از AI است و عامل هوش مصنوعی با اتکا به آن می‌تواند همانند انسان‌ها فکر کند و یاد بگیرد؛ AGI مدت‌ها موضوعی محدود به داستان‎های عملی تخیلی بود. اما همزمان با هوشمندتر شدن AI – علی‌الخصوص به لطف پیشرفت‌های چشمگیری که در ابزارهای ML حاصل شده و این ابزارها می‌توانند کدشان را بازنویسی کنند و از تجارب جدید بیاموزند- AGI به یکی از موضوعات داغ در حوزه AI تبدیل شده است.

    سؤال: بر چه مبنایی می‌توانیم سطح AGI را اندازه‌گیری کنیم؟

    طی سال‌های گذشته، پژوهشگران روش‌های  متعددی برای ارزیابی AGI پیشنهاد کرده‌اند. مشهورترین آن‌ها آزمون تورینگ است که در آن شخصی با انسان‌ و ماشین، بدون اینکه آن‌ها را ببیند، تعامل برقرار می‌کند و باید حدس بزند در آن لحظه با چه کسی (انسان یا ماشین) گفت‌و‌گو داشته است. آزمون Robot College Student بن گورتزل Ben Goertzel و آزمون استخدامی نیلسون دو نمونه‌ی دیگر از این آزمون‌ها هستند، هدف از انجام این آزمون‌ها این بوده که مشخص کنند آیا ماشین‌ها می‌توانند مدرک دانشگاهی اخذ کنند و یا جایی مشغول به کار شوند. یکی دیگر از این آزمون‌ها ادعا می‌کند که موفقیت عامل AI در مونتاژ مبلمان چوبی IKEA را می‌توان مبنایی برای سنجش میزان هوشمندی آن قرار داد.

    علاوه بر مواردی که گفته شد، هم‌بنیان‌گذار شرکت اَپل (Apple) یعنی استیو وزنیاک نیز معیار فوق‌العاده جالبی برای سنجش AGI ارائه داده است. آزمونی که وز (نامی که دوستان و طرفداران وی برای خطاب به او به کار می‌برند) پیشنهاد داده، آزمون قهوه Coffee Test نام دارد. به گفته وی، منظور از AGI این است که ربات بتواند به خانه‌ای، در هر کجای این کره خاکی، برود، آشپزخانه را پیدا کند،  قهوه دم کند و قهوه را در فنجان بریزد.

    همچون هر آزمون‌ دیگری، در مورد جزئی و کلی‌ بودن مفاد این آزمون‌ها نیز اختلاف نظرهایی وجود دارد. با این حال، سنجش هوشِ عامل AI بر مبنای توانایی‌اش در مسیریابی و گشت‌ و گذار در محیط واقعی نیز جالب به نظر می‌رسد. مؤسسه آلن قصد دارد در پژوهش‌ جدید خود این مورد را به آزمایش بگذارد.

    ساخت دنیایی جدید

    لوکا ویز، یکی از پژوهشگران مؤسسه هوش مصنوعی آلن Allen Institute for AI در مصاحبه با Digital Trends گفت: «ظرف چند سال گذشته، جامعه AI شاهد پیشرفت‌های چشمگیری در زمینه آموزش عامل‌های AI برای انجام کارهای دشوار بوده است.». مؤسسه هوش مصنوعی آلن یک آزمایشگاه هوش مصنوعی است که توسط هم‌بنیان‌گذار شرکت مایکروسافت یعنی پاول آلن پایه‌‌ریزی شده است.

    آموزش قایم باشک به ربات ها

    ویز با اشاره به اینکه عامل‌های هوش مصنوعی‌ای که DeepMind توسعه داده قادر به یادگیری بازی‌های آتاری هستند و می‌توانند در بازی GO بر حریفان خود(انسان‌ها) غلبه کنند، گفت این قبیل کارها « غالباً مستقل» از دنیای  واقعی هستند. برای درک بهتر این مطلب کافی است تصویری از دنیای واقعی به رباتی که با هدف بازی کردن آتاری آموزش دیده، نشان دهید و خواهید دید که این ربات هیچ ایده‌ای از اینکه به چه چیزی نگاه می‌کند، ندارد. اینجا دقیقاً همان‌جایی است که پژوهشگران مؤسسه آلن معتقدند می‌توانند وارد عمل شوند و تغییر ایجاد کنند.

    مؤسسه AI آلن یک محیط آزمایشی گسترده (شبیه به خانه) ساخته است. البته این محیط واقعی نیست و مجازی است. این محیط دارای صدها  اتاق، آپارتمان -شامل آشپزخانه، اتاق خواب، اتاق نشیمن- است که عامل AI در آن می‌تواند با هزاران شی ارتباط برقرار کند. فضای این محیط‌ها واقع‌گرایانه است و از چندین عامل و حتی شرایطی همچون گرما و سرما پشتیبانی می‌کنند. هدف از ساخت این محیط این بوده که عاملان AI بتوانند در این محیط‌ها بازی کنند و درک بهتر و جامع‌تری از دنیای واقعی به دست آورند.

    آموزش قایم باشک به ربات ها

    به گفته ویز: «هدف ما از انجام این پروژه این بوده که مشخص کنیم عاملان AI چگونه می‌توانند با انجام بازی‌های تعاملی در محیط‌های واقعی، به دانشی در باب این محیط‌ها دست پیدا کنند»، وی در ادامه اضهار داشت:« برای پاسخ دادن به این سؤال، دو عامل را به کمک یادگیری تقویتی تخاصمی در محیط AI2-THOR، که کیفیت بالایی دارد، آموزش دادیم تا Cache، که یک بازی شبیه قایم باشک است، را بازی کنند.» طی آموزش قایم باشک به ربات ها متوجه شدیم عامل‌های AI یاد گرفته‌اند تصاویر خاصی نشان دهند و به عملکردی دست پیدا کنند که پیش از این برای دستیابی به آن به میلیون‌های تصویر که به صورت دستی برچسب‌گذاری شده‌ بودند نیاز بود و حتی مجموعه‌ای از رفتارهای شناختی ابتدایی از خود نشان دادند که اغلب روانشناسان به مطالعه آن‌ها می‌پردازند.»

    قوانین بازی

    در بازی Cache، برخلاف بازی قایم باشک معمولی، ربات‌ها به نوبت اشیایی، برای مثال لوله‌ بازکن، تکه‌ای نان، گوجه و غیره را پنهان می‌کنند، که البته شکل هندسی هر کدام از این اشیاء با دیگری متفاوت است. این دو عامل، که یکی از آن‌ها قایم می‌شود و دیگری به جست‌و‌جوی آن می‌رود، با یکدیگر رقابت می‌کنند و تلاش می‌کنند شی‌ای را پنهان کنند. در این بازی چالش‌های متعددی ، از جمله کشف و نقشه‌برداری، درک نما، قایم شدن، دستکاری شی و جست‌و‌جو پیش‌روی ربات‌ها قرار دارد. گوشه به گوشه این محیط با دقت شبیه‌سازی شده است،تا جایی‌که رباتی که قایم می‌شود باید بتواند شی‌ای که در دست دارد را دستکاری کند و آن را نیندازد.

    عملکرد ربات‌ها در قایم کردن و پیدا کردن اشیاء با استفاده از یادگیری تقویتی عمیق بهتر و بهتر می‌شود؛ یادگیری تقویتی عمیق ، یکی از زیرشاخه‌های یادگیری ماشین است و در آن ماشین باید کارهایی انجام دهد و به حداکثر پاداش دست پیدا کند.

    ویز می‌گوید: «چیزی که این کار را برای عامل‌های AI مشکل می‌کند این است که آن‌ها نمی‌توانند دنیا را همانند ما انسان‌ها ببینند» وی در ادامه می‌گوید: «مغز ما طی میلیاردها سال تکامل توانسته ،حتی زمانی‌که نوزاد هستیم، تصاویر را به مفاهیم ترجمه کند. اما عامل AI کار خود را از صفر شروع می‌کند و دنیای پیرامون خود را در قالب شبکه‌ای گسترده از اعداد می‌بیند و باید یاد بگیرد آن را رمزگشایی کند. در ضمن، برخلاف بازی شطرنج، که در آن دنیا فقط در ۶۴ مربع خلاصه می‌شود، هر تصویری که عامل می‌بیند فقط بخش کوچکی از محیط است و به همین دلیل باید در طول زمان مشاهدات خود را با یکدیگر ترکیب کند تا به درک جامعی از دنیا برسد.»

    آموزش قایم باشک به ربات ها

    به عبارت دقیق‌تر هدف از آموزش قایم باشک به ربات ها ساخت عامل‌های AI فراهشمند نیست. در فیلم‌ نابودگر۲: روز داوری، Skynet که یک ابرکامپیوتر است رأس ساعت ۲:۱۴ صبح روز ۲۹ آگوست ۱۹۹۷ به خودآگاهی می‌رسد. با وجود اینکه حدود ۲۵ سال از آن روز می‌گذرد، بعید به نظر می‌رسد بتوانیم زمان دقیق دستیابی به AGI را مشخص کنیم.

    انجام کارهای دشوار آسان و انجام کارهای آسان دشوار است!

    پژوهشگران از دیرباز با این تفکر که اگر عاملان AI بتوانند مسائل پیچیده را حل کنند، حل مسائل آسان کار دشواری نخواهد بود، تمایل داشتند عاملان AI را برای حل مسائل پیچیده آموزش دهند. اگر بتوانید فرایند تصمیم‌گیری یک فرد بالغ را شبیه‌سازی کنید، آیا شبیه‌سازی ایده‌ بقای شی ( به این معنا که اشیاء حتی زمانی‌که ما نمی‌توانیم آن‌ها را ببینیم، وجود دارند)، که کودک طی چندین ماه اول زندگی خود یاد می‌گیرد، نیز به همان اندازه دشوار خواهد بود؟ بله – و این تناقض، یعنی در حوزه AI  انجام مسائل دشوار آسان و انجام مسائل آسان دشوار است، همان چیزی است که پژوهش‌هایی از این دست تلاش دارند پاسخی برای آن پیدا کنند.

    طبق اظهارات ویز: « متداول‌ترین الگو برای آموزش عامل‌های AI استفاده از دیتاست‌هایی با حجم بالا است که به صورت دستی و برای مسئله‌ای خاص، برای مثال تشخیص اشیا،  برچسب‌گذاری شده‌اند.» وی در ادامه اظهار داشت:« هرچند این روش موفقیت‌‌آمیز بوده، اما به عقیده من خوشبینانه است اگر فکر کنیم می‌توانیم دیتاست‌هایی با این حجم را ایجاد کنیم و به صورت دستی برچسب‌گذاری کنیم تا یک عامل AI بسازیم و آن عامل بتواند در دنیای واقعی رفتاری هوشمندانه داشته باشد، با انسان‌ها تعامل برقرار کند و هر مشکلی که به آن برمی‌خورد را حل کند. به عقیده من برای انجام این کار باید به عامل‌ها اجازه دهیم تا آزادانه با دنیا تعامل برقرار کنند و رفتارهای شناختی را یاد بگیرند. نتایج حاصل از پژوهش ما حاکی از این است که اگر عامل AI بتواند از طریق بازی با دنیا تعامل برقرار کنند و آن را کشف کنند می‌تواند این رفتارهای شناختی را یاد بگیرد و علاوه بر این نتایج پژوهش ما نشان می‌دهد بازی روش مناسبی برای یادگیری از طریق تجربه است.»
    مقاله‌ی مربوط به این پروژه در کنفرانس بین‌المللی ICLR (سال ۲۰۲۱) ارائه خواهد شد.

    جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید.

    استفاده آسان از مدل ‌های یادگیری عمیق

    مقاله قبلی

    آذری جهرمی : ایران می‌تواند به کشوری پیشرو در هوش مصنوعی بدل شود

    مقاله بعدی

    شما همچنین ممکن است دوست داشته باشید

    بیشتر در اخبار

    نظرات

    پاسخ دهید

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *