دو بازوی ربات مجازی که با آموزش یکدیگر هوشمندتر میشوند
یک بازوی ربات مجازی یاد گرفته است که بدون نیاز به آموزش مجدد برای هر کدام از کارهای محوله، طیف گستردهای از پازلهای مختلف را حل کند. این بازوی ربات مجازی، این کار را با بازی در برابر بازوی ربات دوم انجام داد که برای ایجاد چالشهای سختتر و پیچیدهتر آموزش دیده بود.
بازی با خود
این سیستم توسط محققان شرکت OpenAI ساخته شده است، دو بازوی ربات دوقلو – آلیس و باب – در یک شبیهسازی با انجام یک بازی در مقابل یکدیگر، بدون اینکه هیچ انسانی به بازی ورود کند توانستند آموزش ببینند و از عهده این کار برآیند. در این مدل، رباتها از روش یادگیری تقویتی استفاده میکنند، روشی که در آن هوش مصنوعی با آزمون و خطا یاد میگیرد چه کارهایی را باید در موقعیتهای مختلف انجام دهد تا به اهداف خاصی برسد. این بازی شامل جابجایی اشیا روی یک میز مجازی است. آلیس سعی میکند با چیدمان اشیا به روشهای خاص معماهایی را تعیین کند که حل آنها برای باب سخت است. متقابلا باب نیز سعی میکند معماهای آلیس را حل کند. به این ترتیب هر معمایی را که باب یاد میگیرد حل کند در نتیجه آن، آلیس معماهای پیچیدهتری ارائه میدهد و باب بهتر از قبل آنها را حل میکند.
چند کاره
معمولا مدل های یادگیری عمیق باید بین انجام وظایف دوباره آموزش ببینند. به عنوان مثال AlphaZero که با بازی در مقابل خود نیز توانایی یادگیری دارد از یک الگوریتم یکسان برای اینکه یاد بگیرد بازی شطرنج، شوگی و Go بازی کند بهره میبرد. اما فقط یک بار و در یک زمان. یعنی AlphaZero ی شطرنج باز نمیتواند Go بازی کند و آلفازیرویی که برای بازی Go آموزش دیده است نمیتواند شوگی بازی کند. توسعه ماشینهایی که بتوانند چند کاره باشند و چندین وظیفه مختلف را همزمان انجام دهند، یک مساله بزرگ حل نشده در مسیر دستیابی به هوش مصنوعی عمومی است.
dojo هوش مصنوعی
یک موضوع مهم این است که آموزش هوش مصنوعی برای اینکه بتواند چندین کار را همزمان انجام دهد نیاز به تعداد زیادی مثال دارد. OpenAI برای این که از این کار اجتناب کند، آلیس را آموزش داد تا برای باب مثالهایی بسازد، یعنی استفاده از یک هوش مصنوعی برای آموزش دیگری. آلیس آموخت که با استفاده از قطعات برج بسازد، سپس آنها را بردارد و بین آنها تعادل ایجاد کند. از سوی دیگر باب آموخت که از خصوصیات محیط مجازی مانند اصطکاک برای درک و چرخش اشیا استفاده کند.
واقعیت مجازی
این روش تاکنون تنها در شبیهسازیها به کار گرفته شده است. اما محققان OpenAI و سایر جاها در انتقال مدلهای آموزش دیده در محیطهای مجازی به محیطهای واقعی به پیشرفتهای خوبی رسیده اند. شبیهسازی باعث میشود هوش مصنوعی قبل از اینکه در محیط واقعی به کار گرفته شود، در مدت زمان کوتاهی با استفاده از مجموعه دادههای بزرگ بیش از پیش بهتر شود.
رویای کلی
محققان میگویند هدف نهایی آنها آموزش رباتهایی است که هر کاری را که دیگران از آنها بخواهند انجام دهند. همچون مدل GPT-3 که یک مدل زبانی است و میتواند به روشهای مختلف از زبان استفاده کند، این بازوی ربات نیز بخشی از بلندپروازیهای شرکت OpenAI برای ساخت هوش مصنوعی چند کاره است. استفاده از یک هوش مصنوعی برای آموزش دیگری میتواند بخشی اصلی از مسیر تحقق این رویا باشد.
انواع کاربردهای هوش مصنوعی در صنایع مختلف را در هوشیو بخوانید