Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 استفاده از یادگیری ماشین برای حل تعادل محلی در نظریه بازی

استفاده از یادگیری ماشین برای حل تعادل محلی در نظریه بازی

زمان مطالعه: 3 دقیقه

طی چند دهه‌ گذشته، متخصصان کامپیوتر، مشغول بررسی کاربردهای بالقوه‌ نظریه‌ بازی‌ها و ابزارهای هوش مصنوعی در بازی‌هایی همچون شطرنج، Go و بازی‌های راهبردی دیگری از این دست بوده‌اند. بااین‌حال، نظریه بازی ها در علم اقتصاد نیز کاربرد دارد؛ این نظریه را می‌توان به‌عنوان چارچوبی برای توضیح تعاملات راهبردی بازارها و نتایج نهایی به کار برد.

یکی از پرکاربردترین سازه‌های نظری، نشئت‌گرفته از نظریه بازی در حوزه‌ اقتصاد، «نظریه‌ مزایده Auction Theory» است؛ نظریه‌ مزایده را می‌توان نسخه‌ای از نظریه بازی دانست که بر مطالعه‌ رفتارهای خریداران در مزایده تمرکز دارد.

در پیاده‌سازی نظریه‌ مزایده در بازارهای واقعی که چندین کالا را به فروش گذاشته و ارزش‌گذاری‌های متقابل دارند، برآورد و محاسبه‌ راهبردهای پیشنهادی تعادل Equilibrium biding strategies امر چالش‌برانگیزی به شمار می‌رود. در نظریه‌ بازی‌ها، تعادل نش بیزی Bayesian Nash Equilibrium (BNE) زمانی اتفاق می‌افتد که هیچ بازیکن یا خریداری، بعد از در نظر گرفتن انتخاب‌های حریف، نمی‌تواند راهبرد انتخابی خود را بهتر کند.

تعادل BNE را می‌توان خروجی باثبات یک بازی یا مزایده در نظر گرفت که خروجی را پیش‌بینی می‌کند. بااین‌حال، محاسبه‌ آن در مزایده‌ها، در مقایسه با بازی‌هایی مثل «سنگ- کاغذ- قیچی» که پایان تعریف‌شده و اطلاعات کامل دارند، کار به مراتب سخت‌تری است؛ چون مقادیر و پیشنهادات ارائه‌شده حالت پیوسته دارند.

نظریه بازی
تصویری از تابع تعادل برای مزایده‌ای ساده و تک‌قیمتی خط نقطه‌چین، تعادل برآوردشده را نشان می‌دهد

تعادل مزایده‌ها

مطالعات قبلی برای آموختن تعادل مزایده‌ها، تکنیک‌هایی عددی پیشنهاد داده‌اند که یا مبتنی بر محاسبات نقطه‌به‌نقطه‌ بهترین پاسخ‌های ممکن در فضای راهبردی هستند یا بر پایه‌ حل مکرر زیربازی‌ها. به کارگیری این روش‌ها عمدتاً محدود به مزایده‌های ساده‌ای است که تنها یک شیء برای فروش دارند.

محققان دانشگاه فنی مونیخ به‌تازگی یک تکنیک یادگیری ماشین طراحی کرده‌اند که می‌تواند تعادل محلی Local equilibrium را در بازی‌های قرینه‌ مزایده بیاموزد. این تکنیک که در ژورنال هوش ماشینی طبیعت نیز منتشر شده، راهبردها را به‌عنوان شبکه‌های عصبی در نظر گرفته و سپس بر اساس تغییرات گرادیان، رویه‌ تکرار سیاست را اجرا می‌کند.

مارتین بیچلر، یکی از محققان حاضر در این پروژه، در مصاحبه‌ خود با TeckXplore توضیح‌ می‌دهد: «همین سال گذشته بود که جایزه‌ نوبل علم اقتصاد، برای کار بر روی نظریه‌ مزایده، به پاول میلگرم و باب ویلسون اعطا شد. پیش از این هم اقدامات ویلیام ویکری، برنده‌ جایزه نوبل بودند که راهبردهای تعادلی مبتنی بر نظریه بازی را برای مزایده‌های تک‌آیتمی ساده مطرح کردند، راهبردهایی که معادلات دیفرانسیلی را حل می‌کنند. با وجود این، مزایده‌های چندشیئی پیچیده‌تر و چالش‌برانگیزتر هستند و راهبردهای تعادلی، تا‌به‌حال تنها برای چند مورد خاص از آن‌ها کاربرد داشته‌اند.»

چند سالی هست که بیچلر و همکارانش مشغول تحقیق درباره نظریه‌ مزایده و کاربردهایش هستند. این پژوهشگران در مطالعات اخیر خود، سعی در طراحی تکنیکی داشته‌اند که بتواند با استفاده از شبکه‌های عصبی مصنوعی، راهبردهای تعادلی به‌کاررفته در مزایده‌ها را به صورت خودکار بیاموزد.

بیچلر می‌گوید: «همگرایی این روش جدید با مفروضه‌های استاندارد، در مدل‌های مزایده‌ای گوناگون، تأیید شده است. بنابراین راهکارهای تعادلی جدیدی هم می‌توان طراحی کرد که راهبردهای پیشنهادی تعادلی را برای انواع مدل‌های مزایده به صورت عددی محاسبه کنند، کاری که تاکنون غیرممکن به نظر می‌رسید.»

تکنیک بیچلر

محققان با آزمایش این تکنیک دریافتند در صورت برقراری تعادل، BNEهای برآوردشده با تعادلی که از تحلیل به دست آمده همگرایی دارند. علاوه بر این، در مواردی که تعادل تحلیلی نامعلوم بود، مقدار خطای برآوردشده بسیار پایین بود. در آینده، این ابزار را می‌توان برای بررسی کارایی مزایده‌ها و پیش‌بینی راهبردهای احتمالی به کار برد.

تکنیک بیچلر و دستیارانش علاوه بر نقش مهمی که در مطالعه‌ نظریه‌ مزایده ایفا می‌کند، ابزار بسیار ارزشمندی هم برای برگزارکنندگان مزایده‌ها به شمار می‌رود؛ زیرا به آن‌ها کمک می‌کند، قالب و فرمت مزایده را انتخاب کنند. علاوه بر این، خریداران حاضر در مزایده نیز می‌توانند با تکیه بر این تکنیک، راهبردهای خود را برنامه‌ریزی کنند. به عنوان نمونه، قانونگذاران سراسر دنیا می‌توانند در مزایده‌های طیف Spectrum auctions از این تکنیک استفاده کنند، تا برای مثال، دسترسی به سیگنال‌های مخابراتی باندهای مختلف را در میان ارائه‌دهندگان اینترنت موبایل توزیع کنند.

بیچلر توضیح می‌دهد: «در ابتدا از فرایند یادگیری استاندارد شبکه‌های عصبی، یعنی گرادیان کاهشی، استفاده کردیم، تا ناپیوستگی‌های موجود در توابع مصرفی را در مدل‌های مزایده‌ای مدیریت کنیم. سپس نشان دادیم که این روش با تعادل موجود در مزایده‌هایی که یک سری مفروضه‌ متوسط دارند، همگرایی دارد. این یافته‌ها حائز اهمیت بودند، چون تعادل به‌دست‌آمده از این طریق، معمولاً در بازی‌ها همگرایی ندارد.»

بیچلر و همکارانش قصد دارند در پژوهش‌های آتی، این تکنیک را بر روی سناریوهای مختلف آزمایش کنند و از تعمیم‌پذیری آن اطمینان حاصل کنند. علاوه بر این، امیدوارند بتوانند ابزارهایی طراحی کنند که از بازی‌های قرینه فراتر بروند و تعادل را در طیف وسیع‌تری از موقعیت‌های نظریه بازی ها محاسبه کنند.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]