استفاده از یادگیری ماشین برای حل تعادل محلی در نظریه بازی
طی چند دهه گذشته، متخصصان کامپیوتر، مشغول بررسی کاربردهای بالقوه نظریه بازیها و ابزارهای هوش مصنوعی در بازیهایی همچون شطرنج، Go و بازیهای راهبردی دیگری از این دست بودهاند. بااینحال، نظریه بازی ها در علم اقتصاد نیز کاربرد دارد؛ این نظریه را میتوان بهعنوان چارچوبی برای توضیح تعاملات راهبردی بازارها و نتایج نهایی به کار برد.
یکی از پرکاربردترین سازههای نظری، نشئتگرفته از نظریه بازی در حوزه اقتصاد، «نظریه مزایده Auction Theory» است؛ نظریه مزایده را میتوان نسخهای از نظریه بازی دانست که بر مطالعه رفتارهای خریداران در مزایده تمرکز دارد.
در پیادهسازی نظریه مزایده در بازارهای واقعی که چندین کالا را به فروش گذاشته و ارزشگذاریهای متقابل دارند، برآورد و محاسبه راهبردهای پیشنهادی تعادل Equilibrium biding strategies امر چالشبرانگیزی به شمار میرود. در نظریه بازیها، تعادل نش بیزی Bayesian Nash Equilibrium (BNE) زمانی اتفاق میافتد که هیچ بازیکن یا خریداری، بعد از در نظر گرفتن انتخابهای حریف، نمیتواند راهبرد انتخابی خود را بهتر کند.
تعادل BNE را میتوان خروجی باثبات یک بازی یا مزایده در نظر گرفت که خروجی را پیشبینی میکند. بااینحال، محاسبه آن در مزایدهها، در مقایسه با بازیهایی مثل «سنگ- کاغذ- قیچی» که پایان تعریفشده و اطلاعات کامل دارند، کار به مراتب سختتری است؛ چون مقادیر و پیشنهادات ارائهشده حالت پیوسته دارند.
تعادل مزایدهها
مطالعات قبلی برای آموختن تعادل مزایدهها، تکنیکهایی عددی پیشنهاد دادهاند که یا مبتنی بر محاسبات نقطهبهنقطه بهترین پاسخهای ممکن در فضای راهبردی هستند یا بر پایه حل مکرر زیربازیها. به کارگیری این روشها عمدتاً محدود به مزایدههای سادهای است که تنها یک شیء برای فروش دارند.
محققان دانشگاه فنی مونیخ بهتازگی یک تکنیک یادگیری ماشین طراحی کردهاند که میتواند تعادل محلی Local equilibrium را در بازیهای قرینه مزایده بیاموزد. این تکنیک که در ژورنال هوش ماشینی طبیعت نیز منتشر شده، راهبردها را بهعنوان شبکههای عصبی در نظر گرفته و سپس بر اساس تغییرات گرادیان، رویه تکرار سیاست را اجرا میکند.
مارتین بیچلر، یکی از محققان حاضر در این پروژه، در مصاحبه خود با TeckXplore توضیح میدهد: «همین سال گذشته بود که جایزه نوبل علم اقتصاد، برای کار بر روی نظریه مزایده، به پاول میلگرم و باب ویلسون اعطا شد. پیش از این هم اقدامات ویلیام ویکری، برنده جایزه نوبل بودند که راهبردهای تعادلی مبتنی بر نظریه بازی را برای مزایدههای تکآیتمی ساده مطرح کردند، راهبردهایی که معادلات دیفرانسیلی را حل میکنند. با وجود این، مزایدههای چندشیئی پیچیدهتر و چالشبرانگیزتر هستند و راهبردهای تعادلی، تابهحال تنها برای چند مورد خاص از آنها کاربرد داشتهاند.»
چند سالی هست که بیچلر و همکارانش مشغول تحقیق درباره نظریه مزایده و کاربردهایش هستند. این پژوهشگران در مطالعات اخیر خود، سعی در طراحی تکنیکی داشتهاند که بتواند با استفاده از شبکههای عصبی مصنوعی، راهبردهای تعادلی بهکاررفته در مزایدهها را به صورت خودکار بیاموزد.
بیچلر میگوید: «همگرایی این روش جدید با مفروضههای استاندارد، در مدلهای مزایدهای گوناگون، تأیید شده است. بنابراین راهکارهای تعادلی جدیدی هم میتوان طراحی کرد که راهبردهای پیشنهادی تعادلی را برای انواع مدلهای مزایده به صورت عددی محاسبه کنند، کاری که تاکنون غیرممکن به نظر میرسید.»
تکنیک بیچلر
محققان با آزمایش این تکنیک دریافتند در صورت برقراری تعادل، BNEهای برآوردشده با تعادلی که از تحلیل به دست آمده همگرایی دارند. علاوه بر این، در مواردی که تعادل تحلیلی نامعلوم بود، مقدار خطای برآوردشده بسیار پایین بود. در آینده، این ابزار را میتوان برای بررسی کارایی مزایدهها و پیشبینی راهبردهای احتمالی به کار برد.
تکنیک بیچلر و دستیارانش علاوه بر نقش مهمی که در مطالعه نظریه مزایده ایفا میکند، ابزار بسیار ارزشمندی هم برای برگزارکنندگان مزایدهها به شمار میرود؛ زیرا به آنها کمک میکند، قالب و فرمت مزایده را انتخاب کنند. علاوه بر این، خریداران حاضر در مزایده نیز میتوانند با تکیه بر این تکنیک، راهبردهای خود را برنامهریزی کنند. به عنوان نمونه، قانونگذاران سراسر دنیا میتوانند در مزایدههای طیف Spectrum auctions از این تکنیک استفاده کنند، تا برای مثال، دسترسی به سیگنالهای مخابراتی باندهای مختلف را در میان ارائهدهندگان اینترنت موبایل توزیع کنند.
بیچلر توضیح میدهد: «در ابتدا از فرایند یادگیری استاندارد شبکههای عصبی، یعنی گرادیان کاهشی، استفاده کردیم، تا ناپیوستگیهای موجود در توابع مصرفی را در مدلهای مزایدهای مدیریت کنیم. سپس نشان دادیم که این روش با تعادل موجود در مزایدههایی که یک سری مفروضه متوسط دارند، همگرایی دارد. این یافتهها حائز اهمیت بودند، چون تعادل بهدستآمده از این طریق، معمولاً در بازیها همگرایی ندارد.»
بیچلر و همکارانش قصد دارند در پژوهشهای آتی، این تکنیک را بر روی سناریوهای مختلف آزمایش کنند و از تعمیمپذیری آن اطمینان حاصل کنند. علاوه بر این، امیدوارند بتوانند ابزارهایی طراحی کنند که از بازیهای قرینه فراتر بروند و تعادل را در طیف وسیعتری از موقعیتهای نظریه بازی ها محاسبه کنند.
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید