نظریه بازی
اخبار

استفاده از یادگیری ماشین برای حل تعادل محلی در نظریه بازی

    0
    مدت زمان مطالعه: ۳ دقیقه

    طی چند دهه‌ گذشته، متخصصان کامپیوتر، مشغول بررسی کاربردهای بالقوه‌ نظریه‌ بازی‌ها و ابزارهای هوش مصنوعی در بازی‌هایی همچون شطرنج، Go و بازی‌های راهبردی دیگری از این دست بوده‌اند. بااین‌حال، نظریه بازی ها در علم اقتصاد نیز کاربرد دارد؛ این نظریه را می‌توان به‌عنوان چارچوبی برای توضیح تعاملات راهبردی بازارها و نتایج نهایی به کار برد.

    یکی از پرکاربردترین سازه‌های نظری، نشئت‌گرفته از نظریه بازی در حوزه‌ اقتصاد، «نظریه‌ مزایده Auction Theory» است؛ نظریه‌ مزایده را می‌توان نسخه‌ای از نظریه بازی دانست که بر مطالعه‌ رفتارهای خریداران در مزایده تمرکز دارد.

    در پیاده‌سازی نظریه‌ مزایده در بازارهای واقعی که چندین کالا را به فروش گذاشته و ارزش‌گذاری‌های متقابل دارند، برآورد و محاسبه‌ راهبردهای پیشنهادی تعادل Equilibrium biding strategies امر چالش‌برانگیزی به شمار می‌رود. در نظریه‌ بازی‌ها، تعادل نش بیزی Bayesian Nash Equilibrium (BNE) زمانی اتفاق می‌افتد که هیچ بازیکن یا خریداری، بعد از در نظر گرفتن انتخاب‌های حریف، نمی‌تواند راهبرد انتخابی خود را بهتر کند.

    تعادل BNE را می‌توان خروجی باثبات یک بازی یا مزایده در نظر گرفت که خروجی را پیش‌بینی می‌کند. بااین‌حال، محاسبه‌ آن در مزایده‌ها، در مقایسه با بازی‌هایی مثل «سنگ- کاغذ- قیچی» که پایان تعریف‌شده و اطلاعات کامل دارند، کار به مراتب سخت‌تری است؛ چون مقادیر و پیشنهادات ارائه‌شده حالت پیوسته دارند.

    نظریه بازی

    تصویری از تابع تعادل برای مزایده‌ای ساده و تک‌قیمتی خط نقطه‌چین، تعادل برآوردشده را نشان می‌دهد

    تعادل مزایده‌ها

    مطالعات قبلی برای آموختن تعادل مزایده‌ها، تکنیک‌هایی عددی پیشنهاد داده‌اند که یا مبتنی بر محاسبات نقطه‌به‌نقطه‌ بهترین پاسخ‌های ممکن در فضای راهبردی هستند یا بر پایه‌ حل مکرر زیربازی‌ها. به کارگیری این روش‌ها عمدتاً محدود به مزایده‌های ساده‌ای است که تنها یک شیء برای فروش دارند.

    محققان دانشگاه فنی مونیخ به‌تازگی یک تکنیک یادگیری ماشین طراحی کرده‌اند که می‌تواند تعادل محلی Local equilibrium را در بازی‌های قرینه‌ مزایده بیاموزد. این تکنیک که در ژورنال هوش ماشینی طبیعت نیز منتشر شده، راهبردها را به‌عنوان شبکه‌های عصبی در نظر گرفته و سپس بر اساس تغییرات گرادیان، رویه‌ تکرار سیاست را اجرا می‌کند.

    مارتین بیچلر، یکی از محققان حاضر در این پروژه، در مصاحبه‌ خود با TeckXplore توضیح‌ می‌دهد: «همین سال گذشته بود که جایزه‌ نوبل علم اقتصاد، برای کار بر روی نظریه‌ مزایده، به پاول میلگرم و باب ویلسون اعطا شد. پیش از این هم اقدامات ویلیام ویکری، برنده‌ جایزه نوبل بودند که راهبردهای تعادلی مبتنی بر نظریه بازی را برای مزایده‌های تک‌آیتمی ساده مطرح کردند، راهبردهایی که معادلات دیفرانسیلی را حل می‌کنند. با وجود این، مزایده‌های چندشیئی پیچیده‌تر و چالش‌برانگیزتر هستند و راهبردهای تعادلی، تا‌به‌حال تنها برای چند مورد خاص از آن‌ها کاربرد داشته‌اند.»

    چند سالی هست که بیچلر و همکارانش مشغول تحقیق درباره نظریه‌ مزایده و کاربردهایش هستند. این پژوهشگران در مطالعات اخیر خود، سعی در طراحی تکنیکی داشته‌اند که بتواند با استفاده از شبکه‌های عصبی مصنوعی، راهبردهای تعادلی به‌کاررفته در مزایده‌ها را به صورت خودکار بیاموزد.

    بیچلر می‌گوید: «همگرایی این روش جدید با مفروضه‌های استاندارد، در مدل‌های مزایده‌ای گوناگون، تأیید شده است. بنابراین راهکارهای تعادلی جدیدی هم می‌توان طراحی کرد که راهبردهای پیشنهادی تعادلی را برای انواع مدل‌های مزایده به صورت عددی محاسبه کنند، کاری که تاکنون غیرممکن به نظر می‌رسید.»

    تکنیک بیچلر

    محققان با آزمایش این تکنیک دریافتند در صورت برقراری تعادل، BNEهای برآوردشده با تعادلی که از تحلیل به دست آمده همگرایی دارند. علاوه بر این، در مواردی که تعادل تحلیلی نامعلوم بود، مقدار خطای برآوردشده بسیار پایین بود. در آینده، این ابزار را می‌توان برای بررسی کارایی مزایده‌ها و پیش‌بینی راهبردهای احتمالی به کار برد.

    تکنیک بیچلر و دستیارانش علاوه بر نقش مهمی که در مطالعه‌ نظریه‌ مزایده ایفا می‌کند، ابزار بسیار ارزشمندی هم برای برگزارکنندگان مزایده‌ها به شمار می‌رود؛ زیرا به آن‌ها کمک می‌کند، قالب و فرمت مزایده را انتخاب کنند. علاوه بر این، خریداران حاضر در مزایده نیز می‌توانند با تکیه بر این تکنیک، راهبردهای خود را برنامه‌ریزی کنند. به عنوان نمونه، قانونگذاران سراسر دنیا می‌توانند در مزایده‌های طیف Spectrum auctions از این تکنیک استفاده کنند، تا برای مثال، دسترسی به سیگنال‌های مخابراتی باندهای مختلف را در میان ارائه‌دهندگان اینترنت موبایل توزیع کنند.

    بیچلر توضیح می‌دهد: «در ابتدا از فرایند یادگیری استاندارد شبکه‌های عصبی، یعنی گرادیان کاهشی، استفاده کردیم، تا ناپیوستگی‌های موجود در توابع مصرفی را در مدل‌های مزایده‌ای مدیریت کنیم. سپس نشان دادیم که این روش با تعادل موجود در مزایده‌هایی که یک سری مفروضه‌ متوسط دارند، همگرایی دارد. این یافته‌ها حائز اهمیت بودند، چون تعادل به‌دست‌آمده از این طریق، معمولاً در بازی‌ها همگرایی ندارد.»

    بیچلر و همکارانش قصد دارند در پژوهش‌های آتی، این تکنیک را بر روی سناریوهای مختلف آزمایش کنند و از تعمیم‌پذیری آن اطمینان حاصل کنند. علاوه بر این، امیدوارند بتوانند ابزارهایی طراحی کنند که از بازی‌های قرینه فراتر بروند و تعادل را در طیف وسیع‌تری از موقعیت‌های نظریه بازی ها محاسبه کنند.

    جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

    این مطلب چه میزان برای شما مفید بوده است؟
    [کل: ۲ میانگین: ۴]

    هوش مصنوعی برای کاهش میزان تصادفات جاده‌ای در ایران به کار گرفته می‌شود

    مقاله قبلی

    معرفی کتابخانه های نرم افزاری سبک TF-GAN

    مقاله بعدی

    شما همچنین ممکن است دوست داشته باشید

    بیشتر در اخبار

    نظرات

    پاسخ دهید

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *