هوش مصنوعی دیپ مایند قوانین شطرنج را بازنویسی میکند
محققان هوش مصنوعی دیپ مایند به آلفازیرو اجازه میدهند تا با قوانین مختلف شطرنج بازی کند و با این کار، راههای بهبودبخشی بازی را بیابند.
در رقابتی که بین شطرنج کلاسیک و هوش مصنوعی در جریان است، محققان دیپ مایند گوگل اقدامی دیگر انجام دادهاند. آنها این بار با ولادیمیر کرامنیک، قهرمان سابق شطرنج جهان، برای طراحی و آزمایش انواع جدید بازیهایی که هوش مصنوعی در آنها به کار رفته بود، همکاری کردند. هدف این تیم بهینهسازی طراحی قوانین بازی شطرنج بود و بر همین مبنا، تیم تحقیقاتی در تلاش بود تا به لطف هوش مصنوعی، بهترین قوانین و روشهای امتیازگیری را برای بهبود این بازی چند صد ساله کشف کند.
دانشمندان برای دستیابی به این هدف، از هوش مصنوعی آلفازیرو استفاده کردند. این هوش مصنوعی، یک سیستم یادگیری تطبیقی است که میتواند قوانین جدیدی را از ابتدا به خود بیاموزد و به سطوح فوقالعاده بالا برای انجام بازی دست یابد، تا در نهایت، نتایج 9 نوع مختلف شطرنج را که به کمک کرامنیک از قبل تعریف شده بودند، آزمایش کند.
برای هر یک از انواع نُهگانه، آلفازیرو دهها هزار بازی علیه خودش انجام داد، هر حرکت احتمالی را برای هر شرایط خاص صفحه شطرنج تجزیه و تحلیل کرد و استراتژیها و الگوهای جدیدی برای بازیها ایجاد کرد. کرامنیک و محققان سپس این بازیهایی که هوش مصنوعی ابداع کرده بود را بین بازیکنان انسانی به اجرا درآورند تا دریابند این قوانین جدید در بازیهای انسانی به چه شکل انجام خواهد شد. هدف آنها از این کار، این بود که بفهمند آیا مجموعه قوانین مختلفی که هوش مصنوعی به بازی اضافه کرده است، میتواند بازی را بهبود بخشد؟ یا خیر.
هوش مصنوعی دیپ مایند و قوانین شطرنج کلاسیک
بازی شطرنج در طول قرنهای متمادی به طور قابل توجهی تکامل یافته است و امروزه، گزینههای جدیدی برای بهبود روشهای درکشده این بازی کلاسیک در دسترس است. تغییر قوانین میتواند تأثیر بسزایی در استراتژی، بازیسازی و پویایی مسابقات داشته باشد. اما از نظر تاریخی، درک نتایج اجرای یک نوع خاصی از شطرنج تنها با گذشت زمان و با مشاهده بازیکنان انسانی کافی امکانپذیر شده است.
محققان دیپ مایند میگویند: «آموزش هوش مصنوعی مدل آلفازیرو تحت این تغییرات قوانین به ما کمک کرد تا طی دهههای متمادی، بهطور موثر بازی انسان را در چند ساعت شبیهسازی کنیم و به سوال «چه میشود اگر» پاسخ دهیم. یکی از این سوالات این است: در تئوری توسعه یافته هوش مصنوعی، در هر نوع از بازی شطرنج، انجام بازی و نتیجه آن بهطور بالقوه چگونه خواهد بود؟
برخی از تغییرات انجام شده توسط هوش مصنوعی آلفازیرو شامل توانایی بازیکن برای ضبط مهرههای خود، یا حرکت پیادهها به عقب با یک مربع بود. قانون دیگری که هوش مصنوعی آن را به وجود آورد، قانون «قلعه رفتن ممنوع» بود که در آن، حرکت قلعه رفتن در تمام طول بازی ممنوع است. در مقابل این نوع از بازی شطرنج، نوع دیگری وجود دارد که به جای تساوی طرفین در یک وضعیت بنبست یا پات، برد را ترجیح میدهد و میبایست حتما یکی از طرفین به عنوان برنده معرفی شوند. در بازیهای کلاسیک، تساوی به معنای بازی تمام شدهای است که نصف امتیاز برای هر یک از طرفین داشته باشد و بازی با نتیجه مساوی خاتمه مییابد. وضعیت پات یا بنبست نیز وضعیتی در شطرنج است که حریف مات نشده باشد، ولی امکان حرکت نیز نداشته باشد. قوانین شطرنج در این مورد حکم به تساوی طرفین میدهد. تغییری که هوش مصنوعی در این قوانین به وجود آورد، این بود که در نتیجهگیری این دو نوع بازی این تغییرات را ایجاد کرد.
هوش مصنوعی دیپ مایند چطور خود را برای بازی شطرنج آموزش داد
سیستم هوش مصنوعی هر نوعی از بازی شطرنج را در 10000 بازی انجام داد، به این صورت که سرعت این بازیها یک حرکت در هر ثانیه بود. همچنین این سیستم، 1000 بازی دیگر نیز انجام داد که با سرعت هر حرکت در یک دقیقه صورت گرفت. دانشمندان برای عینیسازی هرچه بیشتر تغییرات و نشان دادن تاثیر آنها بر کیفیت بازیها، عوامل مختلفی را بررسی کردند.
به طور کلی، بیشتر روشهایی که انسانها طبق آنها شطرنج بازی میکنند، با توجه به برخی قوانین مانند «بن بست = برنده» که به طور قابل توجهی باعث پیشرفت بازی میشوند، نتایج تعیینکننده را افزایش میدهند. محققان همچنین دریافتند که کنترل زمان بر قاطعیت بازی تأثیر میگذارد: بازیهایی که در یک ثانیه در هر حرکت انجام میشوند، بسیار کمتر از بازیهایی که یک دقیقه در هر حرکت دارند، به پایان میرسد.
نتایج همچنین نشان داد که در درصد زیادی از بازیها، هوش مصنوعی آلفازیرو به جای اینکه دقیقاً به حرکات کلاسیک پایبند باشد، به لطف قوانین جدید، از حرکات اضافی در اختیار خود فعالانه استفاده میکند. محققان میگویند: «این نشان میدهد که گزینههای جدید و قوانین تازهای که هوش مصنوعی آنها را ایجاد کرده است، واقعاً مفیدند و به بازی کمک میکنند.»
استاد بزرگ شطرنج و هوش مصنوعی دیپ مایند
در بالای تجزیه و تحلیل آماری از گیم پلی جدید آلفازیرو، تیم دیپ مایند از کرامنیک خواست تا به سوالات ذهنی بیشتری درباره موقعیتها، حرکات و الگوهایی که انواع مختلف روشهای بازی شطرنج بهوجود آورده است، پاسخ دهد. ورود هر بازیکن انسانی به نوع جدیدی از بازی شطرنج در اصل قوانین جدیدی که توسط جامعه شطرنج بازان کلاسیک مورد قبول واقع شدهاند را به ما نشان میدهد.
کرامنیک روسی، استاد بزرگ شطرنج مدتهاست که از مدافعان قانون «قلعه رفتن ممنوع» است که هوش مصنوعی آن را ایجاد کرده. او تأیید کرده است که این قانون به طور بالقوه هیجانانگیز است و میتواند بر هیجان بازی بیفزاید، زیرا با افزایش آسیبپذیری مهره شاه هر دو بازیکن، بازی تهاجمی را در طرفین تشویق میکند. از طرف دیگر، کرامنیک دریافت که نوع بازی «بن بست = برنده» تأثیر کمتری در کلیت بازی دارد.
استاد بینالمللی دنی رنش، رئیس ارشد شطرنج در وب سایت شطرنج Chess.com نیز یافتههای دیپ مایند را در یک ویدیو بررسی کرده است. وی قانون «بن بست = برنده» را برعکس کرامنیک توصیف کرد. از نظر دنی رنش، قانون «بن بست = برنده» قانونی است که به طور قابل توجهی گیم پلی را در کل بازی شطرنج تغییر میدهد.
رنش در این باره میگوید: شما نمیتوانید تساوی در شطرنج را تغییر دهید، مگر اینکه واقعاً وضعیت بنبست مهرهها را برطرف کنید. من کاملاً اعتقاد دارم که بنبست مساوی با یک پیروزی نهتنها میتواند به رشد بازی برای بازیکنان مبتدی کمک کند، بلکه در واقع میتواند روی نتایج قاطعی که دیدیم نیز تأثیرگذار باشد.»
در نهایت، به همان اندازه که بینش آلفازیرو به عنوان یک هوش مصنوعی میتواند در خلق قوانین جدید شطرنج مفید باشد، نمیتوان پیشبینی کرد کدام قوانین شطرنج که توسط هوش مصنوعی ایجاد میشوند مورد پذیرش انسانها خواهند بود. تنها راه برای فهمیدن این موضوع، این است که مشاهده کنید بازیکنان انسان چگونه انواع مختلفی از این قوانین و روشهای بازی را برمیگزینند، تغییر میدهند یا آن را کنار میگذارند. چه کسی میداند، شاید وقتش رسیده آن اپلیکیشن قدیمی شطرنج را که تقریبا فراموشش کرده بودید، دوباره باز کنید و یک بازی با حریف هوش مصنوعی انجام دهید!
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید.