تست تورینگ؛ آزمونی برای سنجش هوشمندی ماشین

تیم تحریریه
۴ خرداد ۱۴۰۰

زمان مطالعه: 5 دقیقه

تست تورینگ از مشهورترین آزمون‌ها برای سنجش هوشمندی ماشین‌ها در هوش مصنوعی است. تستی که با نام پدر علم کامپیوتر، آلن تورینگ، گره خورده است.

اگر اهل فیلم دیدن باشید احتمالاً تا کسی حرف از بازی تقلید بزند ذهنتان سریع به‌سمت فیلمی با همین نام خواهد رفت. بازی تقلید در سال 2014 روی پرده رفت و جزء فیلم‌های موفق آن سال بود.

این فیلم سعی می‌کند بخش‌هایی از زندگی آلن تورینگ را بازسازی کند. اما تا به حال به اسم این فیلم فکر کرده‌اید. چرا بازی تقلید؟

فهرست مقاله پنهان

1 تورینگ و مسئله ماشین هوشمند

1.1 بازی تقلید

1.2 ماشین‌هایی که از سد تست تورینگ گذشته‌اند

1.3 مسابقات لوبنر

2 آیا واقعا تست تورینگ هوش ماشین را اندازه می‌گیرد؟

تورینگ و مسئله ماشین هوشمند

«می‌خواهم به این سوال بپردازم که آیا ماشین‌ می‌تواند فکر کند؟»

این جمله آغازگر یکی از مشهورترین مقالات تاریخ علم کامپیوتر و هوش مصنوعی جهان است. مقاله «ماشین رایانشی و هوش Computing machinery and intelligence » را آلن تورینگ زمانی نوشت که در دانشگاه منچستر کار می‌کرد. او سعی کرد به این سوال سنتی پاسخ دهد. منتهی روش او با کسانی که پیش از او درباره این مسئله اندیشیده بودند متفاوت بود. مقالات و مباحث قبلی درباره این موضوع در اکثر موارد از تعریف‌ها شروع می‌کرد. اینکه ماشین چیست یا هوش چه می‌تواند باشد.

او این بار سعی کرد آزمونی تجربی برای بررسی میزان هوشمندی ماشین‌ها پیشنهاد دهد. آزمونی که تورینگ نامش را بازی تقلید می‌گذارد و امروز به نام خود این دانشمند تست تورینگ خوانده می‌شود.

بازی تقلید

تست تورینگ نسخه‌های مختلفی دارد. اما در مشهورترین نوع آن ما سه بازیگر اصلی داریم: یک انسان، یک ماشین و یک سوال‌کننده یا قاضی. سوال‌کننده در اتاقی جدا از ماشین و انسان قرار می‌گیرد. هدف بازی این است که سوال‌کننده تعیین کند که کدام یک از دو شخص دیگر ماشین و انسان هستند. تنها اطلاعاتی که سوال‌کننده از دو نفر دیگر دارد دو برچسب X و Y است اما نمی‌داند کدام یک از آن‌ها انسان است و کدام ماشین. سوال‌کننده سوالاتی از هر دو می‌پرسد ماشین باید تلاش کند تا سوال‌کننده را متقاعد کند که او هم یک انسان است.

تصور کنید در یک اتاق پشت میز نشسته‌اید و کامپیوتری روبه‌رویتان قرار دارد. دو نفر دیگر در اتاق کناری شما هستند. روال این است که شما باید با این دو نفر گفت‌وگو کنید. مکالمه شما با آن‌ها به‌صورت مکتوب است. پس از چند دقیقه گفت‌وگو شما باید تعیین کنید که کدام یک از این دو نفری که با آن‌ها چت کردید انسان بود و کدام یک ماشین.

ماشین‌هایی که از سد تست تورینگ گذشته‌اند

تورینگ در همان مقاله مشهورش می‌نویسد: «به نظر من حدود پنجاه سال بعد می‌توان کامپیوترهایی ساخت که ظرفیت حافظه 100 مگابایت باشد. در این صورت می‌توان حدس زد ماشین‌ها بازی تقلید را چنان خوب بازی کنند که یک سوال‌کننده معمولی پس از پنج دقیقه شانسش بیش از هفتاد درصد برای تشخیص ماشین نخواهد بود.

چند سال پس از انتشار مقاله تورینگ تلاش‌ها برای ساختن ماشینی که می‌توانست از پس این تست برآید آغاز شد. در این جا به چند مورد از مشهورترین این تلاش‌ها می‌پردازیم. از زمان شهرت تست تورینگ بسیاری ادعا کرده‌اند که برنامه‌شان توانسته از سد تست تورینگ بگذرد. اما واقعیت این است که تنها تعداد معدودی از چت‌بات‌ها توانستند به موفقیت در این تست نزدیک شوند.

الیزا

الیزا از اولین برنامه‌های پردازش زبان طبیعی بود که در سال‌های 1964 تا 1966 در آزمایشگاه هوش مصنوعی دانشگاه ام آی تی ساخته شد. این برنامه زیر نظر ژوف ویزنبام Joseph Weizenbaum توسعه داده شد.. برخی‌ها به اشتباه فکر می‌کنند که الیزا توانست از سد آزمون تورینگ بگذرد. این در حالی است که الیزا صرفاً از اولین چت‌بات‌هایی است که امکان شرکت در تست تورینگ را پیدا کرد. الیزا بسیار ساده طراحی شده بود و تشخیص اینکه ربات است کار دشواری نبود.

PARRY

این چت‌بات که در سال 1972 ساخته شد نسخه پیشرفته‌تر الیزا بود. PARRY از نحو فکر کردن و صحبت کردن افراد شیزوفرنیک تقلید می‌کرد. این چت‌بات را روان‌پزشکی به نام کنیث کلبی Kenneth Colby ساخت. کلبی پس از مدتی کار کردن در حوزه روان‌پزشکی از این حوزه سرخورده شد. چرا که اعتقاد داشت که روان‌پزشکی داده‌های قابل اتکایی برای کار علمی تولید نمی‌کند.

به همین خاطر او سراغ مدل‌های کامپیوتری از ذهن آمد او اعتقاد داشت که این مدل‌ها در مطالعه بیماری‌های روانی و فرایندهای شناختی بسیار کاراترند. گفتیم که پری پاسخ‌هایی شبیه به آدم‌های پارانوئیک و شیزوفرنیک می‌داد؛ کسانی که از این بیماری‌ها رنج می‌برند گفته‌های دیگران را جور دیگری تفسیر می‌کنند. آن‌ها گمان می‌کنند دیگران همیشه دروغ می‌گویند و پشت حرف‌های دیگران نیت‌های شرورانه‌ای برای آزار آن‌ها خوابیده است.

Eugen goostman

احتمالا مشهورترین چت‌باتی که توانست است در تست تورینگ آزمونگر یا قاضی تست را فریب دهد چت‌‌باتی به اسم یوجین است.

یوجین در سال 2001 به دست گروهی از برنامه‌‎نویسان در سنت پترزبورگ نوشته شد. این چت‌بات در تست خود را یوجین نوجوان سیزده ساله اوکراینی معرفی کرد. سازندگان این چت‌بات با همین تاکتیک توانستند آزمون‌گر تست را بفریبند. چرا که آزمونگر تصور می‌کرد همه خطاهای گرامری چت‌بات به‌خاطر سن پایین او و خوب نبودن انگلیسی مخاطب است. یوجین تا به امروز در تعدادی از مسابقات تست تورینگ شرکت کرده است و در مسابقات لوبنر 2008 و 2005 مقام دوم را به دست آورد. در سال 2012 در رویدادی که به مناسبت صدمین سال تولد آلن تورینگ برگزار شد یوجین توانست 29 درصد از آزمونگرهای انسانی تست تورینگ را متقاعد کند که انسان است.

مسابقات لوبنر

در سال 1991، لوبنر، خیر آمریکایی مسابقاتی با نام جایزه لوبنر بنیان نهاد. در این مسابقه 100 هزار دلار به اولین ماشینی که می‌توانست از تست تورینگ با موفقیت بیرون بیاید داده می‌شد. از سال 1991 این مسابقه به‌صورت سالانه در میان چت‌بات‌ها برگزار می‌شود. در طول چند دهه برگزاری تغییراتی در شیوه برگزاری این مسابقات صورت گرفته است. برای مثال در سال 2019 برگزارکنندگان این مسابقات اعلام کردند که دیگر در مسابقه از یک عامل انسانی استفاده نخواهند کرد و چت‌بات‌ها به‌صورت جمعی مورد قضاوت قرار خواهند گرفت.

آیا واقعا تست تورینگ هوش ماشین را اندازه می‌گیرد؟

از زمانی که تست تورینگ مورد استقبال جامعه علمی هوش مصنوعی قرار گرفت بسیاری انتقادهایی به این شیوه از سنجش هوشمندی ماشین وارد کردند.

تست تورینگ سطوح مختلف هوش را اندازه‌گیری نمی‌کند.

یکی از نقدهای دقیق به آزمون تورینگ این است که نتیجه تست تنها یک گزاره است: این ماشین هوشمند است یا نیست. اما آیا نمی‌توان سطح هوش ماشین را در سطوح مختلف سنجید مثلا تصور کنید اگر تست تورینگ می‌توانست نتیجه این چنینی هم داشته باشد: «سطح هوشمندی این ماشین در حد کودکی هفت ساله است»

تست تورینگ بیش از آنکه به فرایندها دقت کند نتیجه محور است

این نقد شاید بیش از همه ازسوی فلاسفه مطرح شده است. شاید مهم‌ترین چالش در این حوزه را جان سرل در مقاله اتاق چینی مطرح کرده باشد. سرل در این مقاله با استفاده از تمثیل اتاق چینی نشان می‌دهد که فارغ از نتیجه‌ای که ماشین به دست می‌دهد نمی‌توان گفت ماشین به فرایند‌هایی که انجام می‌دهد آگاهی دارد. در مقاله دیگری به مقاله اتاق چینی سرل به‌صورت مبسوط خواهیم پرداخت.

تست تورینگ فقط توانایی‌های نوشتاری و زبانی را می‌سنجد

همان‌طور که دیدیم آزمون تورینگ بیش از هر چیزی بر اساس گفت‌وگوب مکتوب میان چت‌بات و عامل انسانی طراحی شده است. سوالی که در اینجا مطرح می‌شود این است که چطور با دیدن توانایی‌های نوشتاری یک چت‌بات می‌توان به هوشمندی آن پی برد؟

جمع‌بندی

آزمونی که تورینگ در دهه 1950 بنیانش را نهاد همچنان به‌صورت گسترده در جامعه دانشمندان و پژوهشگران حوزه کامپیوتر و هوش مصنوعی استفاده می‌شود. نقدهایی که تا به امروز به آن وارد شده بیش از آنکه نقطه ضعف ایده‌های تورینگ باشد نشان‌دهنده تخیل قدرتمند علمی این دانشمند است. چرا که هر راه دیگری که برای سنجش هوشمندی ماشین‌ها پیشنهاد می‌شود به نوعی مدیون بازی تقلید تورینگ است.

https://hooshio.com/?p=14084

تست تورینگ؛ آزمونی برای سنجش هوشمندی ماشین