تست تورینگ؛ آزمونی برای سنجش هوشمندی ماشین
تست تورینگ از مشهورترین آزمونها برای سنجش هوشمندی ماشینها در هوش مصنوعی است. تستی که با نام پدر علم کامپیوتر، آلن تورینگ، گره خورده است.
اگر اهل فیلم دیدن باشید احتمالاً تا کسی حرف از بازی تقلید بزند ذهنتان سریع بهسمت فیلمی با همین نام خواهد رفت. بازی تقلید در سال 2014 روی پرده رفت و جزء فیلمهای موفق آن سال بود.
این فیلم سعی میکند بخشهایی از زندگی آلن تورینگ را بازسازی کند. اما تا به حال به اسم این فیلم فکر کردهاید. چرا بازی تقلید؟
تورینگ و مسئله ماشین هوشمند
«میخواهم به این سوال بپردازم که آیا ماشین میتواند فکر کند؟»
این جمله آغازگر یکی از مشهورترین مقالات تاریخ علم کامپیوتر و هوش مصنوعی جهان است. مقاله «ماشین رایانشی و هوش Computing machinery and intelligence » را آلن تورینگ زمانی نوشت که در دانشگاه منچستر کار میکرد. او سعی کرد به این سوال سنتی پاسخ دهد. منتهی روش او با کسانی که پیش از او درباره این مسئله اندیشیده بودند متفاوت بود. مقالات و مباحث قبلی درباره این موضوع در اکثر موارد از تعریفها شروع میکرد. اینکه ماشین چیست یا هوش چه میتواند باشد.
او این بار سعی کرد آزمونی تجربی برای بررسی میزان هوشمندی ماشینها پیشنهاد دهد. آزمونی که تورینگ نامش را بازی تقلید میگذارد و امروز به نام خود این دانشمند تست تورینگ خوانده میشود.
بازی تقلید
تست تورینگ نسخههای مختلفی دارد. اما در مشهورترین نوع آن ما سه بازیگر اصلی داریم: یک انسان، یک ماشین و یک سوالکننده یا قاضی. سوالکننده در اتاقی جدا از ماشین و انسان قرار میگیرد. هدف بازی این است که سوالکننده تعیین کند که کدام یک از دو شخص دیگر ماشین و انسان هستند. تنها اطلاعاتی که سوالکننده از دو نفر دیگر دارد دو برچسب X و Y است اما نمیداند کدام یک از آنها انسان است و کدام ماشین. سوالکننده سوالاتی از هر دو میپرسد ماشین باید تلاش کند تا سوالکننده را متقاعد کند که او هم یک انسان است.
تصور کنید در یک اتاق پشت میز نشستهاید و کامپیوتری روبهرویتان قرار دارد. دو نفر دیگر در اتاق کناری شما هستند. روال این است که شما باید با این دو نفر گفتوگو کنید. مکالمه شما با آنها بهصورت مکتوب است. پس از چند دقیقه گفتوگو شما باید تعیین کنید که کدام یک از این دو نفری که با آنها چت کردید انسان بود و کدام یک ماشین.
ماشینهایی که از سد تست تورینگ گذشتهاند
تورینگ در همان مقاله مشهورش مینویسد: «به نظر من حدود پنجاه سال بعد میتوان کامپیوترهایی ساخت که ظرفیت حافظه 100 مگابایت باشد. در این صورت میتوان حدس زد ماشینها بازی تقلید را چنان خوب بازی کنند که یک سوالکننده معمولی پس از پنج دقیقه شانسش بیش از هفتاد درصد برای تشخیص ماشین نخواهد بود.
چند سال پس از انتشار مقاله تورینگ تلاشها برای ساختن ماشینی که میتوانست از پس این تست برآید آغاز شد. در این جا به چند مورد از مشهورترین این تلاشها میپردازیم. از زمان شهرت تست تورینگ بسیاری ادعا کردهاند که برنامهشان توانسته از سد تست تورینگ بگذرد. اما واقعیت این است که تنها تعداد معدودی از چتباتها توانستند به موفقیت در این تست نزدیک شوند.
الیزا
الیزا از اولین برنامههای پردازش زبان طبیعی بود که در سالهای 1964 تا 1966 در آزمایشگاه هوش مصنوعی دانشگاه ام آی تی ساخته شد. این برنامه زیر نظر ژوف ویزنبام Joseph Weizenbaum توسعه داده شد.. برخیها به اشتباه فکر میکنند که الیزا توانست از سد آزمون تورینگ بگذرد. این در حالی است که الیزا صرفاً از اولین چتباتهایی است که امکان شرکت در تست تورینگ را پیدا کرد. الیزا بسیار ساده طراحی شده بود و تشخیص اینکه ربات است کار دشواری نبود.
PARRY
این چتبات که در سال 1972 ساخته شد نسخه پیشرفتهتر الیزا بود. PARRY از نحو فکر کردن و صحبت کردن افراد شیزوفرنیک تقلید میکرد. این چتبات را روانپزشکی به نام کنیث کلبی Kenneth Colby ساخت. کلبی پس از مدتی کار کردن در حوزه روانپزشکی از این حوزه سرخورده شد. چرا که اعتقاد داشت که روانپزشکی دادههای قابل اتکایی برای کار علمی تولید نمیکند.
به همین خاطر او سراغ مدلهای کامپیوتری از ذهن آمد او اعتقاد داشت که این مدلها در مطالعه بیماریهای روانی و فرایندهای شناختی بسیار کاراترند. گفتیم که پری پاسخهایی شبیه به آدمهای پارانوئیک و شیزوفرنیک میداد؛ کسانی که از این بیماریها رنج میبرند گفتههای دیگران را جور دیگری تفسیر میکنند. آنها گمان میکنند دیگران همیشه دروغ میگویند و پشت حرفهای دیگران نیتهای شرورانهای برای آزار آنها خوابیده است.
Eugen goostman
احتمالا مشهورترین چتباتی که توانست است در تست تورینگ آزمونگر یا قاضی تست را فریب دهد چتباتی به اسم یوجین است.
یوجین در سال 2001 به دست گروهی از برنامهنویسان در سنت پترزبورگ نوشته شد. این چتبات در تست خود را یوجین نوجوان سیزده ساله اوکراینی معرفی کرد. سازندگان این چتبات با همین تاکتیک توانستند آزمونگر تست را بفریبند. چرا که آزمونگر تصور میکرد همه خطاهای گرامری چتبات بهخاطر سن پایین او و خوب نبودن انگلیسی مخاطب است. یوجین تا به امروز در تعدادی از مسابقات تست تورینگ شرکت کرده است و در مسابقات لوبنر 2008 و 2005 مقام دوم را به دست آورد. در سال 2012 در رویدادی که به مناسبت صدمین سال تولد آلن تورینگ برگزار شد یوجین توانست 29 درصد از آزمونگرهای انسانی تست تورینگ را متقاعد کند که انسان است.
مسابقات لوبنر
در سال 1991، لوبنر، خیر آمریکایی مسابقاتی با نام جایزه لوبنر بنیان نهاد. در این مسابقه 100 هزار دلار به اولین ماشینی که میتوانست از تست تورینگ با موفقیت بیرون بیاید داده میشد. از سال 1991 این مسابقه بهصورت سالانه در میان چتباتها برگزار میشود. در طول چند دهه برگزاری تغییراتی در شیوه برگزاری این مسابقات صورت گرفته است. برای مثال در سال 2019 برگزارکنندگان این مسابقات اعلام کردند که دیگر در مسابقه از یک عامل انسانی استفاده نخواهند کرد و چتباتها بهصورت جمعی مورد قضاوت قرار خواهند گرفت.
آیا واقعا تست تورینگ هوش ماشین را اندازه میگیرد؟
از زمانی که تست تورینگ مورد استقبال جامعه علمی هوش مصنوعی قرار گرفت بسیاری انتقادهایی به این شیوه از سنجش هوشمندی ماشین وارد کردند.
- تست تورینگ سطوح مختلف هوش را اندازهگیری نمیکند.
یکی از نقدهای دقیق به آزمون تورینگ این است که نتیجه تست تنها یک گزاره است: این ماشین هوشمند است یا نیست. اما آیا نمیتوان سطح هوش ماشین را در سطوح مختلف سنجید مثلا تصور کنید اگر تست تورینگ میتوانست نتیجه این چنینی هم داشته باشد: «سطح هوشمندی این ماشین در حد کودکی هفت ساله است»
- تست تورینگ بیش از آنکه به فرایندها دقت کند نتیجه محور است
این نقد شاید بیش از همه ازسوی فلاسفه مطرح شده است. شاید مهمترین چالش در این حوزه را جان سرل در مقاله اتاق چینی مطرح کرده باشد. سرل در این مقاله با استفاده از تمثیل اتاق چینی نشان میدهد که فارغ از نتیجهای که ماشین به دست میدهد نمیتوان گفت ماشین به فرایندهایی که انجام میدهد آگاهی دارد. در مقاله دیگری به مقاله اتاق چینی سرل بهصورت مبسوط خواهیم پرداخت.
- تست تورینگ فقط تواناییهای نوشتاری و زبانی را میسنجد
همانطور که دیدیم آزمون تورینگ بیش از هر چیزی بر اساس گفتوگوب مکتوب میان چتبات و عامل انسانی طراحی شده است. سوالی که در اینجا مطرح میشود این است که چطور با دیدن تواناییهای نوشتاری یک چتبات میتوان به هوشمندی آن پی برد؟
جمعبندی
آزمونی که تورینگ در دهه 1950 بنیانش را نهاد همچنان بهصورت گسترده در جامعه دانشمندان و پژوهشگران حوزه کامپیوتر و هوش مصنوعی استفاده میشود. نقدهایی که تا به امروز به آن وارد شده بیش از آنکه نقطه ضعف ایدههای تورینگ باشد نشاندهنده تخیل قدرتمند علمی این دانشمند است. چرا که هر راه دیگری که برای سنجش هوشمندی ماشینها پیشنهاد میشود به نوعی مدیون بازی تقلید تورینگ است.