قابلیت تشخیص الگوهای زبانی توسط هوش مصنوعی
زبانهای انسانی بسیار پیچیده هستند و به همین دلیل است که متخصصان زبانشناسی همواره آموزش تحلیل اصوات و ساختارهای واژگان به ماشینها را غیرممکن دانستهاند. اما بهتازگی پژوهشگران دانشگاههای MIT، کورنل و مکگیل، در راستای تحقق این هدف بلندپروازانه گام برداشتهاند. این متخصصان سیستم هوش مصنوعیای را به نمایش گذاشتهاند که میتواند قوانین و الگوهای حاکم بر زبانهای انسانی را بهصورت خودکار بیاموزد.
مدل مذکور در ابتدا کلمات یک زبان خاص و مثالهایی از کارکردهای گرامری این کلمات (زمان یا جنسیت آنها) را دریافت میکند و سپس، قوانین مربوط به تغییرات را استخراج مینماید. بهعنوانمثال، مدل میتواند دریابد که در زبان صرب-کروات، افزودن حرف «a» به آخر کلمات، آنها را به شکل مذکر در میآورد. علاوه بر این، مدل میتواند بهصورت خودکار الگوهای زبانی پیچیدهتری را بیاموزد که در بسیاری از زبانها به چشم میخورند؛ بدین ترتیب، خروجی مدل بهمرور زمان بهتر و بهتر میشود. پژوهشگران مدل مذکور را با استفاده از مسائل موجود در کتابهای مرجع زبانشناسی به 58 زبان متفاوت آموزش دادهاند. هریک از این مسائل مجموعهای از کلمات و تغییراتشان را نشان میداد. در انتهای آزمایشها، مدل توانست مجموعه قوانینی را استخراج کند که تغییرات کلمات را در 60 درصد از مسائل توضیح میدادند.
آیا هوش مصنوعی میتواند به توانایی مدلسازی الگوهای زبانی دست یابد؟
این سیستم را میتوان برای بررسی فرضیات زبانی و مطالعه شباهتهای نهانی به کار برد که در شکلگیری کلمات متفاوت نقش دارند. آنچه این سیستم را منحصربهفرد میسازد، کشف مدلهایی است که برای انسانها هم قابلفهم هستند. بهعلاوه، سیستم میتواند مدلهای زبانی را با استفاده از مقدار کمی داده، مثلاً چند ده تا کلمه، به دست آورد. این نکته که سیستم بهجای استفاده از دیتاستهای بزرگ، از دادههای کمی برای استخراج مدلها استفاده میکند، باعث میشود کارکردش بهشیوه فرضیهسازی متخصصان شباهت داشته باشد: متخصصان هم به چند دیتاست مرتبط نگاه میکنند و مدلهای مناسب برای توضیح پدیدههای مشاهدهشده در آن دیتاستها را استخراج میکنند.
کوین الیس، استاد علوم کامپیوتر دانشگاه کورنل و نویسنده اول مقاله، توضیح میدهد: «یکی از مهمترین دلایل انجام این پروژه، علاقهمان به مطالعه سیستمهایی بود که میتوانند الگوهای موجود در دیتاستها را مانند انسانها درک کنند. سؤال اینجا بود که آیا این مدلها میتوانند بهجای یادگیری وزن نمونهها، قوانین و توضیحات مناسب را بیاموزند؟ بهبیاندیگر، میخواستیم ببنیم آیا میتوانیم سیستمی بسازیم که بر اساس چند دیتاست مرتبط، مدلسازی الگوهای زبانی آنها را بیاموزد یا خیر.»
نگاهی به دستور زبان از دیدگاه هوش مصنوعی
پژوهشگران در تلاش برای ساخت سیستمی که بتواند بهصورت خودکار و بر اساس چند دیتاست، یک مدل از الگوی زبانی مشخص را بیاموزد، تصمیم گرفتند تا ارتباط بین آواشناسی (مطالعه الگوهای صوتی) و ساختارشناسی (مطالعه ساختارهای کلمات) را بررسی کنند. دادههای استخراجشده از کتب مرجع زبانشناسی بستر آزمایشی ایدهآلی فراهم آوردند، چون برخی ویژگیهای اصلی بین بسیاری از زبانها مشترک هستند و مسائل موجود در این کتابها پدیدههای زبانی خاصی را نشان میدهند. دانشجویان هم تقریباً بهراحتی میتوانند این مسائل را حل کنند، اما دانش قبلیشان از آواشناسی به استدلال بهترشان کمک میکند.
آلبرایت میگوید: «متخصصین زبانشناسی همواره فرض بر این داشتهاند که تنها انسانها میتوانند به درک واقعی از قوانین حاکم بر الگوهای زبانی دست یابند و ماهیت این سیستم را بفهمند. در این پروژه، میخواستیم ببینیم که آیا میتوانیم دانش و استدلال انسانها یا به بیان دقیقتر، متخصصان زبانشناسی را تقلید کنیم؟»
پژوهشگران برای ساخت این مدل از تکنیکی به نام یادگیری برنامهنویسی بیزی استفاده کردند. در این تکنیک، مدل مسائل را با نوشتن برنامههای کامپیوتری حل میکند. در پروژه مذکور، برنامه ساخته شده همان دستور زبان است که به نظر مدل، میتواند کلمات و معنایشان در مسائل زبانی را توضیح دهد. این مدل با استفاده از Sketch ساخته شده است؛ Sketch برای تولید برنامه به کار میرود و محصول سولار-لزاما است.
با وجود این، Sketch برای دریافت محتملترین برنامه به زمان زیادی نیاز دارد. پژوهشگران برای حل این مشکل کاری کردند که مدل گامبهگام کار کند؛ یعنی برنامه کوچکی برای توضیح قسمتی از دادهها بنویسد و سپس برنامه بزرگتری بنویسد که با اصلاح برنامه قبلی، دادههای بیشتری را پوشش میدهد. بهعلاوه، پژوهشگران مدل را به نحوی طراحی کردند که بیاموزد «برنامههای خوب» چه مشخصاتی دارند. برای مثال، باتوجهبه شباهت بین زبان روسی و لهستانی، ممکن است مدل چندین قانونی کلی در مورد زبان روسی بیاموزد که در زبان لهستانی هم کاربرد دارند؛ در این صورت، مدل راحتتر مسائل زبان لهستانی را حل خواهد کرد.
مدل هوش مصنوعی که مشکلات کتاب مرجع خود را برطرف میکند!
طی آزمایش روی 70 مسئله از کتب مرجع زبانشناسی، مدل توانست دستور زبانی را پیدا کند که با مجموعه کلمات موجود در 60 درصد از مسائل و با تغییر شکل کلمات در 79 درصد از مسائل انطباق داشت. بعد از اینکه پژوهشگران سعی کردند با دانش قبلی، مدل را از پیشبرنامهنویسی کنند، مدل توانست عملکرد بهتری هم از خود نشان دهد. آلبرایت اضافه میکند: «یکی از چالشهای این پروژه این بود که بفهمیم آنچه مدل انجام میدهد قابلقبول است یا خیر. بهویژه از آنجایی که در این آزمایشها، فقط یک جواب درست وجود ندارد.»
مدل در بیشتر مواقع توانست راهکارهای موردانتظار را به دست آورد. حتی در یکی از مسائل زبان لهستانی، علاوه بر پاسخ موردانتظار، یک جواب درست دیگر هم ارائه داد که نشاندهنده اشتباه در کتاب مرجع بود. به گفته الیس، این امر نشان میدهد که این مدل را میتوان برای مشکلزدایی از تحلیل الگوهای زبانی نیز به کار برد. آزمایشهای دیگر نیز نشان دادند که مدل میتواند برخی از چارچوبهای کلی قوانین آواشناسی را بیاموزد که در همه مسائل کاربرد داشتند. پژوهشگران قصد دارند تا در آینده، از این مدل برای پیداکردن راهکارهای غیرمنتظره برای مسائل حوزههای دیگر استفاده کنند. برای مثال، به گفته الیس با تکیه بر این رویکرد، شاید بتوان سیستمی برای استنتاج معادلات دیفرانسیل ساخت که مبتنی بر دیتاستهای موجود از حرکت اشیاء مختلف باشد.
وی اضافه میکند: «پروژه ما نشان داد که روشهای قادر به یادگیری سوگیریهای استنتاجی را در اختیار داریم. اما فکر نمیکنم تا بدینجا، حتی در همان مسائل کتب مرجع هم بهصورت کامل سوگیریهای استنتاجی را پیدا کنیم که باعث میشوند متخصصین زبانشناسی برخی دستورهای زبانی را بپذیرند و برخی را رد کنند.»
تیفلوریان جگر، استاد علوم شناختی و مغز و علوم کامپیوتر دانشگاه روچستر، که از نویسندگان این مقاله نبوده است، درباره پژوهش میگوید: «این پروژه راههای زیادی را پیش روی پژوهشهای آینده باز میکند. آنچه بهشخصه برای من بسیار جالب است، رویکرد الیس و همکارانش، یعنی یادگیری برنامهنویسی بیزی یا BPL است که شبیه به یادگیری زبان در نوزادان است. کارهای آینده میتوانند به پرسشهای دیگری بپردازند؛ برای مثال، رویکرد BPL تحت چه سوگیریهای استنتاجی دیگری میتواند رفتار انسانی را بیاموزد؟ به نظر من، خیلی جالب میشود اگر بتوانیم ببینیم که سوگیریهای استنتاجی انتزاعیتر از آنچه الیس و همکارانش مطالعه کردهاند، مثل سوگیریهای ناشی از محدودیت پردازش مغز انسان، میتوانند برای بازآفرینی برخی از الگوهای مشاهدهشده در زبان کافی باشند یا خیر.»
این پروژه از سوی دفتر پژوهشهای علمی دفتر نیروی هوایی، مرکز Brains, Minds, and Machines، آزمایشگاه IBM-Watson دانشگاه MIT، کنسول پژوهشهای مهندسی و علوم طبیعی کانادا، صندوق تحقیقات کبک، برنامه CIFAR AI کانادا و بنیاد ملی علوم پشتیبانی شده است.
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید