هوش مصنوعی فراهوشمند از فرایندهای پردازش زبان در مغز پرده بر میدارد
طی سالهای اخیر، مدلهای زبانی هوش مصنوعی فراهوشمند در انجام برخی مسائل به عملکرد خیلی خوبی دست یافتهاند. از جمله این مسائل، پیشبینی کلمه بعدی است که در موتورهای جستوجو و نرمافزارهای پیامرسانی کاربرد دارد و کلمه بعدی را که کاربر قصد دارد بنویسد، پیشبینی میکند.
بهنظر میرسد نسل جدید مدلهای پیشبینی زبان قابلیت درک معنای زبان را هم دارند. این هوش مصنوعی فراهوشمند علاوه بر پیشبینی کلمه بعدی، مسائلی را که مستلزم درک واقعی زبان هستند نیز میتوانند حل کنند؛ بهعنوان مثال، میتوان به پاسخدهی به سؤالات، خلاصهسازی متون و تکمیل داستان اشاره کرد.
هدف از طراحی این مدلها، بهینهسازی مسئله پیشبینی متن بوده است. این مدلها هرگز قصد تقلید از فرایندهای مغزی انسان هنگام انجام مسائل زبانی یا درک زبان را نداشتهاند؛ با این حال، مطالعات جدید متخصصان عصبشناسی MIT حاکی از شباهت بین کارکرد زیربنایی این مدلها با کارکرد مراکز پردازش زبان در مغز انسانها است.
متخصصان عصبشناسی MIT دریافتهاند کارکرد مدلهای پیشبینی کلمه بعدی مشابه با کارکرد مراکز پردازش زبان در مغز انسانهاست.
از سوی دیگر، مدلهای کامپیوتری که در سایر مسائل زبانی عملکرد خوبی دارند، چنین شباهتی به مغز انسان نشان نمیدهند. این امر گواهی بر این است که مغز انسان نیز برای پیشبرد مسائل پردازش زبان احتمالاً از فرایند پیشبینی کلمه بعدی استفاده میکند.
نانسی کنویشر، استاد علوم عصبشناسی و یکی از نویسندگان مقاله، توضیح میدهد: «هرچه مدل عملکرد بهتری در پیشبینی کلمه بعدی داشته باشد، شباهتش به مغز انسان بیشتر است. تناسب بین این دو واقعاً جالب است. نکتهای که میتوان از این شباهت برداشت کرد، این است که شاید سیستم پردازش زبان مغز انسان هم آنچه را قرار است در مرحله بعد اتفاق بیفتد، پیشبینی میکند.» کنویشر از اعضای مؤسسه McGovern و مرکز CBMM، هر دو از مؤسسات وابسته به دانشگاه MIT، است.
جاشوا تننبام (استاد علومشناختی محاسباتی MIT، عضو CBMM و آزمایشگاه CSAIL)، اولینا فدرینکو (استادیار عصبشناسی و عضو مؤسسه McGovern) نویسندگان ارشد این مقاله هستند. نویسنده اول این مقاله که در ژورنال Proceedings of the National Academy of Sciences به چاپ رسیده است، مارتین شریمف، دانشجوی تحصیلات تکمیلی MIT و عضو CBMM است.
پیشبینی
جدیدترین و پیشرفتهترین مدلهای پیشبینی کلمه بعدی متعلق به دستهای از مدلها به نام شبکههای عصبی عمیق هستند. این شبکهها چندین گره محاسباتی و لایه دارند؛ گرهها اتصالاتی با درجات مختلف قدرت شکل میدهند و لایهها نیز اطلاعات را به شیوهای از پیش مشخصشده، بین یکدیگر ردوبدل میکنند.
طی دهه گذشته، متخصصان سعی داشتهاند با استفاده از شبکههای عصبی عمیق، مدلهای دیداری تشخیص شیئی بسازند که عملکردشان در سطح مغز نخستیها باشد. پیشتر، پژوهشی دیگر از MIT نشان داد با اینکه مدلهای تشخیص شیء برای تقلید از مغز ساخته نشدهاند، کارکرد زیربناییشان با فرایندهای بهکاررفته در ساختار قشر بینایی نخستیها انطباق دارد.
در پژوهش حاضر نیز محققان با تکیه بر رویکردی مشابه، مراکز پردازش زبان مغز انسان را با مدلهای پردازش زبان مقایسه کردند. محققان 43 مدل زبانی مختلف را که برخی برای پیشبینی کلمه بعدی بهینهسازی شده بودند، مورد تجزیه و تحلیل قرار دادند. در میان این مدلها، مدل GPT-3 که میتواند متونی در سطح انسانی تولید کند و از یک هوش مصنوعی فراهوشمند بهره میبرد، نیز حضور داشت. بهجز پیشبینی کلمه بعدی، سایر مدلها برای اجرای مسائل زبانی مختلف، همچون پر کردن جای خالی در یک جمله، آموزش دیده بودند.
محققان رشتهای از کلمات را به همه مدلها تغذیه کردند و فعالیت گرهها را اندازه گرفتند. سپس الگوهای بهدستآمده را با فعالیت مغزی آزمودنیها مقایسه کردند. آزمودنیها باید سه مسئله را اجرا میکردند: گوش دادن به داستان، خواندن جملات کامل و خواندن جملاتی که کلمهبهکلمه نمایان میشوند. دادههای بهدستآمده از فعالیت مغزی آزمودنیها در دو دسته جای میگرفتند: دادههای fMRI (تصویربرداری تشدید مغناطیسی کارکردی) و مقادیر الکتروکورتیکوگرافیک درون جمجمهای از بیمارانی که برای درمان صرع تحت عمل جراحی قرار گرفته بودند.
یافتهها نشان دادند الگوی فعالیت بهترین مدلهای پیشبینی کلمه بعدی بهشدت مشابه با کارکرد مغز انسانها بود. فعالیت این مدلها با معیارهای بهدستآمده از رفتارهای انسانی (برای مثال، سرعت خواندن متن) همبستگی بالایی داشت.
شریمف میگوید: «با بررسی نتایج دریافتیم مدلهایی که بهخوبی پاسخهای عصبی را پیشبینی میکنند، قابلیت پیشبینی پاسخهای رفتاری انسانها را هم دارند. هر دوی این مشاهدات را بهخوبی میتوان با تکیه بر کارکرد پیشبینی کلمه بعدی توجیه کرد. این ارتباط سهگانه همه یافتهها را به هم پیوند میدهد.»
دنیل یامین، استادیار روانشناسی و علوم کامپیوتر دانشگاه استنفورد، میگوید: «یکی از یافتههای کلیدی این تحقیقات این بود که پردازش زبان مسئلهای است با نتیجهای مشخص؛ بدین معنی که حتی بهترین راهکارهای طراحیشده به دست مهندسان هوش مصنوعی هم در نهایت شبیه به همان راهکارهایی میشوند که در نتیجه فرایند تکامل در مغز انسانها به وجود آمدهاند. مدلهای هوش مصنوعی فراهوشمند که در این مطالعات بررسی شدهاند، قصد تقلید مستقیم از مغز را نداشتهاند، ولی در آخر شبیه مغز انسان عمل میکنند؛ پس میتوان نتیجه گرفت نوعی تکامل همگرا بین هوش مصنوعی و طبیعت رخ داده است.»
نتایجی تحولآفرین
یکی از مهمترین ویژگیهای محاسباتی مدلهایی همچون GPT-3 مربوط به مؤلفهای است که با نام ترنسفرمر یکسویه روبهجلو شناخته میشود. این ترنسفرمر میتواند بر اساس قسمتهای قبلی توالی، آینده را پیشبینی کند. یکی از قابلیتهای چشمگیر این مدل این است که برای پیشبینی تنها به چند کلمه قبلی اکتفا نمیکند و بر اساس بافتی وسیعتر (صدها کلمه) به نتیجه میرسد.
به گفته تاننبام، متخصصان هیچ مدار مغزی یا مکانیزم یادگیری پیدا نکردهاند که مسئول این نوع پردازش باشد. با این حال، یافتههای جدید با این فرضیه قدیمی همراستا هستند که میگوید پیشبینی یکی از کارکردهای کلیدی پردازش زبان در مغز است.
وی ادامه میدهد: «یکی از برجستهترین چالشهای پردازش زبان، لحظهای بودن آن است. زبان پدیدهای جاری است و انسانها باید پابهپای آن حرکت کنند و در لحظه معنای آن را بفهمند.»
محققان اکنون قصد دارند نسخههای دیگری از مدلهای پردازش زبان بسازند، تا ببینند تغییرات کوچک در معماری آنها چطور بر تناسب و شباهتشان با دادههای عصبی انسانها تأثیر میگذارد.
فدرنکو میگوید: «این یافتههای خارقالعاده تمام برنامه پژوهشی مرا متحول میکنند، چون هیچگاه تصور نمیکردم روزی را ببینم که به چنین مدلهای محاسباتی دست مییابیم، مدلهایی که اطلاعات فراوانی درباره مغز انسان فراهم میآورند و به ما اجازه میدهند درک بهتری از نحوه کارکرد مغز به دست آوریم.»
علاوه بر این، محققان سعی خواهند کرد این مدلهای زبانی پیشرفته را با مدلهای کامپیوتری دیگری تلفیق کنند که قبلاً برای انجام مسائلی همچون ساخت بازنماییهای ادراکی از دنیای فیزیکی، در آزمایشگاه تاننبام ساخته شدهاند.
تاننبام معتقد است: «اگر بتوانیم این نوع مدلهای زبانی و ارتباطشان با مدلهای دیگری را که مسائل ادراکیتر و تفکریتری انجام میدهند، درک کنیم، آنگاه میتوانیم مدلهای یکپارچهتری از کارکرد مغز در مسائل گوناگون توسعه دهیم. این امر ساخت مدلهای هوش مصنوعی بهتر را امکانپذیر ساخته و علاوه بر این، ما را به شناخت کارکرد مغز و دستیابی به هوش عمومی نزدیکتر میکند؛ تمامی این موارد قابلیتهایی هستند که پیش از این در دست نداشتیم.»
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید