هوش مصنوعی فراهوشمند
اخبار

هوش مصنوعی فراهوشمند از فرایندهای پردازش زبان در مغز پرده بر می‌دارد

0
زمان مطالعه: ۴ دقیقه

طی سال‌های اخیر، مدل‌های زبانی هوش مصنوعی فراهوشمند در انجام برخی مسائل به عملکرد خیلی خوبی دست یافته‌اند. از جمله این مسائل، پیش‌بینی کلمه‌ بعدی است که در موتورهای جست‌وجو و نرم‌افزارهای پیام‌رسانی کاربرد دارد و کلمه‌ بعدی را که کاربر قصد دارد بنویسد، پیش‌بینی می‌کند.

به‌نظر می‌رسد نسل جدید مدل‌های پیش‌بینی زبان قابلیت درک معنای زبان را هم دارند. این هوش مصنوعی فراهوشمند علاوه بر پیش‌بینی کلمه‌ بعدی، مسائلی را که مستلزم درک واقعی زبان هستند نیز می‌توانند حل کنند؛ به‌عنوان مثال، می‌توان به پاسخ‌دهی به سؤالات، خلاصه‌سازی متون و تکمیل داستان اشاره کرد.

هدف از طراحی این مدل‌ها، بهینه‌سازی مسئله‌ پیش‌بینی متن بوده است. این مدل‌ها هرگز قصد تقلید از فرایندهای مغزی انسان هنگام انجام مسائل زبانی یا درک زبان را نداشته‌اند؛ با این حال، مطالعات جدید متخصصان عصب‌شناسی MIT حاکی از شباهت بین کارکرد زیربنایی این مدل‌ها با کارکرد مراکز پردازش زبان در مغز انسان‌ها است.

متخصصان عصب‌شناسی MIT دریافته‌اند کارکرد مدل‌های پیش‌بینی کلمه‌ بعدی مشابه با کارکرد مراکز پردازش زبان در مغز انسان‌هاست.

از سوی دیگر، مدل‌های کامپیوتری که در سایر مسائل زبانی عملکرد خوبی دارند، چنین شباهتی به مغز انسان نشان نمی‌دهند. این امر گواهی بر این است که مغز انسان نیز برای پیشبرد مسائل پردازش زبان احتمالاً از فرایند پیش‌بینی کلمه‌ بعدی استفاده می‌کند.

نانسی کنویشر، استاد علوم عصب‌شناسی و یکی از نویسندگان مقاله، توضیح می‌دهد: «هرچه مدل عملکرد بهتری در پیش‌بینی کلمه‌ بعدی داشته باشد، شباهتش به مغز انسان بیشتر است. تناسب بین این دو واقعاً جالب است. نکته‌ای که می‌توان از این شباهت برداشت کرد، این است که شاید سیستم پردازش زبان مغز انسان هم آنچه را قرار است در مرحله‌ بعد اتفاق بیفتد، پیش‌بینی می‌کند.» کنویشر از اعضای مؤسسه McGovern و مرکز CBMM، هر دو از مؤسسات وابسته به دانشگاه MIT، است.

جاشوا تننبام (استاد علوم‌شناختی محاسباتی MIT، عضو CBMM و آزمایشگاه CSAIL)، اولینا فدرینکو (استادیار عصب‌شناسی و عضو مؤسسه McGovern) نویسندگان ارشد این مقاله هستند. نویسنده‌ اول این مقاله که در ژورنال Proceedings of the National Academy of Sciences به چاپ رسیده است، مارتین شریمف، دانشجوی تحصیلات تکمیلی MIT و عضو CBMM است.

هوش مصنوعی فراهوشمند

پیش‌بینی

جدیدترین و پیشرفته‌ترین مدل‌های پیش‌بینی کلمه‌ بعدی متعلق به دسته‌ای از مدل‌ها به نام شبکه‌های عصبی عمیق هستند. این شبکه‌ها چندین گره‌ محاسباتی و لایه‌ دارند؛ گره‌ها اتصالاتی با درجات مختلف قدرت شکل می‌دهند و لایه‌ها نیز اطلاعات را به شیوه‌ای از پیش مشخص‌شده، بین یکدیگر ردوبدل می‌کنند.

دستیابی به سوختی مشابه نفت سیاه با هوشمندسازی پسماند‌ در کشور

طی دهه‌ گذشته، متخصصان سعی داشته‌اند با استفاده از شبکه‌های عصبی عمیق، مدل‌های دیداری تشخیص شیئی بسازند که عملکردشان در سطح مغز نخستی‌ها باشد. پیش‌تر، پژوهشی دیگر از MIT نشان داد با اینکه مدل‌های تشخیص شیء برای تقلید از مغز ساخته نشده‌اند، کارکرد زیربنایی‌شان با فرایندهای به‌کاررفته در ساختار قشر بینایی نخستی‌ها انطباق دارد.

در پژوهش حاضر نیز محققان با تکیه بر رویکردی مشابه، مراکز پردازش زبان مغز انسان را با مدل‌های پردازش زبان مقایسه کردند. محققان ۴۳ مدل زبانی مختلف را که برخی برای پیش‌بینی کلمه بعدی بهینه‌سازی شده بودند، مورد تجزیه و تحلیل قرار دادند. در میان این مدل‌ها، مدل GPT-3 که می‌تواند متونی در سطح انسانی تولید کند و از یک هوش مصنوعی فراهوشمند بهره می‌برد، نیز حضور داشت. به‌جز پیش‌بینی کلمه بعدی، سایر مدل‌ها برای اجرای مسائل زبانی مختلف، همچون پر کردن جای خالی در یک جمله، آموزش دیده بودند.

محققان رشته‌ای از کلمات را به همه‌ مدل‌ها تغذیه کردند و فعالیت گره‌ها را اندازه گرفتند. سپس الگوهای به‌دست‌آمده را با فعالیت مغزی آزمودنی‌ها مقایسه کردند. آزمودنی‌ها باید سه مسئله را اجرا می‌کردند: گوش دادن به داستان، خواندن جملات کامل و خواندن جملاتی که کلمه‌به‌کلمه نمایان می‌شوند. داده‌های به‌دست‌آمده از فعالیت مغزی آزمودنی‌ها در دو دسته جای می‌گرفتند: داده‌های fMRI (تصویربرداری تشدید مغناطیسی کارکردی) و مقادیر الکتروکورتیکوگرافیک درون جمجمه‌ای از بیمارانی که برای درمان صرع تحت عمل جراحی قرار گرفته بودند.

یافته‌ها نشان دادند الگوی فعالیت بهترین مدل‌های پیش‌بینی کلمه‌ بعدی به‌شدت مشابه با کارکرد مغز انسان‌ها بود. فعالیت این مدل‌ها با معیارهای به‌دست‌آمده از رفتارهای انسانی (برای مثال، سرعت خواندن متن) همبستگی بالایی داشت.

شریمف می‌گوید: «با بررسی نتایج دریافتیم مدل‌هایی که به‌خوبی پاسخ‌های عصبی را پیش‌بینی می‌کنند، قابلیت پیش‌بینی پاسخ‌های رفتاری انسان‌ها را هم دارند. هر دوی این مشاهدات را به‌خوبی می‌توان با تکیه بر کارکرد پیش‌بینی کلمه بعدی توجیه کرد. این ارتباط سه‌گانه همه‌ یافته‌ها را به هم پیوند می‌دهد.»

دنیل یامین، استادیار روان‌شناسی و علوم کامپیوتر دانشگاه استنفورد، می‌گوید: «یکی از یافته‌های کلیدی این تحقیقات این بود که پردازش زبان مسئله‌ای است با نتیجه‌ای مشخص؛ بدین معنی که حتی بهترین راهکارهای طراحی‌شده به دست مهندسان هوش مصنوعی هم در نهایت شبیه به همان راهکارهایی می‌شوند که در نتیجه‌ فرایند تکامل در مغز انسان‌ها به وجود آمده‌اند. مدل‌های هوش مصنوعی فراهوشمند که در این مطالعات بررسی شده‌اند، قصد تقلید مستقیم از مغز را نداشته‌اند، ولی در آخر شبیه مغز انسان عمل می‌کنند؛ پس می‌توان نتیجه گرفت نوعی تکامل همگرا بین هوش مصنوعی و طبیعت رخ داده است.»

ایران کنگره بین‌المللی هوش مصنوعی در علوم پزشکی را برگزار می‌کند

نتایجی تحول‌آفرین

یکی از مهم‌ترین ویژگی‌های محاسباتی مدل‌هایی همچون GPT-3 مربوط به مؤلفه‌ای است که با نام ترنسفرمر یک‌سویه روبه‌جلو شناخته می‌شود. این ترنسفرمر می‌تواند بر اساس قسمت‌های قبلی توالی، آینده را پیش‌بینی کند. یکی از قابلیت‌های چشمگیر این مدل این است که برای پیش‌بینی تنها به چند کلمه‌ قبلی اکتفا نمی‌کند و بر اساس بافتی وسیع‌تر (صدها کلمه) به نتیجه می‌رسد.

به گفته‌ تاننبام، متخصصان هیچ مدار مغزی یا مکانیزم یادگیری پیدا نکرده‌اند که مسئول این نوع پردازش باشد. با این حال، یافته‌های جدید با این فرضیه‌ قدیمی هم‌راستا هستند که می‌گوید پیش‌بینی یکی از کارکردهای کلیدی پردازش زبان در مغز است.

وی ادامه می‌دهد: «یکی از برجسته‌ترین چالش‌های پردازش زبان، لحظه‌ای بودن آن است. زبان پدیده‌ای جاری است و انسان‌ها باید پا‌به‌پای آن حرکت کنند و در لحظه معنای آن را بفهمند.»

محققان اکنون قصد دارند نسخه‌های دیگری از مدل‌های پردازش زبان بسازند، تا ببینند تغییرات کوچک در معماری آن‌ها چطور بر تناسب و شباهت‌شان با داده‌های عصبی انسان‌ها تأثیر می‌گذارد.

فدرنکو می‌گوید: «این یافته‌های خارق‌العاده تمام برنامه‌ پژوهشی مرا متحول می‌کنند، چون هیچ‌گاه تصور نمی‌کردم روزی را ببینم که به چنین مدل‌های محاسباتی دست می‌یابیم، مدل‌هایی که اطلاعات فراوانی درباره مغز انسان فراهم می‌آورند و به ما اجازه می‌دهند درک بهتری از نحوه‌ کارکرد مغز به دست آوریم.»

علاوه بر این، محققان سعی خواهند کرد این مدل‌های زبانی پیشرفته را با مدل‌های کامپیوتری دیگری تلفیق کنند که قبلاً برای انجام مسائلی همچون ساخت بازنمایی‌های ادراکی از دنیای فیزیکی، در آزمایشگاه تاننبام ساخته شده‌اند.

تاننبام معتقد است: «اگر بتوانیم این نوع مدل‌های زبانی و ارتباط‌شان با مدل‌های دیگری را که مسائل ادراکی‌تر و تفکری‌تری انجام می‌دهند، درک کنیم، آن‌گاه می‌توانیم مدل‌های یکپارچه‌تری از کارکرد مغز در مسائل گوناگون توسعه دهیم. این امر ساخت مدل‌های هوش مصنوعی بهتر را امکان‌پذیر ساخته و علاوه بر این، ما را به شناخت کارکرد مغز و دستیابی به هوش عمومی نزدیک‌تر می‌کند؛ تمامی این موارد قابلیت‌هایی هستند که پیش از این در دست نداشتیم.»

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

این مطلب چه میزان برای شما مفید بوده است؟
[کل: ۰ میانگین: ۰]

بررسی اجمالی رشته دیتا ساینس در ایران

مقاله قبلی

دلتان برای بازی تاماگوچی تنگ شده است؟ جای خالی‌اش را با ربات کوچک بانمک پر کنید

مقاله بعدی

شما همچنین ممکن است دوست داشته باشید

بیشتر در اخبار

نظرات

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد.