مدل جدید هوش مصنوعی متا از نرم‌افزارها برای شکست GPT-3 استفاده می‌کند

تیم تحریریه
۹ اردیبهشت ۱۴۰۲
زمان مطالعه 2 دقیقه

متا نوع خاصی از یک مدل زبانی را به نمایش گذاشته که می‌تواند ورودی‌های زبان طبیعی (مانند یک سوال یا عبارت) را درک کرده و از ابزارهای نرم‌افزاری متنوع برای تولید پاسخ‌های خود استفاده نماید. این مدل زبانی Toolformer نام دارد که از موتورهای جستجو و ابزارهای ترجمه ماشینی، برای ایجاد خروجی‌ استفاده می‌کند و به ادعای متا می‌تواند از خروجی‌های ایجاد‌شده توسط OpenAI GPT-3 پیشی بگیرد.

به‌گزارش هوشیو، مدل هوش مصنوعی LLM (Language Logic Model) می‌تواند پاسخ‌ها را به‌گونه‌ای ایجاد کند که ChatGPT نمی‌تواند. براین‌اساس مدل LLM از نظر توانایی در پاسخ‌دهی بهتر از ChatGPT است، زیرا به‌منظور درک ساختار منطقی زبان طراحی شده، نه فقط خود کلمات. این موضوع LLM را قادر می‌سازد تا زبان‌های پیچیده را بهتر درک کرده و پاسخ‌های منسجم و منطقی‌تری ایجاد نماید.

محققان هوش مصنوعی شرکت مادر فیس‌بوک (متا)، از Toolformer یک مدل زبانی جدید که برای پردازش زبان طبیعی طراحی شده، رونمایی کردند.

Toolformer، بر‌اساس مدل زبانی دیگری به نام GPT-J طراحی گردیده که دارای ۶.۷ میلیارد پارامتر و منبع باز است. محققان متا، این مدل را به طیف وسیعی از ابزارها مجهز کرده‌اند که می‌توان به‌صورت مستقل از آن برای پیش‌بینی متن یا پاسخ به مسائل ریاضی و سایر کارها استفاده کرد.

ابزارهای نرم‌افزاری که Toolformer به آنها دسترسی دارد و می‌تواند از آنها برای تولید پاسخ به زبان طبیعی استفاده نماید عبارتند از، ماشین‌حساب (برای انجام عملیات ریاضی)، سیستم پرسش و پاسخ (برای پاسخ به سوالات)، دو موتور جستجوی مختلف (به‌منظور یافتن اطلاعات)، سیستم ترجمه ماشینی (برای ترجمه متن به زبان‌های مختلف) و تقویم (به‌منظور زمان‌بندی رویدادها).

سیستم ترجمه ماشینی مورداستفاده در Toolformer، یک نسخه ۶۰۰ میلیون پارامتری از مدل NLLB آن است که می‌تواند متن را به بیش از ۲۰۰ زبان مختلف ترجمه نماید. این مدل زبانی همچنین از یک API تقویم استفاده می‌کند که به آن اجازه می‌دهد بدون نیاز به ارائه ورودی اضافی، تاریخ فعلی را در زمان درخواست به شما بگوید. علاوه‌بر‌این، Toolformer برای پاسخ به سوالات از سیستمی کمکی به نام اطلس استفاده می‌کند.

Toolformer همچنین یک موتور جستجوی ویژه دارد که اطلاعات را در ویکی‌پدیا جستجو کرده و متن‌های کوتاهی را از این سایت به‌عنوان پاسخ بازگردانی می‌کند. با این حال، این مدل زبانی به‌دلیل استفاده از ویکی‌پدیا به‌عنوان منبع اطلاعاتی مورد انتقاد قرار گرفته است، زیرا اطلاعات موجود در این پلت‌فرم توسط هر کسی قابل ویرایش است و حتی خود پلت‌فرم اذعان می‌کند که «منبع قابل‌اعتمادی برای نقل‌قول نیست».

علی‌‌‌‌‌رغم اینکه مدل اصلی Toolformer مبتنی بر مدل GPT-2 است، اما متا دریافت که این مدل زبانی می‌تواند در برخی از وظایف پردازش زبان طبیعی از مدل GPT-3 بهتر عمل کند. در‌حالی‌که GPT-3 یک مدل بزرگتر است و در پاسخ به سوالات بهتر عمل می‌کند، اما Toolformer در اکثر تست‌های دیگر، از‎جمله استدلال ریاضی و ترجمه ماشینی توانست GPT-3 را شکست داد.

درست است که Toolformer شبیه OpenAI ChatGPT است که در آن کاربران درخواست‌های زبان طبیعی را وارد می‌کنند و سیستم پاسخی را برایشان ارائه می‌دهد. با‌این‌حال، قابلیت منحصر‌به‌فرد Toolformer این است که به ابزارهای نرم‌افزاری مختلفی دسترسی دارد که به آن امکان می‌دهد، براساس رویدادها یا اطلاعات جدیدتر پاسخ‌هایی را به کاربران ارائه دهد. این در‌حالی است که پاسخ‌های ارائه‌شده توسط ChatGPT و سایر مدل‌ها، به مجموعه داده‌هایی که روی آن‌ها آموزش دیده‌اند، محدود می‌شوند، به این معنی که نمی‌توانند به درخواست‌های کاربر درخصوص رویدادهای اخیر پاسخ دهند.

در‌حالی‌که Toolformer دارای برخی از قابلیت‌های منحصر‌به‌فرد است، اما محدودیت‌های واضحی نیز دارد که باید برطرف شوند.