مدل جدید هوش مصنوعی متا از نرمافزارها برای شکست GPT-3 استفاده میکند
متا نوع خاصی از یک مدل زبانی را به نمایش گذاشته که میتواند ورودیهای زبان طبیعی (مانند یک سوال یا عبارت) را درک کرده و از ابزارهای نرمافزاری متنوع برای تولید پاسخهای خود استفاده نماید. این مدل زبانی Toolformer نام دارد که از موتورهای جستجو و ابزارهای ترجمه ماشینی، برای ایجاد خروجی استفاده میکند و به ادعای متا میتواند از خروجیهای ایجادشده توسط OpenAI GPT-3 پیشی بگیرد.
بهگزارش هوشیو، مدل هوش مصنوعی LLM (Language Logic Model) میتواند پاسخها را بهگونهای ایجاد کند که ChatGPT نمیتواند. برایناساس مدل LLM از نظر توانایی در پاسخدهی بهتر از ChatGPT است، زیرا بهمنظور درک ساختار منطقی زبان طراحی شده، نه فقط خود کلمات. این موضوع LLM را قادر میسازد تا زبانهای پیچیده را بهتر درک کرده و پاسخهای منسجم و منطقیتری ایجاد نماید.
محققان هوش مصنوعی شرکت مادر فیسبوک (متا)، از Toolformer یک مدل زبانی جدید که برای پردازش زبان طبیعی طراحی شده، رونمایی کردند.
Toolformer، براساس مدل زبانی دیگری به نام GPT-J طراحی گردیده که دارای 6.7 میلیارد پارامتر و منبع باز است. محققان متا، این مدل را به طیف وسیعی از ابزارها مجهز کردهاند که میتوان بهصورت مستقل از آن برای پیشبینی متن یا پاسخ به مسائل ریاضی و سایر کارها استفاده کرد.
ابزارهای نرمافزاری که Toolformer به آنها دسترسی دارد و میتواند از آنها برای تولید پاسخ به زبان طبیعی استفاده نماید عبارتند از، ماشینحساب (برای انجام عملیات ریاضی)، سیستم پرسش و پاسخ (برای پاسخ به سوالات)، دو موتور جستجوی مختلف (بهمنظور یافتن اطلاعات)، سیستم ترجمه ماشینی (برای ترجمه متن به زبانهای مختلف) و تقویم (بهمنظور زمانبندی رویدادها).
سیستم ترجمه ماشینی مورداستفاده در Toolformer، یک نسخه 600 میلیون پارامتری از مدل NLLB آن است که میتواند متن را به بیش از 200 زبان مختلف ترجمه نماید. این مدل زبانی همچنین از یک API تقویم استفاده میکند که به آن اجازه میدهد بدون نیاز به ارائه ورودی اضافی، تاریخ فعلی را در زمان درخواست به شما بگوید. علاوهبراین، Toolformer برای پاسخ به سوالات از سیستمی کمکی به نام اطلس استفاده میکند.
Toolformer همچنین یک موتور جستجوی ویژه دارد که اطلاعات را در ویکیپدیا جستجو کرده و متنهای کوتاهی را از این سایت بهعنوان پاسخ بازگردانی میکند. با این حال، این مدل زبانی بهدلیل استفاده از ویکیپدیا بهعنوان منبع اطلاعاتی مورد انتقاد قرار گرفته است، زیرا اطلاعات موجود در این پلتفرم توسط هر کسی قابل ویرایش است و حتی خود پلتفرم اذعان میکند که «منبع قابلاعتمادی برای نقلقول نیست».
علیرغم اینکه مدل اصلی Toolformer مبتنی بر مدل GPT-2 است، اما متا دریافت که این مدل زبانی میتواند در برخی از وظایف پردازش زبان طبیعی از مدل GPT-3 بهتر عمل کند. درحالیکه GPT-3 یک مدل بزرگتر است و در پاسخ به سوالات بهتر عمل میکند، اما Toolformer در اکثر تستهای دیگر، ازجمله استدلال ریاضی و ترجمه ماشینی توانست GPT-3 را شکست داد.
درست است که Toolformer شبیه OpenAI ChatGPT است که در آن کاربران درخواستهای زبان طبیعی را وارد میکنند و سیستم پاسخی را برایشان ارائه میدهد. بااینحال، قابلیت منحصربهفرد Toolformer این است که به ابزارهای نرمافزاری مختلفی دسترسی دارد که به آن امکان میدهد، براساس رویدادها یا اطلاعات جدیدتر پاسخهایی را به کاربران ارائه دهد. این درحالی است که پاسخهای ارائهشده توسط ChatGPT و سایر مدلها، به مجموعه دادههایی که روی آنها آموزش دیدهاند، محدود میشوند، به این معنی که نمیتوانند به درخواستهای کاربر درخصوص رویدادهای اخیر پاسخ دهند.
درحالیکه Toolformer دارای برخی از قابلیتهای منحصربهفرد است، اما محدودیتهای واضحی نیز دارد که باید برطرف شوند.