آغاز رقابت متا و ChatGPT با معرفی LLaMA

تیم تحریریه
۶ اسفند ۱۴۰۱

زمان مطالعه: 2 دقیقه

مارک زاکربرگ اخیراً از ابزاری مبتنی بر هوش مصنوعی با نام LLaMA رونمایی کرده که نسبت به سایر مدل‌های زبانی موجود همچون ChatGPT، پاسخ‌های دقیق‌تری به سؤالات می‌دهد. این ابزار اکنون در دسترس عموم قرار ندارد و تنها برای اهداف تحقیقاتی در دسترس محققان خواهد بود. زاکربرگ این مدل را به‌عنوان بخشی از تلاش‌های متا به‌منظور بهبود فناوری هوش مصنوعی معرفی کرده است.

به گزارش هوشیو، این محصول یک چت‌بات است که به‌منظور کمک به محققان در انجام وظایفشان طراحی شده و در حال حاضر در هیچ یک از محصولات عمومی شرکت ادغام نشده است.

علاوه بر مدل‌های زبانی بزرگ ایجاد شده توسط OpenAI، گوگل و مایکروسافت، در حال حاضر یک ابزار هوش مصنوعی جدید، مبتنی بر مدل زبانی بزرگ توسط متا ایجاد گردیده است. این مدل LLaMA نام دارد و مخفف «Large Language Model Meta AI» است.

این هوش مصنوعی جدیدترین افزوده به لیست روبه‌رشد مدل‌های زبانی بزرگ مانند ChatGPT OpenAI ،Bard Google و Prometheus مایکروسافت است.

مارک زاکربرگ، در پستی در فیس‌بوک خود نوشت که شرکتش در تلاش است تا فناوری هوش مصنوعی را به طور گسترده‌تر در دسترس قرار دهد. او ضمن این پست به مشارکت شرکتش در حوزه هوش مصنوعی پرداخت.

زاکربرگ در پلتفرم اجتماعی خود این‌گونه نوشت: «امروز ما یک مدل جدید زبانی بزرگ هوش مصنوعی به نام LLaMA را منتشر می‌کنیم که برای کمک به محققان در پیشرفت کارشان طراحی شده است.» او اضافه کرد که «عملکرد LLaMA در تولید متن، گفتگو، خلاصه کردن مطالب نوشته شده و کارهای پیچیده‌تر مانند حل قضایای ریاضی یا پیش‌بینی ساختارهای پروتئینی بسیار امیدوارکننده بوده است.» اما Meta exec دقیقاً توضیح نداد که LLaMA در حال حاضر کدام یک از آن وظایف را می‌تواند عهده‌دار گردد.

بر اساس جزئیاتی که زاکربرگ در اطلاعیه روز جمعه خود درمورد این مدل زبانی بزرگ ارائه کرد: «شرکت او فیس‌بوک، متعهد به تحقیقات باز است و آنها این مدل زبانی جدید را در دسترس جامعه تحقیقاتی هوش مصنوعی قرار خواهند داد» براین‌اساس محققان می‌توانند برای تحقیقات خود به این مدل دسترسی داشته باشند و از آن استفاده کنند. این بخشی از تعهد فیس‌بوک به تحقیقات باز است که به محققان اجازه می‌دهد به داده‌ها و مدل‌ها به‌منظور پیشبرد تحقیقات خود دسترسی داشته و از آنها استفاده کنند.

یک پست وبلاگی شرکت متا که در بعدازظهر جمعه منتشر شد، حاوی پیوندی به یک مقاله تحقیقاتی کامل در مورد هوش مصنوعی و کارت مدل Github آن بود و در آن اطلاعات قابل‌توجهی بیشتری در این زمینه ارائه گردید. این شرکت نوشت: «مانند دیگر مدل‌های زبان بزرگ، LLaMA با گرفتن دنباله‌ای از کلمات به‌عنوان ورودی و استفاده از آن به‌منظور پیش‌بینی کلمه بعدی کار می‌کند و سپس از آن برای تولید متن استفاده می‌نماید. متا افزود که این مدل بر روی متن از 20 زبان مختلف، از جمله داده‌های در دسترس عموم از CCNet ،C4 ،Wikipedia ،ArXiv و Stack Exchange آموزش‌داده‌شده است.»