آغاز رقابت متا و ChatGPT با معرفی LLaMA
مارک زاکربرگ اخیراً از ابزاری مبتنی بر هوش مصنوعی با نام LLaMA رونمایی کرده که نسبت به سایر مدلهای زبانی موجود همچون ChatGPT، پاسخهای دقیقتری به سؤالات میدهد. این ابزار اکنون در دسترس عموم قرار ندارد و تنها برای اهداف تحقیقاتی در دسترس محققان خواهد بود. زاکربرگ این مدل را بهعنوان بخشی از تلاشهای متا بهمنظور بهبود فناوری هوش مصنوعی معرفی کرده است.
به گزارش هوشیو، این محصول یک چتبات است که بهمنظور کمک به محققان در انجام وظایفشان طراحی شده و در حال حاضر در هیچ یک از محصولات عمومی شرکت ادغام نشده است.
علاوه بر مدلهای زبانی بزرگ ایجاد شده توسط OpenAI، گوگل و مایکروسافت، در حال حاضر یک ابزار هوش مصنوعی جدید، مبتنی بر مدل زبانی بزرگ توسط متا ایجاد گردیده است. این مدل LLaMA نام دارد و مخفف «Large Language Model Meta AI» است.
این هوش مصنوعی جدیدترین افزوده به لیست روبهرشد مدلهای زبانی بزرگ مانند ChatGPT OpenAI ،Bard Google و Prometheus مایکروسافت است.
مارک زاکربرگ، در پستی در فیسبوک خود نوشت که شرکتش در تلاش است تا فناوری هوش مصنوعی را به طور گستردهتر در دسترس قرار دهد. او ضمن این پست به مشارکت شرکتش در حوزه هوش مصنوعی پرداخت.
زاکربرگ در پلتفرم اجتماعی خود اینگونه نوشت: «امروز ما یک مدل جدید زبانی بزرگ هوش مصنوعی به نام LLaMA را منتشر میکنیم که برای کمک به محققان در پیشرفت کارشان طراحی شده است.» او اضافه کرد که «عملکرد LLaMA در تولید متن، گفتگو، خلاصه کردن مطالب نوشته شده و کارهای پیچیدهتر مانند حل قضایای ریاضی یا پیشبینی ساختارهای پروتئینی بسیار امیدوارکننده بوده است.» اما Meta exec دقیقاً توضیح نداد که LLaMA در حال حاضر کدام یک از آن وظایف را میتواند عهدهدار گردد.
بر اساس جزئیاتی که زاکربرگ در اطلاعیه روز جمعه خود درمورد این مدل زبانی بزرگ ارائه کرد: «شرکت او فیسبوک، متعهد به تحقیقات باز است و آنها این مدل زبانی جدید را در دسترس جامعه تحقیقاتی هوش مصنوعی قرار خواهند داد» برایناساس محققان میتوانند برای تحقیقات خود به این مدل دسترسی داشته باشند و از آن استفاده کنند. این بخشی از تعهد فیسبوک به تحقیقات باز است که به محققان اجازه میدهد به دادهها و مدلها بهمنظور پیشبرد تحقیقات خود دسترسی داشته و از آنها استفاده کنند.
یک پست وبلاگی شرکت متا که در بعدازظهر جمعه منتشر شد، حاوی پیوندی به یک مقاله تحقیقاتی کامل در مورد هوش مصنوعی و کارت مدل Github آن بود و در آن اطلاعات قابلتوجهی بیشتری در این زمینه ارائه گردید. این شرکت نوشت: «مانند دیگر مدلهای زبان بزرگ، LLaMA با گرفتن دنبالهای از کلمات بهعنوان ورودی و استفاده از آن بهمنظور پیشبینی کلمه بعدی کار میکند و سپس از آن برای تولید متن استفاده مینماید. متا افزود که این مدل بر روی متن از 20 زبان مختلف، از جمله دادههای در دسترس عموم از CCNet ،C4 ،Wikipedia ،ArXiv و Stack Exchange آموزشدادهشده است.»