سرو صدای انتشار مدلهای هوش مصنوعی بازمتن انویدیا
مدل هوش مصنوعی قدرتمند انویدیا که به عنوان رقیبی بازمتن برای GPT-4 شناخته میشود، با قابلیت تفسیر میمها، تجزیهوتحلیل تصاویر و حل مرحلهبهمرحله مسائل ریاضی معرفی شد.
مدلهای هوش مصنوعی بازمتن انویدیا با هدف رقابت با مدلهای ساختهشده OpenAI و گوگل عرضه شده است؛ عضو اصلی این خانواده از مدلهای زبانی چندوجهی بزرگ با عنوان NVLM-D-72B دارای 72 میلیارد پارامتر است و در وظایف بینایی و زبانی عملکرد استثنایی ارائه میکند و قابلیتهای متنی آن نیز افزایش یافته است.
بنابر گفته سازندگان انویدیا، NVLM 1.0، خانوادهای از مدلهای زبانی بزرگ چندوجهی است که در وظایف بینایی به نتایج پیشرفتهای دست پیدا میکنند و با مدلهای پیشرو مانند GPT-4o و مدلهای قابلدسترس دیگر رقابت میکند.
از جمله ویژگیهای NVLM-D-72B، میتوان به انطباقپذیری بسیار خوب آن در پردازش ورودیهای بصری و متنی پیچیده اشاره کرد؛ در تازهترین گزارش منتشر شده، مدلهای هوش مصنوعی انویدیا توانایی تفسیر میمها، تجزیهوتحلیل تصاویر و حل مرحلهبهمرحله مسائل ریاضی را دارند.
علاوهبر آنچه گفته شد، این مدلهای هوش مصنوعی در زمینه وظایف متنی نیز شاهد بهبودهایی بودهاند؛NVLM-D-72B در این زمینه بهطور میانگین در بنچمارکهای کلیدی 4.3 امتیاز ارتقا پیدا کرده است.
انویدیا از روند بسته نگهداشتن سیستمهای هوش مصنوعی فاصله میگیرد
انویدیا قصد دارد با انتشار عمومی این مدل و وعده انتشار کد آموزشی آن، از روند بسته نگهداشتن سیستمهای هوش مصنوعی پیشرفته فاصله بگیرد؛ این تصمیم منجر به دسترسی محققان و توسعهدهندگان به فناوریهای پیشرفته خواهد شد و روند تحقیقوتوسعه در زمینه هوش مصنوعی را تسریع میکند.
این پروژه همچنین طرحهای معماری (کامپیوتر) نوآورانهای را نیز در دل خود دارد که از جمله آنها میتوان به رویکرد ترکیبی که تکنیکهای مختلف پردازش چندوجهی را ترکیب میکند، اشاره کرد؛ چنین پیشرفتی میتواند مسیر تحقیقات آینده را شکل دهد.
معرفی مدلهای جدید هوش مصنوعی انویدیا با استقبال زیادی مواجه شده است؛ «یمی» از محققان هوش مصنوعی در این خصوص در پستی در شبکه اجتماعی ایکس (توییتر سابق) نوشت:«انویدیا بهتازگی مدل 72B را منتشر کرده که در ریاضی و کدنویسی با لاما 405B 3.1 برابری میکند و قابلیتهای بینایی دارد.»