برترین متخصصین

از سراسر دنیا

مجموعه وبینارهای مدل‌های بزرگ زبانی (LLM)

Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش خبری
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
گزارش
مصاحبه
 مایکروسافت مدل زبان کوچک Phi-4 را به‌صورت رایگان عرضه کرد

مایکروسافت مدل زبان کوچک Phi-4 را به‌صورت رایگان عرضه کرد

زمان مطالعه: 2 دقیقه

مایکروسافت سرانجام مدل زبان کوچک جدید خود با نام Phi-4 را در پلتفرم Hugging Face به‌صورت رایگان در دسترس قرار داده است. این مدل با ۱۴ میلیارد پارامتر اکنون قابل دانلود، بهینه‌سازی و استفاده رایگان است.

چرا این موضوع مهم است؟

Phi-4 علی‌رغم کوچک بودن، در چندین آزمون عملکرد بهتری نسبت به مدل Llama 3.3 با ۷۰ میلیارد پارامتر (که تقریباً پنج برابر بزرگ‌تر است) و مدل GPT-4o Mini شرکت OpenAI داشته است. در واقع مدل Phi-4 در آزمون‌های ریاضی، از Gemini 1.5 Pro و نسخه کوچک GPT-4o پیشی گرفته است.

Phi-4 is a tiny model but outperforms Llama 3.3 70B

مایکروسافت در مقاله‌ای فنی، به توضیح تکنیک‌های مختلف و داده‌های باکیفیتی که برای آموزش این مدل استفاده شده، پرداخته است. این مدل به دلیل توانایی‌های قوی خود در حل مسائل پیچیده شناخته می‌شود.

«هارکیرات بهل»، یکی از خالقان این مدل در گفت‌وگویی اظهار داشت: «مدل‌های بزرگ روی داده‌های بسیار متنوعی آموزش می‌بینند و اطلاعاتی را ذخیره می‌کنند که شاید مرتبط نباشند.» او افزود با تلاش کافی برای انتخاب داده‌های باکیفیت، می‌توان به عملکرد مدل‌های بزرگ دست یافت یا حتی از آن‌ها پیشی گرفت.

مایکروسافت در توسعه Phi-4 تمرکز خاصی روی بهینه‌سازی‌های مربوط به استنتاج نداشته و بیشتر بر داده‌های مصنوعی تمرکز کرده است. «هارکیرات بهل» فاش کرد که با انتشار معماری این مدل، توسعه‌دهندگان می‌توانند آن را بیشتر بهینه‌سازی کنند و با کم‌کردن حجم مدل، آن را برای استفاده محلی روی رایانه‌های شخصی و لپ‌تاپ‌ها اجرا کنند.

پس از متا، مایکروسافت یکی از شرکت‌های بزرگی است که در زمینه مدل‌های زبانی متن‌باز پیشرفت‌های قابل‌توجهی داشته است. نسخه قبلی این مدل یعنی Phi-3.5 نیز به‌صورت رایگان در Hugging Face منتشر شده بود.

با این حال، در رقابت مدل‌های متن‌باز، حتی مایکروسافت و متا هم پیشتاز نیستند. در حال حاضر، مدل DeepSeek-V3 از چین در صدر قرار دارد. این مدل بسیار بزرگ با ۶۷۱ میلیارد پارامتر، عملکرد بهتری نسبت به مدل Llama 3.1 متا با ۴۰۵ میلیارد پارامتر و بسیاری از مدل‌های بسته دیگر دارد. همچنین این مدل چینی سه برابر سریع‌تر از نسخه قبلی خود یعنی DeepSeek V2، است.

بهل گفت که Phi-4 از ده زبان هندی پشتیبانی می‌کند. او افزود: «من شخصاً تلاش زیادی کردم تا Phi-4 بتواند ده زبان رایج هند را تفسیر کند.» این موضوع نشان می‌دهد که مایکروسافت سرمایه‌گذاری بزرگی روی هند انجام داده است.

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]