مایکروسافت مدل زبان کوچک Phi-4 را بهصورت رایگان عرضه کرد
مایکروسافت سرانجام مدل زبان کوچک جدید خود با نام Phi-4 را در پلتفرم Hugging Face بهصورت رایگان در دسترس قرار داده است. این مدل با ۱۴ میلیارد پارامتر اکنون قابل دانلود، بهینهسازی و استفاده رایگان است.
چرا این موضوع مهم است؟
Phi-4 علیرغم کوچک بودن، در چندین آزمون عملکرد بهتری نسبت به مدل Llama 3.3 با ۷۰ میلیارد پارامتر (که تقریباً پنج برابر بزرگتر است) و مدل GPT-4o Mini شرکت OpenAI داشته است. در واقع مدل Phi-4 در آزمونهای ریاضی، از Gemini 1.5 Pro و نسخه کوچک GPT-4o پیشی گرفته است.
مایکروسافت در مقالهای فنی، به توضیح تکنیکهای مختلف و دادههای باکیفیتی که برای آموزش این مدل استفاده شده، پرداخته است. این مدل به دلیل تواناییهای قوی خود در حل مسائل پیچیده شناخته میشود.
«هارکیرات بهل»، یکی از خالقان این مدل در گفتوگویی اظهار داشت: «مدلهای بزرگ روی دادههای بسیار متنوعی آموزش میبینند و اطلاعاتی را ذخیره میکنند که شاید مرتبط نباشند.» او افزود با تلاش کافی برای انتخاب دادههای باکیفیت، میتوان به عملکرد مدلهای بزرگ دست یافت یا حتی از آنها پیشی گرفت.
مایکروسافت در توسعه Phi-4 تمرکز خاصی روی بهینهسازیهای مربوط به استنتاج نداشته و بیشتر بر دادههای مصنوعی تمرکز کرده است. «هارکیرات بهل» فاش کرد که با انتشار معماری این مدل، توسعهدهندگان میتوانند آن را بیشتر بهینهسازی کنند و با کمکردن حجم مدل، آن را برای استفاده محلی روی رایانههای شخصی و لپتاپها اجرا کنند.
پس از متا، مایکروسافت یکی از شرکتهای بزرگی است که در زمینه مدلهای زبانی متنباز پیشرفتهای قابلتوجهی داشته است. نسخه قبلی این مدل یعنی Phi-3.5 نیز بهصورت رایگان در Hugging Face منتشر شده بود.
با این حال، در رقابت مدلهای متنباز، حتی مایکروسافت و متا هم پیشتاز نیستند. در حال حاضر، مدل DeepSeek-V3 از چین در صدر قرار دارد. این مدل بسیار بزرگ با ۶۷۱ میلیارد پارامتر، عملکرد بهتری نسبت به مدل Llama 3.1 متا با ۴۰۵ میلیارد پارامتر و بسیاری از مدلهای بسته دیگر دارد. همچنین این مدل چینی سه برابر سریعتر از نسخه قبلی خود یعنی DeepSeek V2، است.
بهل گفت که Phi-4 از ده زبان هندی پشتیبانی میکند. او افزود: «من شخصاً تلاش زیادی کردم تا Phi-4 بتواند ده زبان رایج هند را تفسیر کند.» این موضوع نشان میدهد که مایکروسافت سرمایهگذاری بزرگی روی هند انجام داده است.