مایکروسافت مدل زبان کوچک Phi-4 را به‌صورت رایگان عرضه کرد

تیم تحریریه
۲۹ دی ۱۴۰۳

زمان مطالعه: 2 دقیقه

مایکروسافت سرانجام مدل زبان کوچک جدید خود با نام Phi-4 را در پلتفرم Hugging Face به‌صورت رایگان در دسترس قرار داده است. این مدل با ۱۴ میلیارد پارامتر اکنون قابل دانلود، بهینه‌سازی و استفاده رایگان است.

چرا این موضوع مهم است؟

Phi-4 علی‌رغم کوچک بودن، در چندین آزمون عملکرد بهتری نسبت به مدل Llama 3.3 با ۷۰ میلیارد پارامتر (که تقریباً پنج برابر بزرگ‌تر است) و مدل GPT-4o Mini شرکت OpenAI داشته است. در واقع مدل Phi-4 در آزمون‌های ریاضی، از Gemini 1.5 Pro و نسخه کوچک GPT-4o پیشی گرفته است.

Phi-4 is a tiny model but outperforms Llama 3.3 70B

مایکروسافت در مقاله‌ای فنی، به توضیح تکنیک‌های مختلف و داده‌های باکیفیتی که برای آموزش این مدل استفاده شده، پرداخته است. این مدل به دلیل توانایی‌های قوی خود در حل مسائل پیچیده شناخته می‌شود.

«هارکیرات بهل»، یکی از خالقان این مدل در گفت‌وگویی اظهار داشت: «مدل‌های بزرگ روی داده‌های بسیار متنوعی آموزش می‌بینند و اطلاعاتی را ذخیره می‌کنند که شاید مرتبط نباشند.» او افزود با تلاش کافی برای انتخاب داده‌های باکیفیت، می‌توان به عملکرد مدل‌های بزرگ دست یافت یا حتی از آن‌ها پیشی گرفت.

مایکروسافت در توسعه Phi-4 تمرکز خاصی روی بهینه‌سازی‌های مربوط به استنتاج نداشته و بیشتر بر داده‌های مصنوعی تمرکز کرده است. «هارکیرات بهل» فاش کرد که با انتشار معماری این مدل، توسعه‌دهندگان می‌توانند آن را بیشتر بهینه‌سازی کنند و با کم‌کردن حجم مدل، آن را برای استفاده محلی روی رایانه‌های شخصی و لپ‌تاپ‌ها اجرا کنند.

پس از متا، مایکروسافت یکی از شرکت‌های بزرگی است که در زمینه مدل‌های زبانی متن‌باز پیشرفت‌های قابل‌توجهی داشته است. نسخه قبلی این مدل یعنی Phi-3.5 نیز به‌صورت رایگان در Hugging Face منتشر شده بود.

با این حال، در رقابت مدل‌های متن‌باز، حتی مایکروسافت و متا هم پیشتاز نیستند. در حال حاضر، مدل DeepSeek-V3 از چین در صدر قرار دارد. این مدل بسیار بزرگ با ۶۷۱ میلیارد پارامتر، عملکرد بهتری نسبت به مدل Llama 3.1 متا با ۴۰۵ میلیارد پارامتر و بسیاری از مدل‌های بسته دیگر دارد. همچنین این مدل چینی سه برابر سریع‌تر از نسخه قبلی خود یعنی DeepSeek V2، است.

بهل گفت که Phi-4 از ده زبان هندی پشتیبانی می‌کند. او افزود: «من شخصاً تلاش زیادی کردم تا Phi-4 بتواند ده زبان رایج هند را تفسیر کند.» این موضوع نشان می‌دهد که مایکروسافت سرمایه‌گذاری بزرگی روی هند انجام داده است.

https://hooshio.com/?p=64746

فعالان هوش مصنوعی

ایران و جهان

مجموعه وبینارهای هوش مصنوعی در عمل؛ از ایده تا اجرا

مایکروسافت مدل زبان کوچک Phi-4 را به‌صورت رایگان عرضه کرد

چرا این موضوع مهم است؟

صدای شما مثل ChatGPT شده است؟

نیویورک‌تایمز می‌خواهد همه چت‌های شما با ChatGPT برای همیشه ذخیره شود

گوگل جمینای را ارتقا داد

افزایش نگرانی‌ها از تقلب با ChatGPT

وقتی هوش مصنوعی به چشم پزشکان بدل می‌شود

وردست‌های هوشمند

آینده دوبله و دوبلاژ در سایه هوش مصنوعی

آنچه آسیموف فاش کرد

افتتاح حساب بانکی فقط با یک کلیک

«دیتاوست» ترکیب بهینه دارایی را پیشنهاد می‌دهد

هوش مصنوعی در خدمت جامعه؛ از ابزار سرکوب تا فناوری مدنی

چگونه فناوری می‌تواند مسیر کنشگری اجتماعی را متحول کند؟

اپلیکیشن Firefly ادوبی، برای تولید تصویر و ویدئو با هوش مصنوعی عرضه شد

صدای شما مثل ChatGPT شده است؟

وقتی هوش مصنوعی به چشم پزشکان بدل می‌شود

نیویورک‌تایمز می‌خواهد همه چت‌های شما با ChatGPT برای همیشه ذخیره شود

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

اپلیکیشن Firefly ادوبی، برای تولید تصویر و ویدئو با هوش مصنوعی عرضه شد

صدای شما مثل ChatGPT شده است؟

وقتی هوش مصنوعی به چشم پزشکان بدل می‌شود

وردست‌های هوشمند

نیویورک‌تایمز می‌خواهد همه چت‌های شما با ChatGPT برای همیشه ذخیره شود

چرا این موضوع مهم است؟

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید