
مدل قدرتمند Phi-4 مایکروسافت
در حالی که OpenAI، همچنان مدلهای استدلالی قدرتمندتری مانند سری جدید o3 را معرفی میکند، مایکروسافت نیز دست روی دست نگذاشته است. این شرکت در حال توسعه مدلهای کوچکتر و قدرتمندتری است که تحت برند خود عرضه میشوند.
اخیراً چند تن از محققان فعلی و سابق مایکروسافت و دانشمندان هوش مصنوعی در پلتفرم X اعلام کردند که مایکروسافت مدل Phi-4 را بهصورت یک پروژه کاملاً متنباز و با وزنهای قابل دانلود در Hugging Face، جامعه اشتراکگذاری کد هوش مصنوعی، منتشر کرده است.
Phi-4 از راه میرسد
«شیتال شاه»، مهندس ارشد تحقیقاتی هوش مصنوعی مایکروسافت، در حساب کاربری X خود نوشت: «واکنشها به انتشار Phi-4 واقعاً ما را شگفتزده کرد. خیلیها از ما درخواست انتشار وزنها را داشتند. حتی چند نفر نسخههای غیررسمی از وزنهای Phi-4 را در Hugging Face آپلود کرده بودند، اما دیگر صبر نکنید. امروز نسخه رسمی مدل Phi-4 را در Hugging Face منتشر میکنیم! با مجوز MIT!!»
وزنها مقادیر عددی هستند که مشخص میکنند یک مدل زبانی هوش مصنوعی، چه کوچک و چه بزرگ، چگونه زبان و دادهها را درک کرده و خروجی میدهد. معمولاً این وزنها در فرآیند آموزش مدل از طریق یادگیری عمیق بدون نظارت ایجاد میشوند که طی آن مدل تعیین میکند چه خروجیهایی باید بر اساس ورودیهای دریافتشده ارائه شود.
وزنهای مدل میتوانند توسط محققان و سازندگان مدل به طور دستی تنظیم شوند که به آنها «بایاس» (تمایلات) میگویند. یک مدل تا زمانی که وزنهای آن عمومی نشده باشد، معمولاً بهعنوان یک مدل کاملاً متنباز در نظر گرفته نمیشود، زیرا این وزنها امکان سفارشیسازی کامل یا سازگاری با نیازهای خاص دیگر محققان را فراهم میکنند.
اگرچه Phi-4 در واقع ماه گذشته توسط مایکروسافت معرفی شد، اما استفاده از آن در ابتدا به پلتفرم توسعه Azure AI Foundry مایکروسافت محدود شده بود.
اکنون Phi-4 خارج از این سرویس اختصاصی در دسترس همه کاربرانی است که حساب کاربری در Hugging Face دارند و با مجوز MIT ارائه میشود. این امر امکان استفاده از آن برای کاربردهای تجاری را نیز فراهم میکند.
این انتشار به محققان و توسعهدهندگان امکان دسترسی کامل به ۱۴ میلیارد پارامتر این مدل را میدهد و اجازه میدهد بدون محدودیتهای منابعی که معمولاً با سیستمهای بزرگتر هوش مصنوعی همراه است، به آزمایش و پیادهسازی بپردازند.
حرکت بهسوی بهرهوری بیشتر در هوش مصنوعی
مدل Phi-4 برای اولین بار در دسامبر ۲۰۲۴ و در پلتفرم Azure AI Foundry مایکروسافت راهاندازی شد، جایی که توسعهدهندگان میتوانستند تحت مجوز تحقیقاتی به آن دسترسی داشته باشند.
این مدل به سرعت توجهها را به خود جلب کرد، زیرا در حوزههایی مانند استدلال ریاضی و درک چندوظیفهای زبان، از بسیاری از مدلهای بزرگتر پیشی گرفت، در حالی که به میزان قابلتوجهی منابع محاسباتی کمتری نیاز داشت.
معماری سادهشده این مدل و تمرکز آن بر استدلال و منطق، به منظور پاسخگویی به نیاز فزاینده به عملکرد بالا در هوش مصنوعی طراحی شده است، در حالی که در محیطهایی با محدودیت منابع محاسباتی و حافظه، کارایی خود را حفظ میکند.
با انتشار این مدل بهصورت متنباز و تحت مجوز MIT، مایکروسافت آن را برای طیف وسیعتری از محققان و توسعهدهندگان (حتی برای اهداف تجاری) قابلدسترس کرده و نشاندهنده تغییری در نحوه طراحی و استقرار مدلهای هوش مصنوعی است که میتواند به تغییر مسیر صنعت کمک کند.
چه چیزی Phi-4 را متمایز میکند؟
مدل Phi-4 در آزمونهای ارزیابی که تواناییهای پیشرفته در استدلال و حوزههای خاص را میسنجند، برجسته عمل میکند. ویژگیهای مهم آن شامل موارد زیر است:
- کسب امتیاز بیش از ۸۰ درصد در آزمونهای چالشبرانگیزی مانند MATH و MGSM که حتی عملکرد بهتری نسبت به مدلهای بزرگتری مانند Google’s Gemini Pro و GPT-4o-mini داشته است.
- عملکرد برتر در وظایف استدلال ریاضی که قابلیت حیاتی برای حوزههایی مانند مالی، مهندسی و تحقیقات علمی محسوب میشود.
- نتایج چشمگیر در HumanEval برای تولید کدهای کاربردی که آن را به گزینهای قوی برای برنامهنویسی با کمک هوش مصنوعی تبدیل میکند.
علاوه بر این، طراحی و آموزش Phi-4 به گونهای انجام شده که هم دقیق باشد و هم کارآمد. این مدل که یک ترانسفورماتور با ۱۴ میلیارد پارامتر و فقط رمزگشا (Decoder) است، روی ۹.۸ تریلیون توکن از دادههای انتخابشده و مصنوعی آموزشدیده است. این دادهها شامل:
- اسناد عمومی که با دقت برای کیفیت فیلتر شدهاند.
- دادههای مصنوعی به سبک کتابهای درسی، با تمرکز بر ریاضیات، کدنویسی و استدلال منطقی.
- کتابهای آکادمیک باکیفیت و مجموعه دادههای پرسش و پاسخ.
این دادههای آموزشی همچنین شامل محتوای چندزبانه (۸ درصد) بوده، هرچند که این مدل عمدتاً برای کاربردهای زبان انگلیسی بهینهسازی شده است.
سازندگان این مدل در مایکروسافت میگویند فرآیندهای ایمنی و همترازی، از جمله تنظیم دقیق تحت نظارت و بهینهسازی ترجیحات مستقیم، تضمینکننده عملکرد قوی آن هستند و نگرانیهای مربوط به انصاف و قابلیت اعتماد را برطرف میکنند.
مزیت بازمتن
با انتشار مدل Phi-4 به همراه وزنهای کامل و مجوز MIT در Hugging Face، مایکروسافت آن را برای کسبوکارها جهت استفاده در عملیات تجاری باز کرده است.
توسعهدهندگان اکنون میتوانند این مدل را در پروژههای خود به کار گیرند یا آن را برای کاربردهای خاص بدون نیاز به منابع محاسباتی گسترده یا دریافت اجازه از مایکروسافت، بهینهسازی کنند.
این اقدام با روند رو به رشد انتشار متنباز مدلهای بنیادی هوش مصنوعی برای ترویج نوآوری و شفافیت همسو است. برخلاف مدلهای اختصاصی که معمولاً به پلتفرمها یا APIهای خاص محدود هستند، ماهیت متنباز Phi-4 دسترسی گستردهتر و سازگاری بیشتری را تضمین میکند.
تعادل بین ایمنی و عملکرد
مایکروسافت با انتشار Phi-4 بر اهمیت توسعه مسئولانه هوش مصنوعی تأکید دارد. این مدل تحت ارزیابیهای ایمنی گسترده از جمله آزمونهای تقابلی قرار گرفته است تا خطراتی مانند تعصب، تولید محتوای مضر و انتشار اطلاعات نادرست را به حداقل برساند.
با این حال، به توسعهدهندگان توصیه میشود برای کاربردهای پرخطر اقدامات حفاظتی بیشتری اعمال کنند و هنگام استفاده از مدل در سناریوهای حساس، خروجیها را بر اساس اطلاعات متنی معتبر تنظیم کنند.
پیامدهای انتشار Phi-4 برای فضای هوش مصنوعی
Phi-4 روند رایج بزرگتر کردن مدلهای هوش مصنوعی را به چالش میکشد. این مدل نشان میدهد که اگر مدلهای کوچکتر بهخوبی طراحی شده باشند، میتوانند در حوزههای کلیدی به نتایجی مشابه یا حتی بهتر دست پیدا کنند.
این کارایی نهتنها هزینهها را کاهش میدهد، بلکه مصرف انرژی را نیز پایین میآورد و باعث میشود قابلیتهای پیشرفته هوش مصنوعی برای سازمانهای متوسط و شرکتهایی با بودجههای محاسباتی محدود، در دسترستر باشند.