برترین متخصصین

از سراسر دنیا

مجموعه وبینارهای مدل‌های بزرگ زبانی (LLM)

Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش خبری
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
گزارش
مصاحبه
 مدل قدرتمند Phi-4 مایکروسافت

مدل قدرتمند Phi-4 مایکروسافت

زمان مطالعه: 4 دقیقه

در حالی که OpenAI، همچنان مدل‌های استدلالی قدرتمندتری مانند سری جدید o3 را معرفی می‌کند، مایکروسافت نیز دست روی دست نگذاشته است. این شرکت در حال توسعه مدل‌های کوچک‌تر و قدرتمندتری است که تحت برند خود عرضه می‌شوند.

اخیراً چند تن از  محققان فعلی و سابق مایکروسافت و دانشمندان هوش مصنوعی در پلتفرم X اعلام کردند که مایکروسافت مدل Phi-4 را به‌صورت یک پروژه کاملاً متن‌باز و با وزن‌های قابل دانلود در Hugging Face، جامعه اشتراک‌گذاری کد هوش مصنوعی، منتشر کرده است.

Phi-4 از راه می‌رسد

«شی‌تال شاه»، مهندس ارشد تحقیقاتی هوش مصنوعی مایکروسافت، در حساب کاربری X خود نوشت: «واکنش‌ها به انتشار Phi-4 واقعاً ما را شگفت‌زده کرد. خیلی‌ها از ما درخواست انتشار وزن‌ها را داشتند. حتی چند نفر نسخه‌های غیررسمی از وزن‌های Phi-4 را در Hugging Face آپلود کرده بودند، اما دیگر صبر نکنید. امروز نسخه رسمی مدل Phi-4 را در Hugging Face منتشر می‌کنیم! با مجوز MIT!!»

وزن‌ها مقادیر عددی هستند که مشخص می‌کنند یک مدل زبانی هوش مصنوعی، چه کوچک و چه بزرگ، چگونه زبان و داده‌ها را درک کرده و خروجی می‌دهد. معمولاً این وزن‌ها در فرآیند آموزش مدل از طریق یادگیری عمیق بدون نظارت ایجاد می‌شوند که طی آن مدل تعیین می‌کند چه خروجی‌هایی باید بر اساس ورودی‌های دریافت‌شده ارائه شود.

وزن‌های مدل می‌توانند توسط محققان و سازندگان مدل به طور دستی تنظیم شوند که به آن‌ها «بایاس» (تمایلات) می‌گویند. یک مدل تا زمانی که وزن‌های آن عمومی نشده باشد، معمولاً به‌عنوان یک مدل کاملاً متن‌باز در نظر گرفته نمی‌شود، زیرا این وزن‌ها امکان سفارشی‌سازی کامل یا سازگاری با نیازهای خاص دیگر محققان را فراهم می‌کنند.

اگرچه Phi-4 در واقع ماه گذشته توسط مایکروسافت معرفی شد، اما استفاده از آن در ابتدا به پلتفرم توسعه Azure AI Foundry مایکروسافت محدود شده بود.

اکنون Phi-4 خارج از این سرویس اختصاصی در دسترس همه کاربرانی است که حساب کاربری در Hugging Face دارند و با مجوز MIT ارائه می‌شود. این امر امکان استفاده از آن برای کاربردهای تجاری را نیز فراهم می‌کند.

این انتشار به محققان و توسعه‌دهندگان امکان دسترسی کامل به ۱۴ میلیارد پارامتر این مدل را می‌دهد و اجازه می‌دهد بدون محدودیت‌های منابعی که معمولاً با سیستم‌های بزرگ‌تر هوش مصنوعی همراه است، به آزمایش و پیاده‌سازی بپردازند.

حرکت به‌سوی بهره‌وری بیشتر در هوش مصنوعی

مدل Phi-4 برای اولین بار در دسامبر ۲۰۲۴ و در پلتفرم Azure AI Foundry مایکروسافت راه‌اندازی شد، جایی که توسعه‌دهندگان می‌توانستند تحت مجوز تحقیقاتی به آن دسترسی داشته باشند.

این مدل به سرعت توجه‌ها را به خود جلب کرد، زیرا در حوزه‌هایی مانند استدلال ریاضی و درک چندوظیفه‌ای زبان، از بسیاری از مدل‌های بزرگ‌تر پیشی گرفت، در حالی که به میزان قابل‌توجهی منابع محاسباتی کمتری نیاز داشت.

معماری ساده‌شده این مدل و تمرکز آن بر استدلال و منطق، به منظور پاسخگویی به نیاز فزاینده به عملکرد بالا در هوش مصنوعی طراحی شده است، در حالی که در محیط‌هایی با محدودیت منابع محاسباتی و حافظه، کارایی خود را حفظ می‌کند.

با انتشار این مدل به‌صورت متن‌باز و تحت مجوز MIT، مایکروسافت آن را برای طیف وسیع‌تری از محققان و توسعه‌دهندگان (حتی برای اهداف تجاری) قابل‌دسترس کرده و نشان‌دهنده تغییری در نحوه طراحی و استقرار مدل‌های هوش مصنوعی است که می‌تواند به تغییر مسیر صنعت کمک کند.

چه چیزی Phi-4 را متمایز می‌کند؟

مدل Phi-4 در آزمون‌های ارزیابی که توانایی‌های پیشرفته در استدلال و حوزه‌های خاص را می‌سنجند، برجسته عمل می‌کند. ویژگی‌های مهم آن شامل موارد زیر است:

  • کسب امتیاز بیش از ۸۰ درصد در آزمون‌های چالش‌برانگیزی مانند MATH و MGSM که حتی عملکرد بهتری نسبت به مدل‌های بزرگ‌تری مانند Google’s Gemini Pro و GPT-4o-mini داشته است.
  • عملکرد برتر در وظایف استدلال ریاضی که قابلیت حیاتی برای حوزه‌هایی مانند مالی، مهندسی و تحقیقات علمی محسوب می‌شود.
  • نتایج چشمگیر در HumanEval برای تولید کدهای کاربردی که آن را به گزینه‌ای قوی برای برنامه‌نویسی با کمک هوش مصنوعی تبدیل می‌کند.

علاوه بر این، طراحی و آموزش Phi-4 به گونه‌ای انجام شده که هم دقیق باشد و هم کارآمد. این مدل که یک ترانسفورماتور با ۱۴ میلیارد پارامتر و فقط رمزگشا (Decoder) است، روی ۹.۸ تریلیون توکن از داده‌های انتخاب‌شده و مصنوعی آموزش‌دیده است. این داده‌ها شامل:

  • اسناد عمومی که با دقت برای کیفیت فیلتر شده‌اند.
  • داده‌های مصنوعی به سبک کتاب‌های درسی، با تمرکز بر ریاضیات، کدنویسی و استدلال منطقی.
  • کتاب‌های آکادمیک باکیفیت و مجموعه داده‌های پرسش و پاسخ.

این داده‌های آموزشی همچنین شامل محتوای چندزبانه (۸ درصد) بوده، هرچند که این مدل عمدتاً برای کاربردهای زبان انگلیسی بهینه‌سازی شده است.

سازندگان این مدل در مایکروسافت می‌گویند فرآیندهای ایمنی و هم‌ترازی، از جمله تنظیم دقیق تحت نظارت و بهینه‌سازی ترجیحات مستقیم، تضمین‌کننده عملکرد قوی آن هستند و نگرانی‌های مربوط به انصاف و قابلیت اعتماد را برطرف می‌کنند.

مزیت بازمتن

با انتشار مدل Phi-4 به همراه وزن‌های کامل و مجوز MIT در Hugging Face، مایکروسافت آن را برای کسب‌وکارها جهت استفاده در عملیات تجاری باز کرده است.

توسعه‌دهندگان اکنون می‌توانند این مدل را در پروژه‌های خود به کار گیرند یا آن را برای کاربردهای خاص بدون نیاز به منابع محاسباتی گسترده یا دریافت اجازه از مایکروسافت، بهینه‌سازی کنند.

این اقدام با روند رو به رشد انتشار متن‌باز مدل‌های بنیادی هوش مصنوعی برای ترویج نوآوری و شفافیت همسو است. برخلاف مدل‌های اختصاصی که معمولاً به پلتفرم‌ها یا APIهای خاص محدود هستند، ماهیت متن‌باز Phi-4 دسترسی گسترده‌تر و سازگاری بیشتری را تضمین می‌کند.

تعادل بین ایمنی و عملکرد

مایکروسافت با انتشار Phi-4 بر اهمیت توسعه مسئولانه هوش مصنوعی تأکید دارد. این مدل تحت ارزیابی‌های ایمنی گسترده از جمله آزمون‌های تقابلی قرار گرفته است تا خطراتی مانند تعصب، تولید محتوای مضر و انتشار اطلاعات نادرست را به حداقل برساند.

با این حال، به توسعه‌دهندگان توصیه می‌شود برای کاربردهای پرخطر اقدامات حفاظتی بیشتری اعمال کنند و هنگام استفاده از مدل در سناریوهای حساس، خروجی‌ها را بر اساس اطلاعات متنی معتبر تنظیم کنند.

پیامدهای انتشار Phi-4 برای فضای هوش مصنوعی

Phi-4 روند رایج بزرگ‌تر کردن مدل‌های هوش مصنوعی را به چالش می‌کشد. این مدل نشان می‌دهد که اگر مدل‌های کوچک‌تر به‌خوبی طراحی شده باشند، می‌توانند در حوزه‌های کلیدی به نتایجی مشابه یا حتی بهتر دست پیدا کنند.

این کارایی نه‌تنها هزینه‌ها را کاهش می‌دهد، بلکه مصرف انرژی را نیز پایین می‌آورد و باعث می‌شود قابلیت‌های پیشرفته هوش مصنوعی برای سازمان‌های متوسط و شرکت‌هایی با بودجه‌های محاسباتی محدود، در دسترس‌تر باشند.

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]