
مایکروسافت rStar-Math و استدلال ریاضی سطح بالا
مایکروسافت روش جدیدی به نام rStar-Math را توسعه داده که به مدلهای زبانی کوچک (SLM) امکان میدهد مسائل پیچیده ریاضی را با دقت بالایی حل کنند و حتی عملکردی بهتر از مدلهای بزرگتری مانند o1 از OpenAI داشته باشند. روش rStar-Math به جای اتکا به انتقال دانش از مدلهای بزرگتر، به مدلهای کوچک اجازه میدهد بهطور مستقل از طریق تکامل خودکار بهبود پیدا کنند.
پژوهشگران در مقاله خود نوشتند: «کار ما نشان میدهد که مدلهای زبانی کوچک میتوانند از طریق خود تکاملی و بررسی دقیق گامبهگام، به عملکردی پیشرفته در استدلال ریاضی دست یابند.»
چرا این موضوع اهمیت دارد؟
مدلهای کوچکتر کاربری سادهتری دارند، ای مدلها به سختافزار قوی نیاز ندارند و ابزارهای پیشرفته هوش مصنوعی را برای افراد و سازمانهای بیشتری در دسترس قرار میدهند. مدلهای کوچکتر بهویژه در حوزههایی مانند آموزش، ریاضیات، برنامهنویسی و پژوهش که استدلال دقیق و مرحلهبهمرحله ضروری است، بسیار مفید هستند.
انتشار متنباز rStar-Math و مدل Phi-4 مایکروسافت موجود در Hugging Face، به دیگران این امکان را میدهد که این ابزارها را برای کاربردهای گوناگون شخصیسازی و استفاده کنند، بدین ترتیب هوش مصنوعی مقرونبهصرفهتر و قابلدسترستر میشود.
این سیستم از روش جستجوی درختی مونتکارلو (MCTS) که معمولاً در بازیهایی مثل شطرنج استفاده میشود تا مشکلات را در مراحل کوچکتر و قابل کنترلتر حل کند. در هر مرحله، صحت کار با اجرای کد تأیید میشود تا از بروز پاسخهای درست اما با منطق نادرست جلوگیری شود.
ویژگیهای rStar-Math
ویژگیهای rStar-Math شامل سه نوآوری برای بهبود عملکرد است. این سیستم از MCTS برای ایجاد دادههای آموزشی گامبهگام استفاده میکند تا دقت را تضمین کند. یک مدل ترجیح فرایند (PPM) مراحل میانی را بدون اتکا به نمرهدهی ناپایدار ارزیابی و هدایت میکند. این سیستم بهصورت تدریجی و در چهار مرحله تکامل پیدا میکند تا مدلها و دادهها برای حل مسائل پیچیده بهبود یابند.
در معیار MATH، دقت این مدل از 58.8٪ به 90٪ افزایش یافته و از o1-preview شرکت OpenAI پیشی گرفته است. این سیستم همچنین موفق به حل 53.3٪ از مسائل آزمون المپیاد ریاضی آمریکا (AIME) شده و در میان 20٪ رقبای برتر قرار گرفته است. این مدل در دیگر معیارها مانند GSM8K، Olympiad Bench و چالشهای در سطح دانشگاه نیز عملکرد قوی نشان داده است.

این مطالعه پتانسیل مدلهای کوچکتر برای دستیابی به تواناییهای استدلال پیشرفتهای که معمولاً با سیستمهای بزرگتر مرتبط است را برجسته میکند. همچنین نشان میدهد که چنین مدلهایی میتوانند قابلیت خود بازبینی درونی برای شناسایی و اصلاح خطاها در هنگام حل مسائل را توسعه دهند.
این چارچوب همراه با کد و دادههای آن به صورت متنباز در GitHub در دسترس است و راه را برای توسعه سیستمهای هوش مصنوعی کوچکتر و کارآمدتری که قادر به انجام وظایف پیچیده استدلالی هستند، هموار میکند.