رقیب OpenAI o1 از چین ظهور کرد
علیبابا (Alibaba) از مدل رقیب OpenAI o1 با قابلیت استدلال رونمایی کرد؛ در بنچمارکهای ریاضی این مدل از o1 عملکرد بهتری داشته است؛ اما فعلاً بهصورت آزمایشی در دسترس قرار دارد.
شرکت چینی علیبابا که بزرگترین شرکت خردهفروش جهان است و در فهرست بزرگترین شرکتهای تجارت الکترونیک دنیا جای دارد، از مدل هوش مصنوعی دارای قابلیت استدلال رونمایی کرده است که رقیب جدید مدل o1 از OpenAI به حساب میآید.
مدل معرفی شده شامل ۳۲.۵ میلیارد پارامتر است و میتواند به درخواستهایی با حداکثر 32 هزار توکن پاسخ بدهد.
عملکرد این مدل مانند دیگر مدلهای بزرگ دارای قابلیت استدلال است، به این معنا که هوش مصنوعی در طول استنتاج خود، برای بررسی پاسخهایی که میخواهد به کاربر ارائه کند و تصحیح اشتباهات، از چرخههای محاسباتی بیشتری استفاده میکند.
این مدل در نتیجه این قابلیت برای کارهایی که به استدلال منطقی و برنامهریزی نیاز دارند، مانند ریاضی و کدنویسی، مناسبتر است.
این مدل، QwQ نام دارد و در بنچمارکهای AIME و MATH که توانایی مدل در حل مسائل ریاضی را ارزیابی میکنند، توانست o1-preview را شکست دهد.
این مدل همچنین در بنچمارک GPQA که برای ارزیابی استدلال علمی است، بهتر از o1-mini عمل کرده است؛ اما در زمینه کدنویسی و بر اساس بنچمارک LiveCodeBench، مدل o1 عملکرد بهتری داشته است؛ گفتنی است که عملکرد QwQ از مدلهای دیگر مانند GPT-4o و Claude 3.5 Sonnet بهتر بوده است.
مدل هوش مصنوعی Alibaba در حال حاضر به شکل پیشنمایش عرضه شده است و میتوان در آینده انتظار عرضه مدلهای بهبودیافتهتری از این شرکت داشت.
Alibaba در بیانیه خود میگوید: «از طریق اکتشافات عمیق و آزمایشهای بیشمار خود، چیزی بسیار محسوس را کشف کردیم: وقتی زمانی را به اندیشیدن، پرسش و تأمل اختصاص میدهیم، درک مدل از ریاضیات و برنامهنویسی مانند گلی در برابر خورشید شکوفا میشود… این فرایند انعکاس دقیق و دروننگری منجر به پیشرفتهای قابلتوجهی در حل مشکلات پیچیده میشود.»
با این حال شرکت حرفی از دادهها یا فرایندی که مدل خود برای آموزش طی کرده است، نزده است، اما با توجه به اینکه QwQ مدلی متنباز است، فرایند تفکر آن پنهان نیست و میتوان برای فهمیدن این موضوع که مدل هنگام حل مشکلات چگونه استدلال میکند، سراغ متن آن رفت.