
انثروپیک و نخستین مدل هوش مصنوعی «استدلال ترکیبی»
شرکت Anthropic که توسط گروهی از اعضای پیشین OpenAI بنیانگذاری شده است، اولین مدل هوش مصنوعی با قابلیت استدلال ترکیبی را امسال عرضه کرده است. مدل جدید با نام Claude 3.7 میتواند بسته به دستور کاربر، پاسخ معمول ارائه دهد یا برای حل مسائل دشوارتر، میزان مشخصی از «استدلال» را به کار گیرد و خروجی ایجاد کند.
این مدل نخستین بار این قابلیت را فراهم میکند که بتوان فرایند استدلال را برای مسائلی که به تحلیل عمیقتر نیاز دارند، فعال یا غیرفعال کرد. عملکرد مدل به گونهای است که کاربر میتواند تعیین کند مدل چه مقدار و تا چه مرحلهای باید به تفکر و استدلال بپردازد تا به پاسخ برسد. هر چند آنتروپیک مدلهای نسخه 4 خود را نیز منتشر کرده اما ویژگی استدلال هیبرید از مدلهای نسخه 3.7 شروع شده است.
شرکت Anthropic اعلام کرده است مدل هیبرید جدید آنها با نام Claude 3.7 به کاربران و توسعهدهندگان کمک میکند تا مسائل پیچیدهای را که به ترکیبی از پاسخهای غریزی و استدلال گامبهگام نیاز دارند، راحتتر حل کنند. به گفته مایکل گِرستن هابر (Michael Gerstenhaber)، مدیر محصول پلتفرم هوش مصنوعی Anthropic ، «کاربر کنترل زیادی روی رفتار مدل دارد، مثلاً میتواند تعیین کند مدل چقدر فکر کند، و بین میزان استدلال و هوشمندی و همچنین زمان و بودجه، تعادل برقرار کند».
مدل Claude 3.7 مجهز به قابلیت جدیدی به نام «دفترچه یادداشت» (scratchpad) است که روند استدلال مدل را به کاربر نمایش میدهد. این ویژگی قبلاً در مدل هوش مصنوعی چینی DeepSeek نیز پرطرفدار بوده است. به کمک این دفترچه، کاربر میتواند نحوه کار مدل را در حل یک مسأله مشاهده و در صورت نیاز دستورات یا درخواستهای خود را اصلاح کند.
«دایان پن» (Dianne Penn)، مدیر محصول بخش تحقیقات Anthropic، میگوید این دفترچه وقتی با امکان افزایش یا کاهش میزان «استدلال» مدل ترکیب شود، حتی مفیدتر نیز خواهد بود. مثلاً اگر مدل نتواند یک مسأله را به درستی تجزیه کند، کاربر میتواند از آن بخواهد زمان بیشتری روی آن بگذارد.
در حال حاضر، شرکتهای هوش مصنوعی پیشرفته تلاش میکنند استدلال مدلها را تقویت کنند تا توانایی حل مسائل و کاربردهای آنها افزایش یابد. شرکت OpenAI که آغازگر موج فعلی هوش مصنوعی با ChatGPT بود، اولین مدل استدلالی خود به نام o1 را در سپتامبر ۲۰۲۴ عرضه کرد و سپس نسخهای قویتر به نام o3 ارائه داد. رقیب دیگر، شرکت گوگل قابلیت مشابهی موسوم به Flash Thinking را به مدل Gemini اضافه کرده است. در همه این موارد، کاربر برای استفاده از قابلیت استدلال باید بین مدلها جابجا شود که این تفاوت مهمی با Claude 3.7 است که امکان تنظیم سطح استدلال را در خود مدل فراهم میکند.
تفاوت بین مدل معمولی و مدل استدلالی شبیه تفاوت بین دو نوع تفکری است که اقتصاددان برنده نوبل مایکل کاهنمن (Michael Kahneman) در کتاب سال ۲۰۱۱ خود به نام «تفکر سریع و کند» شرح میدهد: تفکر سریع و غریزی (سیستم ۱) و تفکر آهسته و تحلیلی (سیستم ۲).
مدلهای زبانی بزرگ مانند ChatGPT، پاسخها را فوراً و با تکیه بر شبکههای عصبی بزرگ تولید میکنند. این خروجیها ممکن است هوشمندانه به نظر برسند، اما در حل مسائلی که به استدلال گامبهگام نیاز دارند، حتی مسائل ساده ریاضی اغلب ناتواناند. اگرچه میتوان با دستورالعملهای خاص مدل را وادار به استدلال مرحلهبهمرحله کرد، اما این روش همیشه قابل اعتماد نیست و معمولاً مدلها در برنامهریزی پیچیده با مشکل مواجه میشوند. اکنون شرکتهایی مانند OpenAI، Google و Anthropic برای بهبود توانایی استدلال مدلها، از روشی به نام «یادگیری تقویتی» استفاده میکنند. یعنی مدل با کمک دادههای بیشتری که انسانها در حل مسائل خاص فراهم میکنند، آموزش میبیند تا استدلال بهتری ارائه کند.
خانم پن میگوید که حالت استدلالی مدل Claude با دادههای بیشتر مربوط به کاربردهای تجاری مانند نوشتن و تصحیح کد، کار با رایانه و پاسخ به پرسشهای حقوقی پیچیده تقویت شده است. وی میافزاید: «مواردی که شاهد بهبود بودهایم، موضوعات فنی یا مسائلی هستند که به استدلال طولانی نیاز دارند. آنچه از مشتریان دریافت کردهایم، علاقه زیاد به استفاده از مدل در حجم کاری واقعی بوده است».
شرکت Anthropic اذعان دارد که Claude 3.7 بهویژه در حل مشکلات کدنویسی که نیازمند استدلال مرحلهبهمرحله هستند، عملکرد فوقالعادهای دارد و در برخی آزمونها مانند SWE-bench از مدل o1 شرکت OpenAI پیشی گرفته است. امروز همچنین ابزاری به نام Claude Code معرفی شده است که مخصوص این نوع کدنویسی مبتنی بر هوش مصنوعی طراحی شده و فعلاً در مرحله آزمایشی قرار دارد.
خانم پن توضیح میدهد: «مدل در حال حاضر در زمینه کدنویسی عملکرد قابل توجهی دارد، اما تفکر اضافهتر برای مواردی که برنامهریزی بسیار پیچیده لازم دارد. برای مثال کار با پایگاههای کد بسیار بزرگ یک شرکت، میتواند بسیار سودمند باشد».