انثروپیک و نخستین مدل هوش مصنوعی «استدلال ترکیبی»

تیم تحریریه
۲۷ مرداد ۱۴۰۴

زمان مطالعه: 3 دقیقه

شرکت Anthropic که توسط گروهی از اعضای پیشین OpenAI بنیان‌گذاری شده است، اولین مدل هوش مصنوعی با قابلیت استدلال ترکیبی را امسال عرضه کرده است. مدل جدید با نام Claude 3.7 می‌تواند بسته به دستور کاربر، پاسخ معمول ارائه دهد یا برای حل مسائل دشوارتر، میزان مشخصی از «استدلال» را به کار گیرد و خروجی ایجاد کند.

این مدل نخستین بار این قابلیت را فراهم می‌کند که بتوان فرایند استدلال را برای مسائلی که به تحلیل عمیق‌تر نیاز دارند، فعال یا غیرفعال کرد. عملکرد مدل به گونه‌ای است که کاربر می‌تواند تعیین کند مدل چه مقدار و تا چه مرحله‌ای باید به تفکر و استدلال بپردازد تا به پاسخ برسد. هر چند آنتروپیک مدل‌های نسخه 4 خود را نیز منتشر کرده اما ویژگی استدلال هیبرید از مدل‌های نسخه 3.7 شروع شده است.

شرکت Anthropic اعلام کرده است مدل هیبرید جدید آنها با نام Claude 3.7 به کاربران و توسعه‌دهندگان کمک می‌کند تا مسائل پیچیده‌ای را که به ترکیبی از پاسخ‌های غریزی و استدلال گام‌به‌گام نیاز دارند، راحت‌تر حل کنند. به گفته مایکل گِرستن هابر (Michael Gerstenhaber)، مدیر محصول پلتفرم هوش مصنوعی Anthropic ، «کاربر کنترل زیادی روی رفتار مدل دارد، مثلاً می‌تواند تعیین کند مدل چقدر فکر کند، و بین میزان استدلال و هوشمندی و همچنین زمان و بودجه، تعادل برقرار کند».

مدل Claude 3.7 مجهز به قابلیت جدیدی به نام «دفترچه یادداشت» (scratchpad) است که روند استدلال مدل را به کاربر نمایش می‌دهد. این ویژگی قبلاً در مدل هوش مصنوعی چینی DeepSeek نیز پرطرفدار بوده است. به کمک این دفترچه، کاربر می‌تواند نحوه کار مدل را در حل یک مسأله مشاهده و در صورت نیاز دستورات یا درخواست‌های خود را اصلاح کند.

«دایان پن» (Dianne Penn)، مدیر محصول بخش تحقیقات Anthropic، می‌گوید این دفترچه وقتی با امکان افزایش یا کاهش میزان «استدلال» مدل ترکیب شود، حتی مفیدتر نیز خواهد بود. مثلاً اگر مدل نتواند یک مسأله را به درستی تجزیه کند، کاربر می‌تواند از آن بخواهد زمان بیشتری روی آن بگذارد.

در حال حاضر، شرکت‌های هوش مصنوعی پیشرفته تلاش می‌کنند استدلال مدل‌ها را تقویت کنند تا توانایی حل مسائل و کاربردهای آن‌ها افزایش یابد. شرکت OpenAI که آغازگر موج فعلی هوش مصنوعی با ChatGPT بود، اولین مدل استدلالی خود به نام o1 را در سپتامبر ۲۰۲۴ عرضه کرد و سپس نسخه‌ای قوی‌تر به نام o3 ارائه داد. رقیب دیگر، شرکت گوگل قابلیت مشابهی موسوم به Flash Thinking را به مدل Gemini اضافه کرده است. در همه این موارد، کاربر برای استفاده از قابلیت استدلال باید بین مدل‌ها جابجا شود که این تفاوت مهمی با Claude 3.7 است که امکان تنظیم سطح استدلال را در خود مدل فراهم می‌کند.

تفاوت بین مدل معمولی و مدل استدلالی شبیه تفاوت بین دو نوع تفکری است که اقتصاددان برنده نوبل مایکل کاهنمن (Michael Kahneman) در کتاب سال ۲۰۱۱ خود به نام «تفکر سریع و کند» شرح می‌دهد: تفکر سریع و غریزی (سیستم ۱) و تفکر آهسته و تحلیلی (سیستم ۲).

مدل‌های زبانی بزرگ مانند ChatGPT، پاسخ‌ها را فوراً و با تکیه بر شبکه‌های عصبی بزرگ تولید می‌کنند. این خروجی‌ها ممکن است هوشمندانه به نظر برسند، اما در حل مسائلی که به استدلال گام‌به‌گام نیاز دارند، حتی مسائل ساده ریاضی اغلب ناتوان‌اند. اگرچه می‌توان با دستورالعمل‌های خاص مدل را وادار به استدلال مرحله‌به‌مرحله کرد، اما این روش همیشه قابل اعتماد نیست و معمولاً مدل‌ها در برنامه‌ریزی پیچیده با مشکل مواجه می‌شوند. اکنون شرکت‌هایی مانند OpenAI، Google و Anthropic برای بهبود توانایی استدلال مدل‌ها، از روشی به نام «یادگیری تقویتی» استفاده می‌کنند. یعنی مدل با کمک داده‌های بیشتری که انسان‌ها در حل مسائل خاص فراهم می‌کنند، آموزش می‌بیند تا استدلال بهتری ارائه کند.

خانم پن می‌گوید که حالت استدلالی مدل Claude با داده‌های بیشتر مربوط به کاربردهای تجاری مانند نوشتن و تصحیح کد، کار با رایانه و پاسخ به پرسش‌های حقوقی پیچیده تقویت شده است. وی می‌افزاید: «مواردی که شاهد بهبود بوده‌ایم، موضوعات فنی یا مسائلی هستند که به استدلال طولانی نیاز دارند. آنچه از مشتریان دریافت کرده‌ایم، علاقه زیاد به استفاده از مدل در حجم کاری واقعی بوده است».

شرکت Anthropic اذعان دارد که Claude 3.7 به‌ویژه در حل مشکلات کدنویسی که نیازمند استدلال مرحله‌به‌مرحله هستند، عملکرد فوق‌العاده‌ای دارد و در برخی آزمون‌ها مانند SWE-bench از مدل o1 شرکت OpenAI پیشی گرفته است. امروز همچنین ابزاری به نام Claude Code معرفی شده است که مخصوص این نوع کدنویسی مبتنی بر هوش مصنوعی طراحی شده و فعلاً در مرحله آزمایشی قرار دارد.

خانم پن توضیح می‌دهد: «مدل در حال حاضر در زمینه کدنویسی عملکرد قابل توجهی دارد، اما تفکر اضافه‌تر برای مواردی که برنامه‌ریزی بسیار پیچیده لازم دارد. برای مثال کار با پایگاه‌های کد بسیار بزرگ یک شرکت، می‌تواند بسیار سودمند باشد».

https://hooshio.com/?p=74589

جدیدترین تحولات هوش مصنوعی را در کانال بله هوشیو بخوانید

انثروپیک و نخستین مدل هوش مصنوعی «استدلال ترکیبی»

GPT-5.3 Codex؛ مدلی که به ساخت خودش کمک کرد

رونمایی از «طوسا»؛ دستیار هوش مصنوعی وزارت نیرو آماده بهره‌برداری شد

نقشه‌برداری دقیق از شمال تهران با استفاده از هوش مصنوعی و ماهواره «خیام»

وقتی NotebookLM مغز متفکر Gemini می‌شود

پلیس و هوش مصنوعی؛ انقلابی که دیر اما ناگزیر

عصر مدل‌های چندگانه در هوش مصنوعی سازمانی

هوش مصنوعی بازیگر اصلی «جشنواره فیلم فجر»

جعل احساسات

رونمایی از «طوسا»؛ دستیار هوش مصنوعی وزارت نیرو آماده بهره‌برداری شد

نقشه‌برداری دقیق از شمال تهران با استفاده از هوش مصنوعی و ماهواره «خیام»

قطع اینترنت، پژوهشگران هوش مصنوعی را زمین‌گیر کرد

هوش مصنوعی بازیگر اصلی «جشنواره فیلم فجر»

GPT-5.3 Codex؛ مدلی که به ساخت خودش کمک کرد

وقتی NotebookLM مغز متفکر Gemini می‌شود

تحقیقات رسمی کمیسیون اروپا علیه «TikTok» کلید خورد

شکست «ChatGPT» و پیروزی «Gemini» در پوشش زنده رویداد حمله به ونزوئلا

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

پلیس و هوش مصنوعی؛ انقلابی که دیر اما ناگزیر

GPT-5.3 Codex؛ مدلی که به ساخت خودش کمک کرد

رونمایی از «طوسا»؛ دستیار هوش مصنوعی وزارت نیرو آماده بهره‌برداری شد

نقشه‌برداری دقیق از شمال تهران با استفاده از هوش مصنوعی و ماهواره «خیام»

عصر مدل‌های چندگانه در هوش مصنوعی سازمانی

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید