Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش خبری
پرامپت‌ نویسی
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
خطرات هوش مصنوعی
دیتاست
مدل‌های بنیادی
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
پیاده‌سازی هوش مصنوعی
گزارش
مصاحبه
هوش مصنوعی در عمل
 انثروپیک و نخستین مدل هوش مصنوعی «استدلال ترکیبی»

انثروپیک و نخستین مدل هوش مصنوعی «استدلال ترکیبی»

زمان مطالعه: 3 دقیقه

شرکت Anthropic که توسط گروهی از اعضای پیشین OpenAI بنیان‌گذاری شده است، اولین مدل هوش مصنوعی با قابلیت استدلال ترکیبی را امسال عرضه کرده است. مدل جدید با نام Claude 3.7 می‌تواند بسته به دستور کاربر، پاسخ معمول ارائه دهد یا برای حل مسائل دشوارتر، میزان مشخصی از «استدلال» را به کار گیرد و خروجی ایجاد کند.

این مدل نخستین بار این قابلیت را فراهم می‌کند که بتوان فرایند استدلال را برای مسائلی که به تحلیل عمیق‌تر نیاز دارند، فعال یا غیرفعال کرد. عملکرد مدل به گونه‌ای است که کاربر می‌تواند تعیین کند مدل چه مقدار و تا چه مرحله‌ای باید به تفکر و استدلال بپردازد تا به پاسخ برسد. هر چند آنتروپیک مدل‌های نسخه 4 خود را نیز منتشر کرده اما ویژگی استدلال هیبرید از مدل‌های نسخه 3.7 شروع شده است.

شرکت Anthropic اعلام کرده است مدل هیبرید جدید آنها با نام Claude 3.7 به کاربران و توسعه‌دهندگان کمک می‌کند تا مسائل پیچیده‌ای را که به ترکیبی از پاسخ‌های غریزی و استدلال گام‌به‌گام نیاز دارند، راحت‌تر حل کنند. به گفته مایکل گِرستن هابر (Michael Gerstenhaber)، مدیر محصول پلتفرم هوش مصنوعی Anthropic ، «کاربر کنترل زیادی روی رفتار مدل دارد، مثلاً می‌تواند تعیین کند مدل چقدر فکر کند، و بین میزان استدلال و هوشمندی و همچنین زمان و بودجه، تعادل برقرار کند».

مدل Claude 3.7 مجهز به قابلیت جدیدی به نام «دفترچه یادداشت» (scratchpad) است که روند استدلال مدل را به کاربر نمایش می‌دهد. این ویژگی قبلاً در مدل هوش مصنوعی چینی DeepSeek نیز پرطرفدار بوده است. به کمک این دفترچه، کاربر می‌تواند نحوه کار مدل را در حل یک مسأله مشاهده و در صورت نیاز دستورات یا درخواست‌های خود را اصلاح کند.

«دایان پن» (Dianne Penn)، مدیر محصول بخش تحقیقات Anthropic، می‌گوید این دفترچه وقتی با امکان افزایش یا کاهش میزان «استدلال» مدل ترکیب شود، حتی مفیدتر نیز خواهد بود. مثلاً اگر مدل نتواند یک مسأله را به درستی تجزیه کند، کاربر می‌تواند از آن بخواهد زمان بیشتری روی آن بگذارد.

در حال حاضر، شرکت‌های هوش مصنوعی پیشرفته تلاش می‌کنند استدلال مدل‌ها را تقویت کنند تا توانایی حل مسائل و کاربردهای آن‌ها افزایش یابد. شرکت OpenAI که آغازگر موج فعلی هوش مصنوعی با ChatGPT بود، اولین مدل استدلالی خود به نام o1 را در سپتامبر ۲۰۲۴ عرضه کرد و سپس نسخه‌ای قوی‌تر به نام o3 ارائه داد. رقیب دیگر، شرکت گوگل قابلیت مشابهی موسوم به Flash Thinking را به مدل Gemini اضافه کرده است. در همه این موارد، کاربر برای استفاده از قابلیت استدلال باید بین مدل‌ها جابجا شود که این تفاوت مهمی با Claude 3.7 است که امکان تنظیم سطح استدلال را در خود مدل فراهم می‌کند.

تفاوت بین مدل معمولی و مدل استدلالی شبیه تفاوت بین دو نوع تفکری است که اقتصاددان برنده نوبل مایکل کاهنمن (Michael Kahneman) در کتاب سال ۲۰۱۱ خود به نام «تفکر سریع و کند» شرح می‌دهد: تفکر سریع و غریزی (سیستم ۱) و تفکر آهسته و تحلیلی (سیستم ۲).

مدل‌های زبانی بزرگ مانند ChatGPT، پاسخ‌ها را فوراً و با تکیه بر شبکه‌های عصبی بزرگ تولید می‌کنند. این خروجی‌ها ممکن است هوشمندانه به نظر برسند، اما در حل مسائلی که به استدلال گام‌به‌گام نیاز دارند، حتی مسائل ساده ریاضی اغلب ناتوان‌اند. اگرچه می‌توان با دستورالعمل‌های خاص مدل را وادار به استدلال مرحله‌به‌مرحله کرد، اما این روش همیشه قابل اعتماد نیست و معمولاً مدل‌ها در برنامه‌ریزی پیچیده با مشکل مواجه می‌شوند. اکنون شرکت‌هایی مانند OpenAI، Google و Anthropic برای بهبود توانایی استدلال مدل‌ها، از روشی به نام «یادگیری تقویتی» استفاده می‌کنند. یعنی مدل با کمک داده‌های بیشتری که انسان‌ها در حل مسائل خاص فراهم می‌کنند، آموزش می‌بیند تا استدلال بهتری ارائه کند.

خانم پن می‌گوید که حالت استدلالی مدل Claude با داده‌های بیشتر مربوط به کاربردهای تجاری مانند نوشتن و تصحیح کد، کار با رایانه و پاسخ به پرسش‌های حقوقی پیچیده تقویت شده است. وی می‌افزاید: «مواردی که شاهد بهبود بوده‌ایم، موضوعات فنی یا مسائلی هستند که به استدلال طولانی نیاز دارند. آنچه از مشتریان دریافت کرده‌ایم، علاقه زیاد به استفاده از مدل در حجم کاری واقعی بوده است».

شرکت Anthropic اذعان دارد که Claude 3.7 به‌ویژه در حل مشکلات کدنویسی که نیازمند استدلال مرحله‌به‌مرحله هستند، عملکرد فوق‌العاده‌ای دارد و در برخی آزمون‌ها مانند SWE-bench از مدل o1 شرکت OpenAI پیشی گرفته است. امروز همچنین ابزاری به نام Claude Code معرفی شده است که مخصوص این نوع کدنویسی مبتنی بر هوش مصنوعی طراحی شده و فعلاً در مرحله آزمایشی قرار دارد.

خانم پن توضیح می‌دهد: «مدل در حال حاضر در زمینه کدنویسی عملکرد قابل توجهی دارد، اما تفکر اضافه‌تر برای مواردی که برنامه‌ریزی بسیار پیچیده لازم دارد. برای مثال کار با پایگاه‌های کد بسیار بزرگ یک شرکت، می‌تواند بسیار سودمند باشد».

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها

در جریان مهم‌ترین اتفاقات AI بمانید

هر هفته، خلاصه‌ای از اخبار، تحلیل‌ها و رویدادهای هوش مصنوعی را در ایمیل‌تان دریافت کنید.

[wpforms id="48325"]