هوش مصنوعی «Claude» می‌تواند گفتگوهای خطرناک یا توهین‌آمیز را خودش متوقف کند

نگار علی
۲۷ مرداد ۱۴۰۴

زمان مطالعه: < 1 دقیقه

شرکت Anthropic اعلام کرد برخی از مدل‌های جدید هوش مصنوعی‌اش، مانند Claude Opus 4 و 4.1، توانایی پایان دادن به گفتگو‌های آسیب‌رسان یا توهین‌آمیز کاربران را دارند. این قابلیت نه برای حفاظت از انسان‌ها، بلکه برای محافظت از خود مدل طراحی شده است.

Anthropic اخیراً برنامه‌ای به نام «رفاه مدل» راه‌اندازی کرده است تا خطرات احتمالی برای مدل‌های هوش مصنوعی را شناسایی و کنترل کند. بر اساس این برنامه، اگر کاربر درخواست‌هایی مانند محتوای جنسی شامل کودکان یا اطلاعاتی برای ایجاد خشونت یا تروریسم را مطرح کند، مدل Claude پس از تلاش‌های متعدد برای هدایت گفتگو به مسیر سالم، می‌تواند گفتگو را قطع کند.

شرکت Anthropic تأکید کرده است که این قابلیت تنها در «موارد شدید و نادر» فعال می‌شود. همچنین کاربران پس از قطع گفتگو می‌توانند مکالمه جدیدی را با همان حساب کاربری آغاز کنند یا شاخه‌های جدیدی از گفتگوهای پیشین ایجاد کنند.

این اقدام Anthropic بخشی از آزمایشی گسترده برای بررسی تعاملات انسان و هوش مصنوعی است و هدف آن، بهبود امنیت و رفاه مدل‌های هوش مصنوعی بدون محدود کردن عملکرد آنها در گفتگوهای معمولی است.

https://hooshio.com/?p=74545

دوبی | 21 تا 25 مهر 1404

DUBAI |13-17 OCT 2025

پوشش رسانه‌ای هوشیو از جیتکس 2025

هوش مصنوعی «Claude» می‌تواند گفتگوهای خطرناک یا توهین‌آمیز را خودش متوقف کند

هکرها در کمین شما؛ ۱۰ فرمان امنیتی برای اینکه قربانی بعدی نباشید

استانبول رقیب جدید دبی در جذب غول‌های فناوری

پای استارلینک رسماً به خاورمیانه باز شد

«هانی‌ول» با هوش مصنوعی خط مقدم کارگران را دگرگون می‌کند

هوش مصنوعی در پی کشف اسرار کیهان

آیا ما در «عصر طلایی حماقت» زندگی می‌کنیم؟

کاربرد هوش مصنوعی در صنعت معدن

تبدیل صوت به متن فارسی

روایتی از تلاقی علم و صنعت در مسیر خلق ارزش

رونمایی از «یکتابات»؛ نخستین پلتفرم ایرانی فروش هوشمند در دایرکت اینستاگرام

آینده هوش مصنوعی در ایران از نگاه سیاست‌گذاری

هوشمند آرنا چگونه GPUهای کمیاب AI را به ایران می‌آورد؟

هکرها در کمین شما؛ ۱۰ فرمان امنیتی برای اینکه قربانی بعدی نباشید

استانبول رقیب جدید دبی در جذب غول‌های فناوری

پای استارلینک رسماً به خاورمیانه باز شد

«هانی‌ول» با هوش مصنوعی خط مقدم کارگران را دگرگون می‌کند

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

هوش مصنوعی در پی کشف اسرار کیهان

آیا ما در «عصر طلایی حماقت» زندگی می‌کنیم؟

کاربرد هوش مصنوعی در صنعت معدن

تبدیل صوت به متن فارسی

هکرها در کمین شما؛ ۱۰ فرمان امنیتی برای اینکه قربانی بعدی نباشید

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید