Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش خبری
پرامپت‌ نویسی
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
خطرات هوش مصنوعی
دیتاست
مدل‌های بنیادی
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
پیاده‌سازی هوش مصنوعی
گزارش
مصاحبه
هوش مصنوعی در عمل
 هوش مصنوعی «Claude» می‌تواند گفتگوهای خطرناک یا توهین‌آمیز را خودش متوقف کند

هوش مصنوعی «Claude» می‌تواند گفتگوهای خطرناک یا توهین‌آمیز را خودش متوقف کند

زمان مطالعه: < 1 دقیقه

شرکت Anthropic اعلام کرد برخی از مدل‌های جدید هوش مصنوعی‌اش، مانند Claude Opus 4 و 4.1، توانایی پایان دادن به گفتگو‌های آسیب‌رسان یا توهین‌آمیز کاربران را دارند. این قابلیت نه برای حفاظت از انسان‌ها، بلکه برای محافظت از خود مدل طراحی شده است.

Anthropic اخیراً برنامه‌ای به نام «رفاه مدل» راه‌اندازی کرده است تا خطرات احتمالی برای مدل‌های هوش مصنوعی را شناسایی و کنترل کند. بر اساس این برنامه، اگر کاربر درخواست‌هایی مانند محتوای جنسی شامل کودکان یا اطلاعاتی برای ایجاد خشونت یا تروریسم را مطرح کند، مدل Claude پس از تلاش‌های متعدد برای هدایت گفتگو به مسیر سالم، می‌تواند گفتگو را قطع کند.

شرکت Anthropic تأکید کرده است که این قابلیت تنها در «موارد شدید و نادر» فعال می‌شود. همچنین کاربران پس از قطع گفتگو می‌توانند مکالمه جدیدی را با همان حساب کاربری آغاز کنند یا شاخه‌های جدیدی از گفتگوهای پیشین ایجاد کنند.

این اقدام Anthropic بخشی از آزمایشی گسترده برای بررسی تعاملات انسان و هوش مصنوعی است و هدف آن، بهبود امنیت و رفاه مدل‌های هوش مصنوعی بدون محدود کردن عملکرد آنها در گفتگوهای معمولی است.

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها

در جریان مهم‌ترین اتفاقات AI بمانید

هر هفته، خلاصه‌ای از اخبار، تحلیل‌ها و رویدادهای هوش مصنوعی را در ایمیل‌تان دریافت کنید.

[wpforms id="48325"]