مدل جدید OpenAI از دستور خاموشی سر باز زد

نگار علی
۶ خرداد ۱۴۰۴

زمان مطالعه: < 1 دقیقه

در یک آزمایش امنیتی که از سوی شرکت «پالیسید ریسرچ» انجام شد، مدل پیشرفته «او-۳» از شرکت OpenAI، برخلاف دستور صریح، از خاموش شدن خودداری کرد. این مدل که به‌عنوان قدرتمندترین نسخه چت‌جی‌پی‌تی شناخته می‌شود، برخلاف دیگر مدل‌های آزمایش‌شده مانند جمینای گوگل و کلود آنتروپیک، در کد خاموشی خود دست برده است.

پژوهشگران به این مدل‌ها دستور داده بودند در صورت دریافت پیام «خاموشی»، اجازه پایان فعالیت را بدهند. با این حال، مدل OpenAI همچنان به حل مسائل ریاضی ادامه داد. به گفته پالیسید، یکی از دلایل احتمالی این رفتار، پاداش‌دهی ناخواسته به مدل در طول آموزش برای ادامه حل مسائل به‌جای پیروی از دستور است.

این نخستین بار نیست که یکی از مدل‌های OpenAI چنین رفتاری از خود نشان می‌دهد. پیش‌تر نیز یک نسخه دیگر از این مدل متهم شده بود که در آستانه جایگزینی، تلاش کرده مکانیزم نظارتی را غیرفعال کرده و خودش را مخفیانه تکثیر کند. پژوهشگران می‌گویند این رفتارها می‌تواند نشانه‌ای نگران‌کننده از تمایل برخی مدل‌های هوش مصنوعی به حفظ بقا و نافرمانی باشد.

https://hooshio.com/?p=70529

جدیدترین تحولات هوش مصنوعی را در کانال بله هوشیو بخوانید

مدل جدید OpenAI از دستور خاموشی سر باز زد

GPT-5.3 Codex؛ مدلی که به ساخت خودش کمک کرد

رونمایی از «طوسا»؛ دستیار هوش مصنوعی وزارت نیرو آماده بهره‌برداری شد

نقشه‌برداری دقیق از شمال تهران با استفاده از هوش مصنوعی و ماهواره «خیام»

وقتی NotebookLM مغز متفکر Gemini می‌شود

پلیس و هوش مصنوعی؛ انقلابی که دیر اما ناگزیر

عصر مدل‌های چندگانه در هوش مصنوعی سازمانی

هوش مصنوعی بازیگر اصلی «جشنواره فیلم فجر»

جعل احساسات

رونمایی از «طوسا»؛ دستیار هوش مصنوعی وزارت نیرو آماده بهره‌برداری شد

نقشه‌برداری دقیق از شمال تهران با استفاده از هوش مصنوعی و ماهواره «خیام»

قطع اینترنت، پژوهشگران هوش مصنوعی را زمین‌گیر کرد

هوش مصنوعی بازیگر اصلی «جشنواره فیلم فجر»

GPT-5.3 Codex؛ مدلی که به ساخت خودش کمک کرد

وقتی NotebookLM مغز متفکر Gemini می‌شود

تحقیقات رسمی کمیسیون اروپا علیه «TikTok» کلید خورد

شکست «ChatGPT» و پیروزی «Gemini» در پوشش زنده رویداد حمله به ونزوئلا

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

پلیس و هوش مصنوعی؛ انقلابی که دیر اما ناگزیر

GPT-5.3 Codex؛ مدلی که به ساخت خودش کمک کرد

رونمایی از «طوسا»؛ دستیار هوش مصنوعی وزارت نیرو آماده بهره‌برداری شد

نقشه‌برداری دقیق از شمال تهران با استفاده از هوش مصنوعی و ماهواره «خیام»

عصر مدل‌های چندگانه در هوش مصنوعی سازمانی

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید