در فاصله چند روز از عرضه جدیدترین مدل OpenAI، بازخورد کاربران عمدتاً منفی بوده

شکستی بزرگ برای ChatGPT

امین رضا کیفرگیر
۲۰ مرداد ۱۴۰۴

زمان مطالعه: 3 دقیقه

طی ماه‌های گذشته، «سم آلتمن»، مدیرعامل شرکت OpenAI، با سروصدای زیادی بر قابلیت‌های GPT-5 تأکید کرده و عرضه آن را لحظه‌ای سرنوشت‌ساز برای این شرکت معرفی کرده بود. اما در ۲۴ ساعت اول پس از انتشار، این مدل جدید با واکنش‌های متفاوت و انتقادهایی روبرو شد.

در اطلاعیه روز پنجشنبه خود، OpenAI اعلام کرد که GPT-5 در کدنویسی و استدلال برای حل مشکلات پیچیده عملکرد بهتری دارد و آن را به قدری پیشرفته دانست که می‌تواند چت‌بات ChatGPT را به یک متخصص در سطح دکترا تبدیل کند. همچنین برخی از افرادی که دسترسی زودهنگامی به این مدل داشتند، آن را ستوده بودند.

«سایمون ویلیسون»، توسعه ‌دهنده، در یک پست وبلاگی نوش بود: «این مدل جدید مورد علاقه من است.» او آن را «کارآمد» و «گاهی اوقات تأثیرگذار» توصیف کرد، اما افزود: «تفاوت چشمگیری با آنچه قبلاً داشتیم، ندارد.»

با این حال، در پلتفرم‌های مختلف شبکه‌های اجتماعی، کاربران ChatGPT از این موضوع ابراز ناراحتی کردند که GPT-5 همچنان به ساخت اطلاعات نادرست ادامه می‌دهد و در مسائل ساده ریاضی و سؤالات املایی دچار مشکل می‌شود.

«نوآ جیانسیراکوسا»، دانشیار ریاضیات در دانشگاه بنتلی، گفت که عرضه این مدل را «ناامیدکننده» می‌داند. او اظهار داشت، در حالی که برخی پیشرفت‌ها وجود داشته، «آن‌ها بسیار جزئی‌تر از آن چیزی بودند که من انتظار داشتم.»

دست‌کم بخشی از این واکنش‌ها ممکن است ناشی از سردرگمی درباره عملکرد درونی این مدل باشد. برخلاف نرم‌افزارهای قبلی OpenAI، مدل GPT-5 بسته به نوع درخواست، به ‌صورت خودکار بین مدل‌هایی با سطوح پیچیدگی متفاوت جابه‌جا می‌شود. این رویکرد می‌تواند به بهینه‌سازی منابع محاسباتی شرکت کمک کند، اما در عین حال به این معنی است که ممکن است کاربران همیشه با قدرتمندترین نسخه از فناوری OpenAI سروکار نداشته باشند.

هنگامی که از GPT-5 خواسته شد تعداد دفعات تکرار حرف «b» در کلمه «blueberry» را مشخص کند، در یک آزمون اولیه پاسخ «۳» را ارائه داد. اما زمانی که به آن گفته شد «دقیق‌تر فکر کن»، به نظر می‌رسد که مدل استدلالی پیشرفته‌تر خود را فعال کرد و به پاسخ صحیح دست یافت.

روز جمعه، آلتمن به برخی از بازخوردها پاسخ داد و گفت که یک مشکل سیستمی وجود داشته است. او اظهار داشت: «GPT-5 از امروز باهوش‌تر به نظر خواهد رسید. دیروز، سیستم تعویض خودکار از کار افتاد و برای بخش قابل توجهی از روز از دسترس خارج بود که در نتیجه،GPT-5 بسیار احمقانه‌تر به نظر می‌رسید.»

همچنین تقریباً تمام کاربران ChatGPT دیگر دسترسی به مدل‌های قبلی GPT ندارند که این امر موجب نارضایتی برخی از کاربران شده. هرچند که پس از اعتراضات فراوان، شرکت OpenAI دسترسی دوباره به مدل GPT-4o را برای کاربران plus فعال کرده و این کاربران می‌توانند بجای مدل جدیدی که پنج‌شنبه ارائه شده، مدل قدیمی‌تر و احتمالاً بهتر را استفاده کنند.

انتشار این محصول با چالش‌های بزرگی برای OpenAI همراه است. این شرکت تلاش می‌کند تا در رقابت فزاینده هوش مصنوعی با رقبای خود در ایالات متحده و چین پیشتاز باقی بماند. همچنین، OpenAI می‌کوشد تا کسب‌وکارها و کاربران عادی را متقاعد کند برای خدمات ویژه آن هزینه پرداخت کنند، تا بتواند هزینه‌های هنگفتی را که صرف استعدادها، تراشه‌ها و مراکز داده برای توسعه هوش مصنوعی می‌شود، جبران کند.

این شرکت مستقر در سان‌فرانسیسکو، نزدیک به سه سال پیش با عرضه ChatGPT که در ابتدا با یک مدل قدیمی‌تر به نام GPT-3.5 کار می‌کرد، موج هوش مصنوعی مولد (generative AI) را آغاز کرد. از آن زمان تا کنون، این شرکت مجموعه‌ای از سیستم‌های پیچیده‌تر، از جمله گزینه‌های متعددی را منتشر کرده است که روند استدلال انسانی را شبیه‌سازی می‌کنند.

با پیشرفت سیستم‌های هوش مصنوعی، ارائه یک دیدگاه قطعی درباره عملکرد خدمات مختلف دشوارتر شده است. تا اواسط روز جمعه، GPT-5 در صدر دسته‌بندی‌های مختلف در LMArena که یک جدول امتیازات محبوب برای مدل‌های هوش مصنوعی بر اساس رتبه‌بندی کاربران است، قرار گرفته بود. اما یک معیار متفاوت دیگر، یعنی ARC-AGI-2، GPT-5 را پشت سر جدیدترین نسخه Grok از xAI ایلان ماسک قرار داده.

در نبود ارزیابی‌های قطعی‌تر، رقابت مدل‌های هوش مصنوعی گاهی به حس و حال و برداشت‌های شخصی کاربران بستگی دارد. با توجه به اینکه نزدیک به ۷۰۰ میلیون نفر هر هفته از ChatGPT استفاده می‌کنند، طبیعی است که نظرات متفاوتی در مورد عملکرد آن وجود داشته باشد. علاوه بر این، ارزیابی ارزش یک سیستم هوش مصنوعی جدید در زندگی شخصی و حرفه‌ای هر فرد، به زمان بیشتری از یک روز نیاز دارد.

«اتان مولیک»، استاد دانشکده وارتون دانشگاه پنسیلوانیا که به طور مداوم با مدل‌های هوش مصنوعی آزمایش می‌کند، از توانایی GPT-5 در انجام تحقیقات، ارائه پاسخ‌های هوشمندانه و نوشتاری، و ساده‌سازی برنامه‌نویسی، حتی برای افراد مبتدی، ابراز شگفتی کرد.

او در یک پست وبلاگی نوشت: «GPT-5 کارهایی انجام می‌دهد که اغلب خارق‌العاده، گاهی عجیب و غریب، و بعضی اوقات بسیار هوش مصنوعی گونه هستند و همین مسئله آن را تا این حد جالب می‌کند.»

با این حال، در ردیت، واکنش‌ها بسیار متفاوت بود. در جلسه پرسش و پاسخ (AMA) روز جمعه در این پلتفرم، آلتمن با انتقاداتی از سوی کاربران روبرو شد که از نداشتن حق اظهار نظر و عدم شفافیت در مورد اینکه کدام مدل به درخواست‌های آن‌ها پاسخ می‌دهد، ناراضی بودند. آلتمن گفت که OpenAI اقداماتی برای رسیدگی به این شکایات انجام خواهد داد، از جمله «شفاف‌تر» کردن موضوعات مطرح شده.

در نقطه‌ای از جلسه، آلتمن در پاسخ به سؤال یک کاربر در ردیت، اشاره کرد که OpenAI فکر می‌کند «کیفیت نوشتاری» یکی از نسخه‌های GPT-5 بهتر از GPT-4.5 است. سپس او پرسید: «آیا شما فکر می‌کنید بدتر است؟» و کاربران یکی پس از دیگری به سرعت پاسخ دادند: بله.

https://hooshio.com/?p=74107

جدیدترین تحولات هوش مصنوعی را در کانال بله هوشیو بخوانید

شکستی بزرگ برای ChatGPT

سامانه هوش مصنوعی مرکز وکلا قوه قضاییه رونمایی شد

هوش مصنوعی کدام مشاغل را نشانه رفته است؟

ابزار و فضای کاری Prism

Crypto.com دامنه AI.com را خرید

غلبه بر چالش‌های علمی

در جست‌وجوی ابرنواختر

۵ تکنیک حرفه‌ای برای استفاده حداکثری از NotebookLM

آیا یک هوش مصنوعی می‌تواند تصادفاً همه ما را به گیره کاغذ تبدیل کند؟

سامانه هوش مصنوعی مرکز وکلا قوه قضاییه رونمایی شد

آموزش رایگان هوش مصنوعی برای کودکان محلات کم‌برخوردار

دستیار هوش مصنوعی وزارت صمت به بهره‌برداری اولیه رسید

طرح ملی توسعه هوش اصلاح شد

هوش مصنوعی کدام مشاغل را نشانه رفته است؟

ابزار و فضای کاری Prism

Crypto.com دامنه AI.com را خرید

Qwen-3 در فضا

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

غلبه بر چالش‌های علمی

سامانه هوش مصنوعی مرکز وکلا قوه قضاییه رونمایی شد

هوش مصنوعی کدام مشاغل را نشانه رفته است؟

ابزار و فضای کاری Prism

در جست‌وجوی ابرنواختر

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید