در فاصله چند روز از عرضه جدیدترین مدل OpenAI، بازخورد کاربران عمدتاً منفی بوده
شکستی بزرگ برای ChatGPT
طی ماههای گذشته، «سم آلتمن»، مدیرعامل شرکت OpenAI، با سروصدای زیادی بر قابلیتهای GPT-5 تأکید کرده و عرضه آن را لحظهای سرنوشتساز برای این شرکت معرفی کرده بود. اما در ۲۴ ساعت اول پس از انتشار، این مدل جدید با واکنشهای متفاوت و انتقادهایی روبرو شد.
در اطلاعیه روز پنجشنبه خود، OpenAI اعلام کرد که GPT-5 در کدنویسی و استدلال برای حل مشکلات پیچیده عملکرد بهتری دارد و آن را به قدری پیشرفته دانست که میتواند چتبات ChatGPT را به یک متخصص در سطح دکترا تبدیل کند. همچنین برخی از افرادی که دسترسی زودهنگامی به این مدل داشتند، آن را ستوده بودند.
«سایمون ویلیسون»، توسعه دهنده، در یک پست وبلاگی نوش بود: «این مدل جدید مورد علاقه من است.» او آن را «کارآمد» و «گاهی اوقات تأثیرگذار» توصیف کرد، اما افزود: «تفاوت چشمگیری با آنچه قبلاً داشتیم، ندارد.»
با این حال، در پلتفرمهای مختلف شبکههای اجتماعی، کاربران ChatGPT از این موضوع ابراز ناراحتی کردند که GPT-5 همچنان به ساخت اطلاعات نادرست ادامه میدهد و در مسائل ساده ریاضی و سؤالات املایی دچار مشکل میشود.
«نوآ جیانسیراکوسا»، دانشیار ریاضیات در دانشگاه بنتلی، گفت که عرضه این مدل را «ناامیدکننده» میداند. او اظهار داشت، در حالی که برخی پیشرفتها وجود داشته، «آنها بسیار جزئیتر از آن چیزی بودند که من انتظار داشتم.»
دستکم بخشی از این واکنشها ممکن است ناشی از سردرگمی درباره عملکرد درونی این مدل باشد. برخلاف نرمافزارهای قبلی OpenAI، مدل GPT-5 بسته به نوع درخواست، به صورت خودکار بین مدلهایی با سطوح پیچیدگی متفاوت جابهجا میشود. این رویکرد میتواند به بهینهسازی منابع محاسباتی شرکت کمک کند، اما در عین حال به این معنی است که ممکن است کاربران همیشه با قدرتمندترین نسخه از فناوری OpenAI سروکار نداشته باشند.
هنگامی که از GPT-5 خواسته شد تعداد دفعات تکرار حرف «b» در کلمه «blueberry» را مشخص کند، در یک آزمون اولیه پاسخ «۳» را ارائه داد. اما زمانی که به آن گفته شد «دقیقتر فکر کن»، به نظر میرسد که مدل استدلالی پیشرفتهتر خود را فعال کرد و به پاسخ صحیح دست یافت.
روز جمعه، آلتمن به برخی از بازخوردها پاسخ داد و گفت که یک مشکل سیستمی وجود داشته است. او اظهار داشت: «GPT-5 از امروز باهوشتر به نظر خواهد رسید. دیروز، سیستم تعویض خودکار از کار افتاد و برای بخش قابل توجهی از روز از دسترس خارج بود که در نتیجه،GPT-5 بسیار احمقانهتر به نظر میرسید.»
همچنین تقریباً تمام کاربران ChatGPT دیگر دسترسی به مدلهای قبلی GPT ندارند که این امر موجب نارضایتی برخی از کاربران شده. هرچند که پس از اعتراضات فراوان، شرکت OpenAI دسترسی دوباره به مدل GPT-4o را برای کاربران plus فعال کرده و این کاربران میتوانند بجای مدل جدیدی که پنجشنبه ارائه شده، مدل قدیمیتر و احتمالاً بهتر را استفاده کنند.
انتشار این محصول با چالشهای بزرگی برای OpenAI همراه است. این شرکت تلاش میکند تا در رقابت فزاینده هوش مصنوعی با رقبای خود در ایالات متحده و چین پیشتاز باقی بماند. همچنین، OpenAI میکوشد تا کسبوکارها و کاربران عادی را متقاعد کند برای خدمات ویژه آن هزینه پرداخت کنند، تا بتواند هزینههای هنگفتی را که صرف استعدادها، تراشهها و مراکز داده برای توسعه هوش مصنوعی میشود، جبران کند.
این شرکت مستقر در سانفرانسیسکو، نزدیک به سه سال پیش با عرضه ChatGPT که در ابتدا با یک مدل قدیمیتر به نام GPT-3.5 کار میکرد، موج هوش مصنوعی مولد (generative AI) را آغاز کرد. از آن زمان تا کنون، این شرکت مجموعهای از سیستمهای پیچیدهتر، از جمله گزینههای متعددی را منتشر کرده است که روند استدلال انسانی را شبیهسازی میکنند.
با پیشرفت سیستمهای هوش مصنوعی، ارائه یک دیدگاه قطعی درباره عملکرد خدمات مختلف دشوارتر شده است. تا اواسط روز جمعه، GPT-5 در صدر دستهبندیهای مختلف در LMArena که یک جدول امتیازات محبوب برای مدلهای هوش مصنوعی بر اساس رتبهبندی کاربران است، قرار گرفته بود. اما یک معیار متفاوت دیگر، یعنی ARC-AGI-2، GPT-5 را پشت سر جدیدترین نسخه Grok از xAI ایلان ماسک قرار داده.
در نبود ارزیابیهای قطعیتر، رقابت مدلهای هوش مصنوعی گاهی به حس و حال و برداشتهای شخصی کاربران بستگی دارد. با توجه به اینکه نزدیک به ۷۰۰ میلیون نفر هر هفته از ChatGPT استفاده میکنند، طبیعی است که نظرات متفاوتی در مورد عملکرد آن وجود داشته باشد. علاوه بر این، ارزیابی ارزش یک سیستم هوش مصنوعی جدید در زندگی شخصی و حرفهای هر فرد، به زمان بیشتری از یک روز نیاز دارد.
«اتان مولیک»، استاد دانشکده وارتون دانشگاه پنسیلوانیا که به طور مداوم با مدلهای هوش مصنوعی آزمایش میکند، از توانایی GPT-5 در انجام تحقیقات، ارائه پاسخهای هوشمندانه و نوشتاری، و سادهسازی برنامهنویسی، حتی برای افراد مبتدی، ابراز شگفتی کرد.
او در یک پست وبلاگی نوشت: «GPT-5 کارهایی انجام میدهد که اغلب خارقالعاده، گاهی عجیب و غریب، و بعضی اوقات بسیار هوش مصنوعی گونه هستند و همین مسئله آن را تا این حد جالب میکند.»
با این حال، در ردیت، واکنشها بسیار متفاوت بود. در جلسه پرسش و پاسخ (AMA) روز جمعه در این پلتفرم، آلتمن با انتقاداتی از سوی کاربران روبرو شد که از نداشتن حق اظهار نظر و عدم شفافیت در مورد اینکه کدام مدل به درخواستهای آنها پاسخ میدهد، ناراضی بودند. آلتمن گفت که OpenAI اقداماتی برای رسیدگی به این شکایات انجام خواهد داد، از جمله «شفافتر» کردن موضوعات مطرح شده.
در نقطهای از جلسه، آلتمن در پاسخ به سؤال یک کاربر در ردیت، اشاره کرد که OpenAI فکر میکند «کیفیت نوشتاری» یکی از نسخههای GPT-5 بهتر از GPT-4.5 است. سپس او پرسید: «آیا شما فکر میکنید بدتر است؟» و کاربران یکی پس از دیگری به سرعت پاسخ دادند: بله.