
چالشهای عملکردی آپدیت جدید GPT-5
پیشرفتهای اندک GPT-5 ممکن است نشانه کاهش سرعت توسعه هوش مصنوعی باشد
جدیدترین مدل زبانی شرکت OpenAI تنها بهبودهایی محدود در عملکرد نشان داده و این موضوع باعث شده این پرسش مطرح شود که آیا صنعت هوش مصنوعی با طراحیهای فعلی قادر به دستیابی به پیشرفتهای چشمگیر خواهد بود یا نه.
گام تازهای که هوش مصنوعی برداشته، بیش از آنکه «جهشی بزرگ» باشد، بیشتر شبیه یک حرکت محتاطانه به نظر میرسد. شرکت OpenAI پس از گذشت دو سال از عرضه GPT-4، حالا نسخه جدید خود یعنی GPT-5 را منتشر کرده است؛ مدلی که نسخه پیشین آن نقشی کلیدی در فراگیرشدن ChatGPT در سراسر جهان داشت. اما برخلاف وعدهها برای جهشی مشابه در تواناییها، GPT-5 تنها پیشرفتهای اندکی نسبت به دیگر مدلهای پیشرفته فعلی نشان داده است؛ موضوعی که میتواند نشانهای از نیاز صنعت به رویکردهای تازه برای ساخت سامانههای هوش مصنوعی واقعاً هوشمند باشد.
جهش محتاطانه
OpenAI در معرفی رسمی خود، GPT-5 را «جهشی بزرگ در هوش» (significant leap in intelligence) نسبت به مدلهای قبلی خواند و از بهبودهای آشکاری در برنامهنویسی، ریاضیات، نوشتار، اطلاعات حوزه سلامت و درک بصری سخن گفته است. همچنین این شرکت وعده داده که GPT-5 کمتر دچار «توهم» شود؛ یعنی مواقعی که یک مدل اطلاعات نادرست را بهعنوان حقیقت ارائه میدهد. بر اساس شاخصهای داخلی OpenAI، این مدل در «انجام کارهای پیچیده و ارزشمند از نظر اقتصادی» در حدود نیمی از موارد عملکردی قابلمقایسه یا حتی بهتر از متخصصان انسانی در بیش از ۴۰ حوزه شغلی از جمله حقوق، لجستیک، فروش و مهندسی داشته است.

بااینحال، عملکرد GPT-5 در آزمونهای عمومی تفاوت چشمگیری با مدلهای پیشرفته دیگر مانند Claude محصول یا Gemini ندارد. این مدل نسبت به GPT-4 بهتر عمل میکند، اما فاصله آن با نسخههای قبلی کمتر از جهشی است که بین GPT-3 و GPT-4 شاهد بودیم. بسیاری از کاربران ChatGPT نیز چندان راضی نبودهاند و مواردی از ناتوانی GPT-5 در پاسخ به پرسشهای ساده در شبکههای اجتماعی به طور گسترده بازنشر شده است.
صرفاً ارتقا
«میرلا لاپاتا» (Mirella Lapata) استاد علوم کامپیوتر دانشگاه ادینبرو نیز راجعبه این بهروزرسانی میگوید: «بسیاری امیدوار بودند که شاهد یک نقطه عطف باشیم، اما چنین نشد و این نسخه جدید بیشتر شبیه یک ارتقاء است؛ آن هم ارتقایی تدریجی.» جامعترین معیارها برای ارزیابی GPT-5 از سوی خود OpenAI منتشر شده، چراکه تنها این شرکت بهطور کامل به مدل دسترسی دارد. با این حال، جزئیات چندانی از این شاخص داخلی علنی نشده است. «آنا راجرز» (Anna Rogers) استادیار دانشگاه فناوری اطلاعات کپنهاگ نیز میگوید: «بنابراین، نمیتوان این بهروزرسانی را بهطور جدی یک ادعای علمی دانست.»
پیش از رونمایی مدل، سم آلتمن مدیرعامل OpenAI در یک نشست خبری مدعی شد GPT-5 نخستین مدلی است که واقعاً احساس میکنید در هر موضوعی با یک کارشناس در سطح دکترا، گفتگو میکنید. اما به گفته راجرز، این ادعا در معیارهای عملکردی تأیید نشده است و اساساً مشخص نیست «مدرک دکتری» چه نسبتی با هوش دارد و توضیح میدهد: «افراد بسیار باهوش الزاماً دکتری ندارند و داشتن مدرک دکتری هم لزوماً به معنای برخورداری از هوش بالا نیست.»

شاید چالش
به نظر میرسد پیشرفتهای نسبتاً محدود GPT-5 ممکن است نشاندهنده مشکلاتی بزرگتر برای توسعهدهندگان هوش مصنوعی باشد. تا همین اواخر تصور میشد که مدلهای زبانی بزرگ هرچه با دادههای بیشتر و قدرت پردازشی بالاتر آموزش ببینند، توانمندتر خواهند شد. اما نتایج مدلهای اخیر نشان میدهد این فرض دیگر صدق نمیکند و شرکتها هنوز نتوانستهاند طراحی بهتری از سیستمهای هوش مصنوعی نسبت به آنچه ChatGPT را قدرت میدهد، ارائه دهند. میرلا لاپاتا نیز عنوان میکند: «در حال حاضر همه شرکتها از یک دستورالعمل مشابه استفاده میکنند و میدانیم آن دستورالعمل چیست»؛ منظور وی فرایند پیشآموزش مدلها با حجم عظیمی از داده و سپس انجام تنظیمات پس از آموزش است.
بااینحال، مشخص نیست LLMها تا چه حد به مرحله رکود نزدیک شدهاند چرا که طراحی دقیق مدلهایی مانند GPT-5 هنوز به طور کامل افشا نشده است. «نیکوس آلتراس» (Nikos Aletras) استاد دانشگاه شفیلد دراینرابطه میگوید: «سعی برای تعمیمدادن اینکه آیا مدلهای زبانی بزرگ به بالاترین حد تکامل خود رسیدهاند، ممکن است زود باشد و بدون اطلاعات فنی نمیتوان چنین ادعاهایی کرد.»

OpenAI در تلاش است روشهای دیگری از جمله سیستم مسیریابی یا Routing جدید را برای افزایش بهرهوری محصولات خود به کار گیرد. برخلاف نسخههای قبلی ChatGPT که کاربران میتوانستند مدل موردنظر خود را انتخاب کنند، GPT-5 اکنون درخواستها را بررسی کرده و آنها را به مدلی هدایت میکند که از نظر محاسباتی مناسبترین گزینه است. لاپاتا عنوان میکند این رویکرد احتمالاً در آینده گستردهتر خواهد شد: «مدلهای استدلالی نیاز به بار محاسباتی زیادی دارند که این زمان و هزینه زیادی میطلبد. اگر بتوان یک پرامپت را با یک مدل کوچکتر پاسخ داد، در آینده شاهد استفاده بیشتری از این روش خواهیم بود.» اما این تغییر به مذاق برخی از کاربران ChatGPT خوش نیامده و آلتمن اعلام کرد که OpenAI در حال بررسی بهبود فرایند روتینگ است.
در آینده
نشانههای مثبت دیگری نیز برای آینده هوش مصنوعی وجود دارد؛ مدل دیگری از OpenAI در ماه گذشته موفق به کسب نمرات همرده با مدال طلا در مسابقات ریاضی و برنامهنویسی Elite شده است، کاری که حتی بهترین مدلهای هوش مصنوعی در سال گذشته قادر به انجام آن نبودند. هرچند جزئیات نحوه عملکرد این مدلها همچنان اندک است اما بهگفته کارکنان OpenAI موفقیت آن نشاندهنده تواناییهای استدلال عمومی گستردهتر است. این مسابقات برای ارزیابی مدلها با دادههای غیرآموزشی مفید است، اما هنوز آزمونهای محدود هوشی محسوب میشوند. به عقیده لاپاتا بهبود عملکرد مدل در یک حوزه ممکن است باعث کاهش آن در حوزههای دیگر شود که تشخیص و ردیابی آن را دشوار است.
یکی از حوزههایی که GPT-5 پیشرفت قابلتوجهی داشته، قیمت آن است؛ اکنون استفاده از این مدل بسیار ارزانتر از سایر مدلهاست. برای مثال، بهترین مدل Claude از Anthropic تقریباً ۱۰ برابر هزینه بیشتری برای پردازش همان تعداد پرامپت را نیاز دارد؛ اما این قیمت پایین اگر درآمد OpenAI هزینههای هنگفت ساخت و راهاندازی مراکز داده جدید را پوشش ندهد میتواند در بلندمدت مشکلاتی ایجاد کند.
رقابت بین برترین مدلهای هوش مصنوعی بسیار داغ است؛ بهویژه با این دیدگاه که مدل بهتر سهم عمده بازار را تصاحب خواهد کرد. به عقیده لاپاتا همه شرکتهای بزرگ تلاش میکنند خودشان تنها برنده این رقابت باشند؛ اما چنین کاری دشوار است و شاید تنها فقط سه ماه برنده باقی بمانند.