چالش‌های عملکردی آپدیت جدید GPT-5

پیشرفت‌های اندک GPT-5 ممکن است نشانه کاهش سرعت توسعه هوش مصنوعی باشد

سید محمدجواد فیاض
۶ شهریور ۱۴۰۴

زمان مطالعه: 4 دقیقه

جدیدترین مدل زبانی شرکت OpenAI تنها بهبودهایی محدود در عملکرد نشان داده و این موضوع باعث شده این پرسش مطرح شود که آیا صنعت هوش مصنوعی با طراحی‌های فعلی قادر به دستیابی به پیشرفت‌های چشمگیر خواهد بود یا نه.

گام تازه‌ای که هوش مصنوعی برداشته، بیش از آنکه «جهشی بزرگ» باشد، بیشتر شبیه یک حرکت محتاطانه به نظر می‌رسد. شرکت OpenAI پس از گذشت دو سال از عرضه GPT-4، حالا نسخه جدید خود یعنی GPT-5 را منتشر کرده است؛ مدلی که نسخه پیشین آن نقشی کلیدی در فراگیرشدن ChatGPT در سراسر جهان داشت. اما برخلاف وعده‌ها برای جهشی مشابه در توانایی‌ها، GPT-5 تنها پیشرفت‌های اندکی نسبت به دیگر مدل‌های پیشرفته فعلی نشان داده است؛ موضوعی که می‌تواند نشانه‌ای از نیاز صنعت به رویکردهای تازه برای ساخت سامانه‌های هوش مصنوعی واقعاً هوشمند باشد.

فهرست مقاله پنهان

جهش محتاطانه

OpenAI در معرفی رسمی خود، GPT-5 را «جهشی بزرگ در هوش» (significant leap in intelligence) نسبت به مدل‌های قبلی خواند و از بهبودهای آشکاری در برنامه‌نویسی، ریاضیات، نوشتار، اطلاعات حوزه سلامت و درک بصری سخن گفته است. همچنین این شرکت وعده داده که GPT-5 کمتر دچار «توهم» شود؛ یعنی مواقعی که یک مدل اطلاعات نادرست را به‌عنوان حقیقت ارائه می‌دهد. بر اساس شاخص‌های داخلی OpenAI، این مدل در «انجام کارهای پیچیده و ارزشمند از نظر اقتصادی» در حدود نیمی از موارد عملکردی قابل‌مقایسه یا حتی بهتر از متخصصان انسانی در بیش از ۴۰ حوزه شغلی از جمله حقوق، لجستیک، فروش و مهندسی داشته است.

بااین‌حال، عملکرد GPT-5 در آزمون‌های عمومی تفاوت چشمگیری با مدل‌های پیشرفته دیگر مانند Claude محصول یا Gemini ندارد. این مدل نسبت به GPT-4 بهتر عمل می‌کند، اما فاصله آن با نسخه‌های قبلی کمتر از جهشی است که بین GPT-3 و GPT-4 شاهد بودیم. بسیاری از کاربران ChatGPT نیز چندان راضی نبوده‌اند و مواردی از ناتوانی GPT-5 در پاسخ به پرسش‌های ساده در شبکه‌های اجتماعی به طور گسترده بازنشر شده است.

صرفاً ارتقا

«میرلا لاپاتا» (Mirella Lapata) استاد علوم کامپیوتر دانشگاه ادینبرو نیز راجع‌به این به‌روزرسانی می‌گوید: «بسیاری امیدوار بودند که شاهد یک نقطه عطف باشیم، اما چنین نشد و این نسخه جدید بیشتر شبیه یک ارتقاء است؛ آن هم ارتقایی تدریجی.» جامع‌ترین معیارها برای ارزیابی GPT-5 از سوی خود OpenAI منتشر شده، چراکه تنها این شرکت به‌طور کامل به مدل دسترسی دارد. با این حال، جزئیات چندانی از این شاخص داخلی علنی نشده است. «آنا راجرز» (Anna Rogers) استادیار دانشگاه فناوری اطلاعات کپنهاگ نیز می‌گوید: «بنابراین، نمی‌توان این به‌روزرسانی را به‌طور جدی یک ادعای علمی دانست.»

پیش از رونمایی مدل، سم آلتمن مدیرعامل OpenAI در یک نشست خبری مدعی شد GPT-5 نخستین مدلی است که واقعاً احساس می‌کنید در هر موضوعی با یک کارشناس در سطح دکترا، گفتگو می‌کنید. اما به گفته راجرز، این ادعا در معیارهای عملکردی تأیید نشده است و اساساً مشخص نیست «مدرک دکتری» چه نسبتی با هوش دارد و توضیح می‌دهد: «افراد بسیار باهوش الزاماً دکتری ندارند و داشتن مدرک دکتری هم لزوماً به معنای برخورداری از هوش بالا نیست.»

شاید چالش

به نظر می‌رسد پیشرفت‌های نسبتاً محدود GPT-5 ممکن است نشان‌دهنده مشکلاتی بزرگ‌تر برای توسعه‌دهندگان هوش مصنوعی باشد. تا همین اواخر تصور می‌شد که مدل‌های زبانی بزرگ هرچه با داده‌های بیشتر و قدرت پردازشی بالاتر آموزش ببینند، توانمندتر خواهند شد. اما نتایج مدل‌های اخیر نشان می‌دهد این فرض دیگر صدق نمی‌کند و شرکت‌ها هنوز نتوانسته‌اند طراحی بهتری از سیستم‌های هوش مصنوعی نسبت به آنچه ChatGPT را قدرت می‌دهد، ارائه دهند. میرلا لاپاتا نیز عنوان می‌کند: «در حال حاضر همه شرکت‌ها از یک دستورالعمل مشابه استفاده می‌کنند و می‌دانیم آن دستورالعمل چیست»؛ منظور وی فرایند پیش‌آموزش مدل‌ها با حجم عظیمی از داده و سپس انجام تنظیمات پس از آموزش است.

بااین‌حال، مشخص نیست LLMها تا چه حد به مرحله رکود نزدیک شده‌اند چرا که طراحی دقیق مدل‌هایی مانند GPT-5 هنوز به طور کامل افشا نشده است. «نیکوس آلتراس» (Nikos Aletras) استاد دانشگاه شفیلد دراین‌رابطه می‌گوید: «سعی برای تعمیم‌دادن این‌که آیا مدل‌های زبانی بزرگ به بالاترین حد تکامل خود رسیده‌اند، ممکن است زود باشد و بدون اطلاعات فنی نمی‌توان چنین ادعاهایی کرد.»

OpenAI در تلاش است روش‌های دیگری از جمله سیستم مسیریابی یا Routing جدید را برای افزایش بهره‌وری محصولات خود به کار گیرد. برخلاف نسخه‌های قبلی ChatGPT که کاربران می‌توانستند مدل موردنظر خود را انتخاب کنند، GPT-5 اکنون درخواست‌ها را بررسی کرده و آن‌ها را به مدلی هدایت می‌کند که از نظر محاسباتی مناسب‌ترین گزینه است. لاپاتا عنوان می‌کند این رویکرد احتمالاً در آینده گسترده‌تر خواهد شد: «مدل‌های استدلالی نیاز به بار محاسباتی زیادی دارند که این زمان و هزینه زیادی می‌طلبد. اگر بتوان یک پرامپت را با یک مدل کوچک‌تر پاسخ داد، در آینده شاهد استفاده بیشتری از این روش خواهیم بود.» اما این تغییر به مذاق برخی از کاربران ChatGPT خوش نیامده و آلتمن اعلام کرد که OpenAI در حال بررسی بهبود فرایند روتینگ است.

در آینده

نشانه‌های مثبت دیگری نیز برای آینده هوش مصنوعی وجود دارد؛ مدل دیگری از OpenAI در ماه گذشته موفق به کسب نمرات هم‌رده با مدال طلا در مسابقات ریاضی و برنامه‌نویسی Elite شده است، کاری که حتی بهترین مدل‌های هوش مصنوعی در سال گذشته قادر به انجام آن نبودند. هرچند جزئیات نحوه عملکرد این مدل‌ها همچنان اندک است اما به‌گفته کارکنان OpenAI موفقیت آن نشان‌دهنده توانایی‌های استدلال عمومی گسترده‌تر است. این مسابقات برای ارزیابی مدل‌ها با داده‌های غیرآموزشی مفید است، اما هنوز آزمون‌های محدود هوشی محسوب می‌شوند. به عقیده لاپاتا بهبود عملکرد مدل در یک حوزه ممکن است باعث کاهش آن در حوزه‌های دیگر شود که تشخیص و ردیابی آن را دشوار است.

یکی از حوزه‌هایی که GPT-5 پیشرفت قابل‌توجهی داشته، قیمت آن است؛ اکنون استفاده از این مدل بسیار ارزان‌تر از سایر مدل‌هاست. برای مثال، بهترین مدل Claude از Anthropic تقریباً ۱۰ برابر هزینه بیشتری برای پردازش همان تعداد پرامپت را نیاز دارد؛ اما این قیمت پایین اگر درآمد OpenAI هزینه‌های هنگفت ساخت و راه‌اندازی مراکز داده جدید را پوشش ندهد می‌تواند در بلندمدت مشکلاتی ایجاد کند.

رقابت بین برترین مدل‌های هوش مصنوعی بسیار داغ است؛ به‌ویژه با این دیدگاه که مدل بهتر سهم عمده بازار را تصاحب خواهد کرد. به عقیده لاپاتا همه شرکت‌های بزرگ تلاش می‌کنند خودشان تنها برنده این رقابت باشند؛ اما چنین کاری دشوار است و شاید تنها فقط سه ماه برنده باقی بمانند.

https://hooshio.com/?p=74740

جدیدترین تحولات هوش مصنوعی را در کانال بله هوشیو بخوانید

پیشرفت‌های اندک GPT-5 ممکن است نشانه کاهش سرعت توسعه هوش مصنوعی باشد

جهش محتاطانه

صرفاً ارتقا

شاید چالش

در آینده

GPT-5.3 Codex؛ مدلی که به ساخت خودش کمک کرد

رونمایی از «طوسا»؛ دستیار هوش مصنوعی وزارت نیرو آماده بهره‌برداری شد

نقشه‌برداری دقیق از شمال تهران با استفاده از هوش مصنوعی و ماهواره «خیام»

وقتی NotebookLM مغز متفکر Gemini می‌شود

پلیس و هوش مصنوعی؛ انقلابی که دیر اما ناگزیر

عصر مدل‌های چندگانه در هوش مصنوعی سازمانی

هوش مصنوعی بازیگر اصلی «جشنواره فیلم فجر»

جعل احساسات

رونمایی از «طوسا»؛ دستیار هوش مصنوعی وزارت نیرو آماده بهره‌برداری شد

نقشه‌برداری دقیق از شمال تهران با استفاده از هوش مصنوعی و ماهواره «خیام»

قطع اینترنت، پژوهشگران هوش مصنوعی را زمین‌گیر کرد

هوش مصنوعی بازیگر اصلی «جشنواره فیلم فجر»

GPT-5.3 Codex؛ مدلی که به ساخت خودش کمک کرد

وقتی NotebookLM مغز متفکر Gemini می‌شود

تحقیقات رسمی کمیسیون اروپا علیه «TikTok» کلید خورد

شکست «ChatGPT» و پیروزی «Gemini» در پوشش زنده رویداد حمله به ونزوئلا

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

پلیس و هوش مصنوعی؛ انقلابی که دیر اما ناگزیر

GPT-5.3 Codex؛ مدلی که به ساخت خودش کمک کرد

رونمایی از «طوسا»؛ دستیار هوش مصنوعی وزارت نیرو آماده بهره‌برداری شد

نقشه‌برداری دقیق از شمال تهران با استفاده از هوش مصنوعی و ماهواره «خیام»

عصر مدل‌های چندگانه در هوش مصنوعی سازمانی

جهش محتاطانه

صرفاً ارتقا

شاید چالش

در آینده

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید