گزارش شاخص هوش مصنوعی ۲۰۲۵، منتشرشده توسط مؤسسه هوش مصنوعی انسانمحور دانشگاه استنفورد، یکی از جامعترین و معتبرترین منابع برای درک وضعیت کنونی و روندهای آینده هوش مصنوعی (AI) در جهان است. این گزارش که هشتمین نسخه از مجموعه گزارشهای سالانه شاخص هوش مصنوعی دانشگاه استنفورد است، با گردآوری و تحلیل دادههای دقیق و بیطرفانه، تصویری روشن از پیشرفتها، چالشها و تأثیرات هوش مصنوعی در حوزههای مختلف ارائه میدهد.
از پیشرفتهای فنی و سرمایهگذاریهای کلان گرفته تا مسائل اخلاقی، آموزشی و سیاستگذاری، این گزارش بهعنوان منبعی کلیدی برای سیاستگذاران، پژوهشگران، مدیران، روزنامهنگاران و عموم مردم شناخته میشود. هدف اصلی این گزارش، ارائه دادههای معتبر و جامع برای کمک به تصمیمگیریهای آگاهانه در مورد توسعه مسئولانه و اخلاقی هوش مصنوعی است که با ارزشهای انسانمحور همراستا باشد.
یکی از بخشهای کلیدی گزارش ۲۰۲۵، بررسی پیشرفتهای چشمگیر در عملکرد فنی هوش مصنوعی است. در سال ۲۰۲۴، سامانههای هوش مصنوعی در معیارهای چالشبرانگیز مانند MMMU، GPQA و SWE-bench عملکرد قابلتوجهی از خود نشان دادهاند.
MMMU (Massive Multi-discipline Multi-choice Understanding): معیاری برای سنجش توان مدل در پاسخ به سؤالات چندگزینهای از رشتههای مختلف دانشگاهی.
GPQA (Graduate-level Physics Question Answering): معیاری برای ارزیابی توان مدل در حل سؤالات دشوار فیزیک در سطح تحصیلات تکمیلی.
SWE-bench (Software Engineering Benchmark): معیاری برای سنجش توان مدل در رفع باگها و انجام اصلاحات در پروژههای واقعی کدنویسی نرمافزاری.
بهعنوانمثال، در معیار SWE-bench که برای ارزیابی توانایی حل مسائل کدنویسی طراحی شده، عملکرد سامانههای هوش مصنوعی از ۴/۴٪ در سال ۲۰۲۳ به ۷۱.۷ درصد در سال ۲۰۲۴ افزایش یافته است. این جهش نشاندهنده بهبود سریع قابلیتهای هوش مصنوعی در انجام وظایف پیچیده است. همچنین، شکاف عملکرد بین مدلهای متنباز (open-weight) و مدلهای بسته (closed-weight) به طور قابلتوجهی کاهش یافته و از ۸.۰۴ درصد در ژانویه ۲۰۲۴ به تنها ۱.۷ درصد تا فوریه ۲۰۲۵ رسیده است. این موضوع نشاندهنده رقابت فزاینده در توسعه مدلهای پیشرفته هوش مصنوعی است.
علاوه بر این، گزارش به پیشرفتهای نوآورانه در حوزههایی مانند تولید ویدئو با هوش مصنوعی و عملکرد عاملهای هوشمند (AI agents) اشاره دارد. به طور خاص، در تنظیمات با محدودیت زمانی کوتاه، سامانههای مبتنی بر هوش مصنوعی تا چهار برابر بهتر از کارشناسان انسانی عمل کردهاند، اگرچه در بازههای زمانی طولانیتر، انسانها همچنان برتری دارند. این یافتهها نشان میدهد که هوش مصنوعی در حال نزدیکشدن به سطح عملکرد انسانی در برخی وظایف خاص است، اما هنوز برای تعمیمدهی کامل به چالشهای پیچیدهتر نیاز به پیشرفت دارد.
گزارش ۲۰۲۵ نشان میدهد که سرمایهگذاری در هوش مصنوعی به سطح بیسابقهای رسیده است. در سال ۲۰۲۴، سرمایهگذاری خصوصی جهانی در هوش مصنوعی به ۱۵۰.۸ میلیارد دلار رسیده که نشاندهنده رشد ۴۴.۵ درصدی نسبت به سال قبل است. سرمایهگذاری در هوش مصنوعی مولد نیز با افزایش ۱۸.۷ درصدی به ۳۳.۹ میلیارد دلار رسیده و بیش از ۲۰ درصد از کل سرمایهگذاری خصوصی در هوش مصنوعی را تشکیل میدهد.
صنعت در توسعه مدلهای برجسته هوش مصنوعی پیشتاز است و در سال ۲۰۲۴، حدود ۹۰ درصد از مدلهای قابلتوجه و مهم از سوی شرکتهای صنعتی منتشر شدهاند، درحالیکه این رقم در سال ۲۰۲۳ تنها ۶۰ درصد بود. در مقابل، دانشگاهها همچنان منبع اصلی تحقیقات با استناد بالا باقیماندهاند که نشاندهنده تقسیم کار بین صنعت و دانشگاه در پیشرفت هوش مصنوعی است. بااینحال، گزارش هشدار میدهد که شکاف عملکرد بین مدلهای برتر در حال کاهش است؛ بهطوریکه اختلاف امتیاز بین مدلهای برتر و دهمین مدل از ۱۱.۹ درصد در سال ۲۰۲۳ به ۵.۴ درصد در سال ۲۰۲۴ کاهش یافته است.
یکی از بخشهای جدید و برجسته گزارش ۲۰۲۵، فصل اختصاصی در مورد نقش هوش مصنوعی در علم و پزشکی است. این بخش به پیشرفتهای چشمگیر در کشفهای علمی و پزشکی با کمک هوش مصنوعی اشاره دارد. بهعنوانمثال، مدلهایی مانند AlphaFold 3 و ESM3 در پیشبینی ساختارهای پروتئینی دقت بسیار بالایی نشان دادهاند و دو جایزه نوبل در سال ۲۰۲۴ به پژوهشهای مرتبط با هوش مصنوعی در شیمی اعطا شده است. در حوزه پزشکی، تعداد دستگاههای پزشکی مبتنی بر هوش مصنوعی تأییدشده توسط سازمان غذا و داروی ایالات متحده آمریکا (Food and Drug Administration – FDA) از ۶ دستگاه در سال ۲۰۱۵ به ۲۲۳ دستگاه در سال ۲۰۲۳ افزایش یافته است. این گزارش همچنین به افزایش چهار برابری انتشارات مرتبط با اخلاق در هوش مصنوعی پزشکی از سال ۲۰۲۰ تا ۲۰۲۴ اشاره میکند که نشاندهنده توجه روبهرشد به مسائل اخلاقی در این حوزه است.
باوجود پیشرفتها، گزارش به افزایش حوادث مرتبط با هوش مصنوعی، مانند تصاویر جعلی عمیق (deepfake) و سوءاستفاده از چتباتها، اشاره دارد. پایگاهداده حوادث هوش مصنوعی نشان میدهد که تعداد این موارد استفاده سوء از هوش مصنوعی در سال ۲۰۲۴ به ۲۳۳ مورد رسیده که ۵۶.۴ درصد بیشتر از سال ۲۰۲۳ است. این گزارش همچنین به کمبود ارزیابیهای استاندارد برای هوش مصنوعی مسئول (Responsible AI) در میان توسعهدهندگان بزرگ اشاره میکند، اگرچه معیارهای جدیدی مانند AIR-Bench و HELM Safety نویدبخش ابزارهایی برای ارزیابی ایمنی و دقت هستند.
اما مطابق با گزارش نظرسنجیهای جهانی نشان میدهند که خوشبینی نسبت به هوش مصنوعی در حال افزایش است. در سال ۲۰۲۴، ۵۵ درصد از مردم در ۲۶ کشور معتقدند که محصولات و خدمات مبتنی بر هوش مصنوعی مزایای بیشتری نسبت به معایب دارند که این رقم از ۵۲ درصد در سال ۲۰۲۲ افزایش یافته است. بااینحال، اعتماد به حفاظت از دادههای شخصی توسط شرکتهای هوش مصنوعی از ۵۰ درصد در سال ۲۰۲۳ به ۴۷ درصد در سال ۲۰۲۴ کاهش یافته است.
گزارش شاخص هوش مصنوعی ۲۰۲۵ استنفورد تصویری جامع و دادهمحور از وضعیت کنونی هوش مصنوعی ارائه میدهد که نهتنها پیشرفتهای فنی و اقتصادی، بلکه چالشهای اخلاقی، آموزشی و نظارتی را نیز پوشش میدهد. این گزارش بر اهمیت توسعه مسئولانه هوش مصنوعی با تمرکز بر ارزشهای انسانمحور تأکید دارد و بهعنوان منبعی بیطرف و معتبر، راهنمایی برای درک بهتر این فناوری تحولآفرین ارائه میکند. باتوجهبه رقابت فزاینده جهانی، افزایش سرمایهگذاریها و گسترش کاربردهای هوش مصنوعی، این گزارش ابزار ارزشمندی برای شکلدهی به آیندهای است که در آن هوش مصنوعی به نفع بشریت عمل کند.