تقسیمبندی «عجیبها و باهوشها» در دنیای هوش مصنوعی
در حالی که بسیاری از فعالان حوزهی هوش مصنوعی (AI) بر این باورند که در چند سال آینده، شاهد یک جهش بزرگ و همهجانبه در مسیر دستیابی به هوش عمومی مصنوعی (AGI) خواهیم بود، پیشرفتهای عملی در این زمینه بهوضوح به دو مسیر متفاوت تقسیم شدهاند؛ یکی تمرکز بر بهینهسازی هوش مصنوعی برای نوشتن کد و انجام محاسبات ریاضی و دیگری ارتقای تواناییهای «نرم» آن در زمینه زبان و خلاقیت.
از یک سو، موج جدید مدلهای «استدلالی» (reasoning models) در برنامهنویسی کامپیوتر و تحلیلهای عددی عملکردی درخشان دارند. اینها همان نابغههای فنی و خورههای تکنولوژی هوش مصنوعی هستند.
از سوی دیگر، چند پروژه جدید نشان میدهند که هوش مصنوعی در تقلید از ظرافتهای ارتباط انسانی نیز بسیار پیشرفت کرده است. اینها در واقع معادل دانشجویان ادبیات انگلیسی و هنرجویان تئاتر در دنیای AI هستند.
حداقل در حال حاضر، مسیر توسعهی هوش مصنوعی در حال بازتولید همان شکاف قدیمی میان علوم انسانی و رشتههای فنی (STEM) است؛ شکافی که سالهاست در بین دانشجویان دانشگاهی یا اگر بخواهیم با اصطلاحات دوران دبیرستان بگوییم، بین «عجیبها» (freaks) و «باهوشها» (geeks) وجود دارد.
جزئیات بیشتر: سه خبر جدید در این هفته روند این شکاف را بهخوبی نشان میدهند.
شگفتی Qwen از علیبابا
شرکت چینی علیبابا (Alibaba) مدل جدیدی به نام Qwen QwQ-32B معرفی کرد که عملکردی مشابه مدل R1 از شرکت DeepSeek دارد، اما تنها بخش کوچکی از قدرت محاسباتی لازم برای اجرا را مصرف میکند.
مشابه DeepSeek، مدل جدید Qwen نیز متنباز (open source) است و هر دو پروژهی چینی جزو مدلهای استدلالی هستند که در کارهای فنی بسیار خوب عمل میکنند. انتشار مدل Qwen نشانهای دیگر از این است که هنوز امکان پیشرفت زیادی برای بهینهسازی این نوع هوش مصنوعی وجود دارد.
مدلهای استدلالی با سرعتی بیسابقه در حال گذار از مرحله «پیشرفت خیرهکننده و نوآورانه» به «کالایی ارزان و در دسترس همگان» هستند.
تعیینکننده سلیقه از OpenAI
پس از یک هفته کار عملی با بزرگترین و جدیدترین مدل OpenAI یعنی GPT-4.5، متخصصان هوش مصنوعی همچنان کمی نسبت به آن سردرگم هستند، زیرا با وجود هزینه بسیار بالا برای استفاده، رکوردی در معیارهای رسمی (benchmark) ثبت نکرده است.
البته یک نظر مشترک در میان طرفداران GPT-4.5 شکل گرفته است و آن هم این است که مدل GPT-4.5 «سلیقه» دارد.
وبلاگنویس Zvi Mowshowitz در جمعبندیاش از ارزیابیها نوشته است: «تا اینجا به نظر میرسد که GPT-4.5 در زمینههایی مثل هوش کلامی، سازگاری با متن، دانش جزئینگر و نوعی توانایی نوشتاری انتزاعی مزایایی دارد. همچنین این مدل سلیقه و زیباییشناسی بهتری دارد،»
Tyler Cowen اقتصاددان و وبلاگنویس معروف هم نوشته است: «من این مدل را تلاشی برای بهبود در بعد زیباییشناختی (aesthetics) میدانم.» و به قول Sam Altman در هنگام معرفی مدل: «در آن نوعی جادو هست که پیشتر هرگز احساس نکرده بودم.»
این تعریفها یک پارادوکس اجتنابناپذیر را به تصویر میکشند. تواناییهای دقیق و ظریف در زبان، دقیقاً همان مهارتهایی هستند که انسانها همیشه آن را مختص خودشان میدانستند، اما هیچ راه عینی برای سنجش آن وجود ندارد و کاملاً ذهنی است. در واقع چیزی که برای یک نفر ممکن است جهشی خلاقانه به نظر برسد، برای دیگری شاید نشانهای از شکست باشد.
صدای جادویی Sesame
یکی از موضوعاتی که اخیراً در محافل هوش مصنوعی سروصدای زیادی به پا کرده است، مدل گفتار محاورهای شرکت Sesame به نام Conversational Speech Model است که هفته گذشته منتشر شد.
بسیاری از افرادی که نسخه آزمایشی زندهی این مدل را تست کردهاند میگویند که هوش مصنوعی Sesame به سطحی جدید از راحتی و اعتماد بهنفس در تقلید از جریان طبیعی مکالمات انسانی و حتی نقصهای ظریف موجود در گفتار واقعی رسیده است.
این هم یکی دیگر از آن پیشرفتهایی است که سنجش یا ارزیابی دقیق آن بسیار سخت است، اما میتواند تأثیر عمیقی بر نحوه ادغام هوش مصنوعی در جامعه داشته باشد. از طرف دیگر، خیلی راحت میتوان تصور کرد که چنین پیشرفتی میتواند موجی از سردرگمی، کلاهبرداری و فریب بههمراه بیاورد.
ایده اینکه هوش دیجیتال در مسیرهای مختلفی پیشرفت کند که بازتابی از همان شکاف علوم/علوم انسانی باشد، پیشینهای طولانی دارد.
فقط کافی است به تصویرسازی اولیه فیلم Star Wars نگاه کنیم که روباتهای پیشرفته را به دو دسته R2-D2، متخصص فنی و تکنسین و C3PO، دیپلمات و مترجم تقسیم کرده بود.
درسته، اما؛ اصطلاحهای «عجیبها» (freaks) و «باهوشها» (geeks) در اصل برای توصیف گروههای مدرسهای و انواع استعدادها بهکار میروند، اما بیشتر افراد موفق در هر دو حوزه تا حدی مهارت دارند و هر هوش مصنوعی خاصی که بخواهد به سطح انسانی برسد، باید در هر دو زمینه توانایی داشته باشد.
چه چیزی در جریان است: اگر خوشبینهای AGI (هوش عمومی مصنوعی) بخواهند وعدههای خود را دربارهی «هوش در سطح انسانی طی دو سال آینده» محقق کنند، توسعهدهندگان مدلها باید راهی برای ترکیب دوبارهی این دو مسیر تکاملی پیدا کنند.
مهندسان و کارآفرینان میگویند: «آسان است! این هم مثل بقیه مشکلات با قدرت ذهن و تلاش کافی حل میشود.»، اما متخصصان علوم انسانی و تاریخنگارها هشدار میدهند: «شکاف میان دو فرهنگ» که C.P. Snow سالها پیش مطرح کرده بود، دههها است که در کنار ما وجود دارد و اینکه فکر کنیم هوش مصنوعی قرار است این شکاف عمیق را بهراحتی از بین ببرد، بیشتر نشانه غرور و سادهانگاری است و اصلا به واقعیت نزدیک نیست.