زمان تفکر در هوش مصنوعی و بهبود فرایند درخواست
رویه کنونی مدلهای جدید هوش مصنوعی، جدا از توسعه مدلهای زبانی بزرگتر، اضافه کردن قابلیت پردازش دادهها در مدت زمان طولانیتر یا آنطور معمولا در رسانهها میبینیم، قدرت تفکر، استدلال یا استنتاج است. در این دیدگاه که نخستین بار در فوربز منتشر شده، آینده این قابلیت نو ظهور در صنعت هوش مصنوعی مورد بحث قرار خواهد گرفت.
در این مقاله، سه دوره اساسی را که منجر به ظهور مفهوم «زمان تفکر» در استفاده از هوش مصنوعی مولد و مدلهای زبانی بزرگ (LLMs) شده است، بررسی میکنم و تغییراتی را که به زودی در فرایند درخواستها (Prompting) ایجاد خواهد شد، مورد بحث قرار میدهم.
این تحلیل بخشی از مجموعه مقالات من در ستون Forbes است که درباره آخرین پیشرفتهای هوش مصنوعی از جمله بررسی و توضیح پیچیدگیهای تأثیرگذار این حوزه نوشتهام.
زمان تفکر در هوش مصنوعی؛ موضوعی داغ
در نسخههای پیشرفته امروزی هوش مصنوعی مولد، قابلیت «زنجیره تفکر» (Chain-of-Thought) به طور پیشفرض تعبیه شده است.
ماهیت این روش این است که هوش مصنوعی مجموعهای از گامهای منطقی را برای پردازش درخواستهای کاربران طراحی میکند. این را میتوان تا حدی به فرایند تصمیمگیری و حل مسئله در انسانها شبیه دانست، به این معنا که سیستم مجموعهای از مراحل را برای رسیدن به پاسخ مشخص میکند (البته نباید هوش مصنوعی را بهعنوان انسان در نظر گرفت؛ زیرا شیوه تفکر آن کاملاً متفاوت است).
در جامعه هوش مصنوعی، این فرایند پردازشی طولانیتر، با اصطلاحات مختلفی مانند «محاسبات اضافی زمان آزمون» یا «زمان تفکر»، «استدلال» و «استنتاج» توصیف شده است. من شخصاً از اصطلاحاتی مانند زمان تفکر یا زمان استدلال چندان استقبال نمیکنم، زیرا این واژهها به طرز نادرستی به تفکر انسانی شباهت دارند. همچنین، محاسبات زمان آزمون (Test-Time Compute) نیز انتخاب مناسبی به نظر نمیرسد، زیرا آزمون معمولاً پیش از عرضه یک سیستم انجام میشود، در حالی که در هوش مصنوعی، این اصطلاح برای حالتی به کار میرود که سیستم در حال استفاده توسط کاربران است.
برای قرار دادن این موضوع در چارجوبی قابل درک، فرض کنید از یک برنامه هوش مصنوعی برای بازی شطرنج استفاده میکنید. اگر تنها کسری از ثانیه به آن فرصت دهید، زمان کافی برای تحلیل مجموعهای گسترده از حرکات ممکن را نخواهد داشت. سیستم مجبور است جستجوی حرکات آینده را متوقف کند، زیرا محدودیت پردازشی وجود دارد. از سوی دیگر، اگر به هوش مصنوعی اجازه دهید که برای هر حرکت تا پنج دقیقه فکر کند، امکان بررسی سناریوهای بیشتر فراهم میشود و احتمالاً حرکت بهتری را انتخاب خواهد کرد.
برخی این فرایند را زمان تفکر، زمان استدلال یا محاسبات زمان آزمون مینامند. به نظر من، میتوانیم سادهتر صحبت کنیم و از عباراتی مانند «افزایش زمان اجرای پردازش»، «زمان پردازش در لحظه» یا «تخصیص بیشتر زمان پردازشی» استفاده کنیم. در نهایت، شما تصمیم بگیرید که کدام واژه مناسبتر و صادقانهتر است.
تخمین و مصرف زمان
ازآنجاییکه به نظر میرسد جامعه هوش مصنوعی تصمیم گرفته است که از عبارت پرطمطراق «زمان تفکر» استفاده کند، من هم در این بحث از این اصطلاح استفاده خواهم کرد، زیرا مثالهایی از هوش مصنوعی مولد (Generative AI) ارائه میدهم که به این موضوع مرتبط هستند. لطفاً توجه داشته باشید که من این عبارت را با اکراه به کار میبرم. در ذهن خود، این «زمان تفکر» را صرفاً به عنوان «زمان پردازش» در نظر بگیرید، ممنون.
من دریافتهام که سه دوره مختلف در ارتباط با میزان «زمان تفکر» برای هوش مصنوعی مولد وجود دارد:
۱. دوره اول: انتخاب فروشنده هوش مصنوعی. در این دوره، سازندگان هوش مصنوعی تصمیم میگیرند که چقدر زمان تفکر اختصاص داده شود.
۲. دوره دوم: انتخاب کاربر. در این دوره، کاربران میتوانند میزان زمان تفکر را خودشان انتخاب کنند.
۳. دوره سوم: انتخاب مشترک انسان و هوش مصنوعی. در این دوره، انسان و هوش مصنوعی به صورت مشترک در مورد میزان زمان تفکر تصمیم میگیرند.
در حال حاضر، ما عمدتاً در دوره اول هستیم. در این دوره وقتی شما از هوش مصنوعی مولد سوالی میپرسید، هوش مصنوعی برای یافتن پاسخ شما، مقداری زمان تفکر صرف میکند. این میزان زمان پردازش توسط سازنده هوش مصنوعی تعیین شده است. در برخی موارد، میتوانید با پرداخت هزینه، زمان تفکر بیشتری دریافت کنید، اما در غیر این صورت، این مقدار از پیش تعیین شده.
این موضوع ما را به دوره دوم رسانده است. در واقع پس از مدتی، سازندگان هوش مصنوعی متوجه شدند که کاربران ممکن است بخواهند خودشان میزان زمان تفکر را تنظیم کنند؛ بنابراین، گزینهای برای انتخاب میزان پردازش ارائه شده است. برای مثال، در حال حاضر «چتجیبیتی» به کاربران اجازه میدهد بین گزینههای کم، متوسط و زیاد انتخاب کنند. «انتروپیک» نیز در حال حرکت به سمت یک مدل مقیاس کشویی (Sliding Scale) است.
با اینکه این قابلیت به نظر جذاب میآید، اما در عمل ممکن است چندان کاربردی نباشد. در ادامه خواهید دید که چرا این روش چالشهایی دارد.
من پیشبینی میکنم که به سرعت به سمت دوره سوم حرکت خواهیم کرد. در دوره سوم، میزان زمان تفکر به صورت مشترک بین انسان و هوش مصنوعی تعیین خواهد شد. به عبارت دیگر، هوش مصنوعی مولد در مورد جنبههای زمان تفکر با کاربر بحث خواهد کرد و در نهایت کاربر تصمیم نهایی را درباره میزان زمان تفکر مورد استفاده برای یک پرسش میگیرد.
منطق من برای این ادعا که سازندگان هوش مصنوعی به زودی و به ناچار به دوره سوم حرکت خواهند کرد، این است که کاربران هوش مصنوعی مولد از رویکرد دوره دوم ناراضی خواهند شد. ممکن است تعداد کمی از سازندگان هوش مصنوعی این نارضایتی را بپذیرند و صرفاً ادعا کنند که روش تعیین زمان تفکر را بهبود بخشیدهاند که در نهایت منجر به پیشرفت سیستم میشود.
مثالی برای توصیف رویکرد «کم، متوسط، زیاد»
دوره اول چیزی است که قبلاً هنگام استفاده از بیشتر ابزارهای هوش مصنوعی مولد متعارف تجربه کردهاید. نیازی به بحث بیشتر در مورد آن دوره نیست. بیایید به دوره دوم که به آرامی در حال ظهور است بپردازیم و چند مثال ببینیم.
توانایی انتخاب بین «کم»، «متوسط» یا «زیاد» ساده است و تصویر مفیدی از رویکرد دوره دوم ارائه میدهد. یا یک لیست انتخاب به شما نمایش داده میشود یا هوش مصنوعی مستقیماً از شما میپرسد که کدام را ترجیح میدهید.
در اینجا مثالی از هوش مصنوعی مولد میبینید که از شما ترجیحتان را میپرسد:
هوش مصنوعی مولد: «میزان زمان تفکر را مشخص کنید: کم، متوسط یا زیاد.»
پرسش من: «زمان تفکر برای این سوال باید کم باشد. پایتخت پاریس چیست؟»
توجه کنید که من به هوش مصنوعی گفتم که برای این پرسش، زمان تفکر کم را انتخاب کردهام.
دلیل من برای انتخاب «کم» این است که سوال من بسیار ساده است. با پرسیدن پایتخت پاریس، انتظار دارم که زمان تفکر بسیار کم باشد. دلیلی ندارد که به هوش مصنوعی بگویم زمان تفکر را روی «زیاد» تنظیم کند، زیرا میدانم که زمان تفکر قابل توجهی نیاز نیست.
این موضوع یک نکته مهم را مطرح میکند. بعضی از برنامههای هوش مصنوعی مولد دقیقاً همانطور که شما میگویید عمل میکنند. مثلاً اگر شما «زیاد» را انتخاب کنید، هوش مصنوعی ممکن است فراتر از زمان لازم به محاسبات بپردازد. شما اساساً به هوش مصنوعی گفتهاید که این موضوع برای شما قابل قبول است، اما مشکل این است که احتمالا برای چرخههای پردازشی اضافی هزینه پرداخت کنید که واقعاً نیازی به آنها نداشتهاید. این تقریباً نوعی کلاهبرداری است.
پاسخ سازندگان هوش مصنوعی این است که اگر کاربر گفته است زمان تفکر زیاد میخواهد، پس این مسئولیت خودش است. در واقع این به کاربر بستگی دارد که بداند چه کاری انجام میدهد.
علاوه بر این، زمان تفکر اضافی میتواند به عنوان نوعی بررسی مضاعف (Double Check) در نظر گرفته شود. بررسی مضاعف به این معناست که شما هوش مصنوعی را وادار میکنید تا بررسی طولانیتری انجام دهد و در نتیجه، ممکن است از پاسخ ارائه شده راضیتر باشید.
مثالی از «مقیاس کشویی»
با وجود اینکه استفاده از مقیاس کشویی به جای گزینههای کم، متوسط و زیاد سروصدایی به پا کرده، اما در اصل این دو تفاوت چندانی با هم ندارد. به این مثال توجه کنید:
هوش مصنوعی مولد: «میزان زمان تفکر را در مقیاسی از ۱ تا ۱۰ مشخص کنید (۱ کمترین و ۱۰ بیشترین مقدار است).»
ورودی من: «زمان تفکر باید ۷ باشد. بهترین حرکت شطرنج را بر اساس وضعیت صفحه که در پیام بعدی ارائه میدهم مشخص کن.»
اینکه بتوانید از مقیاس کشویی استفاده کنید (چه بهصورت یک نوار لغزنده روی صفحه یا وارد کردن یک عدد) ممکن است جالب به نظر برسد، اما در عمل مقیاس ۱ تا ۱۰ تفاوت زیادی با همان دستهبندی کم، متوسط، زیاد ندارد. منطقی است که ۱ را بهعنوان کم، ۵ را متوسط و ۱۰ را زیاد در نظر بگیریم. انتخاب اعداد بین این مقادیر شاید مفید باشد، اما در نهایت تغییری بنیادی ایجاد نمیکند. در واقع همچنان مسئولیت انتخاب زمان تفکر به عهدهی کاربر است.
دوره سوم در راه است
حالا به سراغ دورهی سوم برویم. در مثال قبل، فرض کنید که هوش مصنوعی مقدار ۷ را دریافت کرده و بر اساس آن پردازش را انجام داده است. در اینجا پاسخ نهایی میتوانست بهتر باشد، اگر مقدار تفکر بالاتری تعیین شده بود.
به عبارتی دیگر، در دورههای اول و دوم اگر زمان کافی برای پردازش اختصاص ندهید، هوش مصنوعی به شما هشدار نمیدهد که پاسخ ممکن است بهینه نباشد. در واقع این مسئولیت شماست که زمان مناسب را انتخاب کنید، و اگر انتخاب شما کم باشد، نتیجه ممکن است چندان رضایتبخش نباشد.
البته در دورهی سوم، اتفاقی متفاوت رخ میدهد:
هوش مصنوعی مولد: «شما مقدار زمان تفکر را ۷ تعیین کردید و من بر این اساس پردازش را انجام دادم. بهترین حرکت شطرنج بر اساس این مقدار تفکر در ادامه نمایش داده میشود. پیشنهاد میکنم اگر به پاسخ عمیقتری نیاز دارید، پردازش را با مقدار بالاتری اجرا کنید.»
ورودی من: «دوباره پردازش کن، این بار با زمان تفکر ۹.»
اینجا هوش مصنوعی نهتنها دستور اولیه من را اجرا کرد، بلکه متوجه شد که میتواند پردازش بیشتری انجام دهد تا پاسخ بهتری ارائه شود و به طور دوستانه این موضوع را اطلاع داد. من هم تصمیم گرفتم پردازش را با مقدار ۹ تکرار کنم.
در دورهی سوم، تصمیمگیری دربارهی زمان تفکر بهصورت همکاری بین انسان و هوش مصنوعی انجام میشود. برخلاف دورهی اول که در آن هوش مصنوعی تصمیم میگرفت و دوره دوم که در آن کاربر بدون راهنمایی تصمیم میگرفت، در دورهی سوم، انسان و هوش مصنوعی با هم تعامل دارند.
امکان تغییر زمان تفکر در میانه پردازش
ممکن است بگویید که این فرایند هزینهی اضافی به کاربر تحمیل میکند، چون من ابتدا با مقدار ۷ پردازش را شروع کردم و بعد مجبور شدم آن را با مقدار ۹ تکرار کنم؛ بنابراین، عملاً دو بار هزینه پردازش پرداخت کردهام و این منصفانه نیست.
قبول دارم.
در دورهی سوم، قابلیت تغییر زمان تفکر در میانهی پردازش معرفی خواهد شد. اینطور تصور کنید که من مقدار ۷ را تعیین کردهام و هوش مصنوعی پردازش را آغاز کرده است، اما در همان حین، چنین اتفاقی میافتد:
هوش مصنوعی مولد: «شما مقدار ۷ را انتخاب کردید و من پردازش را آغاز کردهام، اما حالا به این نتیجه رسیدهام که اگر مقدار را به ۹ افزایش دهید، پاسخ به طور محسوسی بهبود خواهد یافت. آیا میخواهید مقدار را به ۹ تغییر دهم یا پردازش را در مقدار ۷ متوقف کنم؟»
ورودی من: «با مقدار ۹ ادامه بده.»
در اینجا نیازی به تکرار کامل پردازش نبود. هوش مصنوعی در حین پردازش متوجه شد که افزایش زمان تفکر میتواند مفید باشد و از من اجازه خواست. من هم تصمیم گرفتم ادامه پردازش را با مقدار بالاتر انجام دهم.
ممکن است برخی بگویند که این قابلیت به سود شرکتهای سازندهی هوش مصنوعی است، چون آنها میتوانند کاربران را ترغیب کنند که بدون نیاز واقعی و صرفا برای کسب درآمد بیشتر، زمان تفکر را افزایش دهند.
این نگرانی منطقی است، چون کاربران معمولی ممکن است متوجه نشوند که آیا واقعاً نیاز به افزایش زمان تفکر دارند یا صرفاً در حال پرداخت هزینه اضافی هستند. در نتیجه، ممکن است هوش مصنوعی به دروغ از کاربر بخواهد که فقط برای کسب درآمد بیشتر پردازش را طولانیتر کند.
این کار برای شرکتها ریسک بزرگی دارد. اگر مشخص شود که یک شرکت عمداً کاربران را به پرداخت هزینههای غیرضروری وادار میکند، با ریسک سنگین از دست دادن اعتبار، شکایات حقوقی و حتی اقدامات قانونی مواجه خواهد شد. بهطورکلی باید منتظر ماند و دید که این مسئله در آینده چگونه مدیریت خواهد شد.
همکاری قویتر میشود
بخشی از مشکل این بود که من عدد ۷ را به عنوان زمان تفکر مورد نظر برای پرسش خود انتخاب کردم، در حالی که این انتخاب صرفاً یک حدس بیپایه بود. این موضوع را اینگونه در نظر بگیرید:
شما برای تعمیر ماشینتان به یک مکانیکی مراجعه میکنید. حالا فرض کنید مکانیک از شما بپرسد: «چقدر میخواهید هزینه کنید؟» این کاملاً غیرمنطقی است! مکانیک باید ابتدا برآوردی از هزینه تعمیر ارائه دهد، زیرا بیشتر افراد جادوی حدس زدن مقدار دقیق هزینه تعمیر را ندارند. همین منطق در دورهی سوم هوش مصنوعی نیز برقرار خواهد بود.
به این مثال توجه کنید:
- هوش مصنوعی مولد: «شما میتوانید به من بگویید چقدر زمان تفکر میخواهید استفاده کنید و این کار را با یک مقیاس لغزنده از ۱ (کم) تا ۱۰ (زیاد) انجام دهید. اگر مطمئن نیستید که چقدر زمان تفکر نیاز است، من میتوانم قبل از شروع به حل یا پاسخ دادن به سوال یا مشکل شما، یک تخمین به شما بدهم. آیا میخواهید تخمینی دریافت کنید؟»
- ورودی من: «بله، من میخواهم یک تخمین دریافت کنم. سوال من این است که میخواهم بدانم چند دریچه فاضلاب در شهر نیویورک وجود دارد. تخمین شما برای زمان تفکر مورد نیاز چقدر است؟»
- هوش مصنوعی مولد: «تخمین من این است که این کار در سطح ۲ از مقیاس ۱ تا ۱۰ قرار میگیرد. شما میتوانید این تخمین را تأیید کنید یا زمان تفکر را به مقدار دیگری بین ۱ تا ۱۰ تغییر دهید.»
- پرسش من: «با زمان تفکر ۲ ادامه بده، ممنون.»
این روش بسیار منطقیتر است. در این سناریو، من ابتدا سوالم را مطرح کردم، هوش مصنوعی یک برآورد از زمان تفکر ارائه کرد و من هم آن را تأیید کردم.
اگر هوش مصنوعی در حین پردازش متوجه شود که تخمین کافی نبوده است، در میانه کار به من اطلاع میدهد و من میتوانم در صورت نیاز تنظیمات لازم را انجام دهم.
همیشه با تخمینها سر و کار نداریم
کاربری که به طور مکرر از هوش مصنوعی مولد استفاده میکند، ممکن است از این که مدام باید با تخمینها و تأییدهای زمان تفکر سروکار داشته باشد، خسته شود. این کار میتواند آزاردهنده و ناخوشایند باشد.
در دوره سوم، هوش مصنوعی عملکرد شما را زیر نظر میگیرد و پیشنهاداتی به شما ارائه میدهد. این مثال را در نظر بگیرید:
- هوش مصنوعی مولد: «من به طور دورهای زمان تفکر استفادهشده برای پاسخ به سوالات شما را تحلیل میکنم. متوجه شدم که شما اغلب سطح «متوسط» را انتخاب میکنید، در حالی که بیشتر سوالات شما در بازه زمانی «کم» پاسخ داده شدهاند. ممکن است بخواهید از سطح «کم» استفاده کنید، مگر این که سوالات شما پیچیدهتر شوند.»
- پرسش من: «ممنون از تحلیل شما. من میخواهم که از این به بعد به طور پیشفرض زمان تفکر من روی سطح «کم» تنظیم شود. اگر بخواهم سطح را تغییر دهم، به شما اطلاع خواهم داد.»
- هوش مصنوعی مولد: «متوجه شدم. از این پس تمام سوالات شما به طور پیشفرض با سطح «کم» پردازش خواهند شد. اگر سوالی مطرح کنید که تخمین من این باشد که به زمان تفکر بیشتری نیاز دارد، به شما اطلاع میدهم و سپس شما تصمیم میگیرید که چه کاری انجام دهید.»
در اینجا هوش مصنوعی به راحتی تشخیص داده است که بهطورکلی بهترین انتخاب برای من سطح «کم» است. این تنظیم انعطافپذیر است، یعنی هوش مصنوعی میتواند آن را تغییر دهد و من نیز میتوانم تنظیمات را تغییر دهم.
فکر کردن به «زمان تفکر»
اگر تاکنون هنگام استفاده از هوش مصنوعی مولد با مفهوم «زمان تفکر» سر و کار نداشتهاید، اکنون میدانید که چه چیزی در راه است. من مطمئنم که شما برای تغییرات پیش رو آماده هستید.
انتظار من این است که ما بهسرعت وارد دوره سوم شویم. در واقع هیچ دلیلی ندارد که با گیر کردن در دوره اول یا دوم، زندگی را برای کاربران سختتر کنیم. زمان آن رسیده است که به جلو حرکت کنیم.
هنری فورد جمله معروفی دارد: «دور هم جمع شدن یک شروع است، با هم ماندن پیشرفت است و با هم کار کردن موفقیت است.»
این موضوع در مورد کار با هوش مصنوعی مولد نیز صدق میکند. همکاری انسان و هوش مصنوعی بهترین راه برای رسیدن به موفقیت است. انسانها راضی خواهند بود و شاید بتوان گفت که هوش مصنوعی نیز «راضی» خواهد بود. البته بیایید این احساسات را به هوش مصنوعی غیرهوشیار نسبت ندهیم. ما باید با ذهنی روشن و منطقی، مرزهای تواناییها و محدودیتهای هوش مصنوعی را درک کنیم. این یک استفاده خوب و هوشمندانه از زمان تفکر است.
نوشته شده توسط لنس الیوت؛ دکتر لنس بی. الیوت یک دانشمند و مشاور مشهور جهانی در زمینه هوش مصنوعی است.