آموزش به هوش مصنوعی برای درک ندانستهها
یک تیم پژوهشی از MIT شرکت Themis AI را تأسیس کردهاند تا میزان عدم قطعیت مدلهای هوش مصنوعی را بسنجند و خلأهای دانشی آنها را شناسایی کنند.
سیستمهای هوش مصنوعی مانند ChatGPT میتوانند به بیشتر پرسشها، پاسخهایی منطقی و قابلقبول ارائه دهند، اما همیشه مشخص نمیکنند که کجاها دچار عدم اطمینان یا کمبود دانش هستند. این موضوع میتواند پیامدهای جدی بهدنبال داشته باشد، بهویژه حالا که از هوش مصنوعی برای کارهایی مانند توسعه دارو، ترکیب اطلاعات و هدایت خودروهای خودران استفاده میشود.
یادگیری از خطاها
شرکت نوپا hemis AI که توسط پژوهشگران MIT تأسیس شده، در تلاش است تا به مدلهای هوش مصنوعی کمک کند قبل از آنکه خطاهای جدی رخ دهند، میزان عدم اطمینان خود را تشخیص دهند و خروجیهایشان را اصلاح کنند. پلتفرم این شرکت به نام Capsa با انواع مدلهای یادگیری ماشین سازگار است و در مدت چند ثانیه میتواند خروجیهای مشکوک یا غیرقابلاعتماد را شناسایی کند. این سیستم با اعمال اصلاحاتی در ساختار مدلها، آنها را قادر میسازد الگوهایی را شناسایی کنند که نشاندهنده ابهام، نقص یا سوگیری در پاسخها هستند.
«دانیلا روس»، یکی از بنیانگذاران Themis AI و استاد MIT که ریاست آزمایشگاه علوم رایانه و هوش مصنوعی این دانشگاه (CSAIL) را نیز بر عهده دارد، میگوید:
«ایده اصلی این است که یک مدل هوش مصنوعی موجود را در پلتفرم Capsa قرار دهیم تا بتوانیم نقاط ضعف، ابهام یا احتمال شکست آن را شناسایی کنیم. سپس، با استفاده از همین تحلیل، مدل را بهگونهای بهبود دهیم که عملکرد دقیقتر و قابل اطمینانتری داشته باشد. هدف، ارتقاء کیفیت خروجی مدلها و ارائه تضمینهایی درباره صحت و پایداری عملکرد آنهاست.»
روس در سال ۲۰۲۱ شرکت Themis AI را همراه با الکساندر امینی (فارغالتحصیل ۲۰۱۷، کارشناسی ارشد ۲۰۱۸، دکترای ۲۰۲۲) و الهه احمدی (فارغالتحصیل ۲۰۲۰، مهندسی ۲۰۲۱) که هر دو از پژوهشگران پیشین آزمایشگاه او بودند، تأسیس کرد. از آن زمان تاکنون، آنها به شرکتهای مخابراتی در برنامهریزی و خودکارسازی شبکه کمک کردهاند، به شرکتهای نفت و گاز در تحلیل تصاویر لرزهای با استفاده از هوش مصنوعی یاری رساندهاند و مقالاتی درباره توسعه چتباتهای قابلاطمینانتر و معتبرتر منتشر کردهاند.
الکساندر امینی میگوید: «هدف ما فعالسازی هوش مصنوعی در حساسترین کاربردهای هر صنعت است. همه ما نمونههایی از خطاها یا اشتباهات هوش مصنوعی را دیدهایم. با گسترش استفاده از هوش مصنوعی، این خطاها میتوانند پیامدهای جدی و مخربی داشته باشند. Themis این امکان را فراهم میکند که هر هوش مصنوعی بتواند شکستهای احتمالی خود را پیشبینی کند، پیش از آنکه اتفاق بیفتند.
کمک به مدلهای هوش مصنوعی برای شناخت محدودیتهای خود
آزمایشگاه روس سالهاست که روی میزان اطمینان مدلهای هوش مصنوعی تحقیق میکند. در سال ۲۰۱۸، او از شرکت تویوتا بودجهای دریافت کرد تا قابلیت اطمینان یک سیستم رانندگی خودکار مبتنی بر یادگیری ماشین را بررسی کند.
روس میگوید: «در این زمینه که ایمنی بسیار مهم است، درک میزان اعتماد به مدل حیاتی است.»
در پروژهای دیگر، روس، امینی و تیمشان الگوریتمی ساختند که تبعیضهای نژادی و جنسیتی در سیستمهای تشخیص چهره را شناسایی و وزن دادههای آموزشی مدل را بهطور خودکار تنظیم میکند تا این تبعیضها حذف شوند. این الگوریتم با پیدا کردن بخشهای نامناسب دادههای آموزشی، نمونههای جدید مشابه تولید میکند و تعادل دادهها را حفظ میکند.
در سال ۲۰۲۱، بنیانگذاران Themis AI نشان دادند که این روش میتواند به شرکتهای داروسازی کمک کند تا با استفاده از هوش مصنوعی، ویژگیهای داروهای جدید را پیشبینی کنند و همین سال، شرکت Themis AI را تأسیس کردند.
روس میگوید: «راهبری فرایند کشف دارو میتواند صرفهجویی مالی قابلتوجهی ایجاد کند، این کاربرد بود که ما را متوجه قدرت بالای این ابزار کرد.»
امروزه Themis AI با شرکتهای مختلفی در صنایع گوناگون همکاری دارد که بسیاری از آنها در حال توسعه مدلهای زبانی بزرگ هستند. با استفاده از سیستم Capsa، این مدلها میتوانند میزان اطمینان خود را برای هر پاسخ به صورت دقیق اندازهگیری کنند.
استوارت جیمیسون، مدیر فناوری Themis AI، میگوید: «بسیاری از شرکتها تمایل دارند از مدلهای زبانی بزرگ بر پایه دادههای خود استفاده کنند، اما در مورد میزان اطمینان آنها دغدغه دارند. ما به این مدلها کمک میکنیم تا سطح اطمینان و میزان عدم قطعیت پاسخهای خود را گزارش دهند؛ این کار باعث میشود پاسخها دقیقتر و خروجیهای نامطمئن راحتتر شناسایی شوند.»
Themis AI همچنین با شرکتهای تولیدکننده نیمههادی در حال مذاکره است تا راهکارهای هوش مصنوعی مبتنی بر تراشههای آنها را که خارج از فضای ابری اجرا میشوند، توسعه دهد.
جیمیسون توضیح میدهد: «مدلهای کوچکتری که روی گوشیها یا دستگاههای تعبیهشده اجرا میشوند معمولاً دقت مدلهای بزرگ سروری را ندارند، اما ما راهکاری ارائه میدهیم که مزایای هر دو را ترکیب میکند: پردازش سریع و با تأخیر کم در لبه شبکه، بدون افت قابلتوجه در کیفیت. ما آیندهای را متصور هستیم که در آن، بیشتر پردازشها توسط دستگاههای لبه انجام میشود و تنها در مواردی که مدل مطمئن نیست، دادهها به سرور مرکزی منتقل میشوند.»
شرکتهای داروسازی نیز میتوانند از Capsa برای بهبود مدلهای هوش مصنوعی که در شناسایی داروهای جدید و پیشبینی عملکرد آنها در آزمایشهای بالینی استفاده میشوند، بهره ببرند.
امینی میگوید: «خروجیهای این مدلها بسیار پیچیده و دشوار برای تفسیر هستند و متخصصان زمان زیادی را صرف فهمیدن آنها میکنند. Capsa از همان ابتدا میتواند نشان دهد که آیا پیشبینیها بر اساس شواهد موجود در دادههای آموزشی است یا صرفاً حدس و گمان است. این موضوع شناسایی بهترین پیشبینیها را سرعت میبخشد و ما معتقدیم این قابلیت پتانسیل بالایی برای منافع اجتماعی دارد.»
تحقیقات با هدف ایجاد تاثیر
تیم Themis AI معتقد است این شرکت در موقعیتی مناسب برای ارتقاء فناوریهای پیشرفته و در حال تحول هوش مصنوعی قرار دارد. به عنوان مثال، این شرکت در حال بررسی توانایی Capsa در بهبود دقت یکی از تکنیکهای هوش مصنوعی به نام «استدلال زنجیرهای» است، روشی که در آن مدلهای زبانی بزرگ (LLM) مراحل رسیدن به پاسخ را توضیح میدهند.
جیمیسون میگوید: «شواهدی دیدهایم که نشان میدهد Capsa میتواند در هدایت فرایندهای استدلال به شناسایی زنجیرههای استدلال با بالاترین اطمینان کمک کند. ما معتقدیم این موضوع میتواند تأثیر زیادی در بهبود تجربه کاربری مدلهای زبانی بزرگ، کاهش تأخیر و کم کردن نیازهای محاسباتی داشته باشد. این یک فرصت بسیار مهم و تأثیرگذار برای ما است.»
برای روس که پس از ورود به MIT چندین شرکت را تأسیس کرده است، Themis AI فرصتی است تا مطمئن شود تحقیقاتش در MIT تأثیرگذار باشد.
روس میگوید: «من و دانشجویانم به مرور زمان بیش از پیش علاقهمند شدهایم که فراتر برویم و کاری کنیم که تحقیقاتمان برای جهان واقعی کاربردی و مفید باشد. هوش مصنوعی پتانسیل بزرگی برای تحول صنایع دارد، اما نگرانیهایی هم به همراه دارد. چیزی که مرا هیجانزده میکند، فرصت کمک به توسعه راهحلهای فنی است که این چالشها را برطرف کند و همچنین اعتماد و درک متقابل میان مردم و فناوریهایی که بخشی از زندگی روزمرهشان شدهاند را تقویت کند.»