در جستوجوی راهی برای جلوگیری از فریب خوردن مدلهای صوتی یادگیری ماشین
معیارهایی وجود دارند که نشان میدهند اختلالات صوتی طراحیشده بهمنظور فریب مدلهای هوش مصنوعی برای انسان قابلدرک هستند یا خیر؛ اما بهنظر میرسد که این معیارها، قابلاعتماد نیستند. محققان دانشگاه UPV/EHU در منطقه خودمختار باسک، نشان میدهند که معیارهای آشفتگی استفادهشده برای تعیین اختلالات سیگنال صوتی، مقیاس قابلاعتمادی از درک انسان نیستند و برای بهبود آنها، پیشنهاداتی ارائه دادهاند. این اختلالات که طوری طراحی شدهاند، تا نامحسوس باشند، میتوانند باعث پیشبینیهای اشتباه در هوش مصنوعی شوند. برای ارزیابی میزان تأثیر این روشها در ایجاد این قبیل حملهها، از معیارهای آشفتگی استفاده میشود.
هوش مصنوعی بهطور فزایندهای مبتنی بر مدلهای یادگیری ماشین است و این مدلها نیز با استفاده از دیتاستهای بزرگ، آموزش میبینند. به همین ترتیب، تعامل انسان-کامپیوتر نیز بهطور روزافزون، به ارتباط گفتاری وابسته است و دلیل اصلی آن هم، عملکرد چشمگیر مدلهای یادگیری ماشین در انجام تکالیف تشخیص گفتار است.
با این حال، این مدلها میتوانند با نمونههای «تخاصمی» فریب بخورند؛ بهعبارت دیگر، نمونههای تخاصمی، ورودیهایی هستند که عمداً دارای اختلالهای غیرقابل درک برای انسان هستند و باعث میشوند مدل، پیشبینی اشتباه انجام دهد. جان وادیلو، پژوهشگر گروه علوم کامپیوتر و هوش مصنوعی دانشگاه UPV/EHU اینگونه موضوع را توضیح داد: «فرض کنید مدلی داریم که دادههای صوتی را طبقهبندی میکند (بهعنوان مثال، فرمان صوتی را تشخیص میدهد) و ما قصد داریم که آن را فریب دهیم؛ به بیان دیگر، اختلالی ایجاد کنیم که بهصورت مخرب از عملکرد درست مدل جلوگیری میکند. زمانی که یک اختلال تخاصمی به سیگنالی مانند «به راست بپیچ» بیفزاییم، ما انسانها، همچنان آن را بهدرستی میشنویم، اما مدل، آن را بهصورت «به چپ بپیچ» یا هر فرمان دیگری که ما قصد انجام آن را نداریم، میشنود.»
وادیلو افزود: «این امر میتواند در هنگام استفاده از این فناوریها در مسائل واقعی یا بسیار حساس، پیامدهای بسیار جدی داشته باشد.» هنوز مشخص نیست چرا این اتفاق رخ میدهد. چرا مدلی که چنان هوشمندانه رفتار میکند، هنگام دریافت سیگنالی که خیلی کم تغییر کرده است، دیگر بهدرستی کار نمیکند؟
فریب مدل با استفاده از اختلال غیرقابل تشخیص
وادیلو بیان کرد: «دانستن اینکه یک مدل یا برنامه دارای آسیبپذیری است، مهم است، زیرا اولین گام در برطرف کردن آن، اطلاع از وجود آن است.» بیشتر پژوهشها بر روی توسعه روشهای تولید اختلالات تخاصمی تمرکز کردهاند و به جنبههای تعیینکننده قابلدرک بودن این اختلالات برای انسان توجه کمتری شده است. این مسئله از این نظر اهمیت دارد که راهبردهای اختلالات تخاصمی پیشنهادشده، فقط هنگامی تهدیدکننده هستند که برای انسان قابلتشخیص نباشند.
پژوهش حاضر، این امر را بررسی کرده است که معیارهای آشفتگی پیشنهادشده برای نمونههای صوتی تخاصمی در ادبیات پژوهش، تا چه اندازه میتوانند درک انسان از اختلالات را بهدرستی اندازه بگیرند. پژوهشگران با استفاده از نتایج آزمایشی که در آن 36 نفر نمونههای تخاصمی یا اختلالات صوتی را بر اساس عوامل مختلفی ارزیابی کردند، نشان دادند که معیارهای قراردادی بهکاررفته در تحقیقات، کاملاً دقیق یا قابلاتکا نیستند. بهعبارت دیگر، این معیارها، به اندازه کافی درک شنوایی انسان را بازنمایی نمیکنند. بر طبق این معیارها، اختلالات بهوسیله انسان قابلشناسایی نیستند، اما زمانی که افراد آنها را ارزیابی کردند، متوجه شدند که قابلتشخیص هستند. این پژوهشگران هشدار دادند که به علت غیرقابل اعتماد بودن این معیارها، مطالعه حملههای صوتی بهخوبی انجام نمیشود.
بهعلاوه، این پژوهشگران روش ارزیابی دقیقتری را ارائه کردند. این روش حاصل تحلیل ویژگیهای مخصوصی از صوت است که به ارزیابی قابلیت تشخیص مرتبط هستند؛ بهعنوان مثال، بخشیهایی از فایل صوتی که در آن اختلال از همه بیشتر قابلشناسایی است. با این حال، وادیلو نتیجه گرفت: «این مشکل حلنشده باقی میماند، زیرا دست یافتن به یک معیار ریاضی که قادر به مدلسازی درک شنوایی باشد، بسیار دشوار است. بسته به نوع سیگنال صوتی، ممکن است معیارهای متفاوتی موردنیاز باشند یا باید عوامل متفاوتی را در نظر گرفت. دستیابی به یک معیار صوتی کلی و جامع، کاری پیچیده است.»
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید