در جست‌وجوی راهی برای جلوگیری از فریب ‌خوردن مدل‌های صوتی یادگیری ماشین

تیم تحریریه
۱۵ اسفند ۱۴۰۰

زمان مطالعه: 3 دقیقه

معیارهایی وجود دارند که نشان می‌دهند اختلالات صوتی طراحی‌شده به‌منظور فریب مدل‌های هوش مصنوعی برای انسان قابل‌درک هستند یا خیر؛ اما به‌نظر می‌رسد که این معیارها، قابل‌اعتماد نیستند. محققان دانشگاه UPV/EHU در منطقه خودمختار باسک، نشان می‌دهند که معیارهای آشفتگی استفاده‌شده برای تعیین اختلالات سیگنال صوتی، مقیاس قابل‌اعتمادی از درک انسان نیستند و برای بهبود آن‌ها، پیشنهاداتی ارائه داده‌اند. این اختلالات که طوری طراحی شده‌اند، تا نامحسوس باشند، می‌توانند باعث پیش‌بینی‌های اشتباه در هوش مصنوعی شوند. برای ارزیابی میزان تأثیر این روش‌ها در ایجاد این قبیل حمله‌ها، از معیارهای آشفتگی استفاده می‌شود.

هوش مصنوعی به‌طور فزاینده‌ای مبتنی بر مدل‌های یادگیری ماشین است و این مدل‌ها نیز با استفاده از دیتاست‌های بزرگ، آموزش می‌بینند. به همین ترتیب، تعامل انسان-کامپیوتر نیز به‌طور روزافزون، به ارتباط گفتاری وابسته است و دلیل اصلی آن هم، عملکرد چشمگیر مدل‌های یادگیری ماشین در انجام تکالیف تشخیص گفتار است.

با این حال، این مدل‌ها می‌توانند با نمونه‌های «تخاصمی» فریب بخورند؛ به‌عبارت دیگر، نمونه‌های تخاصمی، ورودی‌هایی هستند که عمداً دارای اختلال‌های غیرقابل درک برای انسان هستند و باعث می‌شوند مدل، پیش‌بینی اشتباه انجام دهد. جان وادیلو، پژوهشگر گروه علوم کامپیوتر و هوش مصنوعی دانشگاه UPV/EHU این‌گونه موضوع را توضیح داد: «فرض کنید مدلی داریم که داده‌های صوتی را طبقه‌بندی می‌کند (به‌عنوان مثال، فرمان صوتی را تشخیص می‌دهد) و ما قصد داریم که آن را فریب دهیم؛ به بیان دیگر، اختلالی ایجاد کنیم که به‌صورت مخرب از عملکرد درست مدل جلوگیری می‌کند. زمانی که یک اختلال تخاصمی به سیگنالی مانند «به راست بپیچ» بیفزاییم، ما انسان‌ها، همچنان آن را به‌درستی می‌شنویم، اما مدل، آن را به‌صورت «به چپ بپیچ» یا هر فرمان دیگری که ما قصد انجام آن را نداریم، می‌شنود.»

وادیلو افزود: «این امر می‌تواند در هنگام استفاده از این فناوری‌ها در مسائل واقعی یا بسیار حساس، پیامدهای بسیار جدی داشته باشد.» هنوز مشخص نیست چرا این اتفاق رخ می‌دهد. چرا مدلی که چنان هوشمندانه رفتار می‌کند، هنگام دریافت سیگنالی که خیلی کم تغییر کرده است، دیگر به‌درستی کار نمی‌کند؟

فریب مدل با استفاده از اختلال غیرقابل تشخیص

وادیلو بیان کرد: «دانستن اینکه یک مدل یا برنامه دارای آسیب‌پذیری‌ است، مهم است، زیرا اولین گام در برطرف‌ کردن آن‌، اطلاع از وجود آن است.» بیشتر پژوهش‌ها بر روی توسعه روش‌های تولید اختلالات تخاصمی تمرکز کرده‌اند و به جنبه‌های تعیین‌کننده قابل‌درک بودن این اختلالات برای انسان توجه کمتری شده است. این مسئله از این نظر اهمیت دارد که راهبردهای اختلالات تخاصمی پیشنهادشده، فقط هنگامی تهدیدکننده هستند که برای انسان قابل‌تشخیص نباشند.

پژوهش حاضر، این امر را بررسی کرده است که معیارهای آشفتگی پیشنهادشده برای نمونه‌های صوتی تخاصمی در ادبیات پژوهش، تا چه اندازه می‌توانند درک انسان از اختلالات را به‌درستی اندازه بگیرند. پژوهشگران با استفاده از نتایج آزمایشی که در آن 36 نفر نمونه‌های تخاصمی یا اختلالات صوتی را بر اساس عوامل مختلفی ارزیابی کردند، نشان دادند که معیارهای قراردادی به‌کاررفته در تحقیقات، کاملاً دقیق یا قابل‌اتکا نیستند. به‌عبارت دیگر، این معیارها، به اندازه کافی درک شنوایی انسان را بازنمایی نمی‌کنند. بر طبق این معیارها، اختلالات به‌وسیله انسان قابل‌شناسایی نیستند، اما زمانی که افراد آن‌ها را ارزیابی کردند، متوجه شدند که قابل‌تشخیص هستند. این پژوهشگران هشدار دادند که به علت غیرقابل اعتماد بودن این معیارها، مطالعه حمله‌های صوتی به‌خوبی انجام نمی‌شود.

به‌علاوه، این پژوهشگران روش ارزیابی دقیق‌تری را ارائه کردند. این روش حاصل تحلیل ویژگی‌های مخصوصی از صوت است که به ارزیابی قابلیت تشخیص مرتبط هستند؛ به‌عنوان مثال، بخشی‌هایی از فایل صوتی که در آن اختلال از همه بیشتر قابل‌شناسایی است. با این حال، وادیلو نتیجه گرفت: «این مشکل حل‌نشده باقی می‌ماند، زیرا دست‌ یافتن به یک معیار ریاضی که قادر به مدل‌سازی درک شنوایی باشد، بسیار دشوار است. بسته به نوع سیگنال صوتی، ممکن است معیارهای متفاوتی موردنیاز باشند یا باید عوامل متفاوتی را در نظر گرفت. دستیابی به یک معیار صوتی کلی و جامع، کاری پیچیده است.»

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

https://hooshio.com/?p=24218

در جست‌وجوی راهی برای جلوگیری از فریب ‌خوردن مدل‌های صوتی یادگیری ماشین

فریب مدل با استفاده از اختلال غیرقابل تشخیص

حقوق نجومی برای جلوگیری از پایان جهان

ژاپن اسب خود را برای مسابقه هوش مصنوعی زین کرد

خروج سازمان ثبت‌احوال از خدمات احراز هویت غیرحضوری مبتنی بر هوش مصنوعی

جهش ۱۶ پله‌ای قزاقستان در شاخص جهانی AI

هوش مصنوعی در کلاس درس

گفته‌های برنده جایزه نوبل دمیس هاسابیس، درباره معنای AGI برای بشریت

باید برای پیامدهای ژئوپلیتیکی هوش مصنوعی آماده شویم

حریم خصوصی کودکان در دوران هوش مصنوعی

خروج سازمان ثبت‌احوال از خدمات احراز هویت غیرحضوری مبتنی بر هوش مصنوعی

ایلان ماسک به کمک هوش مصنوعی اولین تریلیونر تاریخ خواهد شد؟

گزارش افتتاحیه مرکز هوش مصنوعی و علم داده شهید فقهی

درخواست رفع فعالیت‌های مداخله‌جویانه دولت در خدمات احراز هویت غیرحضوری مبتنی بر هوش مصنوعی

حقوق نجومی برای جلوگیری از پایان جهان

ژاپن اسب خود را برای مسابقه هوش مصنوعی زین کرد

جهش ۱۶ پله‌ای قزاقستان در شاخص جهانی AI

هوش مصنوعی رسماً همکار خبرنگاران شد

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

هوش مصنوعی در کلاس درس

گفته‌های برنده جایزه نوبل دمیس هاسابیس، درباره معنای AGI برای بشریت

حقوق نجومی برای جلوگیری از پایان جهان

باید برای پیامدهای ژئوپلیتیکی هوش مصنوعی آماده شویم

حریم خصوصی کودکان در دوران هوش مصنوعی

فریب مدل با استفاده از اختلال غیرقابل تشخیص

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید