پوشش رسانه‌ای جیتکس ۲۰۲۴ | با ما همراه باشید

Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 در جست‌وجوی راهی برای جلوگیری از فریب ‌خوردن مدل‌های صوتی یادگیری ماشین

در جست‌وجوی راهی برای جلوگیری از فریب ‌خوردن مدل‌های صوتی یادگیری ماشین

زمان مطالعه: 2 دقیقه

معیارهایی وجود دارند که نشان می‌دهند اختلالات صوتی طراحی‌شده به‌منظور فریب مدل‌های هوش مصنوعی برای انسان قابل‌درک هستند یا خیر؛ اما به‌نظر می‌رسد که این معیارها، قابل‌اعتماد نیستند. محققان دانشگاه UPV/EHU در منطقه خودمختار باسک، نشان می‌دهند که معیارهای آشفتگی استفاده‌شده برای تعیین اختلالات سیگنال صوتی، مقیاس قابل‌اعتمادی از درک انسان نیستند و برای بهبود آن‌ها، پیشنهاداتی ارائه داده‌اند. این اختلالات که طوری طراحی شده‌اند، تا نامحسوس باشند، می‌توانند باعث پیش‌بینی‌های اشتباه در هوش مصنوعی شوند. برای ارزیابی میزان تأثیر این روش‌ها در ایجاد این قبیل حمله‌ها، از معیارهای آشفتگی استفاده می‌شود.

هوش مصنوعی به‌طور فزاینده‌ای مبتنی بر مدل‌های یادگیری ماشین است و این مدل‌ها نیز با استفاده از دیتاست‌های بزرگ، آموزش می‌بینند. به همین ترتیب، تعامل انسان-کامپیوتر نیز به‌طور روزافزون، به ارتباط گفتاری وابسته است و دلیل اصلی آن هم، عملکرد چشمگیر مدل‌های یادگیری ماشین در انجام تکالیف تشخیص گفتار است.

با این حال، این مدل‌ها می‌توانند با نمونه‌های «تخاصمی» فریب بخورند؛ به‌عبارت دیگر، نمونه‌های تخاصمی، ورودی‌هایی هستند که عمداً دارای اختلال‌های غیرقابل درک برای انسان هستند و باعث می‌شوند مدل، پیش‌بینی اشتباه انجام دهد. جان وادیلو، پژوهشگر گروه علوم کامپیوتر و هوش مصنوعی دانشگاه UPV/EHU این‌گونه موضوع را توضیح داد: «فرض کنید مدلی داریم که داده‌های صوتی را طبقه‌بندی می‌کند (به‌عنوان مثال، فرمان صوتی را تشخیص می‌دهد) و ما قصد داریم که آن را فریب دهیم؛ به بیان دیگر، اختلالی ایجاد کنیم که به‌صورت مخرب از عملکرد درست مدل جلوگیری می‌کند. زمانی که یک اختلال تخاصمی به سیگنالی مانند «به راست بپیچ» بیفزاییم، ما انسان‌ها، همچنان آن را به‌درستی می‌شنویم، اما مدل، آن را به‌صورت «به چپ بپیچ» یا هر فرمان دیگری که ما قصد انجام آن را نداریم، می‌شنود.»

وادیلو افزود: «این امر می‌تواند در هنگام استفاده از این فناوری‌ها در مسائل واقعی یا بسیار حساس، پیامدهای بسیار جدی داشته باشد.» هنوز مشخص نیست چرا این اتفاق رخ می‌دهد. چرا مدلی که چنان هوشمندانه رفتار می‌کند، هنگام دریافت سیگنالی که خیلی کم تغییر کرده است، دیگر به‌درستی کار نمی‌کند؟

صوتی

فریب مدل با استفاده از اختلال غیرقابل تشخیص

وادیلو بیان کرد: «دانستن اینکه یک مدل یا برنامه دارای آسیب‌پذیری‌ است، مهم است، زیرا اولین گام در برطرف‌ کردن آن‌، اطلاع از وجود آن است.» بیشتر پژوهش‌ها بر روی توسعه روش‌های تولید اختلالات تخاصمی تمرکز کرده‌اند و به جنبه‌های تعیین‌کننده قابل‌درک بودن این اختلالات برای انسان توجه کمتری شده است. این مسئله از این نظر اهمیت دارد که راهبردهای اختلالات تخاصمی پیشنهادشده، فقط هنگامی تهدیدکننده هستند که برای انسان قابل‌تشخیص نباشند.

پژوهش حاضر، این امر را بررسی کرده است که معیارهای آشفتگی پیشنهادشده برای نمونه‌های صوتی تخاصمی در ادبیات پژوهش، تا چه اندازه می‌توانند درک انسان از اختلالات را به‌درستی اندازه بگیرند. پژوهشگران با استفاده از نتایج آزمایشی که در آن 36 نفر نمونه‌های تخاصمی یا اختلالات صوتی را بر اساس عوامل مختلفی ارزیابی کردند، نشان دادند که معیارهای قراردادی به‌کاررفته در تحقیقات، کاملاً دقیق یا قابل‌اتکا نیستند. به‌عبارت دیگر، این معیارها، به اندازه کافی درک شنوایی انسان را بازنمایی نمی‌کنند. بر طبق این معیارها، اختلالات به‌وسیله انسان قابل‌شناسایی نیستند، اما زمانی که افراد آن‌ها را ارزیابی کردند، متوجه شدند که قابل‌تشخیص هستند. این پژوهشگران هشدار دادند که به علت غیرقابل اعتماد بودن این معیارها، مطالعه حمله‌های صوتی به‌خوبی انجام نمی‌شود.

به‌علاوه، این پژوهشگران روش ارزیابی دقیق‌تری را ارائه کردند. این روش حاصل تحلیل ویژگی‌های مخصوصی از صوت است که به ارزیابی قابلیت تشخیص مرتبط هستند؛ به‌عنوان مثال، بخشی‌هایی از فایل صوتی که در آن اختلال از همه بیشتر قابل‌شناسایی است. با این حال، وادیلو نتیجه گرفت: «این مشکل حل‌نشده باقی می‌ماند، زیرا دست‌ یافتن به یک معیار ریاضی که قادر به مدل‌سازی درک شنوایی باشد، بسیار دشوار است. بسته به نوع سیگنال صوتی، ممکن است معیارهای متفاوتی موردنیاز باشند یا باید عوامل متفاوتی را در نظر گرفت. دستیابی به یک معیار صوتی کلی و جامع، کاری پیچیده است.»

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]