رد پای یادگیری ماشین در بهبود ارتباط غیرکلامی در کلاسهای غیرحضوری
به عکس زیر توجه کنید. زمانی که رهبر ویولننوازان ارکستر سمفونی (ردیف اول از بالا سمت چپ) به دوربین خود نگاه میکند، تصور سایر نوازندگان بر این است که رهبر موسیقی با نگاهش آنها را زیر نظر دارد. امّا سیستم ردیاب نگاه نشان میدهد که رهبر دسته ویولن به والتر (ردیف دوم وسط) نگاه میکند؛ سپس سیستم ردیاب نشانهای با نام «والتر» بر روی محتوای ویدیویی این رهبر نمایش میدهد؛ در نتیجه تمام کلاس میدانند نگاه رهبر معطوف به چه کسی است. هر زمان که رهبر ویولن نوازان به نوازنده دیگری نگاه کند این نشانه به روز رسانی میشود؛ به این ترتیب نوعی ارتباط غیرکلامی با دستهی نوازندگان برقرار میشود.
محققان مرکز تحقیقات سرگرمی و یادگیریِ (CREL) دانشگاه کالیفرنیا، سن دیگو، به منظور ارتقاء کیفیت آموزشی کلاسهای مجازی، و به احتمال زیاد سالنهای کنسرت مجازی که در آینده شاهد آنها خواهیم بود، سیستمی طراحی کردهاند که حرکات چشم را تحلیل و ردیابی کرده و از این طریق به بهود ارتباط غیرکلامی کمک میکند.
شلومو دابنوف، استاد موسیقی و علوم کامپیوتر از دانشگاه سن دیگو، اقدام به ساخت ابزار جدیدی کرده است تا در دوران همهگیری کووید-19 با کمبودهای آموزش موسیقی به صورت مجازی مقابله کند.
این متخصص موسیقی رایانهای و مدیر کمپانی خدمات اینترنتی CREL اظهار داشت «در یک کلاس موسیقی، ارتباط غیر کلامی مانند حالتهای صورت و ژست بدن برای نگه داشتن حواس هنرآموزان به کلاس، هماهنگی جریان موسیقی، و انتقال ایدههای بداهه بسیار مهم است. متاسفانه اکنون که استاد و هنرآموز در فضای فیزیکی یکسانی قرار ندارند، جنبه غیرکلامی تدریس و یادگیری به شدت کاهش یافته است».
دابنوف و یکی از دانشجویان مقطع دکتری، راس گریِر، اخیراً در مقالهای که در یک کنفرانس ارائه نمودند سیستم جدیدی برای برای رفع این مشکل پیشنهاد کردند. این سیستم با استفاده از تکنیک ردیابی چشم و یادگیری ماشین این امکان را برای مربی فراهم میکند تا در کلاس مجازی با تک تک دانشجویان یا اجراکنندگان ارتباط غیرکلامی و چشمی برقرار کند؛ و از طرفی به دانشجو اعلام میکند که توجه مدرس به او معطوف است.
این محققان نمونه اولیه سیستم را طراحی نموده و مطالعه مقدماتی آن را در یک کلاس موسیقی در دانشگاه سن دیگو، که در نرمافزار تماس تصویری Zoom برگزار میشد، به انجام رساندند.
سیستم چگونه کار میکند؟
گیِر، دانشجوی الکترونیک و مهندسی کامپیوتر در مقطع دکتری از دانشکده مهندسی جیکوبز Jacobs School of Engineering، دانشگاه سن دیگو، در توضیحات خود درباره این سیستم میگوید «این سیستم با استفاده از یک دوربین از حرکات چشم مدرس عکس میگیرد و مسیر حرکت چشم را بر روی صفحه نمایش ردیابی میکند. بدین منظور صفحه نمایش را به 91 قسمت تقسیم کرده و سپس موقعیت چهره و چشمان مدرس را مشخص میکنیم. پس از آن، الگوریتمِ «تخمین نگاه» برآورد میکند مدرس به کدام خانه، یا به عبارتی به کدام دانشجو، نگاه میکند».
همزمان با تشخیص تغییر نگاه مدرس، الگوریتم هویت دانشجو را مشخص و نام او را بر روی صفحه نمایش تگ میکند؛ به این ترتیب همه دانشجویان میدانند حواس مدرس معطوف به چه کسی است.
دابنوف و گیر در مطالعه مقدماتی متوجه شدند که برآورد سیستم از نگاه مدرس بسیار دقیق است؛ در یک صفحه نمایش با ابعاد 5/27 x 13، سیستم نقطه درست را با سه چهارم اینچ خطا (2 سانتیمتر) شناسایی میکند. گیر در توضیحات خود به مجله New Scientist اینطور گفت که «اصولاً اگر سیستم دادههای باکیفیت کافی داشته باشد، به احتمال زیاد با صفحه نمایش کوچک نیز به خوبی کار خواهد کرد».
طبق اظهارات دابنوف یکی از ایرادهای این سیستم این است که هرچه فاصله مدرس از دوربین بیشتر باشد چشمها کوچکتر شده و ردیابی آنها دشوارتر میشود، در نتیجه دقت برآورد نگاه پایین میآید. با این حال وی معتقد است که در صورت داشتن دادههای آموزشی بهتر، بالا رفتن وضوح تصویر دوربین، و پیشرفت تکنیکهای ردیابی چهره و ژست بدن، با این سیستم، رهبر ارکستر میتواند با حرکت باتون خود از راه دور رهبری یک ارکستر سمفونیک را در دست بگیرد؛ حتی اگر نوازندگان در مکانهای مختلف قرار داشته باشند.
انواع کاربردهای هوش مصنوعی در صنایع مختلف را در هوشیو بخوانید