تشخیص سیگنالهای زیستی و عواطف انسانی به کمک هوش مصنوعی
پژوهشهای بنیادی که حول موضوع یادگیری خودکار Autonomous learning انجام میشوند میتوانند به همه، یا دست کم بیشتر مسائل بینایی کامپیوتر کمک کنند. یادگیری خودکار میتواند نقشی مؤثر در طراحی خودکار شبکههای عصبی بافتآگاه Contextual-aware neural network داشته باشد. این داده ها در عملیاتهای مختلف بینایی کامپیوتر کاربرد دارند. یکی از مباحث مهم تشخیص سیگنالهای به کمک هوش مصنوعی است.
پروفسور گویینگ ژاوGuoying Zhao و چاوبی لی Xiaobi Li معتقدند: «ارتباطات بدونسیم و بینایی کامپیوتر تا کنون متکی بر سیگنالهای گوناگون بودهاند؛ با این حال، با استفاده از یادگیری ماشین میتوان مسائل مختلف، همچون بهینهسازی یا خودکارسازی فرآیندها را ارتقاء داده و تعامل انسانها (با ماشینها) را آسانتر کرد.»
این متخصصان در حوزهی «هوش مصنوعی (تشخیص) عواطف» فعالیت دارند؛ هوش مصنوعی (تشخیص) عواطف مسائلی از قبیل تشخیص و تحلیل حالات (و حالات ریز Micro-gesture ) چهره، حالات عاطفی و عواطف غیرمعمول را در برمیگیرد. این علم به درک عواطف و تسهیل خدمات آموزشی، رواندرمانی، خدمات از راه دور و رانندگی خودکار، کمک میکند.
ژاو و لی در ادامه میگویند: «تحلیل حالات ریز چهره برای درک عواطف مخفی یا سرکوبشدهی افراد اهمیت بالایی دارد. در همین راستا، واحدهای عمل Action unit (AU) چهره را میتوان کوچکترین مؤلفهی حرکات چهرهای دانست.» تحلیل و تشخیص حالات بدن و حالات ریز نیز در شناسایی وضعیت عاطفی افراد نقش مهمی ایفا میکنند. به منظور ساخت سیستمی جامع که توانایی درک عواطف را داشته باشد، باید این اطلاعات که از کانالهای مختلف به دست میآیند را مورد بررسی قرار داد.
هدف این تیم پژوهشی کمک به درک عواطفی است که در دستهبندیهای معمول (شادی، غم، عصبانیت و …) جای نمیگیرند، اما در زندگی روزمره و سناریوهای واقعی، رایج و ضروری هستند. با توجه به گفتههای لی، از جملهی این عواطف غیرمعمول میتوان به کسالت، سردرگمی، علاقهمندی، شرم، اضطراب و اطمینان اشاره کرد.
راهکاری برای خودپایشی و غربال بیماریها در مراحل اولیه
خودپایشی کارکرد قلب و غربال بیماریها در مراحل اولیه از جمله خدمات درمانی از راه دوری هستند که میتوانند از ظرفیت ابزارهای اندازهگیری سیگنالهای فیزیولوژیک استفاده کنند. این ابزارها که برای اندازهگیری ضربان قلب، تغییرات ضربان قلب و نرخ تنفس، ضروری هستند، قابلیت این را دارند که هزینههای حوزهی بهداشت و درمان را به میزان چشمگیری کاهش دهند. به عنوان یک نمونه از کاربرد این ابزارها میتوان به تشخیص از راه دور فیبریلاسیون دهلیزی Atrial fibrillation اشاره کرد که تنها بر اساس تجزیه و تحلیل ویدئویی که از چهره گرفته شده و به کمک متخصصان قلب بیمارستان University، انجام میگیرد.
متخصصان سعی دارند به کمک فناوریهای پیشرفتهی بینایی کامپیوتر و یادگیری ماشین به چالشهایی از این دست پاسخ دهند: هنگام استفاده از تصاویر ویدئویی چهرهها به منظور اندازهگیری ضربان قلب، چطور میتوان تأثیر جنبش افراد و نورپردازیهای مختلف را کنترل کرد؟ چطور میتوان مشکل شدت کم را مدیریت کرده و دقت تشخیص حالات ریز را ارتقاء داد؟ چطور میتوان مشکل دادههای ناکافی و نامتوازن برای انجام تحلیل حالات ریز را حل کرد؟
یکی دیگر از موضوعاتی که توسط این تیم پژوهشی مورد بررسی قرار گرفته «یادگیری و ارتقای (داده) چندحالته Multimodal learning and fusion» است. در عمل، ارتقای چندحالته را میتوان در چندین سطح انجام داد:
- در سطح سنسورها: دادهها توسط چندین سنسور (RGB، طیفسنج مادون قرمز نزدیک NIR ، دوربینهای عمقسنج یا چهاربُعدی و سنسورهای زیستی Bio-sensor ) ثبت میشوند؛
- در سطح ویژگی: ثبت سرنخهای گوناگون (همچون عمق، بافت، چهره از چندین نما و …) بر اساس ویژگیها؛
- در سطح تصمیمگیری: ردهبندی ماژولهای مختلف و رأیگیری مشارکتی از آنها.
ادغام دوربین با انواع سنسورها
ژاو معتقد است: «به کمک اینترنت 6G و اینترنت اشیاء Internet of Things میتوانیم دوربینها را با انواع سنسورها ادغام کرده و بدین ترتیب به یادگیری و ارتقای توزیعشده دست یابیم؛ از این فناوری میتوان برای تضمین ایمنی در رانندگی یا پایش خانگی استفاده کرد. علاوه بر این، با ترکیب ارتقای (داده) چندحالته و یادگیری خودکار میتوان به راهکارهای قویتر و کارآمدتر یادگیری ماشین دست یافت. این راهکارها در حوزههای گوناگون و به اشکال مختلف به کار میروند که از جملهی آنها میتوان به نرمافزارها، سرویسها یا محصولات هوشمند مجهز به هوش عاطفی و خودیادگیری اشاره کرد.»
تشخیص بیماری بر اساس فناوری بینایی کامپیوتر
افزودن قابلیتهای مبتنی بر بینایی کامپیوتر به دستگاههای ارتباطی و مجهز به تماس ویدئویی، در حال حاضر و در آینده، کمک شایانی به حوزهی تشخیصگذاری خواهد کرد؛ این فناوری در همهی راهبردهای از راه دور فناوری سلامت (پزشکی) کاربرد دارد.
پرفسور میگل بوردالو لوپز Miguel Bordallo Lopez خدمات درمانی مجهز به هوش مصنوعی را با قابلیتهای لحظهای بینایی کامپیوتر و تجزیه و تحلیل سیگنال ادغام میکند. به گفتهی او: «پژوهش ما میتواند برای عرصههایی که تا کنون به صورت مشترک مورد مطالعه قرار نگرفتهاند (همچون بهداشت و درمان عمومی و دیجیتالی، بینایی کامپیوتر، محاسبات و معماریهای ارتباطی) کاربردها و روشهایی جدید ارائه دهد.»
هدف وی از انجام این پژوهشها این است که با تکیه بر بینایی کامپیوتر، راهکارهای نوینی برای عملیات تشخیص بیماری در حوزهی بهداشت و درمان عرضه کند. بدین ترتیب میتوان از کاربردهای عملی فناوری بهرهمند شد و نحوهی اجرای خدمات پزشکی و درمانی را متحول کرد.
برودالو لوپز اشاره میکند: «تشخیص بیماری به کمک دوربین (تصاویر ویدئویی) از موضوعات جذاب و نوظهور به شمار میرود؛ این فناوری جایگزینی برای راهکارهای قدیمی بهداشت و درمان عمومی است و امکان انجام از راه دور آنها را فراهم میکند. پس میتوان گفت برتری آن نسبت به روشهای قدیمی این است که مراجعهی حضوری افراد به مراکز بهداشت را ملزم نمیکند و علاوه بر این، امکان پایش مداوم را نیز میسر میسازد. بینایی کامپیوتر و هوش مصنوعی میتوانند از راه دور، با استفاده از دادههای ویدئویی موبایل، به صورت عینی و بدون مزاحمت برای بیمار، در مورد شرایط او اطلاعاتی فراهم آورند.»
تشخیص وضعیت پزشکی به کمک روشهای بینایی کامپیوتر
برای مثال، به کمک روشهای بینایی کامپیوتر و بر اساس تصاویر چهره، میتوان بیش از 30 نشانه یا شرایطی که به وضعیت پزشکی فرد مربوط هستند را تشخیص داد یا دست کم به صورت عینی ارزیابی کرد. علاوه بر این، تحلیل انواع دیگر سیگنالها مثل سیگنالهای رادیویی (همچون سیگنالهایی که در ارتباطات 5G و 6G به کار میروند) منابع اطلاعات خوبی به شمار میروند که بر خلاف منابع قبلی، به حفظ حریم خصوصی افراد احترام میگذارند.
برودالو لوپز خاطرنشان میکند: «روشهای تشخیص بیماری و درمانی بسیاری معرفی شدهاند که از بینایی کامپیوتر پیشرفته بهره میبرند؛ با این حال، ظرفیتی که به عنوان راهکارهای از راه دور یا تعبیهشده در موقعیتهای واقعی دارند، هنوز محقق نشده است. دلیل اصلی این مسئله را میتوان چالشهای اجرایی دانست که به توضیحپذیری، محاسبات لحظهای، قابلیتهای ارتباطی، و هزینهها مربوط میشوند.»
چالشهای اجرایی استفاده از دستگاههای توزیعشده و تعبیهشدهی 5G و 6G
چالش واقعی این است که بفهمیم چطور میتوان با استفاده از بینایی کامپیوتر و بر اساس دستگاههای مجهز به دوربین (مثل گوشیهای همراه، یا ارتباطات ویدئویی از راه دور همچون سرویسهای ویدئوکنفرانس) که قابلیت برقراری ارتباط دارند، امکان تشخیصگذاری پزشکی را فراهم کرد.
طبق گفتههای بوردالو لوپز: «یکی از مشکلات پیش رو مربوط به استفاده از سیگنالهای رادیویی است که دستگاههای 5G و 6G (برای برقراری ارتباط و احساس) تولید میکنند. این کار با هدف کسب داده در مورد موقعیت مکانی، فعالیت و سیگنالهای زیستی (همچون علائم حیاتی) بیمار انجام میشود و سعی دارد حریم خصوصی بیمار را حفظ کرده و برای او مزاحمتی ایجاد نکند. در این صورت است که میتوان سیستمهای مشارکتی که با سایر دستگاهها ادغام شدهاند را در طیف گستردهای از مسائل و موقعیتها به کار برد.»
قابلیت اجرای این روشها اساساً به دستگاههای توزیعشده و تعبیهشدهای بستگی دارد که باید با حداقل تأخیر ممکن و به صورت بسیار کارآمد، حجم بالایی از داده را منتقل و پردازش کنند؛ این موضوع، اصلیترین چالش پژوهشهای 6G به شمار میرود. از سوی دیگر، کارآیی این راهکارها به دادههای ناهمگنی که از منابع مختلف به دست آمدهاند و باید به صورت لحظهای با هم ترکیب شوند، نیز بستگی دارد.
شناخت دنیای واقعی و ویژگیهای برجسته دستگاهها
برای امکانپذیر شدن راهکارهای مذکور لازم است چالشهای دنیای واقعی و ویژگیهای برجستهی دستگاهها را شناخته و بپذیریم.
بوردالو لوپز و همکارانش
بوردالو لوپز و همکارانش برای استخراج و ردهبندی سیگنالهای زیستی (مثل نرخ تنفس یا نبض) و نشانههای خطرناک تنفسی یا گردش خون (chest indrawing, asymmetries) از تصاویر ویدئویی استفاده میکنند؛ ویدئوهای به کار رفته همان فیلمهای معمولی هستند که توسط دستگاههای دستی یا سرویسهای ویدئوکنفرانسی از راه دور ضبط میشوند. این راهکار مقرون به صرفه است و میتواند تأثیرگذاری گسترده و جهانی داشته باشد.
بوردالو لوپز توضیح میدهد: «سعی داریم برنامههای خودپایشی مبتنی بر ویدئو برای دستگاههای موبایل طراحی کنیم که بتوانند سکته را از پیش، حتی قبل از مراجعه به بیمارستان، تشخیص دهند. علاوه بر این، قصد داریم تحلیل لحظهای تصاویر ویدئویی روی دستگاههای موبایل را ارتقاء دهیم تا قابلیت کاربرد در مناطق دورافتاده و کشورهای کمدرآمد نیز وجود داشته باشد. بدین ترتیب میتوان به تشخیصگذاری بیماریهایی همچون ذاتالریه در کودکان در بستر خود بیمار کمک کرد.»
دانشگاه Oulu
در دانشگاه Oulu، بیش از 200 پژوهشگر مشغول کار روی موضوعات پژوهشی گوناگون هوش مصنوعی میباشند. مرکز بینایی کامپیوتر و تحلیل سیگنال Center for Machine Vision and Signal Analysis (CMVS) رویکردی شبیه به اولین گروه پژوهشی هوش مصنوعی، یعنی «گروه بینایی کامپیتر Machine Vision Group»، دارد که در اوایل سال 1981 تأسیس شد. بنابراین میتوان گفت که این پژوهشها سابقهای دیرینه (پیشینهای قوی) دارند.
بخش تحقیق و توسعه (R&D) هوش مصنوعی دانشگاه Oulu بازهای گسترده از انواع موضوعات را پوشش میدهد: بینایی کامپیوتر، هوش مصنوعی عواطف Emotion AI ، یادگیری ماشینی، رباتیک، محاسبات لبه، Edge computing و کاربردهای هوش مصنوعی در حوزهی پزشکی، صنعتی و جوی.
الی سیلون
الی سیلون Olli Silven، رئیس واحد پژوهشی CMVS میگوید: «در طول چندین سال، شرکتهای زیادی در عرصهی هوش مصنوعی شروع به کار کردهاند. تخصص و دانش دیرینهی تیم ما نیز در کنار همهی این شرکتها به رشد و توسعهی فناوری 6G کمک خواهد کرد.»