کاربرد هوش مصنوعی در درمان و پزشکی میتواند عادلانهتر باشد
در چند سال گذشته، تحقیقات نشان داده است که کاربرد هوش مصنوعی در درمان و یادگیری عمیق میتواند همگام با متخصصان در کارهای مربوط به تصویربرداری پزشکی همچون تشخیص زودهنگام سرطان و تشخیص بیماریهای چشم عمل کند. اما یک دلیل برای احتیاط بیشتر در این زمینه وجود دارد. تحقیقات دیگر نشان داده است که یادگیری میتواند به سمت ایجاد تبعیض متمایل شود. در یک سیستم مراقبت بهداشتی که پیش از این نیز ناهمگونیهایی را تجربه کرده است، برخی از برنامههای مبتنی بر یادگیری عمیق میتوانند این وضعیت را بدتر کنند.
در حال حاضر مقاله جدید منتشر شده در Nature Medicine راهی برای توسعه الگوریتمهای پزشکی پیشنهاد میکند که ممکن است به جای تشدید نابرابریهای موجود، کمک کند تا این روند برعکس شود. زیاد ابراهیمیر، دانشیار دانشگاه UC برکلی که ناظر این تحقیق بود میگوید مهم این است که آموزش الگوریتمها را به منظور تطابق با عملکرد یک متخصص انسانی متوقف کنیم.
در این مقاله یک نمونه بالینی خاص از ناهمگونی که در درمان آرتروز زانو وجود دارد بررسی شد. آرتروز زانو یک بیماری است که باعث درد مزمن میشود. ارزیابی شدت این درد به پزشکان کمک میکند تا یک درمان صحیح شامل فیزیوتراپی، دارو یا جراحی را تجویز کنند. این کار به طور سنتی توسط یک رادیولوژیست انجام میشود که یک رادیوگرافی از زانوی بیمار را بررسی میکند و سطح درد را بر اساس وجود ویژگیهای مختلف همچون ساییدگی غضروف براساس مقیاس Kellgren – Lawrence (KLG ارزیابی میکند.
اطلاعات گردآوری شده توسط انستیتوی ملی بهداشت نشان داد که پزشکان وقتی از کاربرد هوش مصنوعی در درمان استفاده میکنند، شدت درد بیماران سیاهپوست را بسیار کمتر آنچه که خودشان میگویند درجهبندی میکنند. یک فرم خوداظهاری وجود داردکه بیماران میتوانند با استفاده از آن سطح درد خود را در طی برخی فعالیتهای مختلف از جمله صاف کردن کامل زانو گزارش کنند. اما مساله این بود که رادیولوژیستها هنگام درجهبندی با استفاده از شاخص KLG و سپس ارائه درمان، این خوداظهاری را نادیده میگرفتند. به عبارت دیگر، بیماران سیاهپوستی بودند که در مقیاسبندی آنها نمرهای مساوی با بیماران سفیدپوست در ساییدگی غضروف داشتند اما درد بیشتری را گزارش کرده بودند. این نشان میدهد که رادیولوژیستها درد بیماران سیاهپوست را کمتر ارزیابی میکردند.
یک فرضیه میگوید که بیماران سیاهپوست سطح بالاتری از درد را گزارش میکنند تا پزشکان را وادار کنند که درمان جدیتری برای آنان تجویز کنند. اما یک فرضیه جایگزین نیز وجود دارد. برخی معتقدند اساسا روش KLG خود میتواند سوگیرانه باشد. در واقع این روش چندین دهه پیش و بر اساس جمعیت سفیدپوستان انگلیس ساخته شد. برخی از متخصصان پزشکی استدلال میکنند که شاخصهای فعلی رادیوگرافی که پزشکان به آنها استناد میکنند ، ممکن است برای جمعیتهای دیگر کارایی نداشته باشد. به عبارت دیگر، ممکن است یک شاخص درد وجود داشته باشد که بیشتر در سیاهپوستان ظاهر شود و این شاخص در روش KLG نادیده گرفته شود.
محققان برای آزمایش این فرضیه یک مدل یادگیری عمیق را برای پیشبینی میزان درد گزارش شده توسط خود بیمار از اشعه ایکس زانو آموزش دادند. اگر این مدل از دقت کمی برخوردار باشد، این نشان میدهد که درد اظهارشده خیلی مبتنی بر واقعیت نیست. اما اگر مدل از دقت بسیار خوبی برخوردار بود، شاهدی است بر این مدعا که که درد اظهارشده در واقع با نشانگرهای رادیوگرافی در اشعه ایکس ارتباط دارد. در نهایت محققان دریافتند که پس از چندین آزمایش و از بین بردن عوامل مخدوش کننده، پیش بینی سطح درد گزارش شده برای بیماران سفیدپوست و سیاهپوست، به ویژه برای بیماران سیاهپوست، بسیار دقیقتر از KLG است. درواقع این مساله فرضیه دوم را تایید کرد.
با این که این این روش موفقیت آمیز بود اما لزوماً هدف این نیست که از این الگوریتم در یک محیط بالینی استفاده شود. اما عملکرد بهتر این الگوریتم نسبت به روش KLG ، مشخص کرد که روش استاندارد اندازهگیری درد برای سیاه پوستان آنچنان دقیق نیست. این کشف میتواند منجر به این شود که جامعه پزشکی در نشانگرهای رادیوگرافی تجدیدنظر کنند و روش امتیازدهی آنها را به روز کنند.
اوبرمایر می گوید: این در واقع یک قسمت مهیج است که به ما نشان میدهد که این نوع الگوریتمها میتوانند در روند تشخیص پزشکی جای خود را پیدا کنند. این کشف به ما میگوید چیزهایی وجود دارد که که ممکن است متوجه آنها نباشیم و بسیار ارزشمند است اگر آنها را کشف کنیم. این روش با کاربرد هوش مصنوعی در درمان راهی نوین را پیش پای انسانها میگذارد تا با استفاده از این الگوریتمها به عنوان ابزار سعی کند بفهمد چه چیزی در جریان است.
ایرنه چن، محقق دانشگاه MIT میگوید که نکته جالب در مورد این مقاله دیدن و تفکر در مورد مسائل از منظری کاملاً متفاوت است. ایرنه چن در مورد اینکه چگونه میتوان نابرابریهای موجود در سیستم مراقبتهای بهداشتی را در یادگیری ماشین کاهش داد مطالعه میکند و البته خود او در این مقاله شرکت نداشت. وی میگوید: به جای آموزش الگوریتمهای جاافتاده، محققان تصمیم گرفتند ارزیابی خود بیمار را به عنوان یک حقیقت تلقی کنند.
اوبرمایر میگوید این دقیقاً یک چیز اسرارآمیز بود. او میگوید اگر الگوریتمها همیشه برای مطابقت با عملکرد متخصص آموزش ببینند، آنها به راحتی شکافها و نابرابریهای موجود را تداوم میبخشند. این مطالعه یک نگاه اجمالی به روندی کلیتر است که به طور فزایندهای قادر به استفاده از آن در پزشکینوین خواهیم بود.