مقدمهای بر کاربردهای یادگیری ماشین در پزشکی
این مقاله با نمونههای عملی به بررسی کاربردهای یادگیری ماشین در پزشکی میپردازد. در همین راستا، مقدمه کوتاهی درباره یادگیری ماشین و موضوع نخستمان «رگرسیون» ارائه خواهیم کرد. لذا از پایچارم یا XCode IDE’s برای نمایش بهتر دادهها استفاده خواهد شد. پایتون بنا به دلیلی آشکار یکی از زبانهای برنامهنویسی محبوب و پرکاربرد به شمار میرود، اما در برخی سناریوها زبان سوئیفت ترجیح داده شده است. الگوریتم قطعهبندی تصویر ابزاری برای رادیولوژیستها است. ابزاری نظیر این میتواند برای اهداف متعددی استفاده شود. دقت آن حدود %92 ارزیابی شده است و میتواند در بخشهای مختلفی مورد استفاده قرار گیرد.
1. کمک به اولویتبندی موارد اضطراری و کمک به رادیولوژیستها در شناسایی سریع ضایعهها.
2. تایید تشخیص برای پیشگیری از هر نوع تشخیص اشتباه.
3. کمک به آموزش رادیولوژیستهای جدید.
هنوز راه دور و درازی پیش رویمان قرار دارد تا یک الگوریتم جایگزینِ تجارب غنیِ متخصصان ارشد رادیولوژی شود. الگوریتمهای یادگیری ماشین عملکرد بسیار خوبی در خودکارسازی برخی از کارها یا انجام تشخیص مقدماتی دارند، اما حتی اگر قرار باشد این الگوریتمها در مورد بیماران واقعی به کار برده شود، ما از آمادگی کافی برای رویارویی با آن برخوردار هستیم. این ابزارهای پیشرفته میتوانند دقت 9/99 درصدی را تضمین کنند، اما این اقدام چندین پیامد اخلاقی به همراه دارد. به این سناریو دقت کنید. تصور نمائید که الگوریتم بیماری GBM (کشندهترین و تخاصمیترین نوع تومور مغزی در بزرگسالان) را در بدن یک بیمار شناسایی میکند. تنها 10 دقیقه بعد، رادیولوژیست میگوید: «اوه، متاسفم. هوش مصنوعیِ ما عارضه را اشتباه تشخیص داده است. این بیمار تومور مغزی دارد، اما به غده پردههای مغز شباهت دارد. اگر بیمار علائم شدیدی داشته باشد، تشخیص جراحی به تنهایی کفایت میکند.» حال بیایید قدری به خود بیمار بپردازیم. بیمار در طی آن 10 دقیقه تصور میکرد که فقط 12 ماه زنده خواهد بود. شما فکر میکنید در طی آن 10 دقیقه چه فعل و انفعالاتی در مغز بیمار رخ داده است؟ چه احساسی داشته است؟ شاید آن زمانِ کم برای او اندازه یک عمر گذشته باشد. چنین خطاهایی جایز نیست و امید است تا کاربردهای یادگیری ماشین در پزشکی آنها را کاهش داده یا از بین ببرد.
پس همانطور که ملاحظه میکنید، رادیولوژیستها برای مدتی طولانی کنار ما خواهند بود. البته رادیولوژیستهایی که از هوش مصنوعی استفاده کنند، مدت زمان بیشتری در کنارمان خواهند بود. رادیولوژی به دلیل توانایی بالا در پردازش تصاویر یکی از بهترین حوزهها برای بکارگیری هوش مصنوعی به حساب میآید، اما نمونه کاربردهای متعددی در همه تخصصها (از پوستشناسی گرفته تا چشمپزشکی) یافت میشود. از این رو، کاربردهای یادگیری ماشین در پزشکی بسیار زیاد و مهم هستند. البته یکی از دشوارترین حوزهها نیز میباشد. مقاله حاضر قصد دارد به همکاران و دانشجویان پزشکی کمک کند تا یادگیری ماشین را درک کرده و یاد گیرند. بیتردید، نیازی نیست حتماً پزشک یا دانشجوی پزشکی باشید تا این مقالهها را بخوانید. چند نمونه میتواند به درک بهتر این مسائل کمک کند.
رگرسیون
این مقاله درباره کاربردهای یادگیری ماشین در پزشکی است؛ اما بگذارید همین اول کار شفافسازی کنیم. رگرسیون چیست؟ چرا به آن نیاز داریم؟ چطور باید از آن استفاده کرد؟ در سادهترین حالت، میتوان رگرسیون را به عنوان فرایند حذف رابطه میان یک متغیر وابسته و یک یا چند متغیر مستقل تعریف کرد. حال، بیایید این موضوع را با یک مثال حقیقی توضیح دهیم.
بازیافت ضربان قلب
میخواهیم نخستین عبارت پزشکیمان را در این بخش به کار ببریم. بازیافت ضربان قلب به کاهش ضربان قلب در یک دقیقه پس از توقف فعالیت اشاره میکند. این شاخص نشان میدهد که فرد از سلامت قلبی و عروقی برخوردار است. بنابراین، تحقیقات زیادی درباره این موضوع انجام شده و کماکان نیز ادامه دارد. ما یک آزمایش ECG بر روی بیمار انجام میدهیم و بر تغییرات ضربان قلب یک دقیقه پس از پایان آزمایش نظارت میکنیم. سپس، بازیافت ضربان قلب بیمار را مقایسه میکنیم. انتظار داریم ضربان بیمار در بازه زمانی معینی به وضعیت آرامش بازگردد. بر اساس میانگین ضربان قلب و مقادیر ضربان مشاهده شده در طول آزمایش، میدانیم که ضربان بیمار در طول 1 دقیقه چه شرایطی را تجربه خواهد کرد. مقدار نرخ بازیافت اندازهگیری شده همسو با این پارامترها بوده و شاخص مهمی برای سلامت قلب بیمار میباشد. مقاله منتشر شده در مجله «انجمن سلامت آمریکا» به ارزیابی بازیافت ضربان قلب پرداخته است.
محققان در یکی از مطالعات خود به بررسی مقدار بازیافت ضربان قلب در 10، 20، 30، 40 و 50 ثانیه پس از توقف ورزش پرداختند. سن میانگین شرکتکنندگان مطالعه 56 نفر بود و %45 آنان مذکر بودند. در طی دوره پیگیری 6 ساله، 536 نفر از شرکتکنندگان فوت کردند (39 نفر از فوتیها از بیماری قلبی عروقی رنج میبردند). محققان پس از تحلیلهای چندمتغیری، بررسی ظرفیت تمرینهای هوازی؛ عوامل ریسک قلبی عروقی و عوامل مرتبط با مرگ توانستند بازیافت ضربان قلب در 10 ثانیه را به عنوان نشانهای برای پیشبینی عوامل مرگ و میر بیماریهای قلبی عروقی شناسایی کنند. بر اساس یافتههای این مطالعه، اثرات بازیافت ضربان قلب در زمانی که بلافاصله پس از توقف ورزش اندازه گرفته شد، بسیار چشمگیر و معنادار بودند. علاوه بر این، ارتباط تغییر ضربان قلب بین 10 ثانیه الی 1 دقیقه پس از توقف با میزان مرگ و میر به بازیافت ضربان قلب در 10 ثانیه بستگی داشت. آنطور که در این مثال ملاحظه میکنید، رابطهای میان تغییر ضربان قلب و سایر پارامترهای موجود در این سناریو وجود دارد. محققان از تحلیل رگرسیون برای شناسایی آن روابط استفاده کردند. افزون بر این، آنان متغیرهای مرتبط را شناسایی کرده و تمرکزشان را بر موثرترین متغیرها معطوف کردند.
دلیل استفاده از رگرسیون چیست؟
در ادامه بحث درباره کاربردهای یادگیری ماشین در پزشکی باید به دلیل استفاده از رگرسیون اشاره کنیم. استفاده از تحلیل رگرسیون دو دلیل دارد: پیشبینیِ مقدار یا بررسی رابطه عِلّی میان متغیرهای متغیرهای وابسته و مستقل. پیش از توضیح متغیرهای وابسته و مستقل، باید تفاوت میان پیشبینی و ارزیابی پیامدها را شفافسازی کنیم. پیشبینی در علم آمار به اظهارنظر درباره رویدادهای آتی اشاره میکند. این پیشبینیها غالباً (نه همیشه) بر پایهی تجربه یا دانش قرار دارند. تخمین رویدادها یا پیامدها به انجام پیشبینی بر اساس دادههای گذشته و حال اطلاق میشود و عمدتاً با تحلیل روندهای موجود صورت میگیرد. در یادگیری ماشین، این واژگان به جای یکدیگر نیز استفاده میشوند. تا بدینجای کار درباره تحلیل رگرسیون صحبت کردیم، اما هنوز متغیرهای وابسته و مستقل را توضیح ندادهایم. فرض کنید قصد داریم آزمایشی را بر روی عدهای از بیماران انجام دهیم که عمل جراحی مغز و اعصاب دارند. آزمایشکننده، متغیر مستقل را دستکاری یا تغییر میدهد. احتمال میرود این اقدام به طور مستقیم بر متغیر وابسته تاثیر بگذارد. برای نمونه، شرکتکنندگان را در دو گروه دارو یا دارونما (متغیر مستقل) دستهبندی میکنیم تا تغییر شدت اضطرابشان (متغیر وابسته) را اندازه بگیریم.
متغیر وابسته در آزمایش اندازه گرفته میشود و به متغیر مستقل بستگی دارد. علائم افسردگی، نمونهای از متغیر وابسته به شمار میرود که به متغیر مستقل بستگی دارد (یعنی درمان). پیش از اینکه لیستی از مدلهای رگرسیون تهیه کنید، بیایید موضوع دیگری را شفافسازی کنیم. چند مدل رگرسیون خطی و غیرخطی وجود دارد. رگرسیون خطی ساده به یک متغیر خطی نیاز دارد. مدل زمانی خطی است که هر کدام از عبارات یا ثابت باشند یا محصولی از یک پارامتر یا متغیر پیشبینی باشند. معادله خطی با جمع بستن نتایج هر عبارت ساخته میشود. لذا، معادله فقط یک شکل پایه به خود میگیرد:
در علم آمار، معادله رگرسیون (یا تابع) زمانی خطی است که در پارامترها خطی باشد. گفتیم که معادله باید در پارامترها خطی باشد، اما میتوانید متغیرهای پیشبینی را به نحوی تغییر دهید که انحنا ایجاد شود. برای نمونه، میتوانید از یک متغیر مربعی برای ایجاد منحنی U شکل استفاده نمائید. این مدل کماکان در پارامترها خطی است، اگرچه متغیر پیشبینی مربعی است. میتوانید از فرمهای تابعی معکوس و لگاریتم برای ایجاد منحنیهای مختلف استفاده کنید. در زیر، نمونهای از مدل رگرسیون خطی را مشاهده میکنید که از یک عبارت مربعی برای تطابق رابطه منحنی میان شاخص توده بدنی و درصد چربی بدن استفاده کرده است.
اگرچه معادله خطی یک شکل اصلی دارد، اما معادلات غیرخطی میتوانند به اَشکال مختلفی درآیند. آسانترین راه برای تعیین اینکه معادله غیرخطی است یا خیر، تمرکز بر خود عبارت «غیرخطی» است. اگر معادله با معیارهای تعریف شده در اسلاید قبلی سازگار نباشد، خطی نیست. این عامل به شکلهای مختلفی بیان میشود و به همین دلیل است که رگرسیون غیرخطی دارای انعطافپذیرترین کارکرد در مواجهه با منحنی است. مدلهای رگرسیون متعددی وجود دارد. اما مقاله حاضر به متداولترین مدلها اشاره کرده است.
• رگرسیون خطی ساده
• رگرسیون خطی چندگانه
• رگرسیون چنداسمی
• بردار پشتیبان برای رگرسیون
• طبقهبندی درخت تصمیم
• طبقهبندی جنگل تصادفی