پیشبینی بهتر کووید 19 به کمک یادگیری ماشین
طی دوران همهگیری کووید 19، نرخ بهشدت متغیر ابتلا به این بیماری امر پیشبینی را برای مدلهای همهگیرشناسی دشوار کرده است. در پژوهش جدیدی که بهوسیله ریاضیدانان دانشگاه براون انجام شده است، از یک روش پیشرفته یادگیری ماشین برای بررسی نقاط ضعف و قوت مدلهای رایج استفاده شده و راههایی برای افزایش قدرت پیشبینی آنها ارائه شده است.
جرج کارنیاداکیس، استاد ریاضیات کاربردی و مهندسی دانشگاه براون و نویسنده ارشد این پژوهش که در مجله Nature Computational Science به چاپ رسیده است، بیان کرد: «مثلی قدیمی در حوزه مدلسازی وجود دارد که میگوید «تمام مدلها اشتباه هستند، اما بعضی از آنها سودمندند»؛ در این پژوهش، نشان دادهایم که مدلهای اصلی کووید 19 خطا داشتند یا حداقل در زمینه پیشبینی روند همهگیری، مفید نبودند. در بسیاری از موارد هم عملکرد آنها، نوشدارو پس از مرگ سهراب بود و پیشبینیهای دقیق زیادی وجود نداشت.»
بررسی 9 مدل
گروه پژوهشی، برای پیدا کردن علت این مشکل، 9 مدل برجسته کووید 19 را که همگی نوعی از مدل «آسیبپذیر- آلوده- حذفشده» یا SIR بودند، بررسی کرد. این مدلها، جمعیت را به سه دسته تقسیم میکنند: کسانی که هنوز آلوده نشدهاند، (آسیبپذیر)، کسانی که آلوده شدهاند و میتوانند ویروس را به دیگران سرایت دهند (آلوده) و کسانی که آلوده بودهاند و دیگر نمیتوانند ویروس را سرایت دهند (حذفشده). نسخههای پیچیدهتر مدل SIR گروههای دیگری را هم در بر میگیرند، از جمله نرخ قرنطینه، افراد بستریشده، نرخ مرگومیر و مقادیر دیگری را که بر انتشار ویروس تأثیر میگذارند نیز ثبت میکنند.
[irp posts=”18729″]عوامل متعددی بر جابهجایی افراد بین گروهها، اثر میگذارند. برای مثال، جابهجایی از گروه «آسیبپذیر» به «آلوده»، بستگی به این دارد که قدرت سرایت ویروس از فردی به فرد دیگر چقدر است و افراد به چه میزان با هم تماس نزدیک دارند. بسیاری از این عوامل را نمیتوان مستقیماً مشاهده کرد و بنابراین، مدلها باید مقادیر آنها را از روی دادههای موجود، استنباط کنند. در مدلسازی، به این عوامل «پارامتر» گفته میشود.
بر اساس یافتههای این پژوهش، علت اصلی شکست مدلهای کووید 19 این بود که بهرغم تغییرات چشمگیر پارامترهای کلیدی، این مدلها آنها را در طول زمان، ثابت فرض میکردند. بهعنوان مثال، نرخ سرایت ویروس در به عوامل فراوانی از جمله استفاده از ماسک، تعطیلی و بازگشایی مشاغل و دیگر شاخصها، بستگی دارد. نرخ بستری نیز بسته به تعداد تختهای بیمارستانی موجود، تغییر میکرد. درمانهای جدید هم بر نرخ مرگومیر تأثیر میگذاشتند. پژوهشگران دریافتند با اینکه عوامل تأثیرگذار بر نرخ ابتلا به بیماری و مرگومیر پیوسته در حال تغییر هستند، مدلها آنها را ثابت در نظر میگیرند و همین امر، موجب عملکرد ضعیف آنها در امر پیشبینی شد.
ثبت پارامترهای متغیر
پرسش بعدی این بود که آیا راهی برای ثبت این پارامترهای متغیر در مدلهای همهگیرشناسی وجود دارد؟ پژوهشگران برای پاسخ به این پرسش، از شبکههای عصبی مبتنی بر فیزیک (PINNs) استفاده کردند. این روش یادگیری ماشین را کارنیاداکیس و همکارانش در دانشگاه براون، توسعه دادهاند. PINNها، شبکههایی عصبی، مشابه شبکههای بهکاررفته برای تشخیص تصویر و یا تبدیل گفتار به متن هستند؛ اما PINNها، برخلاف شبکههای عصبی استاندارد، مجهز به معادلههایی هستند که قوانین فیزیکی حاکم بر سیستمها توصیف میکنند. کارنیاداکیس و گروهش، ابتدا با استفاده از PINNها و بر اساس تصاویر و ویدئوها، سرعت و فشار جریانهای سیال را استخراج کردند. در آن موارد، PINNها مجهز به معادلههای مربوط به دینامیک سیالات بودند. محققان PINNهای بهکاررفته در این پژوهش را به معادلات مربوط به نحوه انتشار عوامل بیماریزا مجهز کردند.
[irp posts=”21096″]احسان خوارزمی، پژوهشگر مدعو دانشگاه براون و از نویسندگان این مقاله گفت: «از آنجایی که همهگیریها در طول زمان تغییر میکنند، دادهها باید به صورت پیوسته جمعآوری شوند. به همین دلیل، شبکههای PINN را میتوان با هر بار جمعآوری داده جدید دوباره آموزش داد و بر اساس پارامترهای استخراجشده، بهروزرسانی کرد. آموزش مجدد PINNها روی دادههای جدید نسبت به سرعت روند تکامل همهگیری، کوتاه است.»
دادههای واقعی
پژوهشگران مدلهای مجهز به PINN را با دادههای واقعی (از نیویورک، ایالتهای رودآیلند و میشیگان و ایتالیا) جمعآوری تغذیه کردند و به آنها اجازه دادند که مقادیر پارامترهای کلیدی را در طول زمان، استنباط کند. همچنین PINNها قادر بودند عدماطمینان موجود در پارامترهای استنباطشده را کمیسازی کنند. سپس پژوهشگران از مدلهای مبتنی بر PINN برای پیشبینی آینده استفاده کردند. در ژانویه 2021، بر اساس پارامترهای منطبق با زمان، شرایط شش ماه آینده را پیشبینی کردند. با مقایسه این نرخ پیشبینیشده با نرخ واقعی مشخص شد که نرخ موارد ابتلا در بازه زمانی مذکور در بازه عدماطمینان پیشبینیهای مدل قرار میگیرد. این امر در خصوص هر چهار دیتاست استفادهشده در پژوهش، صادق بود.
[irp posts=”21042″]به بیان کلی، یافتهها نشان دادند با اینکه هیچ مدلی نمیتواند همه تغییرات رخداده در دوران همهگیریهای طولانیمدت را ثبت کند، مدلهایی که تغییرات پارامترهای کلیدی را در نظر میگیرند، موفقتر عمل میکنند.
به گفته خوارزمی، با تغییر و دستکاری پارامترهای مدل میتوان پیشبینی PINNها را برای ارزیابی روندهای احتمالی در آینده به کار برد. اطلاعات بهدستآمده در تدوین سیاستهای جدید یا تغییر سیاستگذاریهای موجود مفید هستند.
انواع کاربردهای هوش مصنوعی در صنایع مختلف را در هوشیو بخوانید