دیتاست در حوزه­‌ی بهداشت و درمان
دیتاست

معرفی ۱۵ دیتاست در حوزه­ بهداشت و درمان

0
زمان مطالعه: ۴ دقیقه

ورود یادگیری ماشین به حوزه­‌ی بهداشت و درمان توجه زیادی را به خود جلب کرده است. همه ­‌جا صحبت از این است که یادگیری ماشینی (ML) چطور موجب تحول و انقلاب در زمینه‌­های گوناگون شده است. به لطف قدرت یادگیری و پردازش ماشین‌ها، حوزه‌­ی مراقبت­‌های بهداشتی و درمانی از آن زمینه­‌هایی است که سرعت این تحول در آن به طرز چشمگیری بالاست. یافتن شغل در حوزه­‌ی بهداشت و درمان به عنوان متخصص این رشته (یادگیری ماشینی) احتمال بالایی دارد. در این مقاله قصد داریم به معرفی ۱۵ دیتاست در حوزه­ بهداشت و درمان بپردازیم.

 بهداشت عمومی و جمعی

WHO (سازمان بهداشت جهانی): این سازمان بر اساس اولویت­‌های حال حاضر حوزه‌­ی سلامت در دنیا، داده‌­های دیتاست را فراهم می­‌کند. سازمان بهداشت جهانی امکان جستجوی آسان را برای مخاطبان خود به وجود آورده و علاوه بر داده­‌هایی که در اختیار می‌­گذارد، بینش خوبی نیز در مورد موضوعات گوناگون به دست می‌­دهد.

CDC (مرکز کنترل و پیشگیری بیماری): در این مرکز بهداشتی درمانی صرفاً داده‌های ایالات متحده قابل دسترس می‌­باشد. مرکز CDC از داده‌­های دیتاست WONDER Wide-ranging Online Data for Epidemiological Research  (داده‌­ی آنلاین گسترده برای پژوهش‌­های شیوع‌­شناسی) استفاده می‌­کند. قابلیت جستجو براساس موضوع، ایالت و عوامل دیگر در میان داده­‌های این دیتاست وجود دارد.

Data.gov: داده­‌های حوزه­‌ی بهداشت و درمان را در برمی­‌گیرد، قابلیت جستجو داشته و مختص ایالات متحده است. داده‌­های این دیتاست به منظور بهبود زندگی افرادی تنظیم شده‌­اند که در ایالات متحده زندگی می‌­کنند؛ با این­ حال اطلاعاتی که فراهم می­‌آورد برای دیتاست­‌های آموزشی دیگر که در حوزه‌­ی تحقیقات یا سایر حوزه‌­های بهداشت و درمان تعریف می‌شوند نیز مفید خواهد بود.

پژوهش­‌های علمی

Re3Data: این دیتاست در حوزه­ بهداشت و درمان حاوی داده‌های بیش از ۲۰۰۰ موضوع پژوهشی در حوزه‌های مختلف است. با این­که امکان استفاده از همه­‌ی داده‌­های دیتاست­‌های موجود به صورت رایگان وجود ندارد، اما ساختارها به وضوح مشخص شده‌­اند و جستجوی آسان (بر اساس این عوامل: قیمت، شرایط عضویت و محدودیت­ها و موانع کپی­رایت) در میان آن­ها نیز امکان­‌پذیر است.

CHDS Child Health and Development Studies (مطالعات بهداشت و رشد کودکی): با استفاده از داده­‌های دیتاست­‌های CHDS می­‌توان به تحقیق در مورد این موضوع پرداخت که سلامت و بیماری­‌ها چگونه از نسلی به نسل دیگر منتقل می­‌شوند. تحقیقاتی که بر اساس این داده‌­ها انجام می­‌گیرند تنها به بحث ژنتیکی این قضیه نمی‌­پردازند و جنبه­‌های اجتماعی، محیط زیستی و فرهنگی را نیز دربر می­‌گیرند.

راه حل کمبود داده در یادگیری ماشین

داده‌­های زیستی-پزشکی دیتاست­‌های Kent Ridge Kent Ridge Biomedical Datasets: مجموعه‌ای از دیتاست‌های با ابعاد زیاد در حوزه­‌ی زیست‌پزشکی را در برمی‌­گیرد و بر داده­‌های منتشرشده در مجلات (با موضوعات طبیعت، علم و …) متمرکز شده است.

چالش حرکت بهداشت و درمان مولکولی  MerckMerck Molecular Health Activity Challenge: داده­‌های این دیتاست­‌ها برای پرورش جریان یادگیری ماشین در حوزه‌­ی کشف دارو (از طریق شبیه‌­سازی نحوه‌­ی تعامل مولکول­‌ها با یکدیگر) به کار می­‌روند.

SEER: در این مورد، داده‌­های دیتاست­‌ها که توسط دولت ایالات متحده فراهم شده‌­اند، بر اساس گروه‌­های جمعیت­‌شناختی مرتب می‌­گردند. قابلیت جستجو بر اساس سن، نژاد و یا جنسیت در میان این داده‌­ها وجود دارد.

پروژه‌­ی ۱۰۰۰ Genomes: این داده‌­ها از ۲۵۰۰ نفر و ۲۶ گروه جمعیتی متفاوت به دست آمده‌­اند. این دیتاست یکی از بزرگ­‌ترین مخازن ژنوم در دسترس است و حاصل یک همکاری جهانی می‌­باشد. دسترسی به این داده­‌ها از طریق سرویس­‌های شبکه­‌ای آمازون (AWS) امکان­‌پذیر خواهد بود.

خدمات بهداشت و درمان

Medicare: این سرویس دیتاست‌هایی را در اختیار قرار می­‌دهد که مبتنی بر خدمات ارائه شده توسط مؤسسات طرف قرارداد Medicare هستند. می­‌توان گفت بیشتر این داده‌­ها مرتب بوده و بینش خوبی نسبت به بخش خدماتی و درمانی بیمارستان‌­ها به دست می‌­دهند.

HCUP: داده‌­های مربوط به دیتاست‌­های بیمارستا‌‌‌ن­ های ایالات متحده را در برمی‌­گیرد و اطلاعاتی از این دست را شامل می‌شوند: بستری­‌های بخش اورژانس، بستری­‌های بیماران داخلی و آمار مربوط به آمبولانس­‌ها. داده­‌های دیتاست­‌های این سرویس تمیز هستند و در مورد خدمات و مراقبت­‌های درمانی ایالات متحده اطلاعات مفیدی فراهم می‌­کنند.

تصاویر

OASIS Open Access Series of Imaging Studies (مجموعه قابل دسترس از مطالعات تصویربرداری): OASIS به صورت رایگان تصاویر عصبی از مغز تولید می­‌کند، به این امید که پژوهش­‌های حوزه­‌ی بهداشت و درمان و علم عصب­‌شناختی کلینیکی (بالینی) را رشد داده و موجب پیشرفت و توسعه­‌ی بیشتر آن­ها شود.

OpenfMRI: حاوی داده­‌های دیگری از دیتاست­‌های تصویربرداری است که از دستگاه‌­های MRI به دست می­‌آیند تا پژوهش­‌های مربوطه را تقویت و به تشخیص و آموزش باکیفیت‌­تر کمک کنند. این سرویس شامل ۹۵ دیتاست حاوی ۳۳۷۲ مورد بوده و همچنان که محققان داده­‌های خود را منتشر می­‌کنند، به داده‌­های این دیتاست افزوده می­‌شود.

تصاویر پزشکی CT CT Medical Images (پرتونگاری رایانه‌ای): این دیتاست، دیتاست کوچکی است، اما منحصراً به بحث سرطان می­‌پردازد. داده­‌های این دیتاست شامل تصاویری می­‌شوند که بر اساس سن، حالت و تگ‌­های متضاد برچسب خورده‌اند. زمانی که این تصاویر باکیفیت با داده­‌های آموزشی همراه ­شوند، می­‌توانند به کشفیات و پیشرفت­‌های بزرگی منجر گردند.

راه حل کمبود داده در یادگیری ماشین

Deep Lesion: داده‌­های دیتاست Deep Lesion متنوع و گسترده هستند و یکی از بزرگ­‌ترین دیتاست­‌های تصویری موجود در حال حاضر را تشکیل می­‌دهند. تصاویر سی‌تی اسکن گرفته‌شده مؤسسات بهداشتی درمانی ملی (NIH) به منظور کمک به صحت بیشتر در تشخیص و مستندسازی جراحات در این دیتاست گردآوری شده تا مورد استفاده سایرین قرار گیرند. داده‌­های این دیتاست اطلاعات مربوط به بیش از ۳۲۰۰۰ جراحت و آسیب مربوط به ۴۰۰۰ بیمار را در برمی­‌گیرند.

امتیاز ویژه! گردآورنده­‌ها (گردآورنده­‌ی دیتاست­‌ها)

Kaggle: این گردآورنده منبعی عالی است که در آن می­‌توان دیتاست­‌هایی را یافت که هم مربوط به حوزه­‌ی بهداشت و درمان هستند و هم حوزه‌­های دیگر را در برمی­‌گیرند. اگر مطالعات شما در حوزه سلامت علاوه بر حوزه‌­ی بهداشت و درمان، به دیتاست­‌های زمینه­‌های دیگر نیز برای آموزش نیاز دارد، Kaggle می­‌تواند منبع خوبی برای شما باشد.

Subreddit: با این­که کار با subreddit ممکن است نسبت به موارد دیگر کمی دشوارتر به نظر بیاید، می­‌توانید با جستجو در گفتگوهای موجود در داده‌­های دیتاست‌­های رایگان آن به یافته­‌های ارزشمندی دست یابید. به خصوص در مواقعی که سوال مهمی دارید که پاسخش را در داده­‌های دیگر دیتاست­‌ها پیدا نکرده‌­اید، این گردآورنده به احتمال زیاد می‌­تواند مفید واقع شود.

Healthcare.ai: این مورد را نمی ­توان دقیقاً یک گردآورنده در نظر گرفت، بلکه یک نرم­‌افزار متن­‌باز و حتی یک جامعه محسوب می­‌شود که وقف آموزش، جنبش‌­های اجتماعی و … و گسترش استفاده از یادگیری ماشین در حوزه‌­های مختلف بهداشت و درمان شده است.

یادگیری ماشین در حوزه‌­ی بهداشت و درمان

امروزه دنیا بیشتر از هر زمان دیگری نیاز به پاسخ دارد! اگر در علوم داده‌­ها تخصص دارید و در سازمان­‌های بهداشتی درمانی مشغول به کار هستید و یا وقت خود را به پژوهش و یافتن پاسخ سؤالات اساسی اختصاص داده‌­اید می‌دانید که داشتن دسترسی رایگان و آسان به داده‌­ها بسیار حیاتی است. می­‌توانید برای شروع از ۱۵ دیتاست در حوزه­ بهداشت و درمان معرفی شده در بالا استفاده کنید.

 

این مطلب چه میزان برای شما مفید بوده است؟
[کل: ۲ میانگین: ۳]

موسسه فناوری توکیو: مقدمه‌ای بر علوم کامپیوتر و برنامه‌نویسی (آموزش رایگان)

مقاله قبلی

 تحلیل  سریال علمی‌تخیلی بلک ‌میرور از منظر هوش مصنوعی

مقاله بعدی

شما همچنین ممکن است دوست داشته باشید

بیشتر در دیتاست

نظرات

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد.