دیتاست در حوزه­‌ی بهداشت و درمان
دیتاست

معرفی ۱۵ دیتاست در حوزه­ بهداشت و درمان

    0
    مدت زمان مطالعه: ۴ دقیقه

    ورود یادگیری ماشین به حوزه­‌ی بهداشت و درمان توجه زیادی را به خود جلب کرده است. همه ­‌جا صحبت از این است که یادگیری ماشینی (ML) چطور موجب تحول و انقلاب در زمینه‌­های گوناگون شده است. به لطف قدرت یادگیری و پردازش ماشین‌ها، حوزه‌­ی مراقبت­‌های بهداشتی و درمانی از آن زمینه­‌هایی است که سرعت این تحول در آن به طرز چشمگیری بالاست. یافتن شغل در حوزه­‌ی بهداشت و درمان به عنوان متخصص این رشته (یادگیری ماشینی) احتمال بالایی دارد. در این مقاله قصد داریم به معرفی ۱۵ دیتاست در حوزه­ بهداشت و درمان بپردازیم.

     بهداشت عمومی و جمعی

    WHO (سازمان بهداشت جهانی): این سازمان بر اساس اولویت­‌های حال حاضر حوزه‌­ی سلامت در دنیا، داده‌­های دیتاست را فراهم می­کند. سازمان بهداشت جهانی امکان جستجوی آسان را برای مخاطبان خود به وجود آورده و علاوه بر داده­‌هایی که در اختیار می‌­گذارد، بینش خوبی نیز در مورد موضوعات گوناگون به دست می‌­دهد.

    CDC (مرکز کنترل و پیشگیری بیماری): در این مرکز بهداشتی درمانی صرفاً داده‌های ایالات متحده قابل دسترس می‌­باشد. مرکز CDC از داده‌­های دیتاست WONDER Wide-ranging Online Data for Epidemiological Research  (داده‌­ی آنلاین گسترده برای پژوهش‌­های شیوع‌­شناسی) استفاده می‌­کند. قابلیت جستجو براساس موضوع، ایالت و عوامل دیگر در میان داده­‌های این دیتاست وجود دارد.

    Data.gov: داده­‌های حوزه­‌ی بهداشت و درمان را در برمی­‌گیرد، قابلیت جستجو داشته و مختص ایالات متحده است. داده‌­های این دیتاست به منظور بهبود زندگی افرادی تنظیم شده‌­اند که در ایالات متحده زندگی می‌­کنند؛ با این­ حال اطلاعاتی که فراهم می­‌آورد برای دیتاست­‌های آموزشی دیگر که در حوزه‌­ی تحقیقات یا سایر حوزه‌­های بهداشت و درمان تعریف می‌شوند نیز مفید خواهد بود.

    پژوهش­‌های علمی

    Re3Data: این دیتاست حاوی داده‌های بیش از ۲۰۰۰ موضوع پژوهشی در حوزه‌های مختلف است. با این­که امکان استفاده از همه­‌ی داده‌­های دیتاست­‌های موجود به صورت رایگان وجود ندارد، اما ساختارها به وضوح مشخص شده‌­اند و جستجوی آسان (بر اساس این عوامل: قیمت، شرایط عضویت و محدودیت­ها و موانع کپی­رایت) در میان آن­ها نیز امکان­‌پذیر است.

    CHDS Child Health and Development Studies (مطالعات بهداشت و رشد کودکی): با استفاده از داده­‌های دیتاست­‌های CHDS می­‌توان به تحقیق در مورد این موضوع پرداخت که سلامت و بیماری­‌ها چگونه از نسلی به نسل دیگر منتقل می­‌شوند. تحقیقاتی که بر اساس این داده‌­ها انجام می­‌گیرند تنها به بحث ژنتیکی این قضیه نمی‌­پردازند و جنبه­‌های اجتماعی، محیط زیستی و فرهنگی را نیز دربر می­‌گیرند.

    داده‌­های زیستی-پزشکی دیتاست­‌های Kent Ridge Kent Ridge Biomedical Datasets: مجموعه‌ای از دیتاست‌های با ابعاد زیاد در حوزه­‌ی زیست‌پزشکی را در برمی‌­گیرد و بر داده­‌های منتشرشده در مجلات (با موضوعات طبیعت، علم و …) متمرکز شده است.

    چالش حرکت بهداشت و درمان مولکولی  MerckMerck Molecular Health Activity Challenge: داده­‌های این دیتاست­‌ها برای پرورش جریان یادگیری ماشین در حوزه‌­ی کشف دارو (از طریق شبیه‌­سازی نحوه‌­ی تعامل مولکول­‌ها با یکدیگر) به کار می­‌روند.

    SEER: در این مورد، داده‌­های دیتاست­‌ها که توسط دولت ایالات متحده فراهم شده‌­اند، بر اساس گروه‌­های جمعیت­‌شناختی مرتب می‌­گردند. قابلیت جستجو بر اساس سن، نژاد و یا جنسیت در میان این داده‌­ها وجود دارد.

    پروژه‌­ی ۱۰۰۰ Genomes: این داده‌­ها از ۲۵۰۰ نفر و ۲۶ گروه جمعیتی متفاوت به دست آمده‌­اند. این دیتاست یکی از بزرگ­‌ترین مخازن ژنوم در دسترس است و حاصل یک همکاری جهانی می‌­باشد. دسترسی به این داده­‌ها از طریق سرویس­‌های شبکه­‌ای آمازون (AWS) امکان­‌پذیر خواهد بود.

    خدمات بهداشت و درمان

    Medicare: این سرویس دیتاست‌هایی را در اختیار قرار می­‌دهد که مبتنی بر خدمات ارائه شده توسط مؤسسات طرف قرارداد Medicare هستند. می­‌توان گفت بیشتر این داده‌­ها مرتب بوده و بینش خوبی نسبت به بخش خدماتی و درمانی بیمارستان‌­ها به دست می‌­دهند.

    HCUP: داده‌­های مربوط به دیتاست‌­های بیمارستا‌‌‌ن­ های ایالات متحده را در برمی‌­گیرد و اطلاعاتی از این دست را شامل می‌شوند: بستری­‌های بخش اورژانس، بستری­‌های بیماران داخلی و آمار مربوط به آمبولانس­‌ها. داده­‌های دیتاست­‌های این سرویس تمیز هستند و در مورد خدمات و مراقبت­‌های درمانی ایالات متحده اطلاعات مفیدی فراهم می‌­کنند.

    تصاویر

    OASIS Open Access Series of Imaging Studies (مجموعه قابل دسترس از مطالعات تصویربرداری): OASIS به صورت رایگان تصاویر عصبی از مغز تولید می­‌کند، به این امید که پژوهش­‌های حوزه­‌ی بهداشت و درمان و علم عصب­‌شناختی کلینیکی (بالینی) را رشد داده و موجب پیشرفت و توسعه­‌ی بیشتر آن­ها شود.

    OpenfMRI: حاوی داده­‌های دیگری از دیتاست­‌های تصویربرداری است که از دستگاه‌­های MRI به دست می­‌آیند تا پژوهش­‌های مربوطه را تقویت و به تشخیص و آموزش باکیفیت‌­تر کمک کنند. این سرویس شامل ۹۵ دیتاست حاوی ۳۳۷۲ مورد بوده و همچنان که محققان داده­‌های خود را منتشر می­‌کنند، به داده‌­های این دیتاست افزوده می­‌شود.

    تصاویر پزشکی CT CT Medical Images (پرتونگاری رایانه‌ای): این دیتاست، دیتاست کوچکی است، اما منحصراً به بحث سرطان می­‌پردازد. داده­‌های این دیتاست شامل تصاویری می­‌شوند که بر اساس سن، حالت و تگ‌­های متضاد برچسب خورده‌اند. زمانی که این تصاویر باکیفیت با داده­‌های آموزشی همراه ­شوند، می­‌توانند به کشفیات و پیشرفت­‌های بزرگی منجر گردند.

    Deep Lesion: داده‌­های دیتاست Deep Lesion متنوع و گسترده هستند و یکی از بزرگ­‌ترین دیتاست­‌های تصویری موجود در حال حاضر را تشکیل می­‌دهند. تصاویر سی‌تی اسکن گرفته‌شده مؤسسات بهداشتی درمانی ملی (NIH) به منظور کمک به صحت بیشتر در تشخیص و مستندسازی جراحات در این دیتاست گردآوری شده تا مورد استفاده سایرین قرار گیرند. داده‌­های این دیتاست اطلاعات مربوط به بیش از ۳۲۰۰۰ جراحت و آسیب مربوط به ۴۰۰۰ بیمار را در برمی­‌گیرند.

    امتیاز ویژه! گردآورنده­‌ها (گردآورنده­‌ی دیتاست­‌ها)

    Kaggle: این گردآورنده منبعی عالی است که در آن می­‌توان دیتاست­‌هایی را یافت که هم مربوط به حوزه­‌ی بهداشت و درمان هستند و هم حوزه‌­های دیگر را در برمی­‌گیرند. اگر مطالعات شما در حوزه سلامت علاوه بر حوزه‌­ی بهداشت و درمان، به دیتاست­‌های زمینه­‌های دیگر نیز برای آموزش نیاز دارد، Kaggle می­‌تواند منبع خوبی برای شما باشد.

    Subreddit: با این­که کار با subreddit ممکن است نسبت به موارد دیگر کمی دشوارتر به نظر بیاید، می­‌توانید با جستجو در گفتگوهای موجود در داده‌­های دیتاست‌­های رایگان آن به یافته­‌های ارزشمندی دست یابید. به خصوص در مواقعی که سوال مهمی دارید که پاسخش را در داده­‌های دیگر دیتاست­‌ها پیدا نکرده‌­اید، این گردآورنده به احتمال زیاد می‌­تواند مفید واقع شود.

    Healthcare.ai: این مورد را نمی ­توان دقیقاً یک گردآورنده در نظر گرفت، بلکه یک نرم­‌افزار متن­‌باز و حتی یک جامعه محسوب می­‌شود که وقف آموزش، جنبش‌­های اجتماعی و … و گسترش استفاده از یادگیری ماشین در حوزه‌­های مختلف بهداشت و درمان شده است.

    یادگیری ماشین در حوزه‌­ی بهداشت و درمان

    امروزه دنیا بیشتر از هر زمان دیگری نیاز به پاسخ دارد! اگر در علوم داده‌­ها تخصص دارید و در سازمان­‌های بهداشتی درمانی مشغول به کار هستید و یا وقت خود را به پژوهش و یافتن پاسخ سؤالات اساسی اختصاص داده‌­اید می‌دانید که داشتن دسترسی رایگان و آسان به داده‌­ها بسیار حیاتی است. می­‌توانید برای شروع از ۱۵ دیتاست در حوزه­ بهداشت و درمان معرفی شده در بالا استفاده کنید.

     

    این مطلب چه میزان برای شما مفید بوده است؟
    [کل: ۰ میانگین: ۰]

    هوش مصنوعی مبتنی بر زبان هنوز به انسان نیاز دارد

    مقاله قبلی

    انجمن علمی مکاترونیک دانشگاه شهید بهشتی برگزار می‌کند: وبینار رایگان گرایش هوش مصنوعی

    مقاله بعدی

    شما همچنین ممکن است دوست داشته باشید

    بیشتر در دیتاست

    نظرات

    پاسخ دهید

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *