یادگیری 7 مورد از مهارت های اساسی علوم داده به کمک یوتیوب
در این مقاله قصد داریم روشی برای یادگیری مهمترین موارد از مهارت های اساسی علوم داده را توضیح دهیم. در بازیهای کامپیوتری جدید، قهرمانها همیشه قدرت یا توان خاصی دارند. برای مثال، در بازی Dota، قهرمانها بر اساس چابکی، هوش و قدرتشان امتیاز دریافت میکنند. برای برتری در این بازی، بازیکنان باید در همهی ویژگیها نمرهای بالاتر از میانگین گرفته و در حداقل یکی از این ویژگیها تخصص داشته باشد.
یادگیری علوم داده را هم میتوان به منزلهی یک بازی در نظر گرفت که موفقیت در آن مستلزم تواناییهایی چندبُعدی است. در بازیهای ویدئویی باید با اسلحه، آموزش یا معجونی جادویی، مهارتهای خود را بهتر و بهتر کنیم. مهارت های اساسی علوم داده را هم میتوان از طریق مطالعه، تماشای ویدئوهای آموزش علوم داده و البته استفاده از منابع یوتیوبی که در این نوشتار معرفی خواهیم کرد، ارتقاء داد.
قبل از هر چیز، هفت مورد از مهارت های اساسی علوم داده که تضمینکنندهی موفقیت در این حوزه هستند را با هم مرور میکنیم:
1- الگوریتمهای یادگیری ماشین
مبنای نظری الگوریتمهای یادگیری تقویتی، نظارتشده و بدوننظارت از مهمترین مهارت های اساسی علوم داده هستند که باید آنها را بشناسید. از جملهی این الگوریتمها میتوان به این موارد اشاره کرد:
- رگرسیون خطی
- شبکه عصبی
- درخت تصمیم
- KNN (K همسایه نزدیک)
- خوشهبندی
2- آمار و ریاضیات
آمار و ریاضیات سنگ بنای علوم داده، به خصوص یادگیری ماشین و هوش مصنوعی هستند. بنابراین بهتر است بر این مباحث تسلط داشته باشید:
- جبر خطی
- حساب دیفرانسیل و انتگرال
- توزیعهای احتمالاتی
- آزمون فرضیه: آزمون T،ANOVA، همبستگی و …
3- SQL
SQL زبانی است که برای برقراری ارتباط با دیتابیسها و دستیابی به اطلاعات (از طریق استخراج داده و کوئری) به کار میرود. برخی از مهمترین تکنیکهای این حوزه عبارتاند از:
- CRUD: تولید، خواندن، به روزرسانی، حذف
- فیلتر، مرتبسازی، جمع
- تغییرات در تاریخ، رشتههاو اعداد
- پیوند و اتحاد
- سابکوئری
در صورت تمایل به مطالعه بیشتر در این حوزه، به این مقالات رجوع کنید:
4- برنامهنویسی
تعداد زیادی زبان برنامهنویسی ساده، اما قدرتمند وجود دارد که از جملهی آنها میتوان به پایتون و R اشاره کرد. در یادگیری برنامهنویسی، مهمترین نکته، آشنایی با منطق برنامهنویسی و ذهنیت توسعهگر به جای تمرکز بر ساختار کدها است:
- حلقه: حلقه for و حلقه while
- شرطی: جملات if و else
- داده و پیچیدگی آن
- برنامهنویسی شیءگرا
5- مصورسازی داده
مصورسازی در تمام گامهای علوم داده به چشم میخورد، از تحلیل اکتشافی داده در آغاز کار گرفته تا ارائهی گزارشات نهایی. چند مورد از ابزارهای پرکاربرد مصورسازی داده عبارتاند از:
- Tableau
- PowerBI
- Seaborn (بسته پایتون)
- ggplot2 (بسته R)
6- پیادهسازی پروژه
درست است که درک مبنا و مفاهیم نظری از اهمیت بالایی برخوردار است، اما اجرا و پیادهسازی امری ضروری به شمار میرود. این مهارت بر به کارگیری دانش در عمل تمرکز دارد؛ برای یادگیری این مهارت، باید با ساخت پروژه و پیادهسازی چرخهی زندگی علوم داده آشنا باشیم:
- آشنایی با کسب و کارها
- استخراج داده
- پاکسازی داده
- EDA (تحلیل اکتشافی داده)
- مهندسی ویژگی
- مدلسازی پیشبین
- مصورسازی دادهها
7- داستانگویی
داستانگویی یکی از مهارت های اساسی علوم داده است؛ مهارت نرمی است که اغلب نادیده گرفته میشود. با در دست داشتن این مهارت، متخصصان میتوانند توجه مخاطبان را جلب کرده و یافتهها را به زبان ساده به آنها انتقال دهند. علوم داده پلی بین دنیای کسب و کار و فناوری است؛ به همین دلیل، توضیح ماهرانه و صریح تکنیکهای پیچیده به افرادی با تخصصهای گوناگون، مهارتی ضروری به شمار میرود.
کانالهای یوتیوب مفید
کانالهای یوتیوب فراوانی وجود دارند که با فراهم آوردن ویدئوهای آموزشی مفید برای مبتدیان، از جلوهی ترسناک مباحث علوم داده میکاهند؛ تا جایی که یادگیری را تبدیل به امری روزمره میکنند. برای اینکه فرآیند یادگیری را به شکل بازی درآوریم، به یوتیوبرهایی نیاز داریم که شخصیت و خلاقیت خود را در ویدئوهایشان پیاده کنند. برخی از یوتیوبرها، مطالب را برای مخاطبانشان قابل دسترس و جذاب میسازند؛ دنبال کردن این کانالها میتواند در فرآیند یادگیری بسیار سودمند باشد.
در بازی یادگیری علوم داده، برای ارتقای مهارتها، لازم است به درستی از منابع مناسب استفاده کنیم. همانطور که در بازی Dota، هر کدام از تجهیزات یکی از مهارتها را ارتقاء میدهند (شمشیرهایی برای افزایش قدرت و چکمههایی برای افزایش چابکی)، کانالهای ویدئویی نیز هرکدام مزایای خاص خود را دارند. در این مقاله، با استفاده از نمودارهای راداری سعی کردهایم تخصص اصلی کانالها را نشان دهیم. با ترکیب همهی آنها، میتوانید مهارتهای خود در حوزهی علوم داده را به صورت کامل و یکپارچه تقویت کنید.
1- Ken Jee
کانال Ken Jee بیشتر متمرکز بر اجرای پروژه بوده و مناسب افراد تازهکار و مبتدی است. ساخت پروژههای علوم داده، به خصوص پروژههای Kaggle، نقطهی بسیار خوبی برای شروع یادگیری است. اجازه ندهید آمار و ریاضیات الگوریتمها شما را بترساند. این کانال، توصیههای شغلی و میانبرهایی برای بهرهوری بیشتر نیز به مخاطبانش ارائه میدهد.
2- Joma Tech
در میان یوتیوبرهای متخصص در علوم داده که تا به حال دنبال کردهام، Joma Tech را غیرمنظمترین و در عین حال، خلاقترین آنها میدانم. ویدئوهای او طوری هستند که با اشتیاق به تماشای آنها ادامه میدهید. این کانال، علوم داده را از دیدگاه یک برنامهنویس توضیح میدهد. به عنوان مثال، یکی از قسمتهای آن «اگر برنامهنویسی انیمه بود If Programming Was an Anime» نام داشت که میلیونها بازدیدکننده جذب کرد. مطالب او شکل ولاگ
Vlog
دارند و در عین آموزندگی، باعث سرگرمی هم خواهند شد.
3- StatQuest with Josh Starmer
تمرکز اصلی این کانال بر مفاهیم و الگوریتمهای یادگیری ماشین و توضیح آنها به کمک تصاویر است. سازندهی این ویدئوها روشی بسیار جالب برای سادهسازی و توضیح مفاهیم پیچیده (همچون گرادیان کاهشی تصادفی یا ماشین بردار پشتیبان) در پیش گرفته است. هرگاه بخواهید مدل یادگیری ماشین جدیدی بیاموزید میتوانید به StatQuest with Josh Starmer مراجعه کنید.
4- 3Blue1Brown
3Blue1Brown ترکیبی عالی از علم و هنر است. گرانت سندرسون، سازندهی این کانال، مباحث ریاضی را به کمک تصاویری خارقالعاده، شبیه به یک داستان توضیح میدهد. این کانال مجموعهای در مورد ریاضیات و احتمالات کووید-19 منتشر کرده است که تماشای آن را به شدت پیشنهاد میکنم.
5- Nate at StrataScratch
کانال Nate at StrataScratch سؤالاتی که در مصاحبههای کاری شرکتهای بزرگ و غولهای فناوری (همچون مایکروسافت و فیسبوک) از مباحثی مانند SQL مطرح میشوند را به دقت توضیح میدهد. آن دسته افرادی که در حال آمادگی برای مصاحبههای فنی مشاغل علوم داده هستند، میتوانند از این کانال استفاده کنند. این کانال تمرینهایی برای مخاطبان فراهم میآورد تا از طریق یادآوری فعال، مباحث عملی SQL را در ذهن آنها تحکیم کند.
6- Art of Visualization
آنچه Art of Visualization را از سایر کانالها متمایز میکند، ارائهی انواع نمودارها و جداولی (از جمله دیاگرام Sankey و نمودار Sunburst) است که ساختشان در Tableau کار آسانی نیست. چندین ویدئو از این کانال بر مصورسازی داده در پایتون، R و … تمرکز داشتهاند.
جمعبندی
این مقاله، هفت مهارت اساسی علوم داده را مرور کرد:
- الگوریتمهای یادگیری ماشین
- آمار و ریاضیات
- برنامهنویسی
- SQL
- پیادهسازی پروژه
- مصورسازی دادهها
- داستانگویی
علاوه بر توضیح این مهارتها، شش کانال یوتیوبی نیز معرفی شدند که میتوانند به یادگیری این مهارتها کمک کنند.
اگر شما هم منابع مفیدی برای یادگیری علوم داده میشناسید آنها را در کامنتها معرفی کنید تا علاقهمندان این حوزه بتوانند از آنها استفاده کنند.