مبتدیان علوم داده باید جواب این 10 سوال را بدانند
شروع یک شغل با محوریت علوم داده بسیار جذاب است، اما مشکلات خودش را هم دارد. برای مثال سوالهایی هستند که همواره برای شروع پیش روی شما قرار دارند. از کجا شروع کنم؟ چه چیزی یاد بگیرم و چگونه؟ منابع مناسب درباره علوم داده را چطور پیدا کنم؟ اگر این سوالها را از خودتان پرسیدید، نترسید، شما تنها نیستید!
علوم داده بسیار جدید است و حتی در سال 2020 هم میتوان آن را نوظهور نامید. رمزگشایی از هر یک از معماهای آن بسیار سخت است، منابع بسیار پراکنده هستند و از همه مهمتر این که هر منبع رویکرد خودش را نسبت به مسائل دارد. حال با این شرایط به نظرتان چطور میتوانید یک متخصص علوم داده موفق باشید؟
در این مقاله سعی داریم به 10 سوال افرادی که قصد شروع این کار را دارند، بپردازیم. با بررسی این سوالات میتوانید جنبههای مختلف علوم داده را بشناسید و با رزومهها و مصاحبههایی که میتواند به شما در به دست آوردن شغل در این زمینه کمک کند، آشنا شوید.
1- رایجترین اشتباهات افراد علاقهمند به علوم داده در مصاحبههای کاری چیست؟
بیایید یک به یک به برخی از این سوالات بپردازیم:
* آماده کردن موضوعاتی که فقط تئوری هستند و عدم توجه به کاراییشان
تصور کنید در حین مصاحبه هستید و فردی که مقابل شماست میپرسد: جنگل تصادفی random forest چیست و چطور کار میکند؟ باید آرام باشید و به نرمی پاسخ دهید. وقتی این رفتار را داشته باشید بهترین کلمات در زمان مناسب به ذهن شما میرسند. در حین پاسخ دادن باید به این سوال فکر کنید که چطور میتوان از این مدل در تجارت استفاده کرد و پاسخ آن را هم در ادامه پاسخ سوال اول ارائه دهید. با این کار هم نشان دادید که میدانید جنگل تصادفی چیست و هم از کاربردش گفتید و به فرد مصاحبهکننده اجازه پرسیدن سوال بیشتر در این زمینه را ندادید.
* چیزی که در رقابتهای یادگیری ماشین میبینید، همان شغلها در زندگی واقعی هستند
آماده شدن برای این شغل با شرکت در رقابتهای آن هیچ فرقی ندارد. این انکارنشدنی است. در واقع مصاحبهها شما را برای فرصت شغلی آماده نمیکنند. در مصاحبهها معمولا فقط صحبت از مواردی میشود که روی آنها تحقیق شده است و مهارتهای شما در حل کردن مشکلات بررسی میشود. بسیاری از زمینهها در علوم داده تنها با تجربه کاری به دست میآید.
* استفاده بیش از اندازه از اصطلاحات علوم داده
رزومه شما نشان میدهد که چه کارهایی و چطور آنها را انجام دادید. وقتی کسی که به دنبال استخدام نیرو است، به رزومه شما نگاه میکند، میخواهد از زمینههای شما سردربیاورد و بفهمد چه دستاوردهایی داشتهاید. اگر نیمی از صفحه با اصطلاحات تخصصی علوم داده پر شده باشد، رزومه شما بسیار گنگ به نظر میرسد.
* کار نکردن روی مهارتهای ارتباطات
مهارتهای ارتباطی یکی از مهمترین بخشهای علوم داده است که دربارهاش خیلی کم صحبت میشود و باید بیشتر به آن توجه کرد. جدیدترین تکنیکها، بهترین روشهای استفاده از ابزارها و روش ساختن گرافها، همه مسائلی هستند که شما میتوانید آنها را یاد بگیرید. اما اگر نتوانید نتایج تحلیلهایتان را برای مشتریان توضیح دهید، نمیتوان شما را فردی موفق نامید. این چیزی است که فرد مصاحبهکننده دوست دارد در پروسه مصاحبه شما ببیند.
2- من زمینه غیرفنی دارم، چرا باید به مسائل مربوط به مهندسی نرمافزار بپردازم؟
این سوالی است که بیش از باقی سوالها ذهن افراد را درگیر کرده و امید است بعد از خواندن این مطلب دیگر جواب آن را بدانید.
هدف اصلی هر پروژه علوم داده این است که تولید داشته باشد. پس مهم نیست که مدل شما چقدر دقیق است، اگر به مرحله تولید نرسد، هنوز نیمهتمام شناخته میشود.
برای نوشتن یک کد با کیفیت مناسب که در زمان تولید مشکل به بار نیاورد، لازم است که اصول مهندسی نرمافزار را بدانید. همچنین باید اطلاعاتی در زمینه فرایند پروژههای توسعه نرمافزار، انواع دادهها و غیره بدانید.
نوشتن کدهای تمیز و تاثیرگذار در مسیر طولانی پیش رویتان کمک زیادی به شما خواهد کرد و باعث میشود همکاری بهتری با سایر همتیمیهایتان داشته باشید. لازم نیست حتما یک مهندس نرمافزار باشید، اما دانستن اصول، کمک زیادی به شما خواهد کرد.
3- آیا برای این که یک متخصص داده خوب باشم باید برنامهنویسی را به خوبی بلد باشم؟
نه این که لازم باشد در زمینه برنامهنویسی فوقالعاده باشید، اما باید به اندازه کافی و مناسب خوب باشید. بگذارید سوالی بپرسم: برای علوم داده چه زبانی را ترجیح میدهید؟ پایتون Python، آر R ، اس ای اس SAS یا شاید جولیا Julia ؟ مثالی از پایتون برایتان میآورم. برای این که یک متخصص داده خوب باشید باید تمرینات کافی در زمینه کار با پایتون داشته باشید. باید درباره اصول یادگیری ماشین مانند پانداز Pandas، نامپی NumPy و اسکیت Scikit بدانید. باید بتوانید به راحتی درباره عملکرد این سیستمها بنویسید و صحبت کنید، حتی اگر نتوانید کدهایی با استفاده از آنها بنویسید. در واقع لازم نیست در همه زبانها استاد باشید، بهتر است یکی را انتخاب کنید و در آن متخصص شوید.
اگر دوست دارید اطلاعات تکمیلی در زمینه علوم داده داشته باشید، بهتر است سری به بلکبلت پلاس BlackBelt + بزنید، جایی که متخصصان یادگیری ماشین در آن مشغول آموزش اکسل Excel ، اس کیو ال SQL ، پایتون و غیره هستند.
4- گسترش مدل چیست و چرا باید دربارهاش بدانم؟
وقتی پروژه علوم دادهای را تکمیل کردید، زمان آن خواهد بود که به کاربران توضیح دهید مزایای قدرت پیشگویی مدلهای یادگیری ماشین چه هستند. به زبان سادهتر، این یک گسترش مدل است. از نظر تجاری این یکی از مهمترین قدمها است و البته آخرین چیزی است که همیشه آموزش داده میشود.
برای مثال، یک شرکت بیمه از علوم دادهای استفاده کرده که از تصاویر مربوط به تصادفهای اتومبیل میزان خسارت را بررسی کند. تیم علوم داده شب و روز کار کردند تا مدلی توسعه دهند که نتایج قابل قبولی داشته باشد. بعد از ماهها کار سخت مدلی ارائه دادند که مشتریان از آن بسیار راضی بودند، اما بعد چه شد؟
کاربر این مدل یک شرکت بیمه بود و در واقع این مدل باید توسط افرادی استفاده میشد که هیچ اطلاعی از علوم داده نداشتند. در نتیجه روی کارت گرافیک لپتاپهایشان ژوپیتر Jupyter یا کولب Colab نداشتند و با وجود آنها است که پروسه توسعه مدل تکمیل میشود.
این معمولا ماموریت مهندسان یادگیری ماشین است، اما به توجه به شرکتی که در آن کار میکنید، شرایط متفاوت خواهد بود. در نتیجه مهم است که حتی اگر شرکتتان چنین چیزی از شما نخواسته و در حیطه وظایف شما نیست، اصول گسترش مدل را بدانید و همچنین بتوانید توضیح دهید که چرا مهم است.
5- موقعیتهای شغلی در زمینه علوم داده چیست؟
نه این که متخصص علوم داده جذابترین شغل قرن 21 باشد، اما تا سال 2025 یکی از پرکاربردترین و جذابترینها خواهد بود. در نتیجه برای مشتاقان این زمینه سالهای خوبی در راه است. مطمئن باشید در دنیای علوم داده به اندازه کافی شغلهای متنوع وجود دارد. میتوانید تحلیلگر کسب و کار، تحلیلگر داده و حتی فردی مهم در یک تیم مهندسی یادگیری ماشین شوید.
تواناییهای مهم برای یک متخصص علوم داده کدنویسی، ریاضیات و تواناییهای جستجو هستند و هرچه فرد بیشتر مشتاق و مشغول به یادگیری باشد، بهتر میتواند مسیر رسیدن به موفقیت در این زمینه را طی کند.
6- هنگام نوشتن یک رزومه مناسب برای موقعیت شغلی علوم داده به چه مهارتهایی باید اشاره شود؟
مهارتهای بیپایانی هستند که میتوان در رزومه به آنها اشاره کرد، اما سوال اصلی این است که بهتر است از 10 مهارتی که در آن متوسط هستید یاد کنید یا فقط چند مورد را بنویسید که در آن استاد هستید؟ همان طور که میتوان حدس زد، مورد دوم. مصاحبهکننده انتظار دارد در هر مهارتی که در رزومه به آن اشاره کردید، استاد باشید. اجازه دهید به چند مورد به صورت قدم به قدم بپردازیم:
* بر اساس نقش شغلی مهارتها را اولویتبندی کنید
هر مصاحبهکنندهای برای استخدام کارمندانش انتظارات خاصی از هر فردی دارد. قالببندی رزومه شما باید بر اساس شرح شغلیتان باشد. برای مثال، اگر در موقعیت شغلی آمده که به دنبال استخدام فردی با توانایی زیاد در زمینه پایتون و یادگیری ماشین است، باید بیشتر تمرکزتان را روی بیان تواناییهایتان در این زمینه بگذارید. حتی برای پز دادن میتوانید همه پروژههای مربوط به یادگیری ماشین که تجربه کار در آن داشتید را معرفی کنید. نه این که انقدر به پروژههای زیادی که در آنها کار کردید، بپردازید، که موضوع اصلی فراموش شود و کار را از دست بدهید.
* اشاره به پروژههای علوم داده
همانطور که در سوالات قبلی به آن اشاره شد، دانش تمرینی بیشتر از دانش تئوری، توجه را جلب میکند و بیشتر نشان میدهد که شما در زمینه کاریتان مهارت دارید. سعی کنید به پروژههایی اشاره کنید که بیشتر مهارتهایی که به آن اشاره کردید را در بر داشته باشد.
* پروفایل گیتهاب را فراموش نکنید
این روزها داشتن یک پروفایل گیتهاب GitHub ضروری است، مخصوصا اگر بخواهید در زمینه شغلی علوم داده مشغول شوید و مهارتهای مورد نیازشان فقط اکسل و اس کیو ال نباشد. داشتن یک پروفایل گیتهاب باعث بالا رفتن اعتماد شما و همچنین بااعتمادتر نشان دادن شما میشود و به مصاحبهکننده این حس را میدهد که شما آمادهاید هریک از پروژههایی که در آن بودید بررسی شود. مطمئنا با این کار قلب مصاحبهکننده را به دست خواهید آورد.
* رسیدگی به کل رزومه
اگر رزومه نتواند چهره دقیق و واضحی از شما توصیف کند، دیگر اهمیتی ندارد که شما به چه میزان فرد توانمندی هستید. در نتیجه باید حتی به اندازه نوشتهها، فونتها و ساختار رزومه هم دقت کنید.
7- برای به دست آورد یک موقعیت شغلی در زمینه علوم داده، آیا لازم است درباره آمار هم چیزی بدانیم؟
یک شعار مشهور است که میگوید «آمار، دستور زبان علوم داده است Statistics is the grammar of Data Science ». پس برای این که به این سوال، پاسخی کوتاه بدهیم، بله، باید آمار را بشناسید. اما نترسید. لازم نیست در زمینه آمار در حد یک استاد باشید و دورههای پیشرفته آن را بگذرانید. در زیر به مواردی که بهتر است به آنها بپردازید اشاره شده است:
* آمار توصیفی (معانی، مدها، مغایرتها، انحرافات استاندارد)
* آمار استنباطی (بررسی فرضیهها، زد تست z test، تی تست t-test، درجه اهمیت، پی ولیو p-value )
* آنالیزهای آماری (پسرفت خطی linear regression ، پیشبینیها، پسرفت استدلالی logistic regression )
این لیست اصلی موضوعاتی است که باید در آن مهارت زیادی داشته باشید و اگر منابع درست و مناسب را انتخاب کنید، وقت زیادی از شما نخواهد گرفت. میتوانید بلکبلت Blackbelt را هم بررسی کنید و از منابع خوب آماری آن استفاده کنید.
8- آیا باید در هکاتونها hackathons شرکت کنم؟ کمکی در گرفتن شغل به من خواهد کرد؟
رقابتهای علوم داده و شرکت در آنها باعث میشود در زمینههایی که یاد گرفتید به مراتب قویتر شوید. در واقع با این کار شما فهم بهتری از دامنه، تکنیکها و جریانهای پروژههای یادگیری ماشین خواهید داشت.
بسیاری از افراد مصاحبهکننده توجه زیادی به هکاتونهای فرد در رزومهاش خواهند داشت. پس اگر تا به حال در آنها شرکت نکردید، وقت را از دست ندهید.
9- مزایای داشتن مدرک علوم داده چیست؟
مطمئنا داشتن این مدرک مزایای زیادی دارد. اولین نکته این است که نشان میدهد شما به این زمینه علاقهمند بودهاید. هرچند این مشکل وجود دارد که به خاطر بیشتر شدن تمایلات به این رشته، قیمت دورهها به شدت افزایش داشته است. در این شرایط چه میتوان کرد؟
کلاسهای رایگانی که ارائه شدند، نشان میدهند که شما علاقه زیادی داشتید، اما تاثیرگذاری دیگر دورهها را ندارند. باید در دورهای شرکت کنید که شما را با پروژههای سطح بالای این صنعت آشنا کند. باید مدرکی داشته باشید که در سطح استاندارد باشد و بتواند نشان دهد که اطلاعات و هوش شما در این زمینه را محک زده است.
در نهایت اگر تصمیم دارید در دورهها شرکت کنید، باید عاقلانه درباره آنها تصمیم بگیرید. به دنبال مدرکی باشید که در این صنعت به آن بها داده میشود.
10- چطور میتوانم متخصص علوم دادهای شوم که برای ورود به صنعت آماده است؟
خیلیها این سوال را دارند. اما اول باید بررسی کنیم که آماده بودن برای این صنعت یعنی چه. یعنی کسی که به غیر از مهارتهای نرم، مهارتهای سخت هم داشته باشد و بتواند بدون این که در شرکتی نیاز به تعلیم دیدن داشته باشد، کار را انجام دهد. این متخصصان درست از روز اول تاثیر زیادی در شرکت دارند.
برای تبدیل شدن به چنین فردی میتوانید در دورههای بسیاری شرکت کنید تا با تدریس سرفصلهای لازم شما را برای ورود به صنعت آماده کنند. بهتر است در این دورهها به غیر از واحدهای تئوری، کلاسهای عملی هم داشته باشید و با پروژههایی که در دنیای واقعی وجود دارند، آشنا شوید. مدرس دوره هم باید این توانایی را داشته باشد که شما را در مسیر رسیدن به هدفتان راهنمایی و یاری کند.