علوم داده
داده کاوی و بیگ دیتاکارآفرینیکسب‌و‌کار

مبتدیان علوم داده باید جواب این ۱۰ سوال را بدانند

    0

    شروع یک شغل با محوریت علوم داده بسیار جذاب است، اما مشکلات خودش را هم دارد. برای مثال سوال‌هایی هستند که همواره برای شروع پیش روی شما قرار دارند. از کجا شروع کنم؟ چه چیزی یاد بگیرم و چگونه؟ منابع مناسب درباره علوم داده را چطور پیدا کنم؟ اگر این سوال‌ها را از خودتان پرسیدید، نترسید، شما تنها نیستید!

    علوم داده بسیار جدید است و حتی در سال ۲۰۲۰ هم می‌توان آن را نوظهور نامید. رمزگشایی از هر یک از معماهای آن بسیار سخت است، منابع بسیار پراکنده هستند و از همه مهم‌تر این که هر منبع رویکرد خودش را نسبت به مسائل دارد. حال با این شرایط به نظرتان چطور می‌توانید یک متخصص علوم داده موفق باشید؟

    علوم داده

    در این مقاله سعی داریم به ۱۰ سوال افرادی که قصد شروع این کار را دارند، بپردازیم. با بررسی این سوالات می‌توانید جنبه‌های مختلف علوم داده را بشناسید و با رزومه‌ها و مصاحبه‌هایی که می‌تواند به شما در به دست آوردن شغل در این زمینه کمک کند، آشنا شوید.

    ۱- رایج‌ترین اشتباهات افراد علاقه‌مند به علوم داده در مصاحبه‌های کاری چیست؟

    بیایید یک به یک به برخی از این سوالات بپردازیم:

    * آماده کردن موضوعاتی که فقط تئوری هستند و عدم توجه به کارایی‌شان

    تصور کنید در حین مصاحبه هستید و فردی که مقابل شماست می‌پرسد: جنگل تصادفی random forest چیست و چطور کار می‌کند؟ باید آرام باشید و به نرمی پاسخ دهید. وقتی این رفتار را داشته باشید بهترین کلمات در زمان مناسب به ذهن شما می‌رسند. در حین پاسخ دادن باید به این سوال فکر کنید که چطور می‌توان از این مدل در تجارت استفاده کرد و پاسخ آن را هم در ادامه پاسخ سوال اول ارائه دهید. با این کار هم نشان دادید که می‌دانید جنگل تصادفی چیست و هم از کاربردش گفتید و به فرد مصاحبه‌کننده اجازه پرسیدن سوال بیشتر در این زمینه را ندادید.

    * چیزی که در رقابت‌های یادگیری ماشین می‌بینید، همان شغل‌ها در زندگی واقعی هستند

    آماده شدن برای این شغل با شرکت در رقابت‌های آن هیچ فرقی ندارد. این انکارنشدنی است. در واقع مصاحبه‌ها شما را برای فرصت شغلی آماده نمی‌کنند. در مصاحبه‌ها معمولا فقط صحبت از مواردی می‌شود که روی آن‌ها تحقیق شده است و مهارت‌های شما در حل کردن مشکلات بررسی می‌شود. بسیاری از زمینه‌ها در علوم داده تنها با تجربه کاری به دست می‌آید.

    * استفاده بیش از اندازه از اصطلاحات علوم داده

    رزومه شما نشان می‌دهد که چه کارهایی و چطور آن‌ها را انجام دادید. وقتی کسی که به دنبال استخدام نیرو است، به رزومه شما نگاه می‌کند، می‌خواهد از زمینه‌های شما سردربیاورد و بفهمد چه دستاوردهایی داشته‌اید. اگر نیمی از صفحه با اصطلاحات تخصصی علوم داده پر شده باشد، رزومه شما بسیار گنگ به نظر می‌رسد.

    * کار نکردن روی مهارت‌های ارتباطات

    مهارت‌های ارتباطی یکی از مهم‌ترین بخش‌های علوم داده است که درباره‎اش خیلی کم صحبت می‌شود و باید بیشتر به آن توجه کرد. جدیدترین تکنیک‌ها، بهترین روش‌های استفاده از ابزارها و روش ساختن گراف‌ها، همه مسائلی هستند که شما می‎توانید آن‌ها را یاد بگیرید. اما اگر نتوانید نتایج تحلیل‌هایتان را برای مشتریان توضیح دهید، نمی‌توان شما را فردی موفق نامید. این چیزی است که فرد مصاحبه‌‎کننده دوست دارد در پروسه مصاحبه شما ببیند.

    ۲- من زمینه غیرفنی دارم، چرا باید به مسائل مربوط به مهندسی نرم‌افزار بپردازم؟

    علوم داده

    این سوالی است که بیش از باقی سوال‌ها ذهن افراد را درگیر کرده و امید است بعد از خواندن این مطلب دیگر جواب آن را بدانید.

    هدف اصلی هر پروژه علوم داده این است که تولید داشته باشد. پس مهم ‌نیست که مدل شما چقدر دقیق است، اگر به مرحله تولید نرسد، هنوز نیمه‌تمام شناخته می‎شود.

    برای نوشتن یک کد با کیفیت مناسب که در زمان تولید مشکل به بار نیاورد، لازم است که اصول مهندسی نرم‌افزار را بدانید. همچنین باید اطلاعاتی در زمینه فرایند پروژه‌های توسعه نرم‌افزار، انواع داده‌ها و غیره بدانید.

    نوشتن کدهای تمیز و تاثیرگذار در مسیر طولانی پیش رویتان کمک زیادی به شما خواهد کرد و باعث می‎شود همکاری بهتری با سایر هم‌تیمی‌هایتان داشته باشید. لازم نیست حتما یک مهندس نرم‌افزار باشید، اما دانستن اصول، کمک زیادی به شما خواهد کرد.

    ۳- آیا برای این که یک متخصص داده خوب باشم باید برنامه‌نویسی را به خوبی بلد باشم؟

    نه این که لازم باشد در زمینه برنامه‌‎نویسی فوق‌العاده باشید، اما باید به اندازه کافی و مناسب خوب باشید. بگذارید سوالی بپرسم: برای علوم داده چه زبانی را ترجیح می‌دهید؟ پایتون Python، آر R ، اس ای اس SAS یا شاید جولیا Julia ؟ مثالی از پایتون برایتان می‌آورم. برای این که یک متخصص داده خوب باشید باید تمرینات کافی در زمینه کار با پایتون داشته باشید. باید درباره اصول یادگیری ماشین مانند پانداز Pandas، نامپی NumPy و اسکیت Scikit بدانید. باید بتوانید به راحتی درباره عملکرد این سیستم‌ها بنویسید و صحبت کنید، حتی اگر نتوانید کدهایی با استفاده از آن‌ها بنویسید. در واقع لازم نیست در همه زبان‌ها استاد باشید، بهتر است یکی را انتخاب کنید و در آن متخصص شوید.

    علوم داده

    اگر دوست دارید اطلاعات تکمیلی در زمینه علوم داده داشته باشید، بهتر است سری به بلک‌بلت پلاس BlackBelt + بزنید، جایی که متخصصان یادگیری ماشین در آن مشغول آموزش اکسل Excel ، اس کیو ال SQL ، پایتون و غیره هستند.

    ۴- گسترش مدل چیست و چرا باید درباره‌اش بدانم؟

    وقتی پروژه علوم داده‌ای را تکمیل کردید، زمان آن خواهد بود که به کاربران توضیح دهید مزایای قدرت پیش‌گویی مدل‌های یادگیری ماشین چه هستند. به زبان ساده‌تر، این یک گسترش مدل است. از نظر تجاری این یکی از مهم‌ترین قدم‌ها است و البته آخرین چیزی است که همیشه آموزش داده می‌شود.

    برای مثال، یک شرکت بیمه از علوم داده‌ای استفاده کرده که از تصاویر مربوط به تصادف‌های اتومبیل میزان خسارت را بررسی کند. تیم علوم داده شب و روز کار کردند تا مدلی توسعه دهند که نتایج قابل قبولی داشته باشد. بعد از ماه‌ها کار سخت مدلی ارائه دادند که مشتریان از آن بسیار راضی بودند، اما بعد چه شد؟

    کاربر این مدل یک شرکت بیمه بود و در واقع این مدل باید توسط افرادی استفاده می‌شد که هیچ اطلاعی از علوم داده نداشتند. در نتیجه روی کارت گرافیک‌ لپ‎تاپ‎هایشان  ژوپیتر Jupyter یا کولب Colab نداشتند و با وجود آن‌ها است که پروسه توسعه مدل تکمیل می‌شود.

    این معمولا ماموریت مهندسان یادگیری ماشین است، اما به توجه به شرکتی که در آن کار می‌کنید، شرایط متفاوت خواهد بود. در نتیجه مهم است که حتی اگر شرکتتان چنین چیزی از شما نخواسته و در حیطه وظایف شما نیست، اصول گسترش مدل را بدانید و همچنین بتوانید توضیح دهید که چرا مهم است.

    ۵- موقعیت‌های شغلی در زمینه علوم داده چیست؟

    نه این که متخصص علوم داده جذاب‌ترین شغل قرن ۲۱ باشد، اما تا سال ۲۰۲۵ یکی از پرکاربردترین و جذاب‌ترین‌ها خواهد بود. در نتیجه برای مشتاقان این زمینه سال‌های خوبی در راه است. مطمئن باشید در دنیای علوم داده به اندازه کافی شغل‌های متنوع وجود دارد. می‎توانید تحلیلگر کسب و کار، تحلیلگر داده و حتی فردی مهم در یک تیم مهندسی یادگیری ماشین شوید.

    توانایی‌های مهم برای یک متخصص علوم داده کدنویسی، ریاضیات و توانایی‌های جستجو هستند و هرچه فرد بیشتر مشتاق و مشغول به یادگیری باشد، بهتر می‌تواند مسیر رسیدن به موفقیت در این زمینه را طی کند.

    ۶- هنگام نوشتن یک رزومه مناسب برای موقعیت شغلی علوم داده به چه مهارت‌هایی باید اشاره شود؟

    مهارت‌های بی‌پایانی هستند که می‌توان در رزومه به آن‌ها اشاره کرد، اما سوال اصلی این است که بهتر است از ۱۰ مهارتی که در آن متوسط هستید یاد کنید یا فقط چند مورد را بنویسید که در آن استاد هستید؟ همان طور که می‌توان حدس زد، مورد دوم. مصاحبه‌کننده انتظار دارد در هر مهارتی که در رزومه به آن اشاره کردید، استاد باشید. اجازه دهید به چند مورد به صورت قدم به قدم بپردازیم:

    * بر اساس نقش شغلی مهارت‌ها را اولویت‌بندی کنید

    هر مصاحبه‌کننده‌ای برای استخدام کارمندانش انتظارات خاصی از هر فردی دارد. قالب‌بندی رزومه شما باید بر اساس شرح شغلی‌تان باشد. برای مثال، اگر در موقعیت شغلی آمده که به دنبال استخدام فردی با توانایی زیاد در زمینه پایتون و یادگیری ماشین است، باید بیشتر تمرکزتان را روی بیان توانایی‌هایتان در این زمینه بگذارید. حتی برای پز دادن می‎توانید همه پروژه‌های مربوط به یادگیری ماشین که تجربه کار در آن داشتید را معرفی کنید. نه این که انقدر به پروژه‌های زیادی که در آن‌ها کار کردید، بپردازید، که موضوع اصلی فراموش شود و کار را از دست بدهید.

    * اشاره به پروژه‌های علوم داده

    همان‌طور که در سوالات قبلی به آن اشاره شد، دانش تمرینی بیشتر از دانش تئوری، توجه را جلب می‌کند و بیشتر نشان می‌دهد که شما در زمینه کاری‌تان مهارت دارید. سعی کنید به پروژه‌هایی اشاره کنید که بیشتر مهارت‌هایی که به آن اشاره کردید را در بر داشته باشد.

    * پروفایل گیت‌هاب را فراموش نکنید

    این روزها داشتن یک پروفایل گیت‌هاب GitHub ضروری است، مخصوصا اگر بخواهید در زمینه شغلی علوم داده مشغول شوید و مهارت‌های مورد نیازشان فقط اکسل و اس کیو ال نباشد. داشتن یک پروفایل گیت‌هاب باعث بالا رفتن اعتماد شما و همچنین بااعتمادتر نشان دادن شما می‎شود و به مصاحبه‌کننده این حس را می‌دهد که شما آماده‎اید هریک از پروژه‎هایی که در آن بودید بررسی شود. مطمئنا با این کار قلب مصاحبه‌کننده را به دست خواهید آورد.

    * رسیدگی به کل رزومه

    اگر رزومه نتواند چهره دقیق و واضحی از شما توصیف کند، دیگر اهمیتی ندارد که شما به چه میزان فرد توانمندی هستید. در نتیجه باید حتی به اندازه نوشته‌ها، فونت‌ها و ساختار رزومه هم دقت کنید.

    ۷- برای به دست آورد یک موقعیت شغلی در زمینه علوم داده، آیا لازم است درباره آمار هم چیزی بدانیم؟

    یک شعار مشهور است که می‎گوید «آمار، دستور زبان علوم داده است Statistics is the grammar of Data Science ». پس برای این که به این سوال، پاسخی کوتاه بدهیم، بله، باید آمار را بشناسید. اما نترسید. لازم نیست در زمینه آمار در حد یک استاد باشید و دوره‎های پیشرفته آن را بگذرانید. در زیر به مواردی که بهتر است به آن‌ها بپردازید اشاره شده است:

    * آمار توصیفی (معانی، مدها، مغایرت‌ها، انحرافات استاندارد)

    * آمار استنباطی (بررسی فرضیه‌ها، زد تست z test، تی تست t-test، درجه اهمیت، پی ولیو p-value )

    * آنالیزهای آماری (پسرفت خطی linear regression ، پیش‌بینی‌ها، پسرفت استدلالی logistic regression )

    این لیست اصلی موضوعاتی است که باید در آن مهارت زیادی داشته باشید و اگر منابع درست و مناسب را انتخاب کنید، وقت زیادی از شما نخواهد گرفت. می‎توانید بلک‌بلت Blackbelt را هم بررسی کنید و از منابع خوب آماری آن استفاده کنید.

    ۸- آیا باید در هکاتون‌ها hackathons شرکت کنم؟ کمکی در گرفتن شغل به من خواهد کرد؟

    رقابت‌های علوم داده و شرکت در آن‌ها باعث می‎شود در زمینه‌هایی که یاد گرفتید به مراتب قوی‌‍تر شوید. در واقع با این کار شما فهم بهتری از دامنه، تکنیک‌ها و جریان‌های پروژه‌های یادگیری ماشین خواهید داشت.

    بسیاری از افراد مصاحبه‌کننده توجه زیادی به هکاتون‌های فرد در رزومه‎اش خواهند داشت. پس اگر تا به حال در آن‌ها شرکت نکردید، وقت را از دست ندهید.

    ۹- مزایای داشتن مدرک علوم داده چیست؟

    مطمئنا داشتن این مدرک مزایای زیادی دارد. اولین نکته این است که نشان می‌دهد شما به این زمینه علاقه‌مند بوده‌اید. هرچند این مشکل وجود دارد که به خاطر بیشتر شدن تمایلات به این رشته، قیمت دوره‌ها به شدت افزایش داشته است. در این شرایط چه می‌توان کرد؟

    کلاس‌های رایگانی که ارائه شدند، نشان می‌دهند که شما علاقه زیادی داشتید، اما تاثیرگذاری دیگر دوره‌ها را ندارند. باید در دوره‌ای شرکت کنید که شما را با پروژه‌های سطح بالای این صنعت آشنا کند. باید مدرکی داشته باشید که در سطح استاندارد باشد و بتواند نشان دهد که اطلاعات و هوش شما در این زمینه را محک زده است.

    در نهایت اگر تصمیم دارید در دوره‌ها شرکت کنید، باید عاقلانه درباره آن‌ها تصمیم بگیرید. به دنبال مدرکی باشید که در این صنعت به آن بها داده می‎شود.

    ۱۰- چطور می‌توانم متخصص علوم داده‎ای شوم که برای ورود به صنعت آماده است؟

    خیلی‌ها این سوال را دارند. اما اول باید بررسی کنیم که آماده بودن برای این صنعت یعنی چه. یعنی کسی که به غیر از مهارت‌های نرم، مهارت‎های سخت هم داشته باشد و بتواند بدون این که در شرکتی نیاز به تعلیم دیدن داشته باشد، کار را انجام دهد. این متخصصان درست از روز اول تاثیر زیادی در شرکت دارند.

    برای تبدیل شدن به چنین فردی می‌توانید در دوره‌های بسیاری شرکت کنید تا با تدریس سرفصل‌های لازم شما را برای ورود به صنعت آماده کنند. بهتر است در این دوره‌ها به غیر از واحدهای تئوری، کلاس‌های عملی هم داشته باشید و با پروژه‌هایی که در دنیای واقعی وجود دارند، آشنا شوید. مدرس دوره هم باید این توانایی را داشته باشد که شما را در مسیر رسیدن به هدفتان راهنمایی و یاری کند.

    دلایل اصلی سردرگمی شرکت‌ها برای رسیدن به نرخ بازگشت سرمایه با هوش مصنوعی

    مقاله قبلی

    رونمایی از هدفون مجهز به هوش مصنوعی: ایربادی که سمعک است!

    مقاله بعدی

    شما همچنین ممکن است دوست داشته باشید

    نظرات

    پاسخ دهید

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *