سوالات مصاحبه هوش مصنوعی گوگل: اگر 10 پاسخ درست بدهید استخدام میشوید!
به دست آوردن یک شغل در شرکت گوگل، غول تکنولوژی، برای هر انسانی مانند یک رویا است. کسی که به این رویا دست پیدا کند میتواند فرصت کار کردن با متخصصان با استعداد را پیدا کند و در کنار یادگرفتن از آنها اطلاعاتش را با این افراد در میان بگذارد. اما سوالات مصاحبه هوش مصنوعی گوگل اصلا آسان نیستند.
البته که حتی فرصت به دست آوردن مصاحبه شغلی در گوگل هم کاری دشوار است و برای دستیابی به آن باید دانش عمیق و تجربه عملی با پروژهها داشت. در صورتی که فردی بتواند به مرحله مصاحبه برسد، با معماهایی که ذهن را درگیر میکند، سوالاتی که مربوط به واکنش در شرایط بحرانی است، سوالات فنی، کدنویسی و دیگر سوالات مواجه میشود.
10 سوال مهم در مصاحبه دیتاساینس گوگل
در این مقاله ما به 10 سوال مهم یادگیری ماشین که در مصاحبه دیتاساینس گوگل از افراد پرسیده شده، پرداختهایم. سوالات مصاحبه گوگل از منابع مختلف، اظهارنظرات، مطالعات و مکالمات مختلف بین افراد جمعآوری شدند.
1- اگر حذف مقادیر از دست رفته از یک مجموعه داده باعث سوگیری شود، چه خواهید کرد؟
این یکی از سوالات مصاحبه گوگل است. در جواب باید گفت، هنگام کار بر روی یک پروژه یادگیری ماشین، اکثر محققان با دادههای از دست رفته در مجموعه داده روبرو میشوند. این دادههای از دست رفته میتوانند چندین مشکل در پروژه ایجاد کنند. مثلا میتوانند قدرت آماری را کاهش دهند و حتی باعث سوگیری شوند. با این وجود، روشهای مختلفی برای رفع این مشکل وجود دارد. برای مثال میتوان میانگین، میانه، حالت و غیره را جایگزین کرد تا سوگیریها کاهش پیدا کنند.
2- چگونه برای مشاغل موتور توصیهگر طراحی کنیم؟
سیستم های توصیه گر به موتوری گفته میشود که اساسا مانند فیلتری عمل میکند که با توجه به علاقه و دادههای مربوط به سابقه رفتاری کاربرد، میآموزد و به او پیشنهاد میدهد. نمونه آن سیستم توصیهگر لینکدین است که مشاغل مناسب را به افراد مناسب پیشنهاد میدهد.
3- واحد خطی اصلاحشده در یادگیری ماشین چیست؟
یکی دیگر از سوالات مصاحبه گوگل درباره واحد خطی اصلاح شده است. واحد خطی اصلاحشده یک تابع فعالسازی گسترده است که اجازه میدهد تا مقادیر مثبت عبور کنند و مقادیر منفی را مسدود میکند و در نتیجه باعث تسریع روند میشود.
4- تفاوت مدل کیسهای با مدل تقویتشده چیست؟
کیسهگذاری و تقویت روشهای محبوبی هستند. کیسهگذاری راهی است که واریانس پیشبینی را با تولید دادههای اضافی برای آموزش از مجموعه داده با استفاده از ترکیبات با تکرارها برای تولید چند مجموعه از دادههای اصلی کاهش میدهد. اما تقویت یک روش تکراری است که وزن یک مشاهده را بر اساس آخرین طبقهبندی تنظیم میکند.
5- الگوریتم AdaGrad در یادگیری ماشین چیست؟
AdaGrad یک الگوریتم نزولی شیب تصادفی تطبیقی است که برای بهینهسازی مبتنی بر شیب استفاده میشود. با استفاده از AdaGrad میتوان به مزایای مختلفی دست پیدا کرد، مثلا نیازی به تنظیم دستی میزان یادگیری نیست، همگرایی نزول ساده گرادیان تصادفی به نسبت زمانی که مقیاس وزنهها نابرابر است، سریعتر و قابل اطمینانتر خواهد بود.
6- درجه آزادی برای لاسو چقدر است؟
لاسو lasso یک تکنیک محبوب ساخت مدل است که همزمان مدلهای دقیق و مختصر تولید میکند. در رگرسیون خطی درجه آزادی به معنی تعداد پیشبینیهای برآورده شده است و نقش مهمی در ارزیابی و انتخاب مدل دارد. از درجههای آزادی معمولا برای کاهش پیچیدگی روش مدلسازی آماری استفاده میشود. اساسا تعداد ضرایب غیرصفر یک برآورد بیطرفانه و سازگار برای درجات آزادی لاسو است.
7- روشهای تشخیص ناهنجاری چیست؟
یکی از سوالات مصاحبه گوگل مربوط به تشخیص ناهنجاری است. تشخیص ناهنجاری تکنیکی است که برای شناسایی الگوهای غیرمعمول که مطابق با رفتار مورد انتظار دورریزها نیستند، استفاده میشود. روشهای مختلفی وجود دارد که میتوان ناهنجاریها را با آنها تشخیص داد، مانند روشهای آماری ساده، تشخیص ناهنجاری مبتنی بر تراکم، تشخیص ناهنجاری مبتنی بر خوشه و غیره.
8- AUC در یادگیری ماشین چیست؟
AUC یا منطقه تحت منحنی ROC یکی از مهمترین معیارهای ارزیابی برای بررسی عملکرد هر مدل طبقهبندی است که برای تجسم عملکرد مسئله طبقهبندی چندطبقه استفاده میشود. AUC اندازهگیری کل عملکرد را در تمام آستانههای ممکن طبقهبندی و همچنین کل منطقه دوبعدی زیر کل منحنی ROC را اندازهگیری میکند.
9- حافظه پنهان چگونه کار میکند و چگونه از آن در دیتاساینس استفاده کنیم؟
حافظه پنهان یک لایه ذخیره اطلاعات با سرعت بالا است که زیرمجموعهای از دادهها را ذخیره میکند. این کار برای کاربرانی که میخواهند در آینده از آن دادهها استفاده کنند، بسیار مفید خواهد بود و میتوانند سریعتر به دادهها دسترسی پیدا کنند. همچنین میتوانند مکان ذخیرهسازی اصلی دادهها را جستجو کنند.
10- چرا باید از انتخاب ویژگی استفاده کرد؟
آخرین سوال از سوالات مصاحبه گوگل مربوط به ویژگی انتخاب است. انتخاب ویژگی به عنوان متغیر انتخاب هم شناخته میشود و روشی برای کاهش ابعداد داده در حین انجام تجزیهوتحلیل پیشبینی است. همچنین تعداد ویژگیها در مجموعه داده را به گونهای کاهش میدهد که ویژگیهایی را که بدون تغییر در دادهها وجود دارد، حذف میکند.