یادگیری با نظارت چیست؟ هرآنچه باید درباره آن بدانید
همانطور که میدانید دادههای جدید تولیدشده به الگوریتمهای یادگیری ماشین داده میشوند و آنها عملیات خود را برای بهبود عملکرد یاد میگیرند و بهینه میکنند و در طول زمان هوش را توسعه میدهند. چهار نوع الگوریتم یادگیری ماشین وجود دارد: تحت نظارت، نیمه نظارتی، بدون نظارت و یادگیری تقویتی. در این مقاله قصد داریم شما را با یادگیری با نظارت (تحت نظارت) آشنا کنیم.
یادگیری با نظارت یا supervised learning چیست؟
یادگیری نظارتشده یکی از رویکردهای یادگیری ماشین است که در آن، یک الگوریتم کامپیوتری دادههای ورودی را برای به دست آوردن نتیجه مشخصشدهای برچسبگذاری کرده و بر اساس آنها به مدل آموزش میدهند. این مدل تا زمانی آموزش داده میشود که بتواند الگوها و روابط زیربنایی بین دادههای ورودی و برچسبهای خروجی را تشخیص دهد و آن را قادر میسازد تا بتواند هنگام مواجه با دادههایی که قبلاً دیده نشده است، برچسبگذاری دقیقی ارائه دهد.
یادگیری با ناظر در طبقهبندی و مشکلات رگرسیون، مانند تعیین اینکه یک مقاله خبری به چه دستهای تعلق دارد یا پیشبینی حجم فروش برای تاریخ معین آینده، خوب است. در یادگیری نظارتشده، هدف این است که دادهها را در چارچوب یک سؤال خاص معنا کنیم.
در مقابل یادگیری با نظارت، یادگیری بدون نظارت است. در این رویکرد از یادگیری ماشین، کاربران نیاز به نظارت بر مدل ندارند. محققین در این روش به مدل این امکان را میدهند تا بهتنهایی برای کشف الگوها و اطلاعاتی که قبلاً شناسایی نشده بودند، کار کند و عمدتاً با دادههای بدون برچسب سروکار دارد.
یادگیری با نظارت چگونه کار میکند؟
مانند همه الگوریتمهای یادگیری ماشین، یادگیری با نظارت مبتنی بر آموزش است. در طول مرحله آموزش، سیستم با مجموعه دادههای برچسبگذاری شده تغذیه میشود و به مدل دستور میدهد که چه خروجی مربوط به هر مقدار ورودی خاص است. سپس مدل آموزشدیده با دادههای آزمایشی ارائه میشود: این دادههایی هستند که برچسبگذاری شدهاند، اما برچسبها به الگوریتم نشان داده نشدهاند. هدف از دادههای آزمایشی اندازهگیری میزان دقت الگوریتم بر رویدادههای بدون برچسب است.
در الگوریتمهای شبکه عصبی، فرآیند یادگیری ماشین نظارتشده با اندازهگیری مداوم خروجیهای حاصل از مدل و تنظیم دقیق سیستم برای نزدیکتر شدن بهدقت هدف بهبود مییابد. سطح دقت قابلدستیابی به دو چیز بستگی دارد: دادههای برچسبگذاری شده موجود و الگوریتم مورداستفاده. علاوه بر این:
دادههای آموزشی باید متعادل و تمیز شوند. زباله یا دادههای تکراری درک هوش مصنوعی سیستم را منحرف میکند و ازاینرو، دانشمندان باید مراقب دادههایی باشند که مدل روی آنها آموزشدیده است.
این تنوع دادههاست که تعیین میکند هوش مصنوعی در هنگام ارائه موارد جدید چقدر خوب عمل خواهد کرد. اگر نمونههای کافی در مجموعه دادههای آموزشی وجود نداشته باشد، مدل دچار تزلزل میشود و نمیتواند پاسخهای قابلاعتمادی را ارائه دهد.
[irp posts=”16210″]دقت بالا، بهطور متناقض، لزوماً نشانه خوبی نیست. همچنین میتواند به این معنی باشد که مدل از برازش بیشازحد رنج میبرد و بهعنوانمثال، با مجموعه دادههای آموزشی خاص خود هماهنگ شده است. چنین مجموعه دادهای ممکن است در سناریوهای آزمایشی عملکرد خوبی داشته باشد، اما زمانی که با چالشهای دنیای واقعی مواجه میشود، بهشدت شکست میخورد. برای جلوگیری از برازش بیشازحد، مهم است که دادههای آزمون با دادههای آموزشی متفاوت باشند تا مطمئن شویم که مدل از تجربیات قبلی خودپاسخ نمیگیرد، بلکه در عوض استنتاج مدل تعمیم داده شود.
یادگیری نظارتشده در مقابل یادگیری بدون نظارت
تفاوت اصلی بین supervised و unsupervised در نحوه یادگیری الگوریتم است. در یادگیری بدون نظارت، به الگوریتم دادههای بدون برچسب بهعنوان یک مجموعه آموزشی داده میشود. در این روش برخلاف یادگیری با نظارت، هیچ مقدار خروجی صحیحی وجود ندارد. الگوریتم الگوها و شباهتهای درون دادهها را تعیین میکند. بهعبارتدیگر، الگوریتمها میتوانند آزادانه عمل کنند تا درباره دادهها بیشتر بیاموزند و یافتههای جالب یا غیرمنتظرهای را کشف کنند که انسانها به دنبال آن نبودند.
یادگیری بدون نظارت در کاربردهای خوشهبندی (عمل کشف گروهها در دادهها) و تداعی (عمل پیشبینی قوانینی که دادهها را توصیف میکند) رایج است؛ و این در حالی است که مدلهای یادگیری نظارتشده برای طبقهبندی و رگرسیون در مجموعه دادههای برچسبدار ایدهآل هستند. تشخیص هرزنامه، طبقهبندی تصاویر، پیشبینی آبوهوا، پیشبینی قیمت از رایجترین کاربردهای مدلهای یادگیری با ناظر هستند.
[irp posts=”25600″]مزایا و محدودیتهای یادگیری با ناظر
مدلهای یادگیری نظارتشده دارای مزایایی نسبت به رویکرد بدون نظارت هستند، اما محدودیتهایی نیز دارند. سیستمهای یادگیری با نظارت بیشتر احتمال دارد قضاوتهایی را انجام دهند که انسانها میتوانند با آنها ارتباط برقرار کنند، چراکه انسانها مبنای تصمیمگیری را فراهم کردهاند.
بااینحال، در مورد روش مبتنی بر بازیابی، سیستمهای یادگیری با نظارت در برخورد با اطلاعات جدید مشکلدارند. برای مثال، اگر سیستمی با دستهبندی برای خودروها و کامیونها همراه با دوچرخه ارائه شود، باید به اشتباه در یک دسته یا دسته دیگر دستهبندی شود. اگر سیستم هوش مصنوعی مولد بود (بدون نظارت)، ممکن است نداند دوچرخه چیست، اما میتوانست آن را بهعنوان متعلق به یک دسته جداگانه تشخیص دهد.
یادگیری با نظارت نیز معمولاً به مقادیر زیادی از دادههای برچسبگذاری شده صحیح نیاز دارد تا به سطوح عملکرد قابلقبول برسد و چنین دادههایی ممکن است همیشه در دسترس نباشند. یادگیری بدون نظارت از این مشکل رنج نمیبرد و میتواند با دادههای بدون برچسب نیز کار کند.
در ادامه بهصورت موردی نیز به مزایا، معایب و چالشهای یادگیری با نظارت اشارهشده است:
- مزایای یادگیری با نظارت
- یادگیری نظارتشده به افراد این امکان را میدهد تا دادهها را جمعآوری کرده یا یک خروجی داده از تجربه قبلی تولید کنند.
- Supervised learning به توسعهدهندگان هوش مصنوعی کمک میکند تا معیارهای عملکرد را با استفاده از تجربه بهینه کنند.
- یادگیری ماشین نظارتشده به افراد کمک میکند تا انواع مختلفی از مسائل محاسباتی در دنیای واقعی را حل کنند.
- بهترین شیوهها برای یادگیری با نظارت
- قبل از انجام هر کار دیگری، باید تصمیمگیری شود که از چه نوع دادهای بهعنوان مجموعه آموزشی استفاده شود.
- توسعهدهندگان باید ساختار تابع آموختهشده و الگوریتم یادگیری را تعیین کنند.
- متخصصین هوش مصنوعی همچنین باید خروجیهای مربوطه را از متخصصان انسانی یا بر اساس اندازهگیریها جمعآوری کنند.
- چالشهای یادگیری ماشین با نظارت
- اگر ورودیها بهدرستی انتخاب نشوند، مدل نتایج درستی را در اختیار نخواهد گذاشت.
- آمادهسازی و پیشپردازش دادهها همیشه یک چالش است.
- هنگامیکه مقادیر غیرممکن، بعید و ناقص بهعنوان دادههای آموزشی واردشده باشند، دقت کاهش مییابد.
- معایب یادگیری نظارتشده
- اگر مجموعه آموزشی نمونههایی را که میخواهید در یک کلاس باشند نداشته باشید، ممکن است مرز تصمیمگیری بیشازحد تکرار و در مواردی نامشخص گردد.
- زمانی که در حال آموزش طبقهبندی هستید، باید از هر کلاس نمونههای خوب زیادی انتخاب کنید.
- طبقهبندی کلان دادهها میتواند یک چالش واقعی باشد.
- آموزش برای یادگیری با نظارت نیاز به زمان محاسباتی زیادی دارد.
نمونهای از یک پروژه آموزشی با نظارت
مشکل دستهبندی اخبار را از قبل در نظر بگیرید. یک رویکرد این است که مشخص کنید هر خبر به کدام دسته ازجمله تجارت، امور مالی، فناوری، سیاسی و یا ورزش تعلق دارد. برای حل این مشکل، یک مدل نظارتشده بهترین انتخاب خواهد بود. توسعهدهندگان از الگوریتمهای یادگیری نظارتشده استفاده میکنند تا مقالات خبری مختلف و دستهبندیهای آنها ارائه مدل کرده و از آن میخواهند بفهمد که چه نوع اخباری به هر دستهبندی تعلق دارد. بهاینترتیب، مدل قادر به تشخیص دستهبندی اخبار هر مقالهای است که بر اساس تجربهآموزشی قبلی خود به آن نگاه میکند.
بااینحال، مهندسان ممکن است به این نتیجه برسند که طبقهبندی اخبار بر اساس دستههای از پیش تعیینشده بهاندازه کافی آموزنده یا انعطافپذیر نیست، زیرا برخی اخبار ممکن است در مورد فناوریهای تغییرات آبوهوایی یا مشکلات نیروی کار در یک صنعت صحبت کنند. میلیاردها مقاله خبری وجود دارد و جدا کردن آنها به 40 یا 50 دسته ممکن است سادهسازی بیشازحد باشد. در عوض، یک رویکرد بهتر این است که شباهتهای بین مقالات خبری را بیابید و اخبار را بر اساس آن گروهبندی کنید.
این همان چیزی است که یادگیری بدون نظارت به آن دست مییابد: الگوها و شباهتهای درون دادهها را تعیین میکند، در مقابل ارتباط آن با برخی اندازهگیریهای خارجی قرار میدهد.