یادگیری ماشینی لبه
آموزش‌های پیشرفته هوش مصنوعیاخبارداده کاوی و بیگ دیتا

پژوهشی چشمگیر در خصوص یادگیری ماشینی لبه در Qualcomm

    0
    مدت زمان مطالعه: ۴ دقیقه

    یادگیری ماشینی لبه از مباحث داغ و هیجان‌برانگیز این روزها به شمار می‌رود. پیاده‌سازی الگوریتم‌ها و تحلیل داده‌ها در خود گیت‌ها (یا حتی حسگرها) به جای ارسال‌شان به فضای ابری، منجر به صرفه‌جویی در زمان، پهنای باند و انرژی و همچنین تضمین حریم خصوصی کاربران شده است.

    تاکنون، یادگیری ماشینی لبه فقط شامل استنتاج بوده (اجرای داده‌های ورودی در مدلی آماده و بررسی انطباق بین آن‌ها) و آموزش الگوریتم همچنان در فضای ابری انجام می‌گیرد؛ اما Qualcomm سعی دارد با کاهش انرژی لازم برای آموزش الگوریتم‌ها، امکان اجرای آن‌ها در لبه را فراهم کند.

    ورود یادگیری ماشین به دستگاه‌های لبه، بدین معناست که داده‌های کاربران بر روی دستگاه‌هایشان می‌ماند؛ در نتیجه، تضمین حریم خصوصی آسان‌تر شده و انرژی و هزینه‌ مربوط به انتقال داده‌ها کاهش می‌یابد. به علاوه، با تکیه بر این فناوری، می‌توان خدمات شخصی‌سازی‌شده‌تری به کاربران ارائه داد. همه‌ این‌ها از مزایای چشمگیر یادگیری ماشینی لبه به شمار می‌روند؛ حال سؤال ما اینجاست که Qualcomm به چه کشف جدیدی رسیده است؟

    یادگیری ماشینی لبه

    گروه‌بندی تحقیقات شرکت

    جوزف سوریاگا، مدیر ارشد فناوری Qualcomm، تحقیقات این شرکت را در چهار دسته‌ کلی، گروه‌بندی کرده است. پیش از اینکه این چهار دسته را معرفی کنیم، ابتدا فرایند آموزش مدل‌های یادگیری ماشین را با هم مرور می‌کنیم:

    آموزش مدل‌های یادگیری ماشین نیاز به کامپیوتری دارد که بتواند حجم زیادی از داده را تجزیه و تحلیل کند و در حافظه‌اش نگه دارد، تا انطباق‌شان با هدف الگوریتم را بسنجد؛ به همین دلیل، این فرایند معمولاً در فضای ابری انجام می‌گیرد. به عنوان مثال، فرض کنید می‌خواهیم به یک مدل یادگیری ماشین بیاموزیم که گربه‌ها را تشخیص دهد. بدین منظور، باید تعداد زیادی تصویر گربه به آن ماشین بدهیم. کامپیوتر به تدریج دانشش را اصلاح می‌کند و محاسباتی انجام می‌دهد که متخصصان می‌توانند بسنجند و تغییر دهند؛ بدین منظور، طی فرایند وزن‌دهی، به مؤلفه‌هایی که در تشخیص گربه نقش دارند، وزن بیشتری می‌دهند.

    ساخت یک مدل خوب به توان محاسباتی، حافظه و پهنای باند زیاد نیاز دارد. فناوری‌های لبه تاکنون توان محاسباتی یا حافظه‌ زیادی در اختیار نداشته‌اند؛ به همین دلیل است که قادر به استنتاج هستند؛ اما همزمان با انجام این کار، نمی‌توانند یادگیری داشته باشند. سوریاگا و همکارانش روش‌هایی جدید معرفی کرده‌اند که امکان شخصی‌سازی و به کارگیری مدل‌ها در لبه را فراهم می‌آورد.

    few-shot

    یکی از این روش‌ها، یادگیری few-shot نام دارد؛ این روش مخصوص مواقعی است که محققان می‌خواهند الگوریتم را تغییر دهند، تا با داده‌های پرت outliers منطبق شود. سوریاگا برای توضیح این روش از مسئله‌ «تشخیص کلمه‌ فعال‌سازی» استفاده کرده است. بر اساس نتایج، این روش می‌تواند دقت مدل را برای کاربرانی که لهجه دارند یا به سختی می‌توانند کلمه‌ موردنظر را ادا کنند، بهبود ببخشد و ۳۰ درصد افزایش دهد؛ اما دلیل کارایی این روش چیست؟ از آنجایی که دیتاست به‌کاررفته، محدود و پاکسازی‌شده است، مدل را می‌توان بدون منابع و توان محاسباتیِ بالا آموزش داد.

    روش دیگر آموزش در لبه، یادگیری پیوسته با داده‌های بدون برچسب unlabeled data است. در این راهکارها، مدلی آماده با داده‌هایی که به مرور زمان وارد دستگاه لبه می‌شوند، به‌روزرسانی می‌شود؛ اما این داده‌ها برچسب ندارند و می‌توانند بیش از حد شخصی‌سازی شده باشند؛ به همین دلیل، هنگام استفاده از این راهکار، باید دقت لازم را به خرج داد.

    البته یادگیری یکپارچه Federated learning احتمالاً جالب‌ترین روش موجود است؛ در این رویکرد، می‌توان به کمک دو روش قبلی، الگوریتم‌ها را به صورت محلی دستکاری کرد و مدل‌های تغییریافته را به فضای ابری فرستاد یا با سایر دستگاه‌های لبه به اشتراک گذاشت. شرکت Qualcomm بر مسئله‌ تشخیص افراد بر اساس شاخص‌های بیومتریک تمرکز داشته است. درحال‌حاضر، تشخیص افراد بر اساس چهره، اثر انگشت یا صدا، مستلزم ارسال این داده‌ها (تصویر چهره و…) به فضای ابری است؛ اما برای ایمنی بیشتر، می‌توان الگوریتمی ساخت که برای هر کاربر، به صورت محلی آموزش ببیند.

    الگوریتم تعبیه‌شده در فضای ابری می‌تواند چهره‌ها را از یکدیگر تمیز دهد؛ اما انطباق چهره‌ کاربر باید در سطح محلی انجام شود. بدین ترتیب، داده‌های مربوط به چهره‌ هر کاربر، به شکل خصوصی باقی می‌ماند، اما تک‌تک ویژگی‌های چهره به فضای ابری بر می‌گردند، تا به الگوریتم ابتدایی کمک کنند. نسخه‌ تغییریافته‌ الگوریتم به دستگاه‌های لبه بر می‌گردد؛ در این مرحله، به منظور محافظت از حریم خصوصی، مقداری نویز به داده‌ها اضافه می‌شود. بنابراین، بدون به اشتراک‌گذاری داده‌های شخصی، الگوریتم مبتنی بر فضای ابری به مرور زمان بهتر و بهتر می‌شود.

    نیاز به داده‌های فراوان

    این رویکرد به داده‌هایی فراوان نیاز دارد که با توجه به توضیحات قبلی، نمی‌توان بدون اجازه از شبکه‌های اجتماعی یا وب‌سایت‌های عکاسی جمع‌آوری کرد. در یکپارچه‌سازی یادگیری بین چندین دستگاه، مقدار زیادی ورودی وجود خواهد داشت؛ اما داده‌های خام به‌هیچ‌وجه از دستگاه خارج نمی‌شوند.

    در پایان نیز باید به دنبال راهی برای کاهش پیچیدگی‌های محاسباتی لازم در ساخت الگوریتم بود. این مبحث، جنبه‌ ریاضیاتی پررنگی دارد و به همین دلیل، در این نوشتار، وارد جزئیات آن نمی‌شویم. در مجموع، می‌توان گفت راه‌حل مشکلات ناشی از آموزش در فضای ابری، اجرای فرایند آموزش بر روی دستگاه‌هایی است که از نظر محاسباتی، پیچیدگی کمتری دارند.

    به عقیده‌ گروه تحقیقاتی Qualcomm، یکی از راه‌حل‌ها، عدم استفاده از پس‌انتشار برای وزن‌دهی به مؤلفه‌های مدل (هنگام ساخت مدل) است. آن‌ها آموزش کوآنتیزه‌شده را به جای این روش پیشنهاد می‌کنند که از مدل‌های کارآمدتری استفاده می‌کند و مشکلات ناشی از پس‌انتشار را کاهش می‌دهد. این پژوهشگران روشی به نام «برآورد بازه‌ ادراکی On-hindsight range estimation» ابداع کرده‌اند که به انطباق مدل‌ها با دستگاه‌های لبه کمک می‌کند (برای مطالعه‌ بیشتر در خصوص این روش به مقاله‌ اصلی مراجعه کنید.) به طور خلاصه باید گفت، این روش می‌تواند در عین کاهش ۷۹ درصدی حافظه‌ موردنیاز، به نتایج و دقتی برابر با روش‌های آموزشی قدیمی دست یابد.

    یادگیری ماشینی لبه تا چندی پیش، رؤیایی دور از ذهن به نظر می‌رسید. با جدّی‌تر شدن قوانین حمایت از حریم خصوصی و امنیت در دستگاه‌های IoT و همچنین تأکید بسیار بر کاهش انرژی مصرفی، آموزش لبه از خواسته به یک ضرورت تبدیل شده است.

    جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

    این مطلب چه میزان برای شما مفید بوده است؟
    [کل: ۱ میانگین: ۴]

    بررسی چالش‌های آینده هوش مصنوعی در گفتگو با نویسنده کتاب «الهیات سایبر»

    مقاله قبلی

    تنسورفلو یا پای تورچ؟

    مقاله بعدی

    شما همچنین ممکن است دوست داشته باشید

    نظرات

    پاسخ دهید

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *