پژوهشی چشمگیر در خصوص یادگیری ماشینی لبه در Qualcomm
یادگیری ماشینی لبه از مباحث داغ و هیجانبرانگیز این روزها به شمار میرود. پیادهسازی الگوریتمها و تحلیل دادهها در خود گیتها (یا حتی حسگرها) به جای ارسالشان به فضای ابری، منجر به صرفهجویی در زمان، پهنای باند و انرژی و همچنین تضمین حریم خصوصی کاربران شده است.
تاکنون، یادگیری ماشینی لبه فقط شامل استنتاج بوده (اجرای دادههای ورودی در مدلی آماده و بررسی انطباق بین آنها) و آموزش الگوریتم همچنان در فضای ابری انجام میگیرد؛ اما Qualcomm سعی دارد با کاهش انرژی لازم برای آموزش الگوریتمها، امکان اجرای آنها در لبه را فراهم کند.
ورود یادگیری ماشین به دستگاههای لبه، بدین معناست که دادههای کاربران بر روی دستگاههایشان میماند؛ در نتیجه، تضمین حریم خصوصی آسانتر شده و انرژی و هزینه مربوط به انتقال دادهها کاهش مییابد. به علاوه، با تکیه بر این فناوری، میتوان خدمات شخصیسازیشدهتری به کاربران ارائه داد. همه اینها از مزایای چشمگیر یادگیری ماشینی لبه به شمار میروند؛ حال سؤال ما اینجاست که Qualcomm به چه کشف جدیدی رسیده است؟
گروهبندی تحقیقات شرکت
جوزف سوریاگا، مدیر ارشد فناوری Qualcomm، تحقیقات این شرکت را در چهار دسته کلی، گروهبندی کرده است. پیش از اینکه این چهار دسته را معرفی کنیم، ابتدا فرایند آموزش مدلهای یادگیری ماشین را با هم مرور میکنیم:
آموزش مدلهای یادگیری ماشین نیاز به کامپیوتری دارد که بتواند حجم زیادی از داده را تجزیه و تحلیل کند و در حافظهاش نگه دارد، تا انطباقشان با هدف الگوریتم را بسنجد؛ به همین دلیل، این فرایند معمولاً در فضای ابری انجام میگیرد. به عنوان مثال، فرض کنید میخواهیم به یک مدل یادگیری ماشین بیاموزیم که گربهها را تشخیص دهد. بدین منظور، باید تعداد زیادی تصویر گربه به آن ماشین بدهیم. کامپیوتر به تدریج دانشش را اصلاح میکند و محاسباتی انجام میدهد که متخصصان میتوانند بسنجند و تغییر دهند؛ بدین منظور، طی فرایند وزندهی، به مؤلفههایی که در تشخیص گربه نقش دارند، وزن بیشتری میدهند.
ساخت یک مدل خوب به توان محاسباتی، حافظه و پهنای باند زیاد نیاز دارد. فناوریهای لبه تاکنون توان محاسباتی یا حافظه زیادی در اختیار نداشتهاند؛ به همین دلیل است که قادر به استنتاج هستند؛ اما همزمان با انجام این کار، نمیتوانند یادگیری داشته باشند. سوریاگا و همکارانش روشهایی جدید معرفی کردهاند که امکان شخصیسازی و به کارگیری مدلها در لبه را فراهم میآورد.
few-shot
یکی از این روشها، یادگیری few-shot نام دارد؛ این روش مخصوص مواقعی است که محققان میخواهند الگوریتم را تغییر دهند، تا با دادههای پرت outliers منطبق شود. سوریاگا برای توضیح این روش از مسئله «تشخیص کلمه فعالسازی» استفاده کرده است. بر اساس نتایج، این روش میتواند دقت مدل را برای کاربرانی که لهجه دارند یا به سختی میتوانند کلمه موردنظر را ادا کنند، بهبود ببخشد و 30 درصد افزایش دهد؛ اما دلیل کارایی این روش چیست؟ از آنجایی که دیتاست بهکاررفته، محدود و پاکسازیشده است، مدل را میتوان بدون منابع و توان محاسباتیِ بالا آموزش داد.
روش دیگر آموزش در لبه، یادگیری پیوسته با دادههای بدون برچسب unlabeled data است. در این راهکارها، مدلی آماده با دادههایی که به مرور زمان وارد دستگاه لبه میشوند، بهروزرسانی میشود؛ اما این دادهها برچسب ندارند و میتوانند بیش از حد شخصیسازی شده باشند؛ به همین دلیل، هنگام استفاده از این راهکار، باید دقت لازم را به خرج داد.
البته یادگیری یکپارچه Federated learning احتمالاً جالبترین روش موجود است؛ در این رویکرد، میتوان به کمک دو روش قبلی، الگوریتمها را به صورت محلی دستکاری کرد و مدلهای تغییریافته را به فضای ابری فرستاد یا با سایر دستگاههای لبه به اشتراک گذاشت. شرکت Qualcomm بر مسئله تشخیص افراد بر اساس شاخصهای بیومتریک تمرکز داشته است. درحالحاضر، تشخیص افراد بر اساس چهره، اثر انگشت یا صدا، مستلزم ارسال این دادهها (تصویر چهره و…) به فضای ابری است؛ اما برای ایمنی بیشتر، میتوان الگوریتمی ساخت که برای هر کاربر، به صورت محلی آموزش ببیند.
الگوریتم تعبیهشده در فضای ابری میتواند چهرهها را از یکدیگر تمیز دهد؛ اما انطباق چهره کاربر باید در سطح محلی انجام شود. بدین ترتیب، دادههای مربوط به چهره هر کاربر، به شکل خصوصی باقی میماند، اما تکتک ویژگیهای چهره به فضای ابری بر میگردند، تا به الگوریتم ابتدایی کمک کنند. نسخه تغییریافته الگوریتم به دستگاههای لبه بر میگردد؛ در این مرحله، به منظور محافظت از حریم خصوصی، مقداری نویز به دادهها اضافه میشود. بنابراین، بدون به اشتراکگذاری دادههای شخصی، الگوریتم مبتنی بر فضای ابری به مرور زمان بهتر و بهتر میشود.
نیاز به دادههای فراوان
این رویکرد به دادههایی فراوان نیاز دارد که با توجه به توضیحات قبلی، نمیتوان بدون اجازه از شبکههای اجتماعی یا وبسایتهای عکاسی جمعآوری کرد. در یکپارچهسازی یادگیری بین چندین دستگاه، مقدار زیادی ورودی وجود خواهد داشت؛ اما دادههای خام بههیچوجه از دستگاه خارج نمیشوند.
در پایان نیز باید به دنبال راهی برای کاهش پیچیدگیهای محاسباتی لازم در ساخت الگوریتم بود. این مبحث، جنبه ریاضیاتی پررنگی دارد و به همین دلیل، در این نوشتار، وارد جزئیات آن نمیشویم. در مجموع، میتوان گفت راهحل مشکلات ناشی از آموزش در فضای ابری، اجرای فرایند آموزش بر روی دستگاههایی است که از نظر محاسباتی، پیچیدگی کمتری دارند.
به عقیده گروه تحقیقاتی Qualcomm، یکی از راهحلها، عدم استفاده از پسانتشار برای وزندهی به مؤلفههای مدل (هنگام ساخت مدل) است. آنها آموزش کوآنتیزهشده را به جای این روش پیشنهاد میکنند که از مدلهای کارآمدتری استفاده میکند و مشکلات ناشی از پسانتشار را کاهش میدهد. این پژوهشگران روشی به نام «برآورد بازه ادراکی On-hindsight range estimation» ابداع کردهاند که به انطباق مدلها با دستگاههای لبه کمک میکند (برای مطالعه بیشتر در خصوص این روش به مقاله اصلی مراجعه کنید.) به طور خلاصه باید گفت، این روش میتواند در عین کاهش 79 درصدی حافظه موردنیاز، به نتایج و دقتی برابر با روشهای آموزشی قدیمی دست یابد.
یادگیری ماشینی لبه تا چندی پیش، رؤیایی دور از ذهن به نظر میرسید. با جدّیتر شدن قوانین حمایت از حریم خصوصی و امنیت در دستگاههای IoT و همچنین تأکید بسیار بر کاهش انرژی مصرفی، آموزش لبه از خواسته به یک ضرورت تبدیل شده است.
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید