Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 افزایش دقت مدل تشخیص چهره با روش متعادل‌ سازی هیستوگرام

افزایش دقت مدل تشخیص چهره با روش متعادل‌ سازی هیستوگرام

زمان مطالعه: 4 دقیقه

اگر با فناوری تشخیص چهره و OpenCV کار کرده باشید می‌دانید که امتیاز تشخیص در چهره‌هایی که کنتراست واضح‌تری دارند، به طرز معناداری بالا است. حال این سوال پیش می‌آید که چطور می‌توان کنتراست تصاویر را بصورت خودکار ارتقاء داد؟ در بخش‌های بعدیِ مقاله، مفهومِ «متعادل‌ سازی هیستوگرام» histogram equalization را توضیح خواهیم داد.

اگر این مطلب را تا آخر بخوانید، شیوه ارتقای امتیازِ تشخیص را یاد خواهید گرفت. ابتدا باید بدانیم کنتراست در پردازش تصویر به چه معناست. در پایان، این مقاله چگونگیِ بکارگیری «روش متعادل ‌سازی هیستوگرام» بسیار پیشرفته‌ای را در تصاویر رنگی تبیین خواهد کرد. برای این منظور از الگوریتم متعادل ‌سازی هیستوگرام وفقی Adaptive Histogram Equalization algorithm استفاده خواهیم کرد.

کنتراست تصویر چیست؟

به این تعریف ویکیپدیا توجه کنید: «اختلاف رنگ یا روشنایی باعث می‌شود یک شیء از سایر اشیاء در دامنه دید یکسان قابل‌تفکیک باشد.»
هر کسی که با عکاسی آشنایی داشته باشد، می‌داند که تعریف فوق منطقی است. آنچه مشکل ایجاد می‌کند، کنتراست زیاد یا کم است. این تعریف مستقیماً می‌گوید که به چه چیزی برای جداسازی اشیاء از پس‌زمینه‌شان نیاز است. باید روش کار بهینه باشد.

 

تصویر‌ها با کنتراست کم و زیاد
تفاوت بین تصویر‌ها با کنتراست کم و زیاد

تصویر سمت چپ کنتراست کمتری در مقایسه با تصویر سمت راست دارد. برخلاف تصویر سمت راست، خطوط و برجستگی‌های چهره سمت چپ به سختی قابل مشاهده هستند. اما باید به این نکته توجه داشت که اگر تصویر کنتراست بیش از حدی داشته باشد، اطلاعات ظریف از دست می‌روند. این مسئله می‌تواند موجب نگرانی متخصصان داده شود. اگر قبل از دسته‌بندی شیء به ارتقای کنتراست بپردازید، قدری از نویز کاسته می‌شود و مدل بهبود پیدا می‌کند. بنابراین، وقتی از یک الگوریتم برای ارتقای کنتراست استفاده می‌کنید، دست از زیاده‌روی بردارید.

[irp posts=”8488″]

متعادل‌ سازی هیستوگرام

متعادل ‌سازی هیستوگرام یک روش پردازش تصویر برای تنظیم شدت آن تصویر است. این کار به ارتقای کنتراست تصویر کمک شایانی می‌کند. می‌توان از یک هیستوگرام برای توضیح این کار استفاده کرد. هیستوگرامِ متعادل‌سازی شده به این معناست که تصویر از همه سطوح خاکستری با نسبت برابر استفاده می‌کند.

افزون براین، شدت به شکل بهتری در هیستوگرام توزیع می‌شود. تصویرِ زیر این توضیحات را به خوبی نشان می‌دهد؛ حرف T بیانگر تابع تبدیل است. افرادی که تا حدی با آمار آشنایی دارند، باید با این توضیحات موافق باشند.

متعادل‌ سازی هیستوگرام
متعادل ‌سازی هیستوگرام

OpenCV از روشی موسوم به cv2.equalizeHist() بهره می‌برد. این روش هیستوگرام را در تصویر ورودی به کار می‌گیرد. این روش در آن دسته از تصاویری که پس‌زمینه و پیش‌زمینه تاریک یا روشنی دارند، به خوبی عمل می‌کند. اما متعادل‌سازیِ هیستوگرام با محدودیت قابل‌توجهی روبروست.

این روش زمانی به بهترین شیوه عمل می‌کند که توزیع مقادیر پیکسل در کل تصویر مشابه باشد. اگر برخی از نواحی تفاوت چشم‌گیری با دیگر بخش‌های تصویر داشته باشند، شاید امکان افزایش درست کنتراست در برخی نواحی وجود نداشته باشد. این مثال از تصویر را در ذهن تجسم کنید که نور از پنجره به داخل راه پیدا می‌کند و بعضی از بخش‌های تصویر روشن‌تر دیده می‌شوند.

[irp posts=”8342″]

متعادل‌سازیِ هیستوگرام وفقی
برای اینکه کاستی‌های الگوریتم متعادل ‌سازی هیستوگرام را حل کنید، می‌توانید چند هیستوگرام برای یک تصویر محاسبه کنید. در این صورت، هر هیستوگرام ناحیه مشخصی از تصویر را دربرمی‌گیرد. این کار باعث می‌شود همه نواحی تصویر به صورت مجزا ارتقاء پیدا کند. بدین ترتیب، مسئله اصلی رفع می‌شود.

با این حال، الگوریتم متعادل ‌سازی هیستوگرام مسئله جدیدی را به وجود می‌آورد. این الگوریتم می‌تواند کنتراست را در نواحی نسبتاً ثابتِ تصویر بیش از اندازه ارتقاء ببخشد. به همین منظور، روش دیگری در بخش بعدی معرفی خواهیم کرد که عملکرد بهتری دارد.

الگوریتم متعادل‌ سازی هیستوگرام با کنتراست محدود

همان‌طور که در بخش پیشین ذکر شد، متعادل‌ سازی هیستوگرام وفقی باعث می‌شود نویز در نواحی نسبتاً ثابتِ تصویر افزایش پیدا کند. الگوریتمی که در این بخش پیشنهاد می‌شود، این افزایش نویز را محدود می‌کند. این کار با توزیعِ آن بخش از هیستوگرام که از حد مجاز تخطی می‌کند، به انجام می‌رسد. اما می‌خواهید نتایجِ بکارگیری این الگوریتم را ببینید، این‌طور نیست؟ یک مثال خوب در بخش زیر آورده‌ایم.

بایدن
رئیس جمهور فعلیِ آمریکا، قبل و بعد از بکارگیری الگوریتم CLAHE

استفاده از OpenCV

اکثر فرایندهای اجرا تنها با تصاویر مقیاس خاکستری سازگار هستند. اگر در این بخش مثالی از تصویر رتگی برایتان بیاوریم، موضوع را بهتر متوجه می‌شوید. فرایند اجرا به صورت زیر است: استفاده از روش CLAHE برای تصاویر BRG. مهم‌ترین بخش در این مقاله پوشش داده شد و امیدواریم متخصصان داده بتوانند بقیه مراحل را طی کنند. با این حال، این روش با جزئیات بیشتری توضیح داده خواهد شد. در ابتدا، تصویر BGR به فرمت HSV تبدیل شد. باید دقت کنیم که رنگ یا اشباع‌شدگیِ تصویر خراب نشود.

[irp posts=”20424″]


قبل از هر چیز باید HSV را توضیح دهیم:


• رنگ (Hue): عبارتی که برای رنگ‌های طیف خالص به کار برده می‌شود و معمولاً با عنوان «اسامی رنگی» از آن یاد می‌کنند (قرمز، نارنجی، زرد، آبی، سبز و بنفش).

• اشباع‌شدگی (Saturation): شدت رنگ در یک تصویر. رنگ‌های اصلی (قرمز، آبی و زرد) خالص‌ترین رنگ‌ها به شمار می‌آیند زیرا کاملاً اشباع هستند. با افزایش اشباع‌شدگی، رنگ‌ها خالص‌تر دیده می‌شوند.

• مقدار (Value): روشنایی یا تاریکیِ یک رنگ. تصویری که فاقد رنگ یا اشباع‌شدگی باشد، تصویر مقیاس خاکستری است.
در گام بعد باید CLAHE را در اندازه تصویر به کار برد. پارامترهای استفاده شده را توضیح خواهیم داد. محدودیت clipping باید به کمتر از 40 کاهش پیدا کند. پارامتری تحت عنوان اندازه «tile grid» می‌تواند تصویر را به 64 قطعه با 8 ستون و 8 ردیف تقسیم کند. تصور کنید تصویر ورودی‌تان 160×160 پیکسل باشد. در این مورد، تصویر را به نواحیِ 20×20 پیکسل تقسیم می‌کنیم. هر دو پارامتر غالباً به عنوان پیش‌فرض مورد استفاده قرار می‌گیرند. به خاطر داشته باشید که اگر دنبال رفتار باثبات هستید، باید همه تصاویر را در مقیاس یکسان قرار دهید. در گام نهایی، قبل از اینکه عکس را به فرمت اصلی BGR برگردانیم، کانال اندازه را با کانال رنگ و اشباع‌شدگی ادغام می‌کنیم.

OpenCV

چه زمانی باید از این روش استفاده کرد؟

پاسخ این پرسش را به خوانندگان مقاله واگذار می‌کنیم. از دید ما، این روش می‌تواند در مرحله تشخیص و بازشناسی مورد استفاده قرار گیرد. این مراحل در بخش زیر توضیح داده می‌شوند.

مرحله تشخیص

در این مرحله، می‌توان اشیای بیشتری را پیدا کرد. ما این روش را آزمایش کردیم . مدل می‌تواند پس از استفاده از CLAHE به شناسایی اشیای بیشتری بپردازد. برای مثال، امکان استفاده از آن در اسکن MRI نیز وجود دارد. با این حال، بهتر است گاهی در تشخیص اشیاء از ابزار «up-sample» استفاده کنیم. تاثیرِ این کار بیشتر از بکارگیریِ CLAHE است.

مرحله بازشناسی

همان‌طور که در بخش‌های پیشین مشاهده کردیم، یقیناً استفاده از CLAHE در مرحله تشخیص خیلی مفید است. برای مثال، وقتی افراد برای آموزشِ مدل به دسته‌بندی تصاویر نیاز داشته باشند، مرحله بازشناسی به آنها کمک می‌کند آن کار را بهتر انجام دهند. این روش می‌تواند گام پیش‌پردازش خوبی نیز برای مدل‌های خاصی از یادگیری ماشینی باشد. در حال حاضر نمی‌توان با قطعیت گفت که این روش تفاوت قابل ملاحظه‌ای در بازشناسی اشیاء ایجاد می‌کند یا خیر، چرا که یافتنِ تحقیقات خوب درباره این موضوع دشوار است.

نتیجه‌گیری

امیدواریم بتوانید از مطالب این مقاله برای ارتقای ابزارهای بازشناسی و تشخیص اشیاء استفاده کنید. ما همواره منتظر نظرات و پیشنهادهای شما هستیم. پس نظرات خود را در پایان این مقاله در وب‌سایت ما درج کنید.

 مدل تشخیص چهره

 

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]