Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 آموزش پردازش زبان طبیعی با اکوسیستم هاگینگ فیس؛ ساخت کارت مدل (قسمت چهارم فصل چهارم)

آموزش پردازش زبان طبیعی با اکوسیستم هاگینگ فیس؛ ساخت کارت مدل (قسمت چهارم فصل چهارم)

زمان مطالعه: 3 دقیقه

به جرات می‌توان گفت که کارت مدل Model Card به لحاظ اهمیت با فایل‌های مدل و توکن‌کننده یکسان است. کارت مدل می‌تواند قابلیت استفاده‌ی مجدد اعضاء و تکرار نتایج را تضمین کند. افزون بر این، پلتفرم مفیدی به واسطه‌ی آن ایجاد می‌شود که سایر اعضا می‌توانند آرتیفکت خودشان را در آن ایجاد نمایند.

ارائه‌ی مستندِ فرایند آموزش و ارزیابی این فرصت را در اختیار دیگران قرار می‌دهد تا انتظارات‌شان را از مدل تنظیم کنند. بنابراین، اطلاعات کافی درباره داده‌های مورد استفاده و مراحل پس‌پردازش و پیش‌پردازش نیز به دست می‌آید. افزون بر این، محدودیت‌ها، سوگیری‌ها و بافتی که مدل در آن قرار دارد مورد شناسایی قرار گرفته و درک بهتری از آنها حاصل می‌آید. در نتیجه، ساخت کارت مدلی که تعریف دقیق و شفافی از مدل ارائه کند، یکی از مراحل بسیار مهم برشمرده می‌شود. در مقاله حاضر، به چند ترفند برای ارتقای عملکرد در این بخش اشاره خواهیم کرد. همان‌طور که پیشتر دیدید، فایل README.md برای ساخت کارت مدل الزامی است.

مفهوم کارت مدل برای نخستین بار در مقاله‌ی مارگارت و همکارانش به نام «کارت‌های مدل برای گزارش مدل Model Cards for Model Reporting» معرفی شد. بخش عمده‌ای از اطلاعاتی که در بخش حاضر گنجانده شده، از آن مقاله برگرفته شده است. اگر می‌خواهید بدانید چرا کارت‌های مدل در جهانی که به تکرارپذیری، قابلیت استفاده مجدد و عدالت ارج می‌نهد، اهمیت بسزایی دارد، توصیه می‌کنیم مقاله‌ی این پژوهشگران را مطالعه کنید. کارت مدل معمولاً با مرور بسیار کوتاهی از ماهیت مدل آغاز می‌شود و جزئیات بیشتر در بخش‌های بعدی ذکر می‌شوند:

  • تعریف مدل
  • کاربردها و محدودیت‌ها
  • نحوه‌ی استفاده
  • داده‌‍‌های آموزش
  • رویکرد آموزشی
  • نتایج ارزیابی

اینک، نگاهی بیندازیم به محتوای هر کدام از این بخش‌ها:

تعریف مدل

این بخش، جزئیات پایه‌ای درباره مدل ارائه می‌کند که از جمله آنها می‌توان به معماری، نسخه، معرفی در مقاله، امکان دسترسی به نسخه اصلی، نویسنده و اطلاعات کلی درباره مدل اشاره کرد. هرگونه کپی‌رایت باید با ذکر نام و منبع همراه باشد. اطلاعات کلی درباره راهکارهای آموزشی، پارامترها و تکذیب دعاوی نیز در این بخش ذکر می‌شود.

کاربردها و محدودیت‌ها

موارد کاربرد مدل در این بخش معرفی می‌شوند؛ از جمله مهم‌ترین موارد می‌توان به فیلدها، زبان‌ها و حوزه‌های کاربرد اشاره کرد. این بخش از کارت مدل به مستندسازیِ بخش‌هایی می‌پردازد که دور از دسترس مدل هستند یا احتمال ارائه‌ی عملکرد بهینه در آن وجود دارد.

نحوه‌ استفاده

این بخش حاوی نمونه‌هایی است که نحوه‌ی استفاده از مدل را نشان می‌دهد. کاربرد روش pipeline، کاربرد مدل و دسته‌های توکن‌کننده و کدهای مفید دیگر نیز در این بخش توضیح داده می‌شوند.

داده‌های آموزش

دیتاست‌هایی که برای آموزش مدل به کار رفته‌اند، در این بخش نشان داده می‌شوند. ممکن است توضیح مختصری هم درباره دیتاست ارائه شود.

رویکرد آموزشی

کلیه جنبه‌های مرتبط با آموزش که به لحاظ تکرارپذیری حائز اهمیت هستند، در این بخش توضیح داده می‌شوند. این جنبه‌ها می‌تواند شامل مراحل پیش‌پردازش و پس‌پردازشی باشد که بر روی داده‌ها پیاده‌سازی شده است. جزئیاتی مثل تعداد دوره‌های آموزش مدل، اندازه دسته یا بچ، نرخ یادگیری و غیره نیز در این بخش جای دارند.

متغیر و متریک‌ها

متریک‌های استفاده شده برای ارزیابی و عوامل مختلفی که اندازه گرفته می‌شوند، همگی باید در این بخش توضیح داده شوند. اشاره به اینکه چه متریکی در چه دیتاستی استفاده شده است، کار را برای مقایسه‌ی عملکرد مدل آسان‌تر می‌کند. این اطلاعات تا حدی در بخش‌های قبلی مثل کاربران مورد نظر و موارد کاربردی نیز قابل دسترس هستند.

نتایج ارزیابی

عملکرد مدل در دیتاست ارزیابی در این بخش مورد بررسی قرار می‌گیرد. اگر مدل از یک آستانه‌ی تصمیم استفاده می‌کند، بهتر است آستانه‌ی تصمیم مورد استفاده در ارزیابی ارائه شود یا جزئیاتی درباره ارزیابی در آستانه‌های مختلف ارائه شود.

مثال

در زیر، چند مثال از کارت مدل نشان داده شده است:

مثال‌های بیشتری از شرکت‌ها و سازمان‌های مختلف در این لینک ذکر شده است:

نکته

کارت مدل برای انتشار مدل ضروری نیست؛ همچنین، لازم نیست همه موارد توصیف شده در فوق را برای ساخت کارت به کار بگیرید. با این حال، مستندسازیِ صریح مدل می‌تواند به نفع کاربران آتی باشد؛ پس توصیه می‌کنیم بخش‌های بیشتری را پوشش دهید تا دانش و توانمندی‌هایتان افزایش یابد.

متاداده‌ کارت مدل

اگر قدری Hugging Face Hub را بررسی کرده باشید، احتمالاً دیده‌اید که برخی مدل‌ها به دسته‌های خاصی تعلق دارند. آنها به تفکیک کار، زبان، کتابخانه و غیره فیلتر می‌شوند. دسته‌های مدل به بر اساس متاداده‌های افزوده شده در هِدر کارت مدل شناسایی می‌شوند. برای نمونه، اگر نگاهی به کارت مدل camembert-base بیندازید، می‌بینید که کدهای زیر در هدر کارت مدل به کار رفته است:

---
language: fr
license: mit
datasets:
- oscar
---

این متاداده با Hugging Face Hub تجزیه می‌شود. سپس، این مدل به عنوان مدل فرانسوی با مجوز MIT شناخته می‌شود که با دیتاست اسکار آموزش داده شده است. توضیحات کامل کارت مدل می‌تواند اطلاعات مناسبی درباره مجوزها، زبان، برچسب‌ها، متریک‌ها، دیتاست‌ها و نتایج آموزش ارائه کند.

برای دسترسی به دیگر فصل‌ها و قسمت‌های دوره آموزشی پردازش زبان طبیعی با اکوسیستم هاگینگ فیس از لینک زیر استفاده کنید:

[button href=”https://hooshio.com/%D8%B1%D8%B3%D8%A7%D9%86%D9%87-%D9%87%D8%A7/%D8%A2%D9%85%D9%88%D8%B2%D8%B4-%D9%BE%D8%B1%D8%AF%D8%A7%D8%B2%D8%B4-%D8%B2%D8%A8%D8%A7%D9%86-%D8%B7%D8%A8%DB%8C%D8%B9%DB%8C/” type=”btn-default” size=”btn-lg”]آموزش پردازش زبان طبیعی[/button]

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]