آموزش پردازش زبان طبیعی با اکوسیستم هاگینگ فیس؛ ساخت کارت مدل (قسمت چهارم فصل چهارم)
به جرات میتوان گفت که کارت مدل Model Card به لحاظ اهمیت با فایلهای مدل و توکنکننده یکسان است. کارت مدل میتواند قابلیت استفادهی مجدد اعضاء و تکرار نتایج را تضمین کند. افزون بر این، پلتفرم مفیدی به واسطهی آن ایجاد میشود که سایر اعضا میتوانند آرتیفکت خودشان را در آن ایجاد نمایند.
ارائهی مستندِ فرایند آموزش و ارزیابی این فرصت را در اختیار دیگران قرار میدهد تا انتظاراتشان را از مدل تنظیم کنند. بنابراین، اطلاعات کافی درباره دادههای مورد استفاده و مراحل پسپردازش و پیشپردازش نیز به دست میآید. افزون بر این، محدودیتها، سوگیریها و بافتی که مدل در آن قرار دارد مورد شناسایی قرار گرفته و درک بهتری از آنها حاصل میآید. در نتیجه، ساخت کارت مدلی که تعریف دقیق و شفافی از مدل ارائه کند، یکی از مراحل بسیار مهم برشمرده میشود. در مقاله حاضر، به چند ترفند برای ارتقای عملکرد در این بخش اشاره خواهیم کرد. همانطور که پیشتر دیدید، فایل README.md برای ساخت کارت مدل الزامی است.
مفهوم کارت مدل برای نخستین بار در مقالهی مارگارت و همکارانش به نام «کارتهای مدل برای گزارش مدل Model Cards for Model Reporting» معرفی شد. بخش عمدهای از اطلاعاتی که در بخش حاضر گنجانده شده، از آن مقاله برگرفته شده است. اگر میخواهید بدانید چرا کارتهای مدل در جهانی که به تکرارپذیری، قابلیت استفاده مجدد و عدالت ارج مینهد، اهمیت بسزایی دارد، توصیه میکنیم مقالهی این پژوهشگران را مطالعه کنید. کارت مدل معمولاً با مرور بسیار کوتاهی از ماهیت مدل آغاز میشود و جزئیات بیشتر در بخشهای بعدی ذکر میشوند:
- تعریف مدل
- کاربردها و محدودیتها
- نحوهی استفاده
- دادههای آموزش
- رویکرد آموزشی
- نتایج ارزیابی
اینک، نگاهی بیندازیم به محتوای هر کدام از این بخشها:
تعریف مدل
این بخش، جزئیات پایهای درباره مدل ارائه میکند که از جمله آنها میتوان به معماری، نسخه، معرفی در مقاله، امکان دسترسی به نسخه اصلی، نویسنده و اطلاعات کلی درباره مدل اشاره کرد. هرگونه کپیرایت باید با ذکر نام و منبع همراه باشد. اطلاعات کلی درباره راهکارهای آموزشی، پارامترها و تکذیب دعاوی نیز در این بخش ذکر میشود.
کاربردها و محدودیتها
موارد کاربرد مدل در این بخش معرفی میشوند؛ از جمله مهمترین موارد میتوان به فیلدها، زبانها و حوزههای کاربرد اشاره کرد. این بخش از کارت مدل به مستندسازیِ بخشهایی میپردازد که دور از دسترس مدل هستند یا احتمال ارائهی عملکرد بهینه در آن وجود دارد.
نحوه استفاده
این بخش حاوی نمونههایی است که نحوهی استفاده از مدل را نشان میدهد. کاربرد روش pipeline، کاربرد مدل و دستههای توکنکننده و کدهای مفید دیگر نیز در این بخش توضیح داده میشوند.
دادههای آموزش
دیتاستهایی که برای آموزش مدل به کار رفتهاند، در این بخش نشان داده میشوند. ممکن است توضیح مختصری هم درباره دیتاست ارائه شود.
رویکرد آموزشی
کلیه جنبههای مرتبط با آموزش که به لحاظ تکرارپذیری حائز اهمیت هستند، در این بخش توضیح داده میشوند. این جنبهها میتواند شامل مراحل پیشپردازش و پسپردازشی باشد که بر روی دادهها پیادهسازی شده است. جزئیاتی مثل تعداد دورههای آموزش مدل، اندازه دسته یا بچ، نرخ یادگیری و غیره نیز در این بخش جای دارند.
متغیر و متریکها
متریکهای استفاده شده برای ارزیابی و عوامل مختلفی که اندازه گرفته میشوند، همگی باید در این بخش توضیح داده شوند. اشاره به اینکه چه متریکی در چه دیتاستی استفاده شده است، کار را برای مقایسهی عملکرد مدل آسانتر میکند. این اطلاعات تا حدی در بخشهای قبلی مثل کاربران مورد نظر و موارد کاربردی نیز قابل دسترس هستند.
نتایج ارزیابی
عملکرد مدل در دیتاست ارزیابی در این بخش مورد بررسی قرار میگیرد. اگر مدل از یک آستانهی تصمیم استفاده میکند، بهتر است آستانهی تصمیم مورد استفاده در ارزیابی ارائه شود یا جزئیاتی درباره ارزیابی در آستانههای مختلف ارائه شود.
مثال
در زیر، چند مثال از کارت مدل نشان داده شده است:
مثالهای بیشتری از شرکتها و سازمانهای مختلف در این لینک ذکر شده است:
نکته
کارت مدل برای انتشار مدل ضروری نیست؛ همچنین، لازم نیست همه موارد توصیف شده در فوق را برای ساخت کارت به کار بگیرید. با این حال، مستندسازیِ صریح مدل میتواند به نفع کاربران آتی باشد؛ پس توصیه میکنیم بخشهای بیشتری را پوشش دهید تا دانش و توانمندیهایتان افزایش یابد.
متاداده کارت مدل
اگر قدری Hugging Face Hub را بررسی کرده باشید، احتمالاً دیدهاید که برخی مدلها به دستههای خاصی تعلق دارند. آنها به تفکیک کار، زبان، کتابخانه و غیره فیلتر میشوند. دستههای مدل به بر اساس متادادههای افزوده شده در هِدر کارت مدل شناسایی میشوند. برای نمونه، اگر نگاهی به کارت مدل camembert-base بیندازید، میبینید که کدهای زیر در هدر کارت مدل به کار رفته است:
--- language: fr license: mit datasets: - oscar ---
این متاداده با Hugging Face Hub تجزیه میشود. سپس، این مدل به عنوان مدل فرانسوی با مجوز MIT شناخته میشود که با دیتاست اسکار آموزش داده شده است. توضیحات کامل کارت مدل میتواند اطلاعات مناسبی درباره مجوزها، زبان، برچسبها، متریکها، دیتاستها و نتایج آموزش ارائه کند.
برای دسترسی به دیگر فصلها و قسمتهای دوره آموزشی پردازش زبان طبیعی با اکوسیستم هاگینگ فیس از لینک زیر استفاده کنید:
[button href=”https://hooshio.com/%D8%B1%D8%B3%D8%A7%D9%86%D9%87-%D9%87%D8%A7/%D8%A2%D9%85%D9%88%D8%B2%D8%B4-%D9%BE%D8%B1%D8%AF%D8%A7%D8%B2%D8%B4-%D8%B2%D8%A8%D8%A7%D9%86-%D8%B7%D8%A8%DB%8C%D8%B9%DB%8C/” type=”btn-default” size=”btn-lg”]آموزش پردازش زبان طبیعی[/button]