آموزش پردازش زبان طبیعی با اکوسیستم هاگینگ فیس؛ ساخت کارت مدل (قسمت چهارم فصل چهارم)

تیم تحریریه
۲۲ اسفند ۱۴۰۰

زمان مطالعه: 3 دقیقه

به جرات می‌توان گفت که کارت مدل Model Card به لحاظ اهمیت با فایل‌های مدل و توکن‌کننده یکسان است. کارت مدل می‌تواند قابلیت استفاده‌ی مجدد اعضاء و تکرار نتایج را تضمین کند. افزون بر این، پلتفرم مفیدی به واسطه‌ی آن ایجاد می‌شود که سایر اعضا می‌توانند آرتیفکت خودشان را در آن ایجاد نمایند.

ارائه‌ی مستندِ فرایند آموزش و ارزیابی این فرصت را در اختیار دیگران قرار می‌دهد تا انتظارات‌شان را از مدل تنظیم کنند. بنابراین، اطلاعات کافی درباره داده‌های مورد استفاده و مراحل پس‌پردازش و پیش‌پردازش نیز به دست می‌آید. افزون بر این، محدودیت‌ها، سوگیری‌ها و بافتی که مدل در آن قرار دارد مورد شناسایی قرار گرفته و درک بهتری از آنها حاصل می‌آید. در نتیجه، ساخت کارت مدلی که تعریف دقیق و شفافی از مدل ارائه کند، یکی از مراحل بسیار مهم برشمرده می‌شود. در مقاله حاضر، به چند ترفند برای ارتقای عملکرد در این بخش اشاره خواهیم کرد. همان‌طور که پیشتر دیدید، فایل README.md برای ساخت کارت مدل الزامی است.

مفهوم کارت مدل برای نخستین بار در مقاله‌ی مارگارت و همکارانش به نام «کارت‌های مدل برای گزارش مدل Model Cards for Model Reporting» معرفی شد. بخش عمده‌ای از اطلاعاتی که در بخش حاضر گنجانده شده، از آن مقاله برگرفته شده است. اگر می‌خواهید بدانید چرا کارت‌های مدل در جهانی که به تکرارپذیری، قابلیت استفاده مجدد و عدالت ارج می‌نهد، اهمیت بسزایی دارد، توصیه می‌کنیم مقاله‌ی این پژوهشگران را مطالعه کنید. کارت مدل معمولاً با مرور بسیار کوتاهی از ماهیت مدل آغاز می‌شود و جزئیات بیشتر در بخش‌های بعدی ذکر می‌شوند:

تعریف مدل
کاربردها و محدودیت‌ها
نحوه‌ی استفاده
داده‌‍‌های آموزش
رویکرد آموزشی
نتایج ارزیابی

اینک، نگاهی بیندازیم به محتوای هر کدام از این بخش‌ها:

فهرست مقاله پنهان

1 تعریف مدل

2 کاربردها و محدودیت‌ها

تعریف مدل

این بخش، جزئیات پایه‌ای درباره مدل ارائه می‌کند که از جمله آنها می‌توان به معماری، نسخه، معرفی در مقاله، امکان دسترسی به نسخه اصلی، نویسنده و اطلاعات کلی درباره مدل اشاره کرد. هرگونه کپی‌رایت باید با ذکر نام و منبع همراه باشد. اطلاعات کلی درباره راهکارهای آموزشی، پارامترها و تکذیب دعاوی نیز در این بخش ذکر می‌شود.

کاربردها و محدودیت‌ها

موارد کاربرد مدل در این بخش معرفی می‌شوند؛ از جمله مهم‌ترین موارد می‌توان به فیلدها، زبان‌ها و حوزه‌های کاربرد اشاره کرد. این بخش از کارت مدل به مستندسازیِ بخش‌هایی می‌پردازد که دور از دسترس مدل هستند یا احتمال ارائه‌ی عملکرد بهینه در آن وجود دارد.

نحوه‌ استفاده

این بخش حاوی نمونه‌هایی است که نحوه‌ی استفاده از مدل را نشان می‌دهد. کاربرد روش pipeline، کاربرد مدل و دسته‌های توکن‌کننده و کدهای مفید دیگر نیز در این بخش توضیح داده می‌شوند.

داده‌های آموزش

دیتاست‌هایی که برای آموزش مدل به کار رفته‌اند، در این بخش نشان داده می‌شوند. ممکن است توضیح مختصری هم درباره دیتاست ارائه شود.

رویکرد آموزشی

کلیه جنبه‌های مرتبط با آموزش که به لحاظ تکرارپذیری حائز اهمیت هستند، در این بخش توضیح داده می‌شوند. این جنبه‌ها می‌تواند شامل مراحل پیش‌پردازش و پس‌پردازشی باشد که بر روی داده‌ها پیاده‌سازی شده است. جزئیاتی مثل تعداد دوره‌های آموزش مدل، اندازه دسته یا بچ، نرخ یادگیری و غیره نیز در این بخش جای دارند.

متغیر و متریک‌ها

متریک‌های استفاده شده برای ارزیابی و عوامل مختلفی که اندازه گرفته می‌شوند، همگی باید در این بخش توضیح داده شوند. اشاره به اینکه چه متریکی در چه دیتاستی استفاده شده است، کار را برای مقایسه‌ی عملکرد مدل آسان‌تر می‌کند. این اطلاعات تا حدی در بخش‌های قبلی مثل کاربران مورد نظر و موارد کاربردی نیز قابل دسترس هستند.

نتایج ارزیابی

عملکرد مدل در دیتاست ارزیابی در این بخش مورد بررسی قرار می‌گیرد. اگر مدل از یک آستانه‌ی تصمیم استفاده می‌کند، بهتر است آستانه‌ی تصمیم مورد استفاده در ارزیابی ارائه شود یا جزئیاتی درباره ارزیابی در آستانه‌های مختلف ارائه شود.

مثال

در زیر، چند مثال از کارت مدل نشان داده شده است:

مثال‌های بیشتری از شرکت‌ها و سازمان‌های مختلف در این لینک ذکر شده است:

نکته

کارت مدل برای انتشار مدل ضروری نیست؛ همچنین، لازم نیست همه موارد توصیف شده در فوق را برای ساخت کارت به کار بگیرید. با این حال، مستندسازیِ صریح مدل می‌تواند به نفع کاربران آتی باشد؛ پس توصیه می‌کنیم بخش‌های بیشتری را پوشش دهید تا دانش و توانمندی‌هایتان افزایش یابد.

متاداده‌ کارت مدل

اگر قدری Hugging Face Hub را بررسی کرده باشید، احتمالاً دیده‌اید که برخی مدل‌ها به دسته‌های خاصی تعلق دارند. آنها به تفکیک کار، زبان، کتابخانه و غیره فیلتر می‌شوند. دسته‌های مدل به بر اساس متاداده‌های افزوده شده در هِدر کارت مدل شناسایی می‌شوند. برای نمونه، اگر نگاهی به کارت مدل camembert-base بیندازید، می‌بینید که کدهای زیر در هدر کارت مدل به کار رفته است:

---
language: fr
license: mit
datasets:
- oscar
---

این متاداده با Hugging Face Hub تجزیه می‌شود. سپس، این مدل به عنوان مدل فرانسوی با مجوز MIT شناخته می‌شود که با دیتاست اسکار آموزش داده شده است. توضیحات کامل کارت مدل می‌تواند اطلاعات مناسبی درباره مجوزها، زبان، برچسب‌ها، متریک‌ها، دیتاست‌ها و نتایج آموزش ارائه کند.

برای دسترسی به دیگر فصل‌ها و قسمت‌های دوره آموزشی پردازش زبان طبیعی با اکوسیستم هاگینگ فیس از لینک زیر استفاده کنید:

[button href=”https://hooshio.com/%D8%B1%D8%B3%D8%A7%D9%86%D9%87-%D9%87%D8%A7/%D8%A2%D9%85%D9%88%D8%B2%D8%B4-%D9%BE%D8%B1%D8%AF%D8%A7%D8%B2%D8%B4-%D8%B2%D8%A8%D8%A7%D9%86-%D8%B7%D8%A8%DB%8C%D8%B9%DB%8C/” type=”btn-default” size=”btn-lg”]آموزش پردازش زبان طبیعی[/button]

https://hooshio.com/?p=25058

جدیدترین تحولات هوش مصنوعی را در کانال بله هوشیو بخوانید

آموزش پردازش زبان طبیعی با اکوسیستم هاگینگ فیس؛ ساخت کارت مدل (قسمت چهارم فصل چهارم)

تعریف مدل

کاربردها و محدودیت‌ها

نحوه‌ استفاده

داده‌های آموزش

رویکرد آموزشی

متغیر و متریک‌ها

نتایج ارزیابی

مثال

نکته

متاداده‌ کارت مدل

قابلیت Model Council در Perplexity

پایان GPT-4o پیش از ولنتاین؛ کاربران خشمگین و غمگین شدند

افزونه هوش Claude در پاورپوینت

همکاری OpenAI با G42 برای ساخت هوش مصنوعی برای دولت امارات

مهندسی پرامپت: راهنمای جامع از مبتدی تا پیشرفته

معرفی هوش مصنوعی سازمانی

از کدام چت‌بات‌های هوش مصنوعی استفاده کنیم؟

ضرورت بازنگری نقش کمیسیون هوش مصنوعی سازمان نصر ایران در سالگرد تأسیس

رونمایی از نخستین دستیار هوش مصنوعی قضایی ایران

ضرورت بازنگری نقش کمیسیون هوش مصنوعی سازمان نصر ایران در سالگرد تأسیس

سامانه هوش مصنوعی مرکز وکلا قوه قضاییه رونمایی شد

آموزش رایگان هوش مصنوعی برای کودکان محلات کم‌برخوردار

قابلیت Model Council در Perplexity

پایان GPT-4o پیش از ولنتاین؛ کاربران خشمگین و غمگین شدند

افزونه هوش Claude در پاورپوینت

همکاری OpenAI با G42 برای ساخت هوش مصنوعی برای دولت امارات

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

قابلیت Model Council در Perplexity

پایان GPT-4o پیش از ولنتاین؛ کاربران خشمگین و غمگین شدند

افزونه هوش Claude در پاورپوینت

همکاری OpenAI با G42 برای ساخت هوش مصنوعی برای دولت امارات

GPT-5.2 به کشفی تازه در فیزیک نظری رسید

تعریف مدل

کاربردها و محدودیت‌ها

نحوه‌ استفاده

داده‌های آموزش

رویکرد آموزشی

متغیر و متریک‌ها

نتایج ارزیابی

مثال

نکته

متاداده‌ کارت مدل

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید