Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 هوش مصنوعی Meta، سیستم  ترجمه جهانی را دگرگون کرد

هوش مصنوعی Meta، سیستم  ترجمه جهانی را دگرگون کرد

زمان مطالعه: 3 دقیقه

فلش زیرِ لوگوی شرکت آمازون، معنای ساده‌ای دارد؛ به‌طوری که شما می‌توانید به راحتی محصولاتتان، از A تا Z را از یک سامانه واحد، تهیه کنید. قبول دارید این‌گونه کار شما ساده می‌شود؟ همین امر درباره سیستم ترجمه هم صدق می‌کند (تولید متن از یک زبان به زبانی دیگر). برای رسیدن به این هدف، هوش مصنوعی Meta دستاورد جدیدی را رونمایی کرده است. یک مدل چندزبانه جدید که بر روی 10 جفت از 14 جفت زبانی، بهتر از مدل‌های دوزبانه بسیار پیشرفته موجود، عمل می‌کند. موفقیت این مدل به حدی بود که توانست جایزه همایش ترجمه ماشینی (WMT) را که رقابتی معتبر در زمینه ترجمه ماشینی است، از آن خود کند. به این ترتیب، می‌توان به جرئت گفت این مدل، راهی به سوی ساخت سیستم ترجمه جهانی را به همگان معرفی کرده است.

محدودیت‌ها

هدف نهایی رشته ترجمه ماشینی (MT)، ایجاد سیستم ترجمه جهانی است که به تمام افراد اجازه می‌دهد، به اطلاعات دسترسی داشته باشند و به طرز کارآمدتری، ارتباط برقرار کنند. با این‌حال، برای اینکه این رؤیا در آینده به حقیقت بپیوندد، باید برخی از محدودیت‌های اساسی که فعلاً وجود دارند، حل شوند.

[irp posts=”20237″]

درحال‌حاضر، بسیاری از سیستم‌های ترجمه ماشینی مدرن، متکی بر مدل‌های دوزبانه هستند. این مدل‌ها به تعداد زیادی نمونه برچسب‌خورده برای هر جفت زبانی و هر تکلیفی نیاز دارند. متأسفانه زبان‌های زیادی در جهان وجود دارند که اطلاعات لازم در خصوص آموزش آن‌ها کم است، مثل زبان‌های ایسلندی و هوسا. این کمبودها، جهت‌گیری‌های خاص به سمت‌وسوی هدف را بی‌فایده می‌کنند. همچنین، پیچیدگی زیاد آن زبان‌ها، افزودن حالت‌های موجود به نرم‌افزارهای کاربردی برای سامانه‌‌ها را دشوار می‌سازد؛ مثلاً سامانه‌ای مانند فیس‌بوک که روزانه میلیاردها کاربر به صدها زبان در آن مطلب منتشر می‌کنند.

هوش مصنوعی Meta؛ ابزار نجات‌بخش

به گفته گروه هوش مصنوعی Meta، رشته ترجمه ماشینی، نیازمند است که از مدل‌های دوزبانه به سمت ترجمه چندزبانه تغییر جهت بدهد؛ به عبارت دقیق‌تر، چیزی که یک مدل واحد می‌تواند چندین زبان را همزمان ترجمه کند. به علاوه، رفتن به سمت مدل چندزبانه بهتر، هم به نفع زبان‌هایی است که دارای منابع زیاد هستند و هم به نفع زبان‌هایی است که منابع کمی دارند؛ زیرا این مدل‌ها ساده، مقیاس‌پذیر و کارآمدند. در واقع، هدف نهایی، ایجاد سیستم ترجمه جهانی است که امکان دسترسی همگان به اطلاعات و برقراری کارآمدتر ارتباط را فراهم می‌کند.

هوش مصنوعی Meta

سال گذشته، هوش مصنوعی فیس‌بوک (که اکنون Meta نام دارد) مدلM2M-100 را به عنوان اولین مدل چندزبانه به بازار معرفی کرد که بدون اتکا به داده‌های انگلیسی‌محور، هر جفت زبانی را از میان 100 زبان، ترجمه می‌کرد. این گروه، راهبردهای داده‌کاوی متفاوتی را به کار بردند، تا مجموعه‌دادهای با 5/7 میلیارد جمله از 100 زبان را به عنوان داده ترجمه، آماده سازند.

پژوهشگران انواع راهبردهای مقیاس‌بندی را به کار بردند، تا مدلی جهانی، با 15 میلیارد پارامتر ایجاد کنند. این مدل، شامل داده‌هایی از زبان‌های مرتبط است و زبان‌هایی با خط و صرف متنوع را در بر می‌گیرد و برای زبان‌هایی با منابع کم نیز کارآمد است؛ اما عملکرد بالای خود را درباره زبان‌هایی که منابع زیادی دارند، از دست می‌دهد.

بر اساس مدل قبلی، گروه پژوهشی توانست سه پیشرفت جدید را در زمینه‌های زیر ارائه دهد:

– داده‌کاوی در مقیاس کلان

– مقیاس‌بندی گنجایش مدل

– زیرساخت کارآمدتر

هوش مصنوعی Meta

دو سیستم چندزبانه

در واقع، گروه پژوهشی، دو سیستم چندزبانه ساخت، تا ترجمه هر زبانی به انگلیسی و برعکس را به مدل WMT 2021 آموزش دهد. آن‌ها از روش‌های داده‌کاوی موازی مانند CCMatrix استفاده کردند که شرکت آن ادعا می‌کند، بزرگ‌ترین مجموعه‌داده مبتنی بر وب و پیکره دومتنی با کیفیت بالا، برای مدل‌های آموزش ترجمه است. مجموعه‌داده CCMatrix 50 بار بزرگ‌تر از پیکرهWikiMatrix است که فیس‌بوک قبلاً ایجاد کرده و شامل 5/4 میلیاد عبارت موازی در 576 جفت زبانی است که از اطلاعات موجود در مجموعه‌داده عمومی CommonCrawlاستخراج شده است.

به علاوه، گنجایش مدل از 15 میلیون پارامتر به 52 میلیون، افزایش یافته است. نکته جالب اینجاست که با اضافه کردن یک ابزار ذخیره‌سازی حافظه GPU به نام Fully Sharded Data-Parallel که ساخته خود هوش مصنوعی Meta بود، آموزش در مقیاس کلان در این مدل، 5 برابر سریع‌تر از مدل‌های قبلی است.

[irp posts=”19860″]

همچنین باید توجه داشت که اندازه مدل مقیاس‌بندی، اغلب هزینه‌های محاسباتی را بالا می‌برد. گروه پژوهشی ادعا می‌کند که برای غلبه بر این مشکل، از معماری ترنسفرمری استفاده کرده‌اند که در آن، به صورت یکی‌درمیان در لایههای ترنسفرمر، یک بلوک Feedforward قرار گرفته است. این لایه‌ها در رمزگذار و رمزگشا با لایه Sparsely Mixture-of-Experts که دریچه top-2 دارد، جایگزین می‌شوند. در نتیجه این امر، به ازای هر توالی ورودی، فقط امکان به کار رفتن زیرمجموعه‌ای از تمام پارامترهای این مدل وجود دارد.

ترجمه ماشینی، در رفع موانع، توانسته است پیشرفت قابل‌ملاحظه‌ای داشته باشد که البته باید گفت بیشتر بر تعداد کمی از زبان‌های رایج، متمرکز شده است. در مجموع، آخرین مانع بزرگ ترجمه ماشینی و بزرگ‌ترین چالش حل‌نشده این رشته، ترجمه زبان‌هایی است که دارای منابع کمی هستند.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]