ترجمه ماشینی همه زبانهای دنیا با مترجم متا
شرکت متا با هر نوآوری، یک گام به تحقق هدفش مبنی بر توانمندسازی افراد برای ساختن جامعه نزدیکتر میشود. متا به تازگی از پیشرفتی بزرگ در پروژه No Language Left Behind یا NLLB رونمایی کرده است. هدف از این پروژه، توسعه قابلیتهای ترجمه ماشینی باکیفیت برای اکثر زبانهای دنیا بوده است.
مارک زاکربرگ، بنیانگذار و مدیرعامل متا، میگوید: «یک مدل هوش مصنوعی منتشر کردهایم که میتواند بیش از 200 زبان متفاوت را، که برخی در هیچ یک از سیستمهای ترجمهای کنونی پشتیبانی نمیشوند، ترجمه کند. این مدل بخشی از پروژه NLLB است و تکنیکهای به کاررفته در آن، امکان ترجمه با کیفیت از زبان میلیاردها انسان در سطح دنیا را فراهم آورده است.»
محدودیت فناوریهای ترجمهای
جمعیت دیجیتالی کل دنیا به بیش از 5 میلیارد نفر میرسد. این جمعیت به 7,151 زبان سخن میگویند. پس شکی نیست که نیاز مبرمی به سیستمهای مترجم ماشینی مدرن وجود دارد. با این حال، نقص و کمبود دادههای زبانی منجر به محدودیت فناوریهای ترجمهای گشته؛ فناوریهایی که سعی در از میان برداشتن موانع زبانی در محتوای دیجیتال دارند. گوگل ترنسلیت، سرویس ترجمه ماشینی عصبی چندزبانه گوگل، علیرغم تمام قابلیتهای پیشرفتهای که دارد، تنها قادر به ترجمه 133 زبان است.
ترجمه ماشینی بینگ ترنسلیتور مایکروسافت، یکی از بزرگترین شرکتهای فناوری دنیا، حدود 100 زبان را پوشش میدهد. نصف جمعیت جهان تنها 23 تا از 7,151 زبان موجود در دنیا را به کار میبرند، یعنی همان زبانهایی که در اینترنت نیز رایج هستند. این در حالی است که بسیاری از زبانهای دیگر (به ویژه در آفریقا و آسیا) در سرویسهای ترجمه پشتیبانی نمیشوند. در نتیجه، تعامل بین این جمعیتها و محتوای موردنظرشان را با مشکل مواجه ساخته است.
بعد تجاری ترجمه ماشینی
از میان تمام حوزههایی که تحت تأثیر هوش مصنوعی قرار دارند، ترجمه یکی از هیجانانگیزترینهاست. در سال 2021، ارزش بازار ترجمه ماشینی، که ناشی از ورود فناوری هوش مصنوعی به عرصه ترجمه است، معادل 800 میلیون دلار بود. طبق پیشبینیها، این رقم تا سال 2030 به 5/7 میلیارد هم میرسد.
به گزارش Global Market Insights، آنچه صنعت ترجمه ماشینی را به پیش میراند، نیاز روزافزون شرکتهایی است که سعی در ارتقای تجارب مشتریان خود دارند. در همین راستا، پژوهش Gartner نیز نشان داده است که ترجمه یکی از برجستهترین دغدغههای شرکتهاست، به ویژه از آنجایی که در چهار حوزه عمده، اهمیت روزافزون دارد: چندرسانهای (برای مثال، آموزش و سمینارها)، فروش و پشتیبانی آنلاین مشتریان (همچون کوئریها و چتباتها)، چندرسانهای لحظهای (مثل جلسات و غیره) و اسناد، متون و قطعات (همچون بلاگها و اطلاعات محصول).
به بیان دیگر، شرکتهایی که قصد دارند مقیاس کار خود را گسترش دهند، به راهکارهای ترجمهای فراگیری نیاز دارند که ملزومات پایگاه مصرفکنندگان جهانی را برآورده سازند، ملزوماتی که روز به روز پیچیدهتر هم میشوند. اینجاست که ترجمه ماشینی و پروژه جدید متا، NLLB، وارد صحنه میشود.
تحول ترجمه ماشینی با مترجم متا
پروژه مترجم متا با نام NLLB شش ماه پیش راهاندازی شد. این پروژه را میتوان تلاش بلندپروازانه متا در راستای ساخت مترجم ماشینی جهانی دانست که میتواند همه زبانها را، فارغ از دادههای زبانی موجود از آنها، پردازش کند. مترجم متا در مسیر این پروژه به پیشرفت بزرگی دست یافته است: مدل هوش مصنوعی NLLB-200 که بیش از 200 زبان را با کیفیتی خارقالعاده ترجمه میکند.
مترجم متا میتواند از ترجمه با کیفیت زبانهای غیرمتداول (به ویژه از آسیا و اروپا) پشتیبانیکند. به عنوان مثال میتوان به ترجمه زبانهای آفریقایی اشاره کرد که رواج کمتری دارند.
به گفته متا، توان ترجمه این مدل مترجم متا در برخی از زبانهای آفریقایی و هندی، 70 درصد و نمرهاش در شاخص BLEU نیز 44 درصد بیشتر از سیستمهای کنونی است.
برای درک بهتر این ارقام، به توضیحات زاکربرگ توجه کنید: «مدل 200 زبانی NLLB-200 بیش از 50 میلیارد پارامتر دارد و با استفاده از RSC، یکی از سریعترین ابررایانههای دنیا، آموزش دیده است. در نتیجه این پیشرفتها، اکنون نرمافزارهای شرکت بیش از 25 میلیارد ترجمه در روز انجام میدهند.»
با این حال، متا به این نکته واقف است که تحقق اهداف پروژه مترجم متا با نام NLLB بدون همکاری امکانپذیر نیست. به همین دلیل، برای اینکه سایر پژوهشگران نیز بتوانند مقیاس زبانها را گسترش داده و مدلهای فراگیرتر بسازند، متا NLLB-200 را در دسترس عموم قرار داده است. به علاوه، با ارائه کمکهزینههایی به ارزش 200,000 دلار به سازمانهای غیرانتفاعی، آنها را به کاربرد مدل جدید در عملیاتهایشان تشویق کرده است.
کاربردهای گسترده این مدل مترجم متا در پلتفرمهای متا، همکاریها برای ساختن جامعه را سرعت میبخشد و بدین ترتیب، موانع جغرافیایی و زبانی را از میان برمیدارد. به گفته زاکربرگ، تعامل با زبانهای گوناگون ابرقدرتی است که هوش مصنوعی در اختیارمان قرار میدهد و هرچه در این عرصه بیشتر پیشرفت کنیم، میبینیم که در همه ابعاد، از نمایش محتوای مناسب در فیسبوک و اینستاگرام تا پیشنهاد تبلیغات مرتبط و ایمنسازی سرویسها، کاربرد دارد.
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید