40 گام به سوی آینده‌ای هوشمند - مجموعه وبینارهای رایگان در حوزه هوش مصنوعی
Filter by دسته‌ها
chatGTP
آموزش هوش مصنوعی و انواع آن
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
پایتون و ابزارهای یادگیری عمیق
کتابخانه‌ های یادگیری عمیق
یادگیری با نظارت
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
اخبار
تیتر یک
رسانه‌ها
آموزش پردازش زبان طبیعی
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
رویدادها
کاربردهای هوش مصنوعی
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
 امکان برقراری ارتباط به ۱۰۰ زبان مختلف با آخرین مدل هوش مصنوعی متا

امکان برقراری ارتباط به ۱۰۰ زبان مختلف با آخرین مدل هوش مصنوعی متا

متا به‌عنوان بخشی از تلاش گسترده‌تر خود برای حذف موانع زبانی و حفظ ارتباط میان افراد، یک مدل پایه چندزبانه ایجاد کرده که می‌تواند نزدیک به ۱۰۰ زبان را از گفتار یا متن درک کند و ترجمه‌هایی را به یک یا دو زبان مختلف در زمان واقعی ایجاد نماید.

به گزارش هوشیو، این فناوری چندوجهی که SeamlessM4T نام دارد، به‌صورت عمومی منتشر شده است تا به محققان کمک نماید، بر روی توسعه و معرفی برنامه‌های کاربردی جهانی با قابلیت ارائه ترجمه گفتار به گفتار، گفتار به نوشتار، متن به گفتار و متن به متن کار کنند. این مجموعه همراه با SeamlessAlign؛ یک مجموعه داده ترجمه چندوجهی که از مجموع ۲۶۵۰۰۰ ساعت گفتار و متن استخراج شده، در دسترس قرار گرفته است.

این یک پیشرفت قابل‌توجه در کاربرد‌های هوش مصنوعی در زمینه زبان‌شناسی را نشان می‌دهد، زیرا یک سیستم واحد است که می‌تواند چندین کار مرتبط با گفتار و متن را انجام دهد، در حالی که رویکردهای قبلی به سیستم‌های مختلفی برای انجام هر کار نیاز داشتند، به عنوان مثال یک سیستم اختصاصی برای ترجمه گفتار به گفتار.

آخرین مدل هوش مصنوعی متا

 SeamlessM4T چه کاری می‌تواند انجام دهد؟

همانطور که Meta توضیح می‌دهد، SeamlessM4T قادر است به طور ضمنی زبان مبدأ را بدون نیاز به مدل شناسایی زبانی جداگانه تشخیص ‌دهد. این مدل می‌تواند گفتار و متن را در نزدیک به ۱۰۰ زبان تشخیص دهد و متن را با همین تعداد و گفتار را به ۳۶ زبان مختلف تولید نماید. نکته جالب‌تر اینکه SeamlessM4T می‌تواند تشخیص دهد، چه زمانی بیش از یک زبان در یک جمله ترکیب شده و ترجمه‌هایی را بر اساس زبان هدفمندی که از او خواسته شده، ارائه نماید. در حالی که سیستم‌های قبلی برای هر کار به رویکردهای متفاوتی نیاز داشتند.

آزمایش با BLASER 2.0، ابزاری برای ارزیابی واحدهای گفتار و متن، نشان داد که این مدل نسبت به مدل‌های پیشرفته فعلی برای ترجمه گفتار به نوشتار بهتر عمل می‌کند. به طور مشخص، این مدل در مواجهه با نویز پس‌زمینه و تغییرات بلندگو، به ترتیب با میانگین پیشرفت‌های ۳۷ و ۴۸ درصدی، عملکرد بهتری داشت.

متا در یک پست وبلاگی نوشت:«SeamlessM4T از رقبای پیشرفته قبلی بهتر عمل می‌کند و به طرز قابل‌توجهی عملکرد آن در ترجمه زبان‌هایی با منابع کم و متوسط، بهبود بخشیده شده. علاوه بر این عملکرد قوی خود را در زبان‌های با منابع بالا (مانند انگلیسی) حفظ کرده است.»

در صورت توسعه، این مدل می‌تواند منجر به ایجاد به سیستم‌های ترجمه جهانی در مقیاس بزرگ شود و به افرادی که به زبان‌های مختلف صحبت می‌کنند اجازه می‌دهد، به گونه مؤثرتری با یکدیگر ارتباط برقرار نمایند.

قابل ذکر است، گوگل نیز در این زمینه فعالیت می‌کند و در این راستا مدل جهانی گفتار (USM) خود را معرفی کرده که می‌تواند تشخیص خودکار گفتار (ASR) را نه‌تنها برای زبان‌های رایج، بلکه برای زبان‌های غیرمعمول نیز انجام دهد.

بنر اخبار هوش مصنوعی

میانگین امتیاز / ۵. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]