40 گام به سوی آینده‌ای هوشمند - مجموعه وبینارهای رایگان در حوزه هوش مصنوعی
Filter by دسته‌ها
chatGTP
آموزش هوش مصنوعی و انواع آن
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
پایتون و ابزارهای یادگیری عمیق
کتابخانه‌ های یادگیری عمیق
یادگیری با نظارت
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
اخبار
تیتر یک
رسانه‌ها
آموزش پردازش زبان طبیعی
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
رویدادها
کاربردهای هوش مصنوعی
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
 مایکروسافت اجازه دسترسی محدود به فناوری تبدیل متن به گفتار عصبی را می‌دهد

مایکروسافت اجازه دسترسی محدود به فناوری تبدیل متن به گفتار عصبی را می‌دهد

به تازگی مایکروسافت اعلام کرده که دسترسی محدود افراد به فناوری هوش مصنوعی تبدیل متن به گفتار به نام Custom Neural Voice را باز می‌کند. این فناوری که بخشی از سرویس هوش مصنوعی Azure به نام Speech است به توسعه دهندگان اجازه می‌دهد صداهای مصنوعی سفارشی ایجاد کنند. شرکت‌ها می‌توانند از این فناوری در مواردی همچون دستیارهای صوتی و دستگاه‌های هوشمند مجهز به صدا، چت بات‌ها، آموزش آنلاین و خواندن کتاب‌های صوتی یا اخبار استفاده کنند. افراد و شرکت‌ها برای دسترسی به Neural Voice باید ابتدا درخواست دسترسی دهند و از مایکروسافت تاییدیه بگیرند.

مایکروسافت ادعا می‌کند صداهای تولید شده به وسیله این فناوری، بسیار طبیعی‌تر از صداهای تولید شده‌ دیگر سرویس‌های تبدیل متن به گفتار است. صداهای سفارشی از یک بانک اصوات یا واج‌ها برای ایجاد فونت‌های صوتی استفاده می‌کنند. صدای عصبی سفارشی با استفاده از شبکه های عصبی متعدد سعی می‌کند از لحاظ نوای گفتار (لحن و مدت زمان هر واج) و تلفظ دقیق باشد. این موضوع به هوش مصنوعی کمک می‌کند تا صدای فرد را به درستی تقلید کند یا صدایی مشابه با صدای واقعی تولید کند.

متن به گفتار

در حال حاضر چندین شرکت از جمله AT&T و برادران وارنر از این فناوری استفاده می‌کنند. آن‌ها اخیراً سیستمی را در فروشگاه AT&T در دالاس نصب کرده اند. در این مکان افراد می‌توانند با باگزبانی تعامل کنند. این شخصیت‌های کارتونی می‌توانند با استفاده از ترکیبی از صدای عصبی سفارشی، واقعیت افزوده و ۵G، به صورت زنده با مشتریان گپ بزنند و در فروشگاه حرکت کنند تا به آن‌ها در یافتن هویج طلایی پنهان شده کمک شود.

اریک باوزا، که در حال حاضر صداپیشه‌ شخصیت‌های باگزبانی است بیش از ۲۰۰۰ خط و عبارت را با کمک مایکروسافت برای ایجاد یک فونت صوتی ضبط کرد. برادران وارنر و مایکروسافت با همکاری یکدیگر صدایی سفارشی ایجاد کردند که به شخصیت و رفتارهای او بسیار نزدیک باشد. همچنین دولینگو از Neural Voice استفاده کرده است تا به افراد در یادگیری زبان‌های جدید کمک کند.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

میانگین امتیاز / ۵. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]