پوشش رسانه‌ای جیتکس ۲۰۲۴ | با ما همراه باشید

Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 مایکروسافت اجازه دسترسی محدود به فناوری تبدیل متن به گفتار عصبی را می‌دهد

مایکروسافت اجازه دسترسی محدود به فناوری تبدیل متن به گفتار عصبی را می‌دهد

زمان مطالعه: < 1 دقیقه

به تازگی مایکروسافت اعلام کرده که دسترسی محدود افراد به فناوری هوش مصنوعی تبدیل متن به گفتار به نام Custom Neural Voice را باز می‌کند. این فناوری که بخشی از سرویس هوش مصنوعی Azure به نام Speech است به توسعه دهندگان اجازه می‌دهد صداهای مصنوعی سفارشی ایجاد کنند. شرکت‌ها می‌توانند از این فناوری در مواردی همچون دستیارهای صوتی و دستگاه‌های هوشمند مجهز به صدا، چت بات‌ها، آموزش آنلاین و خواندن کتاب‌های صوتی یا اخبار استفاده کنند. افراد و شرکت‌ها برای دسترسی به Neural Voice باید ابتدا درخواست دسترسی دهند و از مایکروسافت تاییدیه بگیرند.

مایکروسافت ادعا می‌کند صداهای تولید شده به وسیله این فناوری، بسیار طبیعی‌تر از صداهای تولید شده‌ دیگر سرویس‌های تبدیل متن به گفتار است. صداهای سفارشی از یک بانک اصوات یا واج‌ها برای ایجاد فونت‌های صوتی استفاده می‌کنند. صدای عصبی سفارشی با استفاده از شبکه های عصبی متعدد سعی می‌کند از لحاظ نوای گفتار (لحن و مدت زمان هر واج) و تلفظ دقیق باشد. این موضوع به هوش مصنوعی کمک می‌کند تا صدای فرد را به درستی تقلید کند یا صدایی مشابه با صدای واقعی تولید کند.

متن به گفتار

در حال حاضر چندین شرکت از جمله AT&T و برادران وارنر از این فناوری استفاده می‌کنند. آن‌ها اخیراً سیستمی را در فروشگاه AT&T در دالاس نصب کرده اند. در این مکان افراد می‌توانند با باگزبانی تعامل کنند. این شخصیت‌های کارتونی می‌توانند با استفاده از ترکیبی از صدای عصبی سفارشی، واقعیت افزوده و ۵G، به صورت زنده با مشتریان گپ بزنند و در فروشگاه حرکت کنند تا به آن‌ها در یافتن هویج طلایی پنهان شده کمک شود.

اریک باوزا، که در حال حاضر صداپیشه‌ شخصیت‌های باگزبانی است بیش از ۲۰۰۰ خط و عبارت را با کمک مایکروسافت برای ایجاد یک فونت صوتی ضبط کرد. برادران وارنر و مایکروسافت با همکاری یکدیگر صدایی سفارشی ایجاد کردند که به شخصیت و رفتارهای او بسیار نزدیک باشد. همچنین دولینگو از Neural Voice استفاده کرده است تا به افراد در یادگیری زبان‌های جدید کمک کند.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]