برترین متخصصین

از سراسر دنیا

مجموعه وبینارهای مدل‌های بزرگ زبانی (LLM)

Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 هوش مصنوعی در یک‌قدمی انسان: شبیه‌ساز صدای افراد مشهور

هوش مصنوعی در یک‌قدمی انسان: شبیه‌ساز صدای افراد مشهور

زمان مطالعه: 2 دقیقه

سرویس تبدیل متن به صوت یا به اختصار (TTS) از جمله ویژگی‌های کاربردی هوش مصنوعی است که در سالیان گذشته، توجه بسیاری را به خود جلب کرده است. لحن ماشینی مکالمه ربات‌ها، همیشه دستمایه رویاپردازی آینده‌نگرانه فیلم‌های سینمایی بوده و هرجا که یک ربات قصد داشته ‌باشد که جمله‌ای را بیان کند، می‌توان حدس زد که قرار است شاهد مکالمه‌ای خشک و غیرعادی باشیم. این رویاپردازی‌ها زیاد هم دور از واقعیت نیست و در دنیای واقعی هم اغلب APIهای تبدیل متن به صوت مبتنی بر هوش مصنوعی، عملکرد بهتری از خود به نمایش نگذاشتند و با شنیدن چند کلمه از صحبت‌ آنها‌، به‌سادگی می‌توان به ماشینی بودن صدا پی برد.

شبیه‌ساز صدای افراد مشهور

در این میان، سایت play.ht با ارائه سرویس جدید خود تحت عنوان «Peregrine» سعی دارد تا سرویس‌های تبدیل متن به صوت را وارد مرحله تازه‌ای کند. اکثر برنامه‌هایی که از قابلیت TTS بهره می‌برند، معمولاً از APIهای یکسانی استفاده می‌کنند که عملکرد مناسبی در بیان لحن واقعی ندارند، اما Peregrine به طور کامل از پایه طراحی شده تا مکالمه انسانی را به واضح‌ترین شکل ممکن شبیه‌سازی کند. این سرویس از مفهوم مدل‌های زبانی مشهوری همچون DALL-E و GPT-2 استفاده می‌کند که خروجی آن، صدای فوق‌العاده واقع‌گرایانه‌ای است که حتی می‌تواند احساسات، خنده، خشم و دیگر موارد تاثیرگذار بر لحن صحبت‌کردن را شبیه‌سازی کند.

یکی دیگر از قابلیت‌های بسیار جذاب Peregrine، امکان شبیه‌سازی صداست. با استفاده از این ویژگی Peregrine می‌توانید متن خود را با صدای افراد مشهور و یا صدای شخص مورد نظر خود بشنوید. هرچند که این سرویس از بانک داده‌ای عظیمی پشتیبانی می‌کند و صدای اشخاص شناخته‌شده‌ای ازجمله ایلان ماسک، جان.اف.کندی، تام هنکس، کوین هارت و… را به‌صورت پیش‌فرض در خود جای داده اما با این‌ حال می‌توانید با پخش یک فایل صوتی 30 ثانیه‌ای برای Peregrine، به او آموزش دهید که متن شما را با صدای فرد دلخواه بازگو کند.

شبیه‌سازی صدا موضوع تازه‌ای نیست و پیش از این هم متخصصان موسیقی قادر بودند که در استودیو و با استفاده از تکنولوژی‌های پیشرفته، صدای افراد را شبیه‌سازی کنند، اما همان‌طور که بیان شد، این امر نیازمند تخصص، هزینه و زمان بسیار بالایی بود. این درحالی است که Peregrine خروجی صدا را تنها در عرض چند ثانیه و بدون نیاز به تخصص و سخت‌افزار گران‌قیمت در اختیار شما قرار می‌دهد.

هرچند که این سرویس درحال حاضر فرایند توسعه خود را طی می‌کند، اما علاقه‌مندان می‌توانند با مراجعه به دامنه play.ht از امکانات این موتور تبدیل متن به صوت بهره ببرند و فایل‌های متنی خود را به صوت تبدیل کنند. پس اگر تا به امروز آرزو داشتید که مورگان فریمن یکی از کتاب‌های رمان‌تان را هنگام خواب برای شما بخواند، می‌توان گفت که از همیشه به تحقق رویای خود نزدیک‌تر هستید!

در ادامه می‌توانید تعدادی از نمونه‌ صداهای Peregrine را بشنوید که به طور کامل توسط هوش مصنوعی ساخته شده‌اند.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]