هوش مصنوعی در یک‌قدمی انسان: شبیه‌ساز صدای افراد مشهور

تیم تحریریه
۷ آذر ۱۴۰۱

زمان مطالعه: 2 دقیقه

سرویس تبدیل متن به صوت یا به اختصار (TTS) از جمله ویژگی‌های کاربردی هوش مصنوعی است که در سالیان گذشته، توجه بسیاری را به خود جلب کرده است. لحن ماشینی مکالمه ربات‌ها، همیشه دستمایه رویاپردازی آینده‌نگرانه فیلم‌های سینمایی بوده و هرجا که یک ربات قصد داشته ‌باشد که جمله‌ای را بیان کند، می‌توان حدس زد که قرار است شاهد مکالمه‌ای خشک و غیرعادی باشیم. این رویاپردازی‌ها زیاد هم دور از واقعیت نیست و در دنیای واقعی هم اغلب APIهای تبدیل متن به صوت مبتنی بر هوش مصنوعی، عملکرد بهتری از خود به نمایش نگذاشتند و با شنیدن چند کلمه از صحبت‌ آنها‌، به‌سادگی می‌توان به ماشینی بودن صدا پی برد.

در این میان، سایت play.ht با ارائه سرویس جدید خود تحت عنوان «Peregrine» سعی دارد تا سرویس‌های تبدیل متن به صوت را وارد مرحله تازه‌ای کند. اکثر برنامه‌هایی که از قابلیت TTS بهره می‌برند، معمولاً از APIهای یکسانی استفاده می‌کنند که عملکرد مناسبی در بیان لحن واقعی ندارند، اما Peregrine به طور کامل از پایه طراحی شده تا مکالمه انسانی را به واضح‌ترین شکل ممکن شبیه‌سازی کند. این سرویس از مفهوم مدل‌های زبانی مشهوری همچون DALL-E و GPT-2 استفاده می‌کند که خروجی آن، صدای فوق‌العاده واقع‌گرایانه‌ای است که حتی می‌تواند احساسات، خنده، خشم و دیگر موارد تاثیرگذار بر لحن صحبت‌کردن را شبیه‌سازی کند.

یکی دیگر از قابلیت‌های بسیار جذاب Peregrine، امکان شبیه‌سازی صداست. با استفاده از این ویژگی Peregrine می‌توانید متن خود را با صدای افراد مشهور و یا صدای شخص مورد نظر خود بشنوید. هرچند که این سرویس از بانک داده‌ای عظیمی پشتیبانی می‌کند و صدای اشخاص شناخته‌شده‌ای ازجمله ایلان ماسک، جان.اف.کندی، تام هنکس، کوین هارت و… را به‌صورت پیش‌فرض در خود جای داده اما با این‌ حال می‌توانید با پخش یک فایل صوتی 30 ثانیه‌ای برای Peregrine، به او آموزش دهید که متن شما را با صدای فرد دلخواه بازگو کند.

شبیه‌سازی صدا موضوع تازه‌ای نیست و پیش از این هم متخصصان موسیقی قادر بودند که در استودیو و با استفاده از تکنولوژی‌های پیشرفته، صدای افراد را شبیه‌سازی کنند، اما همان‌طور که بیان شد، این امر نیازمند تخصص، هزینه و زمان بسیار بالایی بود. این درحالی است که Peregrine خروجی صدا را تنها در عرض چند ثانیه و بدون نیاز به تخصص و سخت‌افزار گران‌قیمت در اختیار شما قرار می‌دهد.

هرچند که این سرویس درحال حاضر فرایند توسعه خود را طی می‌کند، اما علاقه‌مندان می‌توانند با مراجعه به دامنه play.ht از امکانات این موتور تبدیل متن به صوت بهره ببرند و فایل‌های متنی خود را به صوت تبدیل کنند. پس اگر تا به امروز آرزو داشتید که مورگان فریمن یکی از کتاب‌های رمان‌تان را هنگام خواب برای شما بخواند، می‌توان گفت که از همیشه به تحقق رویای خود نزدیک‌تر هستید!

در ادامه می‌توانید تعدادی از نمونه‌ صداهای Peregrine را بشنوید که به طور کامل توسط هوش مصنوعی ساخته شده‌اند.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

https://hooshio.com/?p=39741

فعالان هوش مصنوعی

ایران و جهان

مجموعه وبینارهای هوش مصنوعی در عمل؛ از ایده تا اجرا

هوش مصنوعی در یک‌قدمی انسان: شبیه‌ساز صدای افراد مشهور

ابزارهای تازه هوش مصنوعی برای معلمان و دانش‌آموزان

وقتی هوش مصنوعی دروغ‌های ترامپ را تاب نمی‌آورد

عطرهای سفارشی با هوش مصنوعی

تفنگ خودکار هوشمند در ارتش هند؛ گام بزرگ در تسلیحات کشنده با هوش مصنوعی

اگر برای این ۱۱ کار از ChatGPT استفاده می‌کنید، همین حالا دست نگه‌ دارید!

سایه هوش مصنوعی بر پادشاه سرطان‌ها

داستان ۲۰۲۵؛ هوش مصنوعی مولد در بافت زندگی واقعی

آیا استفاده از چت‌بات‌های هوش مصنوعی فعالیت مغز انسان را تغییر می‌دهد؟

افتتاح حساب بانکی فقط با یک کلیک

«دیتاوست» ترکیب بهینه دارایی را پیشنهاد می‌دهد

هوش مصنوعی در خدمت جامعه؛ از ابزار سرکوب تا فناوری مدنی

چگونه فناوری می‌تواند مسیر کنشگری اجتماعی را متحول کند؟

ابزارهای تازه هوش مصنوعی برای معلمان و دانش‌آموزان

وقتی هوش مصنوعی دروغ‌های ترامپ را تاب نمی‌آورد

عطرهای سفارشی با هوش مصنوعی

تفنگ خودکار هوشمند در ارتش هند؛ گام بزرگ در تسلیحات کشنده با هوش مصنوعی

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

ابزارهای تازه هوش مصنوعی برای معلمان و دانش‌آموزان

اگر برای این ۱۱ کار از ChatGPT استفاده می‌کنید، همین حالا دست نگه‌ دارید!

وقتی هوش مصنوعی دروغ‌های ترامپ را تاب نمی‌آورد

سایه هوش مصنوعی بر پادشاه سرطان‌ها

عطرهای سفارشی با هوش مصنوعی

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید