هوش مصنوعی در یک‌قدمی انسان: شبیه‌ساز صدای افراد مشهور

تیم تحریریه
۷ آذر ۱۴۰۱

زمان مطالعه: 2 دقیقه

سرویس تبدیل متن به صوت یا به اختصار (TTS) از جمله ویژگی‌های کاربردی هوش مصنوعی است که در سالیان گذشته، توجه بسیاری را به خود جلب کرده است. لحن ماشینی مکالمه ربات‌ها، همیشه دستمایه رویاپردازی آینده‌نگرانه فیلم‌های سینمایی بوده و هرجا که یک ربات قصد داشته ‌باشد که جمله‌ای را بیان کند، می‌توان حدس زد که قرار است شاهد مکالمه‌ای خشک و غیرعادی باشیم. این رویاپردازی‌ها زیاد هم دور از واقعیت نیست و در دنیای واقعی هم اغلب APIهای تبدیل متن به صوت مبتنی بر هوش مصنوعی، عملکرد بهتری از خود به نمایش نگذاشتند و با شنیدن چند کلمه از صحبت‌ آنها‌، به‌سادگی می‌توان به ماشینی بودن صدا پی برد.

در این میان، سایت play.ht با ارائه سرویس جدید خود تحت عنوان «Peregrine» سعی دارد تا سرویس‌های تبدیل متن به صوت را وارد مرحله تازه‌ای کند. اکثر برنامه‌هایی که از قابلیت TTS بهره می‌برند، معمولاً از APIهای یکسانی استفاده می‌کنند که عملکرد مناسبی در بیان لحن واقعی ندارند، اما Peregrine به طور کامل از پایه طراحی شده تا مکالمه انسانی را به واضح‌ترین شکل ممکن شبیه‌سازی کند. این سرویس از مفهوم مدل‌های زبانی مشهوری همچون DALL-E و GPT-2 استفاده می‌کند که خروجی آن، صدای فوق‌العاده واقع‌گرایانه‌ای است که حتی می‌تواند احساسات، خنده، خشم و دیگر موارد تاثیرگذار بر لحن صحبت‌کردن را شبیه‌سازی کند.

یکی دیگر از قابلیت‌های بسیار جذاب Peregrine، امکان شبیه‌سازی صداست. با استفاده از این ویژگی Peregrine می‌توانید متن خود را با صدای افراد مشهور و یا صدای شخص مورد نظر خود بشنوید. هرچند که این سرویس از بانک داده‌ای عظیمی پشتیبانی می‌کند و صدای اشخاص شناخته‌شده‌ای ازجمله ایلان ماسک، جان.اف.کندی، تام هنکس، کوین هارت و… را به‌صورت پیش‌فرض در خود جای داده اما با این‌ حال می‌توانید با پخش یک فایل صوتی 30 ثانیه‌ای برای Peregrine، به او آموزش دهید که متن شما را با صدای فرد دلخواه بازگو کند.

شبیه‌سازی صدا موضوع تازه‌ای نیست و پیش از این هم متخصصان موسیقی قادر بودند که در استودیو و با استفاده از تکنولوژی‌های پیشرفته، صدای افراد را شبیه‌سازی کنند، اما همان‌طور که بیان شد، این امر نیازمند تخصص، هزینه و زمان بسیار بالایی بود. این درحالی است که Peregrine خروجی صدا را تنها در عرض چند ثانیه و بدون نیاز به تخصص و سخت‌افزار گران‌قیمت در اختیار شما قرار می‌دهد.

هرچند که این سرویس درحال حاضر فرایند توسعه خود را طی می‌کند، اما علاقه‌مندان می‌توانند با مراجعه به دامنه play.ht از امکانات این موتور تبدیل متن به صوت بهره ببرند و فایل‌های متنی خود را به صوت تبدیل کنند. پس اگر تا به امروز آرزو داشتید که مورگان فریمن یکی از کتاب‌های رمان‌تان را هنگام خواب برای شما بخواند، می‌توان گفت که از همیشه به تحقق رویای خود نزدیک‌تر هستید!

در ادامه می‌توانید تعدادی از نمونه‌ صداهای Peregrine را بشنوید که به طور کامل توسط هوش مصنوعی ساخته شده‌اند.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

https://hooshio.com/?p=39741

هوش مصنوعی در یک‌قدمی انسان: شبیه‌ساز صدای افراد مشهور

نمایشگاه AIx 2026؛ نگاهی به معماری آینده هوش مصنوعی ایران در غرفه «پارت»

شورش بازیگران بریتانیا علیه هوش مصنوعی

طرح ملی آموزش هوش مصنوعی در مدارس کلید خورد

ثبت احوال مکلف شد ظرف یک ماه از بازار احراز هویت آنلاین خارج شود

رونق هوش مصنوعی در سال ۲۰۲۵ به اندازه کل نیویورک دی‌اکسید کربن تولید کرده است

فانتزی تکنولوژی پشت هوش مصنوعی روی آخرین نفس‌ها می‌چرخد

شتاب‌دهی کشفیات علمی با هوش مصنوعی

خیزش هواشناختی

نمایشگاه AIx 2026؛ نگاهی به معماری آینده هوش مصنوعی ایران در غرفه «پارت»

طرح ملی آموزش هوش مصنوعی در مدارس کلید خورد

ثبت احوال مکلف شد ظرف یک ماه از بازار احراز هویت آنلاین خارج شود

خروج سازمان ثبت‌احوال از خدمات احراز هویت غیرحضوری مبتنی بر هوش مصنوعی

شورش بازیگران بریتانیا علیه هوش مصنوعی

پیش‌بینی جهش ۵ برابری ارزش بازار همدم‌های مجازی تا ۲۰۳۵

رونمایی از «Gemini 3 Flash» سرعت هوش مصنوعی را جابه‌جا کرد

حقوق نجومی برای جلوگیری از پایان جهان

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

نمایشگاه AIx 2026؛ نگاهی به معماری آینده هوش مصنوعی ایران در غرفه «پارت»

اکانت اشتراکی Chatgpt Plus، بخریم یا نخریم؟

رونق هوش مصنوعی در سال ۲۰۲۵ به اندازه کل نیویورک دی‌اکسید کربن تولید کرده است

چگونه هوش مصنوعی، VoIP را برای شرکت‌های کوچک و متوسط متحول می‌کند؟

شورش بازیگران بریتانیا علیه هوش مصنوعی

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید