هوش مصنوعی در یکقدمی انسان: شبیهساز صدای افراد مشهور
سرویس تبدیل متن به صوت یا به اختصار (TTS) از جمله ویژگیهای کاربردی هوش مصنوعی است که در سالیان گذشته، توجه بسیاری را به خود جلب کرده است. لحن ماشینی مکالمه رباتها، همیشه دستمایه رویاپردازی آیندهنگرانه فیلمهای سینمایی بوده و هرجا که یک ربات قصد داشته باشد که جملهای را بیان کند، میتوان حدس زد که قرار است شاهد مکالمهای خشک و غیرعادی باشیم. این رویاپردازیها زیاد هم دور از واقعیت نیست و در دنیای واقعی هم اغلب APIهای تبدیل متن به صوت مبتنی بر هوش مصنوعی، عملکرد بهتری از خود به نمایش نگذاشتند و با شنیدن چند کلمه از صحبت آنها، بهسادگی میتوان به ماشینی بودن صدا پی برد.
در این میان، سایت play.ht با ارائه سرویس جدید خود تحت عنوان «Peregrine» سعی دارد تا سرویسهای تبدیل متن به صوت را وارد مرحله تازهای کند. اکثر برنامههایی که از قابلیت TTS بهره میبرند، معمولاً از APIهای یکسانی استفاده میکنند که عملکرد مناسبی در بیان لحن واقعی ندارند، اما Peregrine به طور کامل از پایه طراحی شده تا مکالمه انسانی را به واضحترین شکل ممکن شبیهسازی کند. این سرویس از مفهوم مدلهای زبانی مشهوری همچون DALL-E و GPT-2 استفاده میکند که خروجی آن، صدای فوقالعاده واقعگرایانهای است که حتی میتواند احساسات، خنده، خشم و دیگر موارد تاثیرگذار بر لحن صحبتکردن را شبیهسازی کند.
یکی دیگر از قابلیتهای بسیار جذاب Peregrine، امکان شبیهسازی صداست. با استفاده از این ویژگی Peregrine میتوانید متن خود را با صدای افراد مشهور و یا صدای شخص مورد نظر خود بشنوید. هرچند که این سرویس از بانک دادهای عظیمی پشتیبانی میکند و صدای اشخاص شناختهشدهای ازجمله ایلان ماسک، جان.اف.کندی، تام هنکس، کوین هارت و… را بهصورت پیشفرض در خود جای داده اما با این حال میتوانید با پخش یک فایل صوتی 30 ثانیهای برای Peregrine، به او آموزش دهید که متن شما را با صدای فرد دلخواه بازگو کند.
شبیهسازی صدا موضوع تازهای نیست و پیش از این هم متخصصان موسیقی قادر بودند که در استودیو و با استفاده از تکنولوژیهای پیشرفته، صدای افراد را شبیهسازی کنند، اما همانطور که بیان شد، این امر نیازمند تخصص، هزینه و زمان بسیار بالایی بود. این درحالی است که Peregrine خروجی صدا را تنها در عرض چند ثانیه و بدون نیاز به تخصص و سختافزار گرانقیمت در اختیار شما قرار میدهد.
هرچند که این سرویس درحال حاضر فرایند توسعه خود را طی میکند، اما علاقهمندان میتوانند با مراجعه به دامنه play.ht از امکانات این موتور تبدیل متن به صوت بهره ببرند و فایلهای متنی خود را به صوت تبدیل کنند. پس اگر تا به امروز آرزو داشتید که مورگان فریمن یکی از کتابهای رمانتان را هنگام خواب برای شما بخواند، میتوان گفت که از همیشه به تحقق رویای خود نزدیکتر هستید!
در ادامه میتوانید تعدادی از نمونه صداهای Peregrine را بشنوید که به طور کامل توسط هوش مصنوعی ساخته شدهاند.
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید