با کمک این سرویسها با کامپیوتر و موبایلتان به فارسی صحبت کنید!
محققان هوش مصنوعی «مرکز تحقیقات هوش مصنوعی پارت» موفق به ساختن نرمافزارهایی با دقت بسیار بالا در حوزه بازشناسی گفتار شدند.
صحبت کردن و برقراری ارتباط از طریق تولید آوا یکی از مهمترین ابزارهای ارتباطی میان انسانها و دیگر موجودات زنده است. از سالها پیش محققان به دنبال ساختن نرمافزارهایی هستند که انسانها بتوانند با کامپیوترهایشان نیز از طریق صحبت کردن ارتباط برقرار کنند. برای درک بهتر این فناوری میتوان به دستیارهای صوتی سیری اپل و الکسای آمازون اشاره کرد. سرویس متن به صوت قادر است متن درخواستی را برای کاربر بخواند و نرمافزارهای صوت به متن نیز میتوانند گفتار درخواستی را به متن تبدیل کنند.
حالا یک شرکت دانشبنیان ایرانی توانسته است نرمافزارهایی توسعه دهد که قابلیت درک زبان فارسی را دارد و میتواند متن فارسی را به صوت و صوت را به متن تبدیل کند.
محمد صادق صفری، کارشناس ارشد هوش مصنوعی مرکز تحقیقات هوش مصنوعی پارت، درباره نیازهایی که باعث توسعه این نرمافزار شد گفت: «در سالهای اخیر تلاشهایی در حوزه ساخت نرمافزارهای تبدیل متن به صوت و صوت به متن فارسی انجام شده است. متاسفانه اغلب نرمافزارهای تولید شده دقت بالایی ندارند و در تشخیص صدا در محیطهای واقعی مشکل دارند.»
صفری با اشاره به اینکه همین مشکلات محققان مرکز تحقیقات هوش مصنوعی پارت را بر آن داشت تا وارد این حوزه شوند، افزود: «خوشبختانه در مرکز تحقیقات هوش مصنوعی پارت، به لطف حضور کارشناسان خبره هوش مصنوعی، این امکان فراهم شد تا بر روی ایدههای جدید در حوزه تبدیل متن به صوت و صوت به متن کار شود.»
این کارشناس ارشد هوش مصنوعی درباره قابلیتهای سیستمهای متن به صوت و صوت به متن این شرکت و وجهتمایز آن با محصولات مشابه دیگر گفت: «یکی از مشکلات سیستمهای قبلی دقت بسیار پایین آنها بود. یکی از مهمترین دلایل این دقت پایین نیز استفاده از دیتای صدای بسیار کم حجم و کوچک است. در نرمافزارهای هوش مصنوعی هر چقدر دیتاست بزرگتری داشته باشید، تواناییهای سرویس تولیدشده نیز بیشتر خواهد بود». صفری درباره دیتاست استفادهشده در سرویسهای تبدیل متن به صوت و صوت به متن مرکز تحقیقات هوش مصنوعی نیز گفت: «ما برای آموزش الگوریتمهای خودمان، داده صوتی برچسبداری با حجم بیش از 10 هزار ساعت جمعآوری کردهایم. این در حالی است که نمونههای دیگر موجود در بازار از دیتاستهای بهمراتب کوچکتری بهره بردهاند.»
یکی دیگر از ویژگیهای منحصربه فرد سرویس تبدیل صوت به متن این شرکت دانشبنیان توانایی تشخیص متن محاوره و نیز قابلیت استفاده در فضاهای مختلف مانند محیطهای شلوغ و نویزی است.
همچنین سرویس متن به صوت مرکز تحقیقات هوش مصنوعی پارت نیز قابلیتهایی دارد که پیش از این در محصولات مشابه کمتر به آن توجه شده بود. صفری درباره سرویس متن به صوت پارت نیز میگوید: «صوتی که سرویس متن به صوت مرکز تحقیقات هوش مصنوعی پارت بهازای متن متناظرش تولید میکند بسیار طبیعی است و خواندن و تلفظ کلمات با درستترین شکل ممکن انجام میشود.»
گفتنی است این سرویسها کاربردهای بسیاری در بخشهای مختلف فناوری دارند و ورود نرمافزارهایی دقیق، مانند سرویسهای بازشناسی گفتار مرکز تحقیقات هوش مصنوعی پارت، میتواند بسیاری از موانعی که پیش از این در این حوزهها وجود داشت را از میان بردارد.