هوش مصنوعی ایرانی در آستانه تحول فناوری پردازش متن و گفتار فارسی
زمانی که از فناوریهای پردازش گفتار هوش مصنوعی صحبت میکنیم، دو فناوری STT یا TTS از دیگر فناوریهای این عرصه، نمود بیشتری پیدا میکنند. این دو فناوری در واقع به ترتیب اختصار کلمات Speech to Text و Text to Speech هستند. علاوه بر آنکه این دو تکنولوژی از جدیدترین آوردههای هوش مصنوعی در جهان به شمار میروند، تقاضا برای استفاده از این فناوریها در جهان به نحو چشمگیری در حال افزایش است. اما توسعه این دو فناوری چرا تا این حد پراهمیت و ضروری است؟ و چه دستاوردهایی از این توسعه منتج خواهد شد؟
دو فناوری تبدیل گفتار به متن و تبدیل متن به گفتار چیستند؟
در حال حاضر هوش مصنوعی یکی از بهترین فناوریهای موجود در جهان است که به کمک آن میتوان عناصری نظیر اصوات و اجسام را تحت کنترل و مدیریت درآورد و رفتار و عملکرد آنها را تحلیل کرد. در همین راستا، یکی از مسیرهایی که هوش مصنوعی توانسته گامهای جدی و محکمی را در توسعه از آن خود کند، تبدیل گفتار به متن و متن به گفتار است.
در حال حاضر هوش مصنوعی به کمک فناوری پردازش گفتار، سعی دارد تا درک ماشینها از پدیده زبان را، به درک انسان نزدیک کند. بهنحویکه بتوان انتظار داشت ماشینها نیز مانند انسان برداشت درستی از واژهها، جملات و گفتار انسانی به دست آورند. فناوریهای هوشمند تبدیل متن به گفتار (TTS) و تبدیل گفتار به متن (STT) از نمونههایی هستند که در مسیر توسعه پردازش گفتار ایجاد شدهاند. فناوری نخست دارای این توانایی است که به خوانش متنها و نگاشتههای الکترونیک، مطابق با گفتار انسانی بپردازد و فناوری دوم نیز دارای این قابلیت است که گفتار انسانی را به متن قابل ویرایش تبدیل کند.
کاربردهای فناوری تبدیل گفتار به متن و تبدیل متن به گفتار
این دو فناوری امروزه توانستهاند در قالب API های کارا، هوشمند و تاثیرگذار، نهتنها به کسبوکارها و سامانههای آنلاین الکترونیکی خدمات سریع، آنی و دقیق ارائه دهند، که حتی زمینه را برای توانمندسازی کاربرانی که به هر دلیل قادر به انجام برخی فرایندها نیستند، فراهم کند. این رابطهای کاربری هوشمند ابری دارای آن میزان انعطاف هستند که روی پلتفرمهای گوناگون اجرا شوند و تجربههای کاربری درخشانی را رقم بزنند:
- رابط سخنگوی هوشمند وبسایتها و ارائهدهنده خدمات پشتیبانی آنلاین و پاسخگوی سوالات کاربران و مشتریان
- دستیار صوتی یا گوینده در امکان عمومی نظیر بیمارستانها، مترو، ایستگاههای اتوبوس و سالنهای عمومی
- رابط هوشمند آموزشی برای کودکان و نوجوانان و ارتقای سطح کیفی آموزش سمعی – بصری
- رابط کاربری سخنگو و نویسنده هوشمند برای توانیابان یا افرادی که اختلال جسمی حرکتی دارند
- دستیار هوشمند ضبط دقیق محتوای صوتی و نوشتاری جلسات، سخنرانیها و کنفرانسها
متخصصان هوش مصنوعی ایران متمرکز بر فناوریهای پردازش گفتار
باتوجهبه پراکندگی دانش و تخصص هوش مصنوعی در سطح جهان، امروزه شاهد بازتولید فناوریهای متنوع هوش مصنوعی در کشورهای گوناگونی هستیم. کشورمان ایران نیز یکی از بازیگران جدی در سطح منطقه و جهان است که نهتنها برای کسب رتبه برتر جهان در هوش مصنوعی خیز برداشته، بلکه در کارنامه خود سابقه درخشانی در زمینه تولید علم و فناوریهای هوش مصنوعی دارد.
در این شرایط تیمهای متخصص در مراکز تحقیقاتی گوناگون کشورمان، نظیر مرکز تحقیقات هوش مصنوعی پارت، همواره در حال کوشش هستند تا لبه تکنولوژی جهان را رصد کرده و به بازتولید موفقترین فناوریها آن در داخل کشور بپردازند. در حال حاضر میتوان گفت دو فناوری تبدیل متن به گفتار و تبدیل گفتار به متن که جزو خط مقدم تکنولوژیهای جهان محسوب میشوند، به دست متخصصان داخلی و مراکز تحقیقاتی هوش مصنوعی در حال بازتولید و توسعه هستند.
زبان فارسی و گویش ایرانی بر لبه تکنولوژیهای نوین
در بحبوحه جهشهای پرسرعت تکنولوژی در سراسر دنیا، متخصصان هوش مصنوعی ایران نیز با همت و تلاش خود در مراکز تحقیقاتی هوش مصنوعی ایران، این فرصت را ایجاد کردهاند تا فناوریهای روز دنیا را روی زبان فارسی و گفتار بومی ایران پیادهسازی کنند. تکنولوژیهای هوشمند پردازش گفتار که طی یک فرایند دقیق و مبتنی بر الگوریتمهای روز دنیا، گفتار فارسی را از گوینده فارسی زبان به نوشتار قابل ویرایش فارسی درآورد، و نوشتار فارسی را به صوتی قابل درک تبدیل کند، از نتایج درخشان این کوششها بوده است.
این موفقیت نهتنها میتواند نقطه عطفی برای متخصصان هوش مصنوعی کشورمان باشد، بلکه دریچهای تازه از جنس فناوری را به روی فرهنگ و زبان فارسی و هویت ایرانی گویشگران این مرز و بوم گشوده است. ناگفته پیداست که همواره حجم بالایی از فعالیتهای تیمهای پژوهشی متمرکز بر جنبههای جهانی هوش مصنوعی و صنایعی بوده که تا حد زیادی با دنیای بیرون از این آب و خاک پیوند دارد و همین موضوع باعث شده زبان فارسی از تحولهای کلیدی دنیای امروز مهجور بماند. تیمهای متخصص ایرانی که روی صوت و گفتار و زبان فارسی متمرکز شدهاند، این شکاف را درک کردهاند و توجه به گنجینههای هویتی و میراث ملی که با آن سخن میگوییم را در اولویت پژوهشهای خود قرار دادهاند تا زبان فارسی نیز از این موج تحول جهانی دور نماند.
سخن پایانی
با توجه به همت متخصصان کشورمان و دغدغه هوشمندسازی فرایندهای زندگی که شعار و هدف اصلی مرکز تحقیقاتی هوش مصنوعی پارت است، میتوان نوید آن را داد که در آینده نزدیک بتوانیم شاهد محصولات فناورانه ویژهای باشیم که با زبان شیرین فارسی و فرهنگ ایرانی بومیسازی شده باشند. محصولاتی که علاوه بر رفع نیازهای داخلی، قادر باشند با برترین نمونههای خارجی رقابت کنند و حتی به کشورهای گوناگون صادر شوند.