Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 هوش مصنوعی ایرانی در آستانه تحول فناوری پردازش متن و گفتار فارسی

هوش مصنوعی ایرانی در آستانه تحول فناوری پردازش متن و گفتار فارسی

زمان مطالعه: 3 دقیقه

پردازش گفتار و پردازش متنزمانی که از فناوری‌های پردازش گفتار هوش مصنوعی صحبت می‌کنیم، دو فناوری STT یا TTS از دیگر فناوری‌های این عرصه، نمود بیشتری پیدا می‌کنند. این دو فناوری در واقع به ترتیب اختصار کلمات Speech to Text و Text to Speech هستند. علاوه بر آنکه این دو تکنولوژی از جدیدترین آورده‌های هوش مصنوعی در جهان به‌ شمار می‌روند، تقاضا برای استفاده از این فناوری‌ها در جهان به نحو چشم‌گیری در حال افزایش است. اما توسعه این دو فناوری چرا تا این حد پراهمیت و ضروری است؟ و چه دستاوردهایی از این توسعه منتج خواهد شد؟

دو فناوری تبدیل گفتار به متن و تبدیل متن به گفتار چیستند؟

در حال حاضر هوش مصنوعی یکی از بهترین فناوری‌های موجود در جهان است که به کمک آن می‌توان عناصری نظیر اصوات و اجسام را تحت کنترل و مدیریت درآورد و رفتار و عملکرد آن‌ها را تحلیل کرد. در همین راستا، یکی از مسیرهایی که هوش مصنوعی توانسته‌ گام‌های جدی و محکمی را در توسعه از آن خود کند، تبدیل گفتار به متن و متن به گفتار است.

در حال حاضر هوش مصنوعی به کمک فناوری پردازش گفتار، سعی دارد تا درک ماشین‌ها از پدیده زبان را، به درک انسان نزدیک کند. به‌نحوی‌که بتوان انتظار داشت ماشین‌ها نیز مانند انسان برداشت درستی از واژه‌ها، جملات و گفتار انسانی به دست آورند. فناوری‌های هوشمند تبدیل متن به گفتار (TTS) و تبدیل گفتار به متن (STT) از نمونه‌هایی هستند که در مسیر توسعه پردازش گفتار ایجاد شده‌اند. فناوری نخست دارای این توانایی است که به خوانش متن‌ها و نگاشته‌های الکترونیک، مطابق با گفتار انسانی بپردازد و فناوری دوم نیز دارای این قابلیت است که گفتار انسانی را به متن قابل ویرایش تبدیل کند.

کاربردهای فناوری تبدیل گفتار به متن و تبدیل متن به گفتار

این دو فناوری امروزه توانسته‌اند در قالب API های کارا، هوشمند و تاثیرگذار، نه‌تنها به کسب‌وکارها و سامانه‌های آنلاین الکترونیکی خدمات سریع، آنی و دقیق ارائه دهند،‌ که حتی زمینه را برای توانمندسازی کاربرانی که به هر دلیل قادر به انجام برخی فرایندها نیستند، فراهم کند. این رابط‌های کاربری هوشمند ابری دارای آن میزان انعطاف هستند که روی پلتفرم‌های گوناگون اجرا شوند و تجربه‌های کاربری درخشانی را رقم بزنند:

  • رابط‌ سخنگوی هوشمند وب‌سایت‌ها و ارائه‌دهنده خدمات پشتیبانی آنلاین و پاسخگوی سوالات کاربران و مشتریان
  • دستیار صوتی یا گوینده در امکان عمومی نظیر بیمارستان‌ها، مترو، ایستگاه‌های اتوبوس و سالن‌های عمومی
  • رابط هوشمند آموزشی برای کودکان و نوجوانان و ارتقای سطح کیفی آموزش سمعی – بصری
  • رابط کاربری‌ سخنگو و نویسنده هوشمند برای توانیابان یا افرادی که اختلال جسمی حرکتی دارند
  • دستیار هوشمند ضبط دقیق محتوای صوتی و نوشتاری جلسات، سخنرانی‌ها و کنفرانس‌ها

متخصصان هوش مصنوعی ایران متمرکز بر فناوری‌های پردازش گفتار

باتوجه‌به پراکندگی دانش و تخصص هوش مصنوعی در سطح جهان، امروزه شاهد بازتولید فناوری‌های متنوع هوش مصنوعی در کشورهای گوناگونی هستیم. کشورمان ایران نیز یکی از بازیگران جدی در سطح منطقه و جهان است که نه‌تنها برای کسب رتبه برتر جهان در هوش مصنوعی خیز برداشته، بلکه در کارنامه خود سابقه درخشانی در زمینه تولید علم و فناوری‌های هوش مصنوعی دارد.

در این شرایط تیم‌های متخصص در مراکز تحقیقاتی گوناگون کشورمان، نظیر مرکز تحقیقات هوش مصنوعی پارت، همواره در حال کوشش هستند تا لبه تکنولوژی جهان را رصد کرده و به بازتولید موفق‌ترین فناوری‌ها آن در داخل کشور بپردازند. در حال حاضر می‌توان گفت دو فناوری تبدیل متن به گفتار و تبدیل گفتار به متن که جزو خط مقدم تکنولوژی‌های جهان محسوب می‌شوند، به دست متخصصان داخلی و مراکز تحقیقاتی هوش مصنوعی در حال بازتولید و توسعه هستند.

زبان فارسی و گویش ایرانی بر لبه تکنولوژی‌های نوین

در بحبوحه جهش‌های پرسرعت تکنولوژی در سراسر دنیا، متخصصان هوش مصنوعی ایران نیز با همت و تلاش خود در مراکز تحقیقاتی هوش مصنوعی ایران، این فرصت را ایجاد کرده‌اند تا فناوری‌های روز دنیا را روی زبان فارسی و گفتار بومی ایران پیاده‌سازی کنند. تکنولوژی‌های هوشمند پردازش گفتار که طی یک فرایند دقیق و مبتنی بر الگوریتم‌های روز دنیا، گفتار فارسی را از گوینده فارسی زبان به نوشتار قابل ویرایش فارسی درآورد، و نوشتار فارسی را به صوتی قابل درک تبدیل کند، از نتایج درخشان این کوشش‌ها بوده است.

این موفقیت نه‌تنها می‌تواند نقطه عطفی برای متخصصان هوش مصنوعی کشورمان باشد، بلکه دریچه‌ای تازه از جنس فناوری را به روی فرهنگ و زبان فارسی و هویت ایرانی گویشگران این مرز و بوم گشوده است. ناگفته پیداست که همواره حجم بالایی از فعالیت‌های تیم‌های پژوهشی متمرکز بر جنبه‌های جهانی هوش مصنوعی و صنایعی بوده که تا حد زیادی با دنیای بیرون از این آب و خاک پیوند دارد و همین موضوع باعث شده زبان فارسی از تحول‌های کلیدی دنیای امروز مهجور بماند. تیم‌های متخصص ایرانی که روی صوت و گفتار و زبان فارسی متمرکز شده‌اند، این شکاف را درک کرده‌اند و توجه به گنجینه‌های هویتی و میراث ملی که با آن سخن می‌گوییم را در اولویت پژوهش‌های خود قرار داده‌اند تا زبان فارسی نیز از این موج تحول جهانی دور نماند.

سخن پایانی

با توجه‌ به همت متخصصان کشورمان و دغدغه‌ هوشمندسازی فرایندهای زندگی که شعار و هدف اصلی مرکز تحقیقاتی هوش مصنوعی پارت است، می‌توان نوید آن را داد که در آینده نزدیک بتوانیم شاهد محصولات فناورانه ویژه‌ای باشیم که با زبان شیرین فارسی و فرهنگ ایرانی بومی‌سازی شده باشند. محصولاتی که علاوه بر رفع نیازهای داخلی، قادر باشند با برترین نمونه‌های خارجی رقابت کنند و حتی به کشورهای گوناگون صادر شوند.

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]