پوشش رسانه‌ای جیتکس ۲۰۲۴ | با ما همراه باشید

Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 پیشنهاد من برای شما، آوانگار است

پیشنهاد من برای شما، آوانگار است

زمان مطالعه: 5 دقیقه

روزی که با فناوری تبدیل گفتار به متن «آوانگار» آشنا شدم، قرار بود گزارش مکتوب فایل ضبط‌شده «هفتمین کنفرانس ملی توانمندسازی جامعه در حوزه علوم انسانی» را به مدیرم تحویل دهم. می‌دانستم که مکتوب کردن چهار ساعت صوت یک کنفرانس با دقت بالا، کاری بسیار دشوار و زمان بر است و قطعا بیشتر از خود کنفرانس از من زمان خواهد گرفت. به خاطر دارم همان روز قرار بود گزارش بررسی عملکرد حوزه‌های دورکار را نیز تحویل دهم. زمان اندک بود و کار بسیار…

شنیده بودم نرم‌افزاری با عنوان تبدیل‌گر گفتار به متن وجود دارد که از طریق فناوری هوش مصنوعی توسعه یافته است و چند سالی است که در کشورمان نیز به کار گرفته شده و گفت‌وگوها را به متن تبدیل می‌کند. تصمیم گرفتم با تحقیق در خصوص چند نرم‌افزار کارآمد و حرفه‌ای تبدیل گفتار به متن در دنیای تکنولوژی، باکیفیت‌ترین و مناسب‌ترین آن‌ها را انتخاب کنم، تا علاوه بر به‌کارگیری آن برای فعالیت‌های روزانه‌ام، آن را به‌عنوان نتیجه تحقیقم به دیگران معرفی نمایم.

در ابتدا گمان می‌کردم احتمالاً نرم‌افزارهای خارجی، تبدیل گفتار به متن را بهتر انجام خواهند داد؛ با این حال، برای اینکه نتیجه بهتری از این پژوهش کسب کنم، لازم دیدم از هر دو نمونه خارجی و ایرانی، چند نرم‌افزار را برگزینم و مورد تحقیق قرار دهم. فناوری‌های تبدیل گفتار به متن «مایکروسافت» و «گوگل» به‌عنوان نمونه‌های خارجی و سه نمونه ایرانی تبدیل گفتار به متن به‌عنوان نمونه‌های داخلی، انتخاب من برای انجام این پژوهش بود.

باورم نمی‌شد که فناوری هوش مصنوعی آنقدر رشد نموده است که در انجام هر کاری، ردپایی از این فناوری به چشم می‌خورد و کارهایی که تا چند سال پیش، انسان‌ها مجبور بودند خودشان آن‌ها را انجام دهند، هم‌اکنون به‌راحتی آن را در اختیار یک ماشین یا نرم‌افزار قرار می‌دهند. در واقع، دیگر برای افراد، باورپذیر نیست که لحظه‌ای فعالیت بر سبک و سیاق گذشته‌ای بدون هوش مصنوعی را تجربه کنند. مهم‌تر اینکه برخی از نرم‌افزارهای توسعه‌یافته از جمله تبدیل‌گر گفتار به متن، بر روی زبان فارسی پیاده‌سازی شده‌اند و نمونه‌های داخلی نیز تکنولوژی تبدیل گفتار به متن را طوری در زبان فارسی توسعه داده‌اند که عده‌ای با رغبت آن را برای انجام امورشان مورد استفاده قرار می‌دهند.

پژوهش در مورد محصول

به نظر می‌رسید باید با برنامه‌ای کار کنم که قادر باشد صحبت‌های افراد را در محیط‌های شلوغ به طور جداگانه تشخیص دهد. برایم اهمیت داشت وقتی آقایان «الف» و «ب» و «ج» همهمه‌وار صحبت‌ می‌کنند، صحبت‌های آقای «الف» در لابه‌لای صحبت‌های آقای «ب» تایپ نشود و حرف‌های آقای «ج» که لهجه اصفهانی داشت، از قلم نیفتد. به‌طور کلی، از فناوری تبدیل گفتار به متن، انتظار داشتم، عبارت‌ها و اصطلاحاتی را که در کلام افراد وجود داشت، به‌درستی درک و سپس مکتوب کند. تحقیقاتم را آغاز کردم:

سه نمونه صوت را با هر کدام از فناوری‌های تبدیل گفتار به متن «مایکروسافت» و «گوگل» و «آوانگار» و دو نمونه داخلی دیگر تست کردم. این سه نمونه صوت، در زمینه‌های مختلف (داستانی، ادبی، روزنامه‌ای و…) در حالت‌های «نویزی و رسمی» و «نویزی و محاوره» با صداهای مختلف خوانده شدند. نتیجه تست در جدول های ۱ و ۲ و ۳ آمده است. (کلمات زرد کلماتی هستند که تبدیل‌گر از قلم انداخته و کلمات قرمز، کلماتی هستند که تبدیل‌گر آن‌ها را اشتباه تایپ کرده است.)


جدول شماره۱- تست نرم‌افزارها با صوت رسمی در محیط عادی

تبدیل‌گرها خروجی جمله تعداد غلط‌ها و جاافتادگی‌ها
مایکروسافت تلفن با [باز] زنگ میزنن [می‌زند] می‌بینم که زن لحظه‌ای درنگ می‌کند بعد یکباره به خود می‌آید چمدان را رها می‌کند با عجله به سوی تلفن می‌رود و گوشی را بر می‌دارد هنوز کلامی نگفته صدای مردی را می‌شنود ۲ غلط

۰ جاافتادگی

گوگل تلفن با [باز] زنگ می‌زنم [می‌زند] که زن [لحظه‌ای] [درنگ] می‌کند بعد یکباره [به] خود می‌آید [چمدان] [را] [رها] می‌کند با عجله به سوی تلفن می‌رود و گوشی را بر می‌دارد هنوز کلامی نگفتی [نگفته] صدای مردی را می‌شود [می‌شنود] ۴ غلط

۶ جاافتادگی

توسعه‌دهنده داخلی۱ تلفن با [باز] زنگ می‌زنم [می‌زند] ببینم [می‌بینم] که زن [لحظه‌ای] [درنگ] می‌کند بعد یکباره [به] خود می‌آید مرا [چمدان را] رها می‌کند با عجله به سوی تلفن می‌رود و گوشی را بر می‌دارد هنوز کلامی نگفتی [نگفته] صدای مردی را می‌شنود ۵ غلط

۱ جاافتادگی

توسعه‌دهنده داخلی۲ تلفن باهات [باز] زنگ می‌زنم [می‌زند] می‌بینم که زن لحظه‌ای درنگ می‌کند بعد یکباره به خود می‌آید چمدان را رها می‌کند با عجله به سوی تلفن می‌رود و گوشی را بر می‌دارد هنوز کلامی نگفته صدای مهدی [مردی] را می‌شنود ۳ غلط

۰ جاافتادگی

تبدیل‌گر هوشمند آوانگار تلفن [باز] زنگ می‌زند می‌بینم که زن لحظه‌ای درنگ می‌کند بعد یکباره به خود می‌آید چمدان را رها می‌کند با عجله به سوی تلفن می‌رود و گوشی را بر می‌دارد هنوز کلامی نگفته صدای مردی را می‌شنود ۰ غلط

۱ جاافتادگی

 

• • • • •                              • • • • •                              • • • • •

 


جدول شماره۲- تست نرم‌افزارها با صوت رسمی در محیط نویزی

تبدیل‌گرها

خروجی جمله

تعداد غلط‌ها و جاافتادگی‌ها

مایکروسافت

چاره‌ای نیست من مرغ دریایی هم [دریایی‌ام] و محدود به طبیعت خویش اگر قرار بود با سرعت پرواز کنم باید بال‌های [بال‌هایی] به کوتاهی بال‌های شاهین می‌داشتم و به جای ماهی موش می‌خوردم ۲ غلط

۰ جاافتادگی

گوگل

چاره‌ای نیست من مرغ دریایی [دریایی‌ام] و محدود به طبیعت خویش اگر قرار بود با سرعت پرواز کنم باید بال‌هایی به کوتاهی بال‌های شاهین می‌داشتم و به جای ماهی [موش] می‌خوردم ۱ غلط

۱ جاافتادگی

توسعه‌دهنده داخلی۱

چاره‌ای نیست من مرغ دریایی‌ام و محدود به طبیعت خویش ر [اگر] قرار بود با سرعت پرواز کنم باید بال‌هایی به کوتاهی بال‌های شاهین می‌داشتند [می‌داشتم] و به جای ماهی موش می‌خورد [می‌خوردم] ۳ غلط

۰ جاافتادگی

توسعه‌دهنده داخلی۲

چاره‌ای نیست من مرغ دریایی‌ام و محدود به طبیعت خویش اگر قرار بود با سرعت پرواز کنم باید بال‌هایی به کوتاهی بارهای [بال‌های] شاهین می‌داشتم و به جای ماهی موش می‌خوردم ۱ غلط

۰ جاافتادگی

تبدیل‌گر هوشمند آوانگار

چاره‌ای نیست من مرغ دریایی‌ام و محدود به طبیعت خویش اگر قرار بود با سرعت پرواز کنم باید بال‌هایی به کوتاهی بال‌های شاهین می‌داشتم و به جای ماهی موش می‌خوردم ۰ غلط

۰ جاافتادگی

 

• • • • •                              • • • • •                              • • • • •

 


جدول شماره۳- تست نرم‌افزارها با صوت محاوره در محیط عادی

تبدیل‌گرها

خروجی جمله

تعداد غلط‌ها و جاافتادگی‌ها

مایکروسافت

[و] حالا برادر ایشان [ایشون] آقای فریک فعلی [فردیک فرلی] یعنی همان [همون] کسی که شما را [رو] استخدام کرده مالک این خانه [خونه] هستند [هستن] ۶ غلط

۱ جاافتادگی

گوگل

[و] حالا برادر ایشون آقای فردی [فردیک فرلی] یعنی همون کسی که شما را [رو] استخدام کردیم [کرده] که [مالک] این خونه هست [هستن] ۵ غلط

۷ جاافتادگی

توسعه‌دهنده داخلی۱

برادر ایشان [ایشون] آقای فردی [فردیک فرلی] یعنی همون کسی که شما را [رو] استخدام کردیم [کرده] مالکین [مالک] این خانه [خونه] هستند [هستن] ۷ غلط

۴ جاافتادگی

توسعه‌دهنده داخلی۲

ت [و] حالا برادری [برادر] شونقای [ایشون آقای] فردیک فرلی یعنی همان [همون] کسی که شما را [رو] استخدام کرده ملکه [مالک] این خویی [خونه] هستند [هستن] ۸ غلط

۰ جاافتادگی

تبدیل‌گر هوشمند آوانگار

و حالا برادر ایشون آقای فردیک فرلی یعنی همون کسی که شما رو استخدام کرده مالک این خونه هستن ۰ غلط

۰ جاافتادگی

 

در نهایت، با نگاهی کلی و دقیق به خروجی‌های این ۵ نرم‌افزار پرکاربرد تبدیل گفتار به متن خارجی و داخلی، دریافتم که میزان دقت و درک خروجی تبدیل‌گر هوشمند «آوانگار» از همه نمونه‌های ذکرشده بیشتر و قادر است در محیط‌های شلوغ و نویزی، متن را به‌درستی تایپ کند و جملات محاوره را به‌خوبی تشخیص دهد. از سوی دیگر، آوانگار حاصل دانش و تلاش مداوم متخصصان و جوانان نخبه کشورمان برای پیشرفت و توسعه کسب‌وکارهاست و بنابراین این وب‌سرویس هوشمند را به عنوان تبدیل‌گر برتر انتخاب کردم.

از آن‌جا که تصمیم گرفتم در دیگر پروژه‌های کاری نیز از این فناوری استفاده کنم، بیشتر درباره آوانگار جستجو کردم و متوجه شدم این وب‌سرویس هوشمند را مرکز تحقیقات هوش مصنوعی پارت توسعه داده است. پیش از این هم درباره این مرکز دانش‌بنیان شنیده بودم و اطلاع داشتم که در حوزه فناوری‌های هوش مصنوعی و هوشمندسازی کسب‌وکارها و فرایندهای زندگی فعالیت می‌کند. در ضمن اگر خواستید از آوانگار استفاده کنید، می‌توانید به این سایت اصلی وب‌‌سرویس هوشمند آوانگار سر بزنید.

نتیجه این پژوهش برایم رضایت‌بخش و قانع‌کننده بود، چراکه هم توانسته بودم با تحقیق و بررسی دریابم که کدام نرم‌افزار تبدیل‌گر گفتار به متن کارآمد و مطمئن است و در نتیجه آن را برای انجام سریع کارهایم مورد استفاده قرار خواهم داد، هم در مجموع به خود ببالم که توسعه‌دهنده چنین نرم‌افزار دقیق و مطمئنی، متخصصان کشور خودمان هستند و این موضوع در خلال مقایسه نرم‌افزارهای خارجی و داخلی به روشنی مشخص شد. به همین دلیل، لازم دیدم تجربه خود را در خصوص کیفیت خوب نرم‌افزار تبدیل گفتار به متن «آوانگار» در اختیار سایر کاربران نیز بگذارم.

جالب اینکه پس از کار بیشتر با این تبدیل‌گر، دریافتم که این فناوری کاربردهای دیگری نیز دارد: آوانگار برای مکتوب کردن گزارش‌ها، پژوهش‌های صوتی، ثبت صورت‌جلسات و آماده کردن آن‌ها به شکل سندی قابل ویرایش، کارا و مفید است. همچنین از این فناوری هوشمند می‌توانیم به‌عنوان یک دستیار صوتی در آرشیو کردن مطالب نیز استفاده کنیم. سایر کارکردهای این فناوری، تولید زیرنویس فارسی فایل‌های ویدئویی، هوشمندسازی مراکز تماس و مراکز خدمات مشتریان و کمک به توان‌یابان و نابینایان است که باعث می‌گردد با مجهز نمودن پلتفرم خود به این نرم‌افزار، مجموعه کاملی از خدمات را دریافت کنید.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]