هند پیشرو در توسعه فناوریهای دیجیتال در حوزه بهداشت و درمان
بر اساس گزارش تازهای که توسط نسکام-زینوو (Nasscom-Zinnov) منتشر شده است، پیشبینی
پردازش گفتار که به ماشینها قابلیت درک و پردازش گفتار انسانها را میدهد، یکی از فناوریهای اصلی هوش مصنوعی میباشد که امروزه بسیار مورد توجه قرار گرفته است. این فناوری با تمرکز بر ایجاد ارتباط کلامی بین ماشینها و انسانها منجر به تبدیل هر چه بیشتر دنیای واقعی به فیلمهای علمی-تخیلی شده است. چیستی این فناوری، تاریخچه، نحوه کار و ارزیابی سیستمهای پردازش گفتار و تفاوتش با پردازش صدا از جمله مواردی است که میتواند به شناخت این حوزه فناوری کمک نماید، درباره پردازش گفتار بیشتر بخوانید
بر اساس گزارش تازهای که توسط نسکام-زینوو (Nasscom-Zinnov) منتشر شده است، پیشبینی
اکنون این ویژگی در نسخه بتای iOS 18.2 برای توسعهدهندگان بهصورت زودهنگام قابل دسترسی است.
به تازگی مشخص شده است که مدل هوش مصنوعی whisper با مشکلات جدی دست و پنجه نرم میکند.
مدلهای زبانی در هوش مصنوعی تحولات بزرگی را در چند سال اخیر تجربه کردهاند و به طرز چشمگیری دنیای هوش مصنوعی را متحول کردهاند. این مدلها که بهمنظور درک و تولید و پردازش زبان انسان طراحی شدهاند، روزبهروز در کاربردهایی نظیر پردازش زبان طبیعی، ترجمۀ ماشینی و حتی نوشتن خلاقانه مهارت و تنوع بیشتری پیدا میکنند. این مقاله به بررسی تکامل مدلهای زبانی در هوش مصنوعی، از روزهای اولیه تا قابلیتهای پیشرفته امروزی، میپردازد.
رقابت غولهای تکنولوژی جهان بر سر دستیابی به نافذترین دستیارهای صوتی، در
در این مقاله به معرفی شرکتهای فعال در حوزه پردازش گفتار در
برای اینکه درک بهتری از اهمیت دسته بندی صداها داشته باشید، به
دستیار گوگل، سیری (Siri)، الکسا (Alexa) و سایر دستیارهای صوتی همیشه مایه
انسانها به صورت پیچیده و به طرق مختلف احساسات و عواطف خود
قبل از آنکه به کاربردهای شبکههای عصبی در پردازش گفتار بپردازیم، باید
فیلمهای سینمایی و برنامههای تلویزیونی دوست دارند روباتهایی را به تصویر بکشند
موسیقی یکی از عناصر حیاتی فیلم به شمار میرود؛ چرا که جوّ
یکی از ویژگیهای بارز مشاغل موفق در قرن بیست و یکم، تعامل
فناوری تشخیص گفتار گوگل به عنوان گامی به سمت هوشمند شدن ابزارها
اصطلاح «خانه های هوشمند» از اوایل دهه شصت میلادی بر سر زبانها
محققان موسسه Skoltech و همکاران آنها از Mobile TeleSystems مفهوم «پیامهای متنی
میدانید چطور باید یک مدل یادگیری عمیق ساخته و آنرا ارتقا دهید؟
در هر سازمانی روزانه حجم زیادی از دادههای صوتی تولید میشوند. اگر
درب کاپوت اتومبیلهای مدرن را که باز میکنید، به جای مجموعهای از
دستیار صوتی سیری امروزه نظر بسیاری از کاربران را به خود جلب
پیوتر زلاسکو، مهندس مرکز پردازش زبان و گفتار جانز هاپکینز، مدل یادگیری
بدون شک یکی از دغدغههای مهم کسبوکارها، همگام ماندن با انتظارات مشتریان
در این پروژه، ما از LSTM به جای GAN برای تولید موسیقی
بیتردید، محصولات فناوری مارک زاکربرگ از قبیل فیسبوک یا نرمافزارهایی همچون مسنجر
یک دستیار شخصی مجهز به هوش مصنوعی درواقع نرمافزاری است که دستورات
باز هم با یک پژوهش مشکلساز دیگر در حوزه هوش مصنوعی روبهرو
در طول سالیان متمادی، تلاشهای بسیاری صورت گرفته است، تا با توسعه
هوش مصنوعی مکالمه ای، به لطف تعدادی از نرمافزارهای مفید، زندگی را
پردازش گفتار یکی از فناوریهای بنیادین هوش مصنوعی است که به ماشینها
WellSaid Labs آنچه مشتریان میتوانند از هشتتا از صداپیشه های مجهز به
Speech Brain که یک تولکیت منبع باز مبتنی بر PyTorch است درحال
امروزه دیگر همگی به دستیاران هوشمند خانگی و سیستم پردازشگر صوتی عادت
امروزه، نرمافزارهای بازشناسی گفتار در مقیاس گستردهای به کار برده میشوند. از
در این نوشته به چگونگی تبدیل فایلهای صوتی به فایلهای متنی با
در این مقاله قصد داریم به الگوریتم Wav2vec 2.0 بپردازیم. تلاشهای بیوقفه
سیستمهایی که در امور تکراری به کار گرفته میشوند، برای چندین نسل
مقاله حاضر بر آن است تا یادگیری عصبی ساماندهی شده در کتابخانه
آنتونی بوردن که در سال 2018 اقدام به خودکشی کرد، سوژه مستند
همانطور که از نامش پیداست، تبدیل متن به گفتار Text to speech
شاید محبوبترین کارگزار املاک «فیل دانفی» شخصیت سریال کمدی «خانواده مدرن» باشد.
هوشیو رسانه تخصصی هوش مصنوعی است که هدف آن انتشار جدیدترین اخبار، کاربردهای نوین هوش مصنوعی، چالشهای فنی این حوزه و ارائه مقالات آموزشی است.