Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 راه‌اندازی سامانه پیکره‌های ایرانداک (ساپا) به منظور آسان‌سازی فرایند پژوهش

راه‌اندازی سامانه پیکره‌های ایرانداک (ساپا) به منظور آسان‌سازی فرایند پژوهش

زمان مطالعه: < 1 دقیقه

پژوهشگاه علوم و فناوری اطلاعات به منظور رفع نیاز پژوهشگران کشور در آسان‌سازی فرایند پژوهش، سامانه پیکره‌های ایرانداک (ساپا) را راه‌اندازی کرد.

به گزارش هوشیو به نقل از ایرنا، نشانی سامانه پیکره‌های ایرانداک (ساپا) SAPA.IRANDOC.AC.IR است و همه پژوهشگران کشور از طریق این آدرس به سامانه‌ای که به تازگی راه‌اندازی شده، دسترسی خواهند داشت.

در توضیح مفهوم پیکره باید گفت مجموعه‌ای نظام‌مند و مبتنی بر رایانه از زبان است که برای بررسی‌های زبان‌شناختی استفاده می‌شود. اهمیت پیکره به این دلیل است که بسیاری از پژوهش‌های زبان‌شناسی و تصمیم‌گیری‌ها در برنامه‌ریزی زبانی، تنها با کاربرد یک پیکره میسر می‌شود.

همچنین انواع کاربرد پیکره‌ها در زمینه پردازش زبان طبیعی، درک و بازشناسی گفتار، تبدیل متن به گفتار و گفتار به متن، نگارش فرهنگ‌ها، آموزش و پژوهش، ساخت پایگاه‌های داده زبانی، بررسی واژه‌‎های هم‌آیند در زبان‌های مختلف، پایشگری زبان به منظور پیگیری و ردگیری دگرگونی‌های زبانی، ترجمه ماشینی، توسعه مفاهیم و منابع در پیوند با واژگان، نگارش و گسترش مهارت‌های نوشتاری، آموزش و یادگیری زبان با شناخت گویش‌ها و گوناگونی زبان‌ها، معناشناسی، تحلیل کلام، زبان‎شناسی اجتماعی، زبان‌شناسی حقوقی، واکاوی ژانرهای ادبی و پژوهش‌های دستور زبان، هستند.

سامانه پیکره‌های ایرانداک (ساپا) توانایی پشتیبانی از چند پیکره را دارد. این سامانه درحال‌حاضر پیکره‌ای تحت عنوان «پیکره پژوهش‌نامه» دارد که دارای حدود 4 میلیون و 780 هزار واژه تخصصی و میان رشته در زمینه‌های علم اطلاعات و دانش‌شناسی، فناوری اطلاعات، مدیریت دانش، زبان‎شناسی رایانشی، اصطلاح‌شناسی و غیره است. این پیکره از مقاله‌های «پژوهش‌نامه پردازش و مدیریت اطلاعات» ساخته شده و برای پژوهش‌هایی که نیازمند استفاده از پیکره‌های تخصصی هستند، بسیار پرکاربرد خواهد بود.

از ویژگی‌های این پیکره این است که هنگام بازیابی اطلاعات در پیکره پژوهش‌نامه، به غیر از نمایش واژه یا عبارت جستجو در بافت زبان، اسم مقاله‌ای که آن عبارت یا واژه در آن استفاده شده، موضوع مقاله، پدیدآوران مقاله و تعداد واژه یا عبارت جستجو نیز نمایش داده می‌شود.

نکته دیگر این است که داده‌های این پیکره دارای برچسب اجزای واژگانی کلام (POS tag) هستند که در بیشتر پردازش‌های زبان از آن استفاده می‌شود و باعث پیدا کردن واژه‌ها مانند اسم، صفت، قید و غیره می‌شود.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]