راهاندازی سامانه پیکرههای ایرانداک (ساپا) به منظور آسانسازی فرایند پژوهش
پژوهشگاه علوم و فناوری اطلاعات به منظور رفع نیاز پژوهشگران کشور در آسانسازی فرایند پژوهش، سامانه پیکرههای ایرانداک (ساپا) را راهاندازی کرد.
به گزارش هوشیو به نقل از ایرنا، نشانی سامانه پیکرههای ایرانداک (ساپا) SAPA.IRANDOC.AC.IR است و همه پژوهشگران کشور از طریق این آدرس به سامانهای که به تازگی راهاندازی شده، دسترسی خواهند داشت.
در توضیح مفهوم پیکره باید گفت مجموعهای نظاممند و مبتنی بر رایانه از زبان است که برای بررسیهای زبانشناختی استفاده میشود. اهمیت پیکره به این دلیل است که بسیاری از پژوهشهای زبانشناسی و تصمیمگیریها در برنامهریزی زبانی، تنها با کاربرد یک پیکره میسر میشود.
همچنین انواع کاربرد پیکرهها در زمینه پردازش زبان طبیعی، درک و بازشناسی گفتار، تبدیل متن به گفتار و گفتار به متن، نگارش فرهنگها، آموزش و پژوهش، ساخت پایگاههای داده زبانی، بررسی واژههای همآیند در زبانهای مختلف، پایشگری زبان به منظور پیگیری و ردگیری دگرگونیهای زبانی، ترجمه ماشینی، توسعه مفاهیم و منابع در پیوند با واژگان، نگارش و گسترش مهارتهای نوشتاری، آموزش و یادگیری زبان با شناخت گویشها و گوناگونی زبانها، معناشناسی، تحلیل کلام، زبانشناسی اجتماعی، زبانشناسی حقوقی، واکاوی ژانرهای ادبی و پژوهشهای دستور زبان، هستند.
سامانه پیکرههای ایرانداک (ساپا) توانایی پشتیبانی از چند پیکره را دارد. این سامانه درحالحاضر پیکرهای تحت عنوان «پیکره پژوهشنامه» دارد که دارای حدود 4 میلیون و 780 هزار واژه تخصصی و میان رشته در زمینههای علم اطلاعات و دانششناسی، فناوری اطلاعات، مدیریت دانش، زبانشناسی رایانشی، اصطلاحشناسی و غیره است. این پیکره از مقالههای «پژوهشنامه پردازش و مدیریت اطلاعات» ساخته شده و برای پژوهشهایی که نیازمند استفاده از پیکرههای تخصصی هستند، بسیار پرکاربرد خواهد بود.
از ویژگیهای این پیکره این است که هنگام بازیابی اطلاعات در پیکره پژوهشنامه، به غیر از نمایش واژه یا عبارت جستجو در بافت زبان، اسم مقالهای که آن عبارت یا واژه در آن استفاده شده، موضوع مقاله، پدیدآوران مقاله و تعداد واژه یا عبارت جستجو نیز نمایش داده میشود.
نکته دیگر این است که دادههای این پیکره دارای برچسب اجزای واژگانی کلام (POS tag) هستند که در بیشتر پردازشهای زبان از آن استفاده میشود و باعث پیدا کردن واژهها مانند اسم، صفت، قید و غیره میشود.
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید