ساپا
اخبارهوش مصنوعی در ایران

راه‌اندازی سامانه پیکره‌های ایرانداک (ساپا) به منظور آسان‌سازی فرایند پژوهش

    0
    مدت زمان مطالعه: ۲ دقیقه

    پژوهشگاه علوم و فناوری اطلاعات به منظور رفع نیاز پژوهشگران کشور در آسان‌سازی فرایند پژوهش، سامانه پیکره‌های ایرانداک (ساپا) را راه‌اندازی کرد.

    به گزارش هوشیو به نقل از ایرنا، نشانی سامانه پیکره‌های ایرانداک (ساپا) SAPA.IRANDOC.AC.IR است و همه پژوهشگران کشور از طریق این آدرس به سامانه‌ای که به تازگی راه‌اندازی شده، دسترسی خواهند داشت.

    در توضیح مفهوم پیکره باید گفت مجموعه‌ای نظام‌مند و مبتنی بر رایانه از زبان است که برای بررسی‌های زبان‌شناختی استفاده می‌شود. اهمیت پیکره به این دلیل است که بسیاری از پژوهش‌های زبان‌شناسی و تصمیم‌گیری‌ها در برنامه‌ریزی زبانی، تنها با کاربرد یک پیکره میسر می‌شود.

    همچنین انواع کاربرد پیکره‌ها در زمینه پردازش زبان طبیعی، درک و بازشناسی گفتار، تبدیل متن به گفتار و گفتار به متن، نگارش فرهنگ‌ها، آموزش و پژوهش، ساخت پایگاه‌های داده زبانی، بررسی واژه‌‎های هم‌آیند در زبان‌های مختلف، پایشگری زبان به منظور پیگیری و ردگیری دگرگونی‌های زبانی، ترجمه ماشینی، توسعه مفاهیم و منابع در پیوند با واژگان، نگارش و گسترش مهارت‌های نوشتاری، آموزش و یادگیری زبان با شناخت گویش‌ها و گوناگونی زبان‌ها، معناشناسی، تحلیل کلام، زبان‎شناسی اجتماعی، زبان‌شناسی حقوقی، واکاوی ژانرهای ادبی و پژوهش‌های دستور زبان، هستند.

    سامانه پیکره‌های ایرانداک (ساپا) توانایی پشتیبانی از چند پیکره را دارد. این سامانه درحال‌حاضر پیکره‌ای تحت عنوان «پیکره پژوهش‌نامه» دارد که دارای حدود ۴ میلیون و ۷۸۰ هزار واژه تخصصی و میان رشته در زمینه‌های علم اطلاعات و دانش‌شناسی، فناوری اطلاعات، مدیریت دانش، زبان‎شناسی رایانشی، اصطلاح‌شناسی و غیره است. این پیکره از مقاله‌های «پژوهش‌نامه پردازش و مدیریت اطلاعات» ساخته شده و برای پژوهش‌هایی که نیازمند استفاده از پیکره‌های تخصصی هستند، بسیار پرکاربرد خواهد بود.

    از ویژگی‌های این پیکره این است که هنگام بازیابی اطلاعات در پیکره پژوهش‌نامه، به غیر از نمایش واژه یا عبارت جستجو در بافت زبان، اسم مقاله‌ای که آن عبارت یا واژه در آن استفاده شده، موضوع مقاله، پدیدآوران مقاله و تعداد واژه یا عبارت جستجو نیز نمایش داده می‌شود.

    نکته دیگر این است که داده‌های این پیکره دارای برچسب اجزای واژگانی کلام (POS tag) هستند که در بیشتر پردازش‌های زبان از آن استفاده می‌شود و باعث پیدا کردن واژه‌ها مانند اسم، صفت، قید و غیره می‌شود.

    جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

    این مطلب چه میزان برای شما مفید بوده است؟
    [کل: ۰ میانگین: ۰]

    فراخوان جهت عضویت در کمسیون‌های سازمان نظام صنفی رایانه‌ای استان تهران

    مقاله قبلی

    ربات های خانگی تویوتا با قابلیت‌های جدیدی عرضه می‌شوند

    مقاله بعدی

    شما همچنین ممکن است دوست داشته باشید

    بیشتر در اخبار

    نظرات

    پاسخ دهید

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *