راه‌اندازی سامانه پیکره‌های ایرانداک (ساپا) به منظور آسان‌سازی فرایند پژوهش

تیم تحریریه
۱۳ تیر ۱۴۰۰

زمان مطالعه: 2 دقیقه

پژوهشگاه علوم و فناوری اطلاعات به منظور رفع نیاز پژوهشگران کشور در آسان‌سازی فرایند پژوهش، سامانه پیکره‌های ایرانداک (ساپا) را راه‌اندازی کرد.

به گزارش هوشیو به نقل از ایرنا، نشانی سامانه پیکره‌های ایرانداک (ساپا) SAPA.IRANDOC.AC.IR است و همه پژوهشگران کشور از طریق این آدرس به سامانه‌ای که به تازگی راه‌اندازی شده، دسترسی خواهند داشت.

در توضیح مفهوم پیکره باید گفت مجموعه‌ای نظام‌مند و مبتنی بر رایانه از زبان است که برای بررسی‌های زبان‌شناختی استفاده می‌شود. اهمیت پیکره به این دلیل است که بسیاری از پژوهش‌های زبان‌شناسی و تصمیم‌گیری‌ها در برنامه‌ریزی زبانی، تنها با کاربرد یک پیکره میسر می‌شود.

همچنین انواع کاربرد پیکره‌ها در زمینه پردازش زبان طبیعی، درک و بازشناسی گفتار، تبدیل متن به گفتار و گفتار به متن، نگارش فرهنگ‌ها، آموزش و پژوهش، ساخت پایگاه‌های داده زبانی، بررسی واژه‌‎های هم‌آیند در زبان‌های مختلف، پایشگری زبان به منظور پیگیری و ردگیری دگرگونی‌های زبانی، ترجمه ماشینی، توسعه مفاهیم و منابع در پیوند با واژگان، نگارش و گسترش مهارت‌های نوشتاری، آموزش و یادگیری زبان با شناخت گویش‌ها و گوناگونی زبان‌ها، معناشناسی، تحلیل کلام، زبان‎شناسی اجتماعی، زبان‌شناسی حقوقی، واکاوی ژانرهای ادبی و پژوهش‌های دستور زبان، هستند.

سامانه پیکره‌های ایرانداک (ساپا) توانایی پشتیبانی از چند پیکره را دارد. این سامانه درحال‌حاضر پیکره‌ای تحت عنوان «پیکره پژوهش‌نامه» دارد که دارای حدود 4 میلیون و 780 هزار واژه تخصصی و میان رشته در زمینه‌های علم اطلاعات و دانش‌شناسی، فناوری اطلاعات، مدیریت دانش، زبان‎شناسی رایانشی، اصطلاح‌شناسی و غیره است. این پیکره از مقاله‌های «پژوهش‌نامه پردازش و مدیریت اطلاعات» ساخته شده و برای پژوهش‌هایی که نیازمند استفاده از پیکره‌های تخصصی هستند، بسیار پرکاربرد خواهد بود.

از ویژگی‌های این پیکره این است که هنگام بازیابی اطلاعات در پیکره پژوهش‌نامه، به غیر از نمایش واژه یا عبارت جستجو در بافت زبان، اسم مقاله‌ای که آن عبارت یا واژه در آن استفاده شده، موضوع مقاله، پدیدآوران مقاله و تعداد واژه یا عبارت جستجو نیز نمایش داده می‌شود.

نکته دیگر این است که داده‌های این پیکره دارای برچسب اجزای واژگانی کلام (POS tag) هستند که در بیشتر پردازش‌های زبان از آن استفاده می‌شود و باعث پیدا کردن واژه‌ها مانند اسم، صفت، قید و غیره می‌شود.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

https://hooshio.com/?p=15689

جدیدترین تحولات هوش مصنوعی را در کانال بله هوشیو بخوانید

راه‌اندازی سامانه پیکره‌های ایرانداک (ساپا) به منظور آسان‌سازی فرایند پژوهش

تبلیغات در ChatGPT

تجریه‌ای جدید از وب‌گردی با قابلیت Gemini 3 Auto-Browse در کروم

OpenAI ایرباد مجهز به هوش مصنوعی عرضه می‌کند

هوش مصنوعی وارد بدن ربات‌های انسان‌نما شد

آیا یک هوش مصنوعی می‌تواند تصادفاً همه ما را به گیره کاغذ تبدیل کند؟

هر سوال چند قطره آب مصرف می‌کند؟

آیا هوش مصنوعی می‌تواند منشأ حیات را کشف کند؟

خطرات واقعی هوش مصنوعی

آموزش رایگان هوش مصنوعی برای کودکان محلات کم‌برخوردار

دستیار هوش مصنوعی وزارت صمت به بهره‌برداری اولیه رسید

طرح ملی توسعه هوش اصلاح شد

آغاز تدریس «فقه هوش مصنوعی» در حوزه علمیه قم

تبلیغات در ChatGPT

تجریه‌ای جدید از وب‌گردی با قابلیت Gemini 3 Auto-Browse در کروم

OpenAI ایرباد مجهز به هوش مصنوعی عرضه می‌کند

هوش مصنوعی وارد بدن ربات‌های انسان‌نما شد

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

تبلیغات در ChatGPT

تجریه‌ای جدید از وب‌گردی با قابلیت Gemini 3 Auto-Browse در کروم

OpenAI ایرباد مجهز به هوش مصنوعی عرضه می‌کند

هوش مصنوعی وارد بدن ربات‌های انسان‌نما شد

Anthropic در سوپر بول از ChatGPT انتقاد کرد

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید