Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 پرشین پراسسینگ ؛ فعال حوزه توسعه ابزار و پردازش زبان طبیعی

پرشین پراسسینگ ؛ فعال حوزه توسعه ابزار و پردازش زبان طبیعی

زمان مطالعه: < 1 دقیقه

شرکت پرشین پراسسینگ با محصول خود یعنی Persianp Toolbox در زمینه پردازش زبان طبیعی و در حوزه توسعه ابزار برای توسعه دهندگان فعالیت می کند.

این شرکت با مدل درآمدی پرداخت به ازای استفاده، به صورت مستقیم و به میزان بالا از هوش مصنوعی در محصول خود استفاده می کند. جامعه هدف پرشین پراسسینگ کاربران شخصی هستند.

ابزار پیش‌پردازش متون فارسی Persianp Toolbox

ابزار Persianp با هدف پردازش متون فارسی طراحی و پیاده‌سازی شده‌ است. از جمله قابلیت‌های ‌این محصول می توان به نرمال‌سازی، واحدسازی (tokenization)، جمله‌یابی، بن‌واژه‌یابی (یا ریشه‌یابی) با دو روش آماری و غیرآماری، تعیین‌ایست‌واژه‌‌ها (stopwords)، تشخیص عبارات اسمی (noun phrase chunking) و تشخیص موجودیت‌های اسمی (named entity recognition) اشاره کرد.

نسخه 1.0 ابزار Persianp، برای استفاده در فعالیت‌های صرفاً تحقیقاتی ارائه شده و قابل دانلود است. پیش‌پردازش‌هایی که نسخه 1.0 انجام می‌دهد شامل نرمال‌سازی، واحدسازی، جمله‌یابی، برچسب‌گذاری اجزای کلام، بن‌واژه‌یابی (ریشه‌یابی) غیرآماری و تعیین‌ایست‌واژه‌‌ها است.

استفاده از‌این ابزار تنها برای فعالیت‌های پژوهشی غیرتجاری مجاز است و استفاده از آن به هر شیوه و تحت هر عنوانی در فعالیت‌های تجاری، به صورت مستقیم و غیر مستقیم، جایز نیست.

در‌این محصول، نرمال‌ساز (Normalizer)  کاراکترهای غیر متعارف یا کم کاربرد را حذف و کد کاراکترهای مشابه را یکسان‌سازی می‌کند. واحدساز (Tokenizer) مرز کلمات را تشخیص و آن را به فهرستی از کلمات تبدیل می‌کند. برچسب‌گذار (Part-Of-Speech Tagger) بر اساس بافت هر کلمه در متن، برچسب‌ّهای زیر را به کلمه منتسب می‌کند: اسم (N)، فعل (V)، صفت (AJ)، قید (ADV)، حرف اضافه (P)، حرف ربط (CON)، حرف تعریف (DET)، عدد (NUM)، حرف اضافه پسین یا “را” (POSTP)، ضمیر (PRO)، جداکننده (PUNC)، شاخص (IDEN)، حرف صوت (INT)، متفرقه یا مابقی (RES). بن‌واژه‌یاب (Lemmatizer) بر اساس بافت هر کلمه در متن، بن‌واژه هر کلمه را تعیین می‌کند.‌ایست‌واژه‌یاب‌ایست‌واژه‌های (stopwords) متن را مشخص می‌کند.


شرکت پرشین پراسسینگ در یک نگاه

پرشین پراسسینگ


ما فهرستی از شرکت‌های فعال در حوزه پردازش زبان طبیعی را گردآوری کرده‌ایم تا در اختیار علاقه‌مندان و مخاطبان این حوزه قرار دهیم. در صورتی که شما نیز اطلاعات تکمیلی در خصوص این شرکت‌ها یا کسب‌وکارهای دیگری که از قلم افتاده‌اند دارید می‌توانید از طریق صفحه تماس با ما ارسال نمایید و ما را در تکمیل این فهرست یاری نمایید.
هوشیو به عنوان پایگاه جامع هوش مصنوعی در ایران، ارائه‌دهنده به‌روزترین اخبار و مقالات این حوزه است.

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]