40 گام به سوی آینده‌ای هوشمند - مجموعه وبینارهای رایگان در حوزه هوش مصنوعی
Filter by دسته‌ها
آموزش هوش مصنوعی و انواع آن
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
پایتون و ابزارهای یادگیری عمیق
کتابخانه‌ های یادگیری عمیق
یادگیری با نظارت
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
اخبار
تیتر یک
رسانه‌ها
آموزش پردازش زبان طبیعی
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
رویدادها
دوره
کارگاه
وبینار
کاربردهای هوش مصنوعی
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
وبینارها، کارگاره‌ها و دوره‌ها
 معرفی جایگزین متن باز GPT-3: این هوش مصنوعی متون باکیفیت تولید می‌کند

معرفی جایگزین متن باز GPT-3: این هوش مصنوعی متون باکیفیت تولید می‌کند

سازندگان Eleuther ابراز امیدواری کرده‌اند که این محصول می‌تواند یک جایگزین متن باز برای GPT-3 باشد. لازم به ذکر است که GPT-3 یکی از نرم‌افزارهای مشهور زبانِ OpenAI می‌باشد.
برخی از بزرگ‌ترین پیشرفت‌های هوش مصنوعی را مرهون منابعی هستیم که فقط در اختیار شرکت‌های بزرگ فناوری قرار دارد. آنها از هزاران رایانه قدرتمند و ترابایت‌ها داده برای حصول اهداف‌شان کمک می‌گیرند. اما محققان در پروژه جدیدشان از داده‌ها، کدها و توان بالای رایانه‎‌ها برای بازتولید یکی از حماسی‌ترین الگوریتم‌های هوش مصنوعی که در سال‌های اخیر تولید شده، استفاده کرده‌اند.

Eleuther یک ابزار متن باز است که قابلیت سازگاری با الگوریتم قدرتمند زبان GPT-3 را دارد . الگوریتم مذکور که در سال 2020 از طرف شرکت OpenAI منتشر شد ، گاهی می‌تواند مقاله‌های بسیار منسجمی به زبان انگلیسی بنویسد. Eleuther کماکان قادر نیست با تمامی قابلیت‌های GPT-3 سازگار باشد، اما محققان چندی پیش نسخه جدیدی از مدل خود موسوم به GPT-Neo منتشر کردند که توانی برابر با ساده‌ترین نسخه‌ی GPT-3 دارد. ارائه متن باز پروژه‌های بزرگ هوش مصنوعی می‌تواند میزان دسترسی به این فناوری را افزایش دهد؛ به ویژه در عصری که اکثر این فناوری‌ها در انحصار شرکت‌های بزرگ فناوری قرار گرفته است. البته اشاره به این نکته خالی از لطف نیست که چنین اقدامی می‌تواند به درآمدهای حاصل از فناوری‌های هوش مصنوعی تاثیر بگذارد و احتمال سوء استفاده از ابزارهای هوش مصنوعی را افزایش دهد.

استفاده از پردازش زبان طبیعی

الکساندر راش، استاد کامپیوتر در دانشگاه کورنل، می‌گوید: «امروزه، بکارگیری پردازش زبان طبیعی متن باز با هدفِ تولید مدل‌های مفید، منجر به ایجاد شور و شوق زیادی شده است. این مدل‌ها دیگر در انحصار شرکت‌های بزرگ فناوری نخواهند بود. فکر می‌کنم نوعی رقابت پرشور در زمینه پردازش زبان طبیعی ایجاد شده است.»

اگر گفته‌های راش صحت داشته باشد، شاید بتوان GPT-3 را به عنوان «اسپوتنیکِ» این حوزه در نظر گرفت . GPT-3 از شبکه عصبی مصنوعی بزرگی تشکیل یافته که چند میلیارد واژه از فضای وب دریافت کرده است. GPT-3 می‌تواند به طرز شگفت‌انگیزی فصیح و شیوا باشد، اما گاهی کلمات یا جملات اهانت‌آمیز و نامفهوم نیز به کار می‌برد. چندین شرکت و گروه تحقیقاتی در تلاش‌اند تا راهکارهایی برای استفاده از این فناوری ابداع کنند.

کدهای GPT-3 هنوز در دسترس قرار نگرفته است، اما چندی از محققان که در پروژه Eleuther مشغول به کارند، در مقالاتی به نحوه کارکرد آن اشاره کرده‌اند. آقای راش که هیچ نقشی در پروژه Eleuther ندارد، می‌گوید این پروژه یکی از جذاب‌ترین فعالیت‌های متن باز در پردازش زبان طبیعی است. به باور وی، علاوه بر انتشار الگوریتم‌های قدرتمند زبان پس از GPT-3، اعضای پروژه Eleuther موفق به گردآوری و انتشار مجموعه داده متنیِ باکیفیتی تحت عنوان «the Pile» شده‌اند که برای آموزش الگوریتم‌های پردازش زبان طبیعی به کار برده می‌شود .

موهیت لیِر، استاد کامپیوتر در دانشگاه ماساچوست آمریکا، از داده‌ها و مدل‌های Eleuther برای استخراج نقدهای ادبی استفاده می‌کند. در همین راستا، یک الگوریتم آموزش داده می‌شود تا پیش‌بینی کند کدام بخش از کتاب در یک نقد ادبی مورد اشاره قرار می‌گیرد: «این اقدام می‌تواند منجر به ساخت نرم‌افزاری با توانش زبانی بالا شود. ما از این موضوع بسیار خوشحالیم که محققان آن پروژه کل این داده‌ها را در یک منبع به کار بردند.»

منابع محاسباتی گران‌قیمت

شاید قدرت محاسباتی بالا، بزرگ‌ترین چالش پیش روی پروژه‌های متن باز هوش مصنوعی باشد. آموزش GPT-3 به منابع محاسباتی گران‌قیمت نیاز داشت و در کل هفت میلیون دلار هزینه برد. به تازگی، شرکت OpenAI اعلام کرد که قدرت محاسباتی لازم برای پیشرفته‌ترین پروژه‌های هوش مصنوعی در بین سال‌های 2012 تا 2018 حدود 300/000 برابر افزایش یافته است . در پروژه Eleuther از منابع رایانش توزیع‌شده استفاده می‌شود که شرکت ابری CoreWeave و گوگل برای ارائه آن از «ابر تحقیقاتی تنسورفلو » کمک گرفته‌اند.

به گفته‌ی اعضای این پروژه، در این طرح از قدرت رایانش بیشتری برای پیشبرد اهداف بهره برده شده است . تیم Eleuther برای دسترسی آسان به این قدرت رایانشِ بالا، راهکاری برای تقسیم محاسبات هوش مصنوعی در میان ماشین‌های مختلف ابداع نموده است. اما مشخص نیست که در صورت گسترش پروژه، نیازهای پردازشی و رایانشی آن رفع خواهد شد یا خیر.

شرکت OpenAI ابراز امیدواری کرده که GPT-3 می‌تواند به بازار عرضه شود. این شرکت در ماه جولای 2019 مبلغ 1 میلیارد دلار از مایکروسافت دریافت کرد . بنا به اعلام OpenAI، بیش از 300 پروژه GPT-3 (با API محدود) در دست انجام است . در این راستا، از ابزاری برای کسب بینش از بازخورد مشتریان استفاده می‌شود . افزون بر این، استفاده از سیستم تولید خودکار ایمیل و بازی‌های ماجراجویانه‌ی متنی نیز در دستور کار قرار دارد . شاید Eleuther زمینه را برای ساخت ابزارهای مشابه هموارتر کند، بدون اینکه نیازی به دسترسی به GPT-3 API باشد.

چالش سوگیری

این پروژه با چالش دیگری برای دسترسی به سامانه‌های قدرتمند هوش مصنوعی روبرو است. از آنجا که GPT-3 و مدل‌های زبانی مشابه از متون تصادفی استفاده می‌کنند، ممکن است به سوگیری‌ها دامن زده یا بیانات تبعیض‌آمیز تولید کنند. احتمال می‌رود ابزاری نظیر GPT-3 برای تولید اخبار جعلی یا پیام‌ها و فعالیت‌های کلاهبرداری استفاده شود. یکی از دلایل عمده‌ای که OpenAI از انتشار نسخه کامل GPT-3 امتناع می‌کند، همین است. داده‌های مورد استفاده‌ی Eleuther تنوع بیشتری نسبت به GPT-3 دارد. در این پروژه، از منابعی نظیر Reddit استفاده نشده زیرا احتمال انتشار مطالب نادرست و بحث‌برانگیز در این قبیل از منابع بالاست.

کانر لیهی، محقق مستقل هوش مصنوعی و هم‌بنیان‌گذار Eleuther، اظهار کرد: «محققان پروژه Eleuther ماه‌ها برای گردآوری یک دیتاست ارزشمند زحمت کشیده‌اند. آنها مطمئن‌اند که این مجموعه‌داده از صافی عبور داده شده و از تنوع بالایی برخوردار است. محققان نواقص و سوگیری‌های آن را نیز به طور مستند بررسی کرده‌اند.»

الکساندر راش، استاد کامپیوتر در دانشگاه کورنلف گفت: «بهتر است این نوع ابزارها به صورت آزاد توسعه داده شوند. از نظر من، ارائه‌ی متن بسته‌ی آن کار اشتباهی است. بسیاری از محققان دانشگاهی علاقمند به بررسی سوءرفتارِ مدل‌های زبان هستند و قصد دارند راهکارهایی برای مسائل پیدا کنند. پروژه‌های متن باز می‌تواند نقش بی‌بدیلی در این پیشرفت‌ها داشته باشد.»

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
لطفاً برای تکمیل این فرم، جاوا اسکریپت را در مرورگر خود فعال کنید.