40 گام به سوی آینده‌ای هوشمند - مجموعه وبینارهای رایگان در حوزه هوش مصنوعی
Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
کاربردهای هوش مصنوعی
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 پردازش داده‌ی Gemini چقدر معتبر است؟

پردازش داده‌ی Gemini چقدر معتبر است؟

ابزارهای هوش مصنوعی گوگل که با نام‌هایی مانند Gemini 1.5 pro به بازار رقابتی وارد شده و در اختیار کاربران قرار گرفته‌اند، کاربردهای مختلفی دارند. یکی از کاربردهایی که شرکت گوگل ادعا می‌کند این ابزارها قادر به انجام آن هستند، تحلیل و پردازش داده است. اما این سوال ایجاد می‌شود که آیا واقعا این پلتفرم‌ها در حد ادعایی که شرکت تولیدکننده آن دارد هستند یا خیر؟
در این مطلب همراه ما باشید تا با میزان توانایی Gemini به عنوان ابزار هوش مصنوعی گوگل در تحلیل و پردازش داده آشنا شوید.

ادعای گوگل درباره ابزارهای هوش مصنوعی خود


شرکت گوگل در کنفرانس مطبوعاتی معرفی ابزارهای هوش مصنوعی خود بارها ادعا کرده است که مدل‌های هوش مصنوعی متعلق به این شرکت، توانایی انجام کارهایی مانند خلاصه کردن چندین سند چندصد صفحه‌ای و تحلیل تعداد زیادی داده را دارند که پیش از این غیرممکن بوده‌ است.

اما آنچه از که از نتایج مطالعات مختلف در این زمینه برمی‌آید با ادعای گوگل متناقض است و نشان می‌دهد که این ابزارها آنقدرها که گوگل ادعا می‌کند، توانا نیستند.
نتایج دو مطالعه‌ای که به صورت جداگانه بر روی دقت و درستی عملکرد ابزارهای گوگل در پردازش و درک متن و داده‌های طولانی، انجام شده است، نشان می‌دهد که این ابزارها تنها 40 تا 50 درصد، نتایج درستی را ارائه می‌دهند. علاوه بر این، این پژوهشگران معتقدند که این ابزارها قدرت درک درستی از محتوا ندارند.

پلتفرم Gemini فاقد پنجره محتوایی (context window) است


«پنجره محتوایی» به حجم داده‌هایی گفته می‌شود که به عنوان ورودی به ابزارهای هوش مصنوعی داده می‌شوند و پیش از تولید خروجی، مورد استفاده قرار می‌گیرند. با افزایش پنجره‌های محتوایی، اندازه اسناد و فایل‌هایی که در آن‌ها قرار می‌گیرند نیز افزایش می‌یابند.
شرکت گوگل ادعا می‌کند که جدیدترین نسخه‌های Gemini می‌توانند بیش از 2 میلیون توکن (توکن به بیت‌های تقسیم‌بندی شده داده‌های خام گفته می‌شود. به عنوان مثال در کلمه fantastic، fan، tas و tic به عنوان توکن به شمار می‌روند.) را به عنوان محتوا استفاده کنند. این رقم از توکن تقریبا معادل 1.4 میلیون کلمه، 2 ساعت ویدئو و 22 ساعت صدا است.
به منظور تایید این ادعاها مسئولان گوگل بارها این ابزارها را در کنفرانس‌های مطبوعاتی با مثال‌های مختلفی مورد آزمایش قرار داده و از نتایج به دست آمده تعریف و تمجید کرده‌اند. حتی معاون بخش تحقیق و توسعه‌ی گوگل دیپ‌مایند (Google DeepMind)، مدل Gemini را جادویی توصیف کرده است.
علیرغم تمام ادعاهای شرکت گوگل، پژوهشگران به منظور بررسی میزان صحت این ادعاها، ابزارهای هوش مصنوعی گوگل را به روش‌های مختلفی مورد مطالعه قرار داده‌اند. در یکی از این مطالعات کارپینسکا (Karpinska) و همکارانش ازمدل‌های مختلف هوش مصنوعی Gemini خواستند تا گزاره‌های درست و نادرست کتاب‌های داستانی (Fiction) که به زبان انگلیسی نوشته شده‌اند را مشخص کنند. این پژوهشگران به منظور جلوگیری از هرگونه سوء استفاده از دانش قبلی، کتاب‌هایی که به تازگی منتشر شده‌اند را مورد ارزیابی قرار دادند. همچنین برای سنجش میزان درک و دقت این ربات‌ها درخواست‌هایی کردند که درک آن‌ها بدون مطالعه کامل کتاب، غیرممکن بود.
در این آزمایش آن‌ها با در نظر گرفتن شرایط فوق یک کتاب 260000 کلمه‌ای که حدود 520 صفحه بود را با استفاده از دو ابزار هوش مصنوعی Flash و Gemini 1.5 pro مورد بررسی قرار دادند. هر دو ابزار هوش مصنوعی در تشخیص کامل گزاره‌های درست و نادرست با چالش روبرو شدند و به ترتیب 20 و 46.7 درصد پاسخ صحیح ارائه کردند.
این پژوهشگران با استناد به نتایج خود بیان می‌کنند که هیچ یک از این مدل‌ها از نظر دقت در پاسخگویی به سوالات به درستی عمل نکردند و کارایی خوبی نداشتند.
در پژوهشی دیگر، پژوهشگران توانایی ابزار Gemini 1.5 Flash را به تنهایی مورد ارزیابی قرار دادند. در این مطالعه با پرسیدن سوالاتی درباره‌ی محتوای یک ویدئو، توانایی این ربات درباره میزان درک و تحلیل محتوای ویدئویی ارزیابی شد.
«مایکل ساکسون» (Michael Saxon) که از جمله پژوهشگران این پژوهش بوده است، بیان می‌کند:« نتایج این مطالعه نشان می‌دهد که دقت این ابزار در درک محتوای ویدئو بسیار پایین بوده و میزان پاسخ درست ارائه شده به سوالات در حدود 30 درصد بوده است.»
پژوهشگران معتقدند که تبلیغ شرکت‌ها از ابزارهای خود با تعداد توکن قابل پشتیبانی توسط‌ آن‌ها نمی‌تواند پاسخی برای این سوال باشد که این ابزارها با این دقت و ناکارآمدی قرار است چه کاری انجام دهند؟
پاسخ‌های اشتباه، اطلاعات نادرست و سایر محدودیت‌های ابزارهای هوش مصنوعی، سبب شده است تا شرکت‌کندگان در نظرسنجی اخیر گروه مشاوران بوستون از کارایی هوش مصنوعی مولد اظهار ناامیدی کنند. همچنین بر اساس گزارش‌هایی که PitchBook به تازگی منتشر کرده است، معاملات مبتنی بر هوش مصنوعی مولد در پایان سال 2023 میلادی طی دو فصل متوالی با کاهش همراه بوده است.

جمع‌بندی


کارپینسکا معتقد است با توجه به نتایج مطالعه‌ای که انجام داده‌اند نمی‌توان با دقت و صراحت گفت که ادعاهای شرکت گوگل درمورد میزان عملکرد ابزارهای هوش مصنوعی این شرکت چقدر درست است. علاوه بر این، هر دو گروه پژوهشگر بیان می‌کنند که برای اثبات چنین ادعاهایی از سوی سازندگان ابزارهای هوش مصنوعی نیاز است تا مطالعات دقیق‌تری توسط شخص دیگر صورت بگیرد تا این ادعاها تایید یا رد شوند.
همچنین ساکسون معتقد است که این ابزارها تنها برای پاسخ به سوالات سطح پایین و بسیار ساده توانایی دارند و برای مباحث پیچیده که نیاز به درک بالاتر و عمیق‌تری از موضوع است، توانایی آن‌ها بسیار کاهش می‌یابد.

منبع: techcrunch

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]