هوش مصنوعی بی طرف در سال 2021 مأموریتی ضروری بر عهده دارد
یکی از چالشهای متخصصان در سال 2021 ساخت مدلهای هوش مصنوعی بی طرف است. اگر بخواهیم ارتباط میان هوش مصنوعی و دادهها را به طور خلاصه و کاملا فشرده بازتعریف کنیم، این ارتباط به صورت زیر توصیف میشود: یک مدل هوش مصنوعی از لحاظ کیفیت عملکرد، تنها به همان خوبی دادههایی است که با آنها آموزش دیده است. دادههای آموزشی به عنوان پایه و اساس راهحلهای هوش مصنوعی در همه عملکردهای سامانههای هوشمند خود را نشان میدهند. این دادههای آموزشی هستند که میتوانند موفقیت یک مدل هوش مصنوعی را تضمین کنند یا آن را با شکست مواجه کنند.
مدیریت دادهها یک نقطه کانونی و یک مرکز اصلی برای شرکتهایی است که مدل یادگیری ماشین میسازند. اهمیت این حوزه در سال 2021 و بعد از آن نه تنها ادامه خواهد یافت، بلکه بیش از پیش خواهد شد. دستکم گرفتن هزینهها و ارزش دادههای آموزشی در سالهای آینده بیش از هر زمان دیگری آشکار خواهد شد.
آمادهسازی دادههای آموزشی در حال حاضر یک پروسه زمانبر است. بیشتر تیمهای هوش مصنوعی حدود 80٪ از وقت خود را صرف آمادهسازی این دادههای آموزشی میکنند. برای حاشیهنویسی دادهها به سرمایهگذاری مادی و نیروی انسانی نیاز است. سازمانها میتوانند در این مرحله انتخاب کنند که آیا میخواهند اطلاعات آموزش خود را در داخل سازمان خود حاشیهنویسی میکنند، یا در نظر دارند برای انجام این عملیات وقتگیر و پرهزینه، به یک شرکت ثالث مراجعه کنند تا کار را برونسپاری کند.
شرکتها اگر هر کدام از این روشها را انتخاب کنند، باید خود را برای یک معامله آماده کنند. استفاده از یک تیم داخلی برای حاشیهنویسی مجموعه دادهها و مناسبسازی آنها برای آموزش ماشین، اغلب محدودیتهایی دارد. کمترین محدودیتی که در این بین به وجود میآید، این است که ایجاد یک تیم داخلی منجر به تنوع کمتر در دیدگاههایی میشود که ماشین قرار است با آنها آموزش ببیند. بنابراین تعصبها و سوگیریهایی که حاصل ذهن انسانی است، در دادههای آموزشی بیشتر میشود. استفاده از یک شرکت ثالث برای برونسپاری این عملیات، به شرکتها امکان دسترسی فوری به تعداد زیادی از حاشیهنویسان داده را میدهد، اما این انتخاب نیز کاستیهای خود را دارد، به عنوان مثال، در برخی موارد، امکان نظارت مستقیم نسبت به این که افراد حاشیهنویس بر دادهها، دقیقا چه نوع افراد با چه زمینههای ذهنی هستن، کمتر میشود.
با پیشرفتهایی که در زمینه یادگیری ماشین و هوش مصنوعی صورت میگیرد، شرکتها بیش از پیش در صدد پاسخگویی به این سوال حیاتی بر میآیند: چه کسی دادههای ما را حاشیهنویسی میکند؟ آیا ما مجموعه متنوعی از صداها و اندیشهها را با یکدیگر ترکیب میکنیم یا ناخواسته تعصب و سوگیری را در ذهن مصنوعی ماشین تعریف میکنیم؟ صرفنظر از این که یک شرکت کدام یک از روشهای حاشیهنویسی داده را انتخاب میکند، تشخیص اینکه حاشیهنویسان دادهها نقش مهم و تأثیرگذاری بر سوگیریهای هوش مصنوعی دارند، برای شرکتها در درجه اول اهمیت است و به نوعی، پیشزمینه موفقیت یا شکست آنها خواهد بود.
نقش حاشیهنویسی دادهها در هوش مصنوعی
تا پیش از این، شرکتها به طور سنتی بر جنبه مادی دادههای آموزشی تمرکز میکردند؛ اما امروزه، توجه افرادی که پشت فرایند حاشیهنویسی دادههای آموزشی هوش مصنوعی قرار دارند، بیش از پیش افزایش یافته است و هر روز هم بیشتر میشود. این افرادی که مسئولیت حاشیهنویسی بر دادههای آموزشی هوش مصنوعی را بر عهده دارند، دقت حقیقتگرایانه و چشمانداز جهانی را برای هوش مصنوعی ایجاد میکنند.
حاشیهنویسان دادهها مهمترین بخش مربوط به توسعه هوش مصنوعی را بر عهده دارند؛ چرا که دقت برچسبهای آنها به طور مستقیم بر دقت پیشبینیهای آینده سیستم هوش مصنوعی تأثیر میگذارد. ماشینی که روی دادههایی با برچسب ضعیف آموزش دیده باشد، مرتکب خطا میشود، اعتمادها را از بین میبرد و در نهایت، خوب و موثر کار نمیکند. پیامدهای حاشیهنویسی ضعیف بر دادههای آموزشی میتواند بسیار زیاد باشد. امور مالی، خرده فروشی و سایر صنایع عمده برای معاملات مختلف به هوش مصنوعی متکی هستند. به عنوان مثال هوش مصنوعی که پیشبینیهای دقیقی انجام نمیدهد، منجر به کاستیهایی در تجربه مشتری و تأثیرات منفی آن بر درآمد شرکت و کل برآیندهای آن کسبوکار خواهد شد.
این مشکلات تقریباً همیشه در مراحل جمعآوری دادهها و حاشیهنویسی ایجاد میشوند. به عنوان مثال، دادههای بهکاررفته برای آموزش هوش مصنوعی ممکن است همه موارد استفاده بالقوه را شامل نشود، یا افرادی که برای حاشیهنویسی این دادهها در نظر گرفته میشوند، ممکن است فقط تعداد کمی از کاربران نهایی را در بر بگیرند یا نماینده تعداد محدودی از مخاطبان باشند. حتی بزرگترین شرکتهایی که بیشترین منابع را در اختیار دارند همیشه از پس عملیات آموزش به طور کامل و موفقیتآمیز به طوری که به دور از هر نوع سوگیری باشد، برنمیآیند. هوش مصنوعی که آلوده به سوگیری و تعصبات حاشیهنویسان دادههای آموزشی باشد، در نهایت تأثیر سوء خود را بر روی نام تجاری و تجربه مشتری نشان میدهد و این تاثیرات سوء میتواند آسیبزا باشد. با ادامه تلاش شرکتها برای حذف تعصبات ناخواسته از مدلهای خود، انتظار میرود نمونههای بیشتری از این نوع سوگیریها در دادهها شناسایی و از مدلهای هوش مصنوعی حذف گردند تا بیشتر از قبل شاهد عملکردهای مطلوب هوش مصنوعی بیطرف باشیم. با دقت و توجه بر دادههای آموزشی و بررسی آنها از نظر وجود یا عدم وجود حاشیههای متعصابه، شرکتها با اطمینان بیشتری به سمت توسعه و تجهیز مدلهای هوش مصنوعی بی طرف حرکت خواهند کرد. این نمونهها به عنوان یک یادآوری کاملاً جدی درباره پیامدهای بیتوجهی به دادههای آموزشی هوش مصنوعی مطرح میشوند و بر هزینههای ضروری برای داشتن یک برنامه کاهش سوگیری از ابتدای کار تاکید میکنند.
شرکتها از طریق اقتصاد جهانی، هوش مصنوعی بی طرف را توسعه میدهند
چگونه برخی از شرکتها تعصب و سوگیری را در مدلهای هوش مصنوعی خود کاهش میدهند؟ در حقیقت بیشتر شرکتها تا حد زیادی این سوگیریها را با مدیریت و نظارت حاشیهنویسان دادههای آموزشی کنترل میکنند و کاهش میدهند. حاشیهنویسان نقش اساسی در کاهش سوگیری در هوش مصنوعی دارند. به همین دلیل است که انتخاب حاشیه نویسان دادههای آموزشی به ویژه برای محصولات و خدماتی که در بازارهای مختلف فعالیت میکنند، بسیار پراهمیت است. ایجاد هوش مصنوعی مسئول، باعث شکلگیری بستری میشود که تعصب و سوگیریهای غیراخلاقی در آن به حداقل برسد، به همین دلیل مأموریتی حیاتی برای شرکتها به حساب میآید. از سوی دیگر، هوش مصنوعی که برای همه مفید نباشد، در نهایت کارایی لازم را ندارد.
در حالی که گفتگو پیرامون هوش مصنوعی مسئول و ملاحظات و توجهات روی اهمیت آن در چند سال آینده بیشتر میشود، انتظار میرود سازمانها در کاهش تعصب و سوگیری مدلهای هوش مصنوعی موفقتر باشند و حاشیههای متعصابه در دادههای آموزشی را به صفر برسانند. فراموش نکنید که دادههای آموزشی هوش مصنوعی که انسانها آن روی آنها حاشیهنویسی کردهاند، میتواند تعصبات ذهن آنها را منعکس کند. این سوگیریهای ذهنی حقیقتا برای عینیت یک الگوریتم بههیچوجه قابل قبول نیست. حل این سوگیری نیازمند گنجاندن دیدگاههای متنوع از همان ابتدای شکلگیری دادههای آموزشی است.
خوشبختانه، شرکتها تا امروز به آن حد از بلوغ سازمانی رسیدهاند که از قدرت اقتصاد هوش مصنوعی استفاده کنند؛ به این صورت که میتوانند از انبوه حاشیههایی که به صورت جهانی بر دادههای آموزشی هوش مصنوعی ایجاد میشود استفاده کنند و از منابع قدرتمند آموزشی که مشارکتکنندگان و حاشیهنویسان در مقیاس جهانی تولید میکنند، بهرهمند گردند. دسترسی به جمعیت جهانی حاشیهنویسان، ایدهها، نظرات و ارزشهای متنوعی را برای مدلهای هوش مصنوعی به همراه دارد. این دیدگاههای متنوع در دادههای آموزشی و خود راهحل هوش مصنوعی منعکس میشود و منجر به تولید مدلهای کاراتر نهایی میشود که برای همگان کمتر مغرضانه و بیشتر کاربردی باشد. جمعیت حاشیهنویسان در سطح جهانی همچنین تخصص و مهارتهای منحصربهفردی را ارائه میدهند که ممکن است در تیمهای داخلی شرکتها وجود نداشته باشد و همین موضوع، دامنه گستردهتری از پروژه را امکانپذیر میکند. از سوی دیگر، جهانی شدن اقتصاد هوش مصنوعی بستر مناسبی را برای حاشیهنویسان دادههای آموزشی فراهم میکند تا تأثیرات لازم را بر توسعه مدلهای کاراتر و در نتیجه سیستمهای هوش مصنوعی بی طرف داشته باشند.
جهانی شدن عامل مهم دیگری است که اکوسیستم را به سمت هوش مصنوعی بی طرف هدایت میکند. با ادامه جهانی شدن، شرکتها بیش از پیش در مییابند که باید چه کسی را برای کارهای حاشیهنویسی استخدام کنند. آنها روز به روز به اهمیت این بخش از یادگیری ماشین بیشتر توجه میکنند و در مییابند که حاشیهنویسان دادههای آموزشی چه تنوع خوبی را برای مدلهای تصمیمگیری ماشین به ارمغان میآورند. این فاکتورها به طور ایدهآل در یک برنامه جامع مدیریت دادهها تحت پوشش قرار گرفتهاند، برنامهای که باید شامل پروتکل حریم خصوصی و امنیت دادهها نیز باشد.
هرچه اطلاعات بیشتری در دسترس قرار گیرد و سازمانهای بیشتری به دستاوردهای هوش مصنوعی فکر کنند و در پی بهکارگیری آن بر آیند، فرصتهای چشمگیرتری برای موفقیت و عدم موفقیت وجود خواهد داشت. اما با هر ماجرای جدید، چالشهای تازه ایجاد میشود و شناخت هر چالش و تلاش برای یافتن راهحل منجر به کسب دانش بیشتر در حوزه یادگیری ماشین و هوش مصنوعی میشود. در آینده، پاکسازی دادههای آموزشی از سوگیریها و تعصبات و نیز اصلاح و درستسازی حاشیههایی که آلوده به تعصبات هستند، همچنان به عنوان ابزاری برای سودآوری شرکتها مورد توجه قرار خواهد گرفت. از همین رو، تلاشهای هماهنگ مدیریت داده و جدیت در رسیدن به یک مدل هوش مصنوعی بی طرف باید منجر به ایجاد مدلهای موثرتر و با تعصب کمتر در سال 2021 و سالهای آینده شود.
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید