آزمایش
آموزش‌های پیشرفته هوش مصنوعیداده کاوی و بیگ دیتا

آزمایش بیزی AB ــ قسمت دوم: درآمد

0
زمان مطالعه: ۸ دقیقه

این متن، دومین قسمت از مجموعه‌ روش‌های آزمایش AB بیزی در موقعیت‌های زندگی واقعی است. در اینجا از برخی مفاهیم معرفی‌شده در قسمت اول (لینک دسترسی به آن در انتهای مطلب قرار دارد) استفاده می‌شود:

  1. مدل‌سازی و تجزیه و تحلیل معیارهای آزمایش بر اساس تبدیل (معیارهای نرخی)
  2. مدل‎سازی و تجزیه و تحلیل معیارهای آزمایشی بر اساس درآمد (معیارهای پیوسته)
  3. محاسبه‌ی طول ‌زمان آزمایش
  4. انتخاب احتمال پیشین مناسب
  5. اجرای آزمایشات با چند متغیر

بستر آزمایش

فرض کنید اخیراً در یکی از ویژگی‌های فروشگاه در برنامه خود تغییرات UX ایجاد کرده‌ایم. باور ما بر این است که این تغییرات باعث شده‌اند کاربران خریدهای  بیشتری از طریق این برنامه انجام دهند؛ قبل از اعمال این تغییرات در کل پایگاه کاربری قصد داریم این باور را در چارچوب AB بیازماییم. پس مفروض این است که تغییرات ایجادشده باعث می‌شوند میانگین درآمد حاصل از هر کاربر به میزان چشمگیری افزایش پیدا کند.

درآمد حاصل از هر کاربر را به‌صورت یک متغیر تصادفی R=X * Y مدل‌ می‌کنیم.

در این معادله، X یک متغیر تصادفی برنولی است و بر این دلالت دارد که آیا کاربر خریدی انجام داده است یا خیر، با احتمال تبدیل: ?: ? ∼ ???(?).

Y یک متغیر تصادفی نمایی است و حجم خرید را نشان می‌دهد، پارامتر نرخ این متغیر عبارت است از:   ?: ? ∼ ??(?).

در این مدل، میانگین درآمد حاصل از هر فروش به صورت ۱/? و میانگین درآمد به‌ازای هر کاربر به صورت ?/? مشخص می‌شود.

گام اول این است که با توجه به داده‌های گذشته، توزیع‌های پیشین مناسب برای پارامترهای کلیدی ? و ? در این مدل انتخاب شوند.

سپس آستانه‌ی زیان تعیین می‌شود؛ یعنی بزرگ‌ترین مقدار زیان مورد انتظار که در صورت به‌اشتباه انتخاب‌کردن متغیر، در این سناریو پذیرفته می‌شود. روش‌های آزمایش بیزی نیز همچون سایر مدل‌های آماری بر برآورد داده‌های دنیای واقعی مبتنی هستند. به همین دلیل، همیشه، امکان نتیجه‌گیری اشتباه از آزمایش‌ها هست. آستانه‌ زیان کمک می‌کند که در صورت به دست آوردن نتایج غلط، مطمئن شد که میانگین درآمد حاصل از هر کاربر بیشتر از حد آستانه افت نخواهد کرد.

در نهایت نمونه‌ها در قالب آزمایش تصادفی بیان می‌شوند و از آنها برای به‌روزرسانی توزیع‌های پیشین، و اصلاح باورهایمان، راجع به ? و ? در نسخه‌های کنترل و تیمار از فروشگاه استفاده می‌شود. توزیع‌های پسین که بدین طریق به دست می‌آیند در محاسبه‌ی احتمالات و زیان موردانتظاری که مورد نظر ماست نقش دارند.

به‌منظور انتخاب توزیع‌ پیشین برای این پارامترها، ابتدا باید داده‌هایی را که اخیراً از خرید کاربران جمع‌آوری شده است بررسی کرد. یک دیتاست پیشینی نمونه برای این آزمایش‌ها تولید شده است.

آزمایش بیزی

از آنجایی که این دیتاست به صورت مصنوعی تولید شده است، قبلاً قالب ایده‌آلی برای این آزمایش دارد. در دنیای واقعی، احتمالاً باید مقداری عملیات‌ ETL (استخراج، تبدیل، بارگذاری) روی داده‌ها انجام داد تا به قالب مورد نظر درآیند. پرداختن به این موضوع خارج از حوصله این مقاله است.
همان‌طور که مشاهده می‌کنید، تعداد کاربران نمونه ۵۲۶۸ نفر است، و برای هر کاربر مشخص شده که خرید انجام شده است یا خیر. برای کاربرانی که خرید کرده‌اند، می‌توان حجم خرید را هم دید. در ادامه می‌توان نرخ تبدیل پیشین، میانگین درآمد حاصل از هر فروش، پارامتر نرخ برای درآمد حاصل از هر فروش و میانگین درآمد حاصل از هر کاربر را به دست آورد.

آزمون بیزی

انتخاب توزیع پیشین

با استفاده از اطلاعات بالا می‌توان توزیع‌های پیشین را برای ? و ? انتخاب کرد. طبق منطق قسمت اول، می‌توان توزیع پیشین Beta(7,15) را برای احتمال تبدیل ? برگزید. به بیان خلاصه، دلیل انتخاب توزیع بتا این است که توزیعی انعطاف‌پذیر در بازه [۰,۱]  بوده و یک پیشین مزدوج خوب به شمار می‌رود.

برای ?، پارامتر نرخ درآمد حاصل از هر فروش، از توزیع گاما استفاده می‌شود، زیرا هم توزیع انعطاف‌پذیری در بازه‌ [۰,∞)  و هم یک پیشین مزدوج خوب است. این توزیع‌ محاسبات پسین‌ها بر اساس داده‌های آزمایشی را آسان‌تر می‌کند.

روش ساده ساخت سیستم توصیه گر

می‌توان توزیع پیشین بسیار ضعیف ?????(۰.۱, ۰.۱) را انتخاب کرد.

تنظیم آستانه‌ زیان

بعد از انتخاب توزیع پیشین، باید مقدار ? را مشخص کرد؛ ? بالاترین مقدار زیان موردانتظار است که در صورت ارتکاب اشتباه در انتخاب متغیر همچنان قابل‌قبول خواهد بود. در این تمرین فرض می‌شود که فروشگاه منبع اصلی درآمد نیست، اما بسیار مهم است و به همین دلیل، باید در انتخاب مقدار ? محتاط بود: ? = ۰.۰۰۵.

اکنون توزیع‌های پیشین و آستانه‌ زیان برای زیان مورد انتظار در اختیار است، پس می‌توان آزمایش را اجرا کرد و داده‌های لازم را از آن جمع‌آوری نمود.

نتایج آزمایشات

فرض کنید، چند هفته‌ای،آزمایش‌ها در حال اجرا بوده‌اند و می‌خواهیم ببنیم می‌توان از داده‌های آن‌ نتیجه‌ای استخراج کرد یا خیر. بدین منظور، باید با استفاده از داده‌های آزمایش، توزیع‌های پسین را محاسبه کرد. سپس، از این توزیع‌های پسین برای محاسبه‌ احتمال بهبود هر متغیر و احتمال زیان موردانتظار به‌خاطر انتخاب اشتباه هر متغیر استفاده کرد.

آزمایش بیزی AB

همان‌طور که مشاهده می‌کنید این دیتاست مشابه دیتاست قبلی است که یک ستون اضافی دارد. این ستون گروهی که کاربر به آن اختصاص داده شده و متغیری که کاربران دیده‌اند مشخص می‌کند. بار دیگر اشاره به این تذکر سودمند است که چون این دیتاست به‌طور مصنوعی تولید شده، از پیش قالب ایده‌آل دارد و لازم نیست عملیات‌ ETL اضافی روی آن اجرا شود.

حالا وقت تجمیع داده‌هاست.

AB

با بررسی نتایج در می‌یابیم که هر دو گروه نرخ تبدیل یکسانی دارند، اما درآمد حاصل از هر فروش برای گروه تیمار بیشتر است. برای به‌روزرسانی باورهایمان درباره ? و ? این دو متغیر (تیمار و کنترل)، باید محاسبات بیشتری انجام شود.

با استفاده از محاسباتی که در مقاله‌ قبلی توضیح داده شده است، می‌توان توزیع پسین ? را برای هر دو نوع متغیر حساب کرد.

پسین

پسین‌های احتمالی تبدیل

توزیع‌های پسین ?_? و ?_? تقریباً یک‌شکل هستند. بعد از تجزیه و تحلیل متوجه می‌شویم که تیمار تأثیر چندانی روی احتمال تبدیل نداشته است.

حال باید دید تیمار چطور روی پارامتر نرخ درآمد تأثیر گذاشته است. از نتیجه‌ [۲] برای محاسبه‌ ?_? و ?_? استفاده می‌شود.

فرض کنید پیشین این بوده است:

? ∼ ????(?, Θ)

فرض کنید متغیری برای n بازدیدکننده نمایش داده شود، c کاربر با میانگین درآمد حاصل از هر فروش s متقاعد به خرید شده‌اند. پس، توزیع پسین بدین شکل مشخص می‌شود:

?|?, ∼ ?????(? + ?, Θ/(۱ + Θ??))

در ادامه، توزیع‌های پسین ?_? و ?_? را محاسبه می‌کنیم.

بیزی

پسین‌های پارامترهای نرخ (درآمد حاصل از هر فروش)

توزیع‌های پسین هیچ‌گونه هم‌پوشانی ندارند، پس می‌توانیم تقریباً با قطعیت بگوییم که یکی از متغیرها از دیگری بهتر بوده است. پارامتر نرخ تیمار از پارامتر نرخ کنترل کمتر بوده است، پس متغیر تیمار بهتر بوده است، زیرا منجر به میانگین درآمد حاصل از هر فروش بالاتری می‌شود. برای درک بهتر این نکته، توزیع‌های پسین میانگین درآمد حاصل از هر فروش رسم می‌شود.

3 روش برای ساخت سیستم پیشنهاددهنده

پسین آزمایش

پسین‌های میانگین درآمد حاصل از هر فروش

به‌وضوح می‌توان دید میانگین درآمد حاصل از هر فروش برای متغیر تیمار بیشتر از متغیر کنترل است.

پس هر دو نوع متغیر نرخ تبدیل مشابهی دارند، اما تیمار میانگین درآمد حاصل از هر فروش بالاتری دارد، بنابراین، میانگین درآمد حاصل از هر کاربر نیز برای این متغیر باید بیشتر باشد. حال می‌خواهیم نمودار پسین میانگین درآمد حاصل از هر کاربر را رسم کنیم تا نتیجه‌گیری انجام‌شده تأیید شود. مقداری شبیه‌سازی انجام می‌دهیم تا در این مسئله به ما کمک کند.

آزمایش

پسین‌های میانگین درآمد حاصل از هر کاربر

به‌وضوح، متغیر تیمار نسبت به متغیر کنترل به نتایج بهتری در میانگین درآمد حاصل از هر کاربر دست یافته است. بعد از بررسی این توزیع‌های پسین، می‌توان با سطح اطمینان بالایی گفت متغیر تیمار بهتر از متغیر کنترل است. با این حال، برای کمی‌سازی این یافته باید ?(?_?/?_? ≥ ?_?/?_?) و ?[?](?) (زیان موردانتظار در صورت انتخاب متغیر تیمار‌ اشتباه) را محاسبه کرد.

بر اساس نتایج شبیه‌سازی متوجه می‌شویم که ?(?_?/?_? ≥ ?_?/?_?) = ۱ ، پس، تیمار به احتمال ۱۰۰% از کنترل بهتر است.

بعد از محاسبه احتمال بهتربودن تیمار، باید ?[?](?) محاسبه شود. تابع زیان هر متغیر بدین شکل به دست می‌آید:

آزمایش تابع

از این فرمول برای محاسبه‌ زیان موردانتظار استفاده می‌شود.

بعد از اجرای شبیه‌سازی‌ها می‌توان دید:

?[?](?)=۰ < 0.005=?.

از آنجایی که زیان موردانتظار یکی از متغیرها پایین‌تر از مقدار آستانه‌ای است که پیش‌تر، در آغاز آزمایش، تنظیم شده است، می‌توان گفت آزمایش به معناداری رسیده است. پس با اطمینان بالا می‌توان نتیجه‌ گرفت که تیمار از کنترل بهتر است و هزینه مورد انتظار در صورت انتخاب اشتباه تیمار بزرگ‌تر از آنچه قابل قبول بوده نخواهد بود. بدین ترتیب با قطعیت پیشنهاد می‌شود که متغیر تیمار صفحه‌ پرفروش‌ها برای باقی پایگاه کاربری نیز پیاده‌ شود.

شما می‌توانید از طریق لینک زیر به قسمت اول این مطلب دسترسی داشته باشید:

قسمت اول

این مطلب چه میزان برای شما مفید بوده است؟
[کل: ۰ میانگین: ۰]

شرکت هوش ماندگار شایا ؛ توسعه‌دهنده ابزارهای تحلیل زبان فارسی

مقاله قبلی

کتاب هوش مصنوعی و آینده بانکداری به فارسی ترجمه شد

مقاله بعدی

شما همچنین ممکن است دوست داشته باشید

نظرات

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد.