مفاهیم داده کاوی بهمثابه ابزارهای مفهومی در راستای توسعه پلتفرمهای هوشمند
پیش از آنکه با مفاهیم داده کاوی و مکانیزمهای آن آشنا شویم، بهتر است از نگاهی کلانتر به آن نظر افکنده و به چرایی پیدایی این فناوری بپردازیم. به نظر این مقاله تبیین چرایی ایجاد فناوری و مفاهیم داده کاوی میتواند در فهم چگونگی آن و آشنایی با کاربردها یا مکانیزمهای استفاده از این فناوری مفید واقع میشود.
ما امروزه در عصر داده زیست میکنیم. باید توجه داشته باشید که داده با اطلاعات تمایز ظریفی دارد. داده نهاییترین بخش از یک موجودیت مجازی است. درحالیکه اطلاعات شامل تفسیرهای میشود که از داده یا دادههای موجود به دست میآید؛ لذا اگرچه مشهور است که در عصر اطلاعات زندگی میکنیم، اما مراد از این عبارت مشهور، تذکر این موضوع است که در عصری زیست میکنیم که رفتهرفته بهوسیله پلتفرمها و دادههای در حال گردش در آنها احاطه خواهیم شد. از طرفی واقعیت آن است که دادهها بهسرعت در حال افزایش هستند. سختافزارهای ذخیره دادهها همواره عمیقتر و عظیمتر میشوند. به طور مثال مقیاس ذخیره داده از ترابایت، به پتابایت و اگزابایت رسیده است. علاوهبرآن تصور میشود که در مسیر توسعه آنها پایانی وجود نخواهد داشت.
در اوان عصر داده و اختراع ماشینهای پردازنده، به دلیل آنکه اطلاعات اندک بودند، انسان به طور دستی و بدون کمک از ماشینهای تحلیلگر، به بررسی دادهها میپرداخت. اما دادهها به لحاظ کمی رشد پیدا کردند. همین موضوع دلیلی بود برای اینکه انسان به فکر ایجاد الگوریتمهای تحلیلگر دادههایی با حجم بالا بپردازد. این نقطه به لحاظ زمانی به 1990 بازمیگردد که با تأسی از مفاهیم داده کاوی، نخستین الگوریتمهای تحلیل دادههای انبوه بر روی پایگاههای داده به کار بسته شد.
بنابراین تعریف دقیق داده کاوی نیز شکل گرفت که عبارت بود از «فراهمکردن روشهای نرمافزاری برای تحلیل و اکتشاف در مجموعههای بزرگ داده». بر مبنای همین تعریف میتوان گفت که فناوری دادهکاوی پلی است که انسان را از دادههای انبوه موجود در پایگاههای داده، به دانش و الگوهای پنهان هدایت میکند. به عقیده یکی از دانشمندان این حوزه، تا پیش از فناوری دادهکاوی، مخازن داده گورستان بودند، اما با تولد این فناوری، گورستانهای دادهها به معادن طلا تبدیل شدند.
مفاهیم داده کاوی
هر شاخه از هوش مصنوعی، با تولد خود مفاهیم جدیدی نیز ایجاد میکند. در رابطه با فناوری دادهکاوی نیز از ابتدای دهه 60 میلادی مفاهیم گوناگون ایجاد شد که همگی بهعنوان مقدمهای بر شکلگیری ایده این فناوری بهحساب میآمد. برخی از این مفاهیم شامل Data Fishing، Data Dredging و Data Analytic بود. تمامی این واژگان نشانگر تکاپوهای انسان برای تجزیهوتحلیل داده در موازات رشد کمی آنها در مراکز داده بود. امروز که دادهکاوی به یک دانش مستقل تبدیل شده است، مفاهیم مورد استفاده در آن نیز تخصصیتر شده و انسجام بهتری یافتهاند.
به طور مثال در حال حاضر دو شیوه دادهکاوی ایجاد شده است. یکی به نام دادهکاوی توصیفی و دیگری با عنوان دادهکاوی پیشبینیکننده شناخته میشود. در دادهکاوی توصیفی محققان با مقولاتی نظیر آنالیز خوشهای، خلاصهسازی، تحلیل سبد بازار و آنالیز مبتنی بر یافتن توالی زمانی مواجه هستند. این مفاهیم در واقع مکانیزمهای کاربست فناوری دادهکاوی بهحساب میآید. همچنین، در نوع پیشبینی آن، با دستهبندی، رگرسیون و توالی زمانی مواجه هستیم که در هر کدام مکانیزمهای فناورانه میکوشند تا بنا بر تحلیل دادهها به پیشبینی درباره آینده پلتفرم یا سیستمی که داده از بستر آن گردآوری شده است، بپردازند.
شبکهکاوی
مفهوم شبکهکاوی یکی از زیرشاخههای نوین فناوری دادهکاوی است. تکنولوژیهایی که از فناوری دادهکاوی متولد میشوند، میتوانند در بسترهای متفاوت و پایگاههای گوناگون داده استفاده شوند. شبکهکاوی به معنای تجزیهوتحلیل دادههای یک شبکه است. امروزه مهمترین نوع شبکه که دادههای انبوهی در بستر آن در حال جابهجایی است، شبکههای اجتماعی هستند.
کاوش در شبکههای اجتماعی
شبکههای اجتماعی امروزه به یکی از شلوغترین پلتفرمهای جهان تبدیل شدهاند. در زمان حاضر، پلتفرمهای مختلفی وجود دارند که میکوشند گوشهای از زندگی ما انسانها را هوشمندسازی کنند. پلتفرمهای فروشگاهی میکوشند خریدوفروش را هوشمندسازی کنند، پلتفرمهای خدماتی به دنبال هوشمندسازی انواع خدمات آنلاین نظیر سرویسهای پزشکی، بیمه، تاکسی اینترنتی، خدمات قضایی و اداری هستند. پلتفرمهای اجتماعی نیز به دنبال هوشمندسازی راههای ارتباطی بوده و میکوشند با ایجاد شبکههای گسترده، شرایط را برای تعامل کاربران فراهم کنند. در بین تمامی پلتفرمها، شبکههای اجتماعی پُرکاربردترین بسترهای آنلاین بهحساب میآیند. بر اساس آمار منتشر شده در 17 اکتبر 2021 از سوی مجله اینترنتی Data Reportal، پُرجمعیتترین پلتفرمهای اجتماعی به ترتیب عبارتاند از فیسبوک، یوتیوب، واتساَپ و اینستاگرام؛ بنابراین پیداست که این پلتفرمها مناسبترین بستر برای دادهکاوی و کاوش در شبکههای اجتماعی محسوب میشوند.
اهمیت دادهکاوی در شبکههای اجتماعی
با ظهور فناوری شبکهکاوی، مخازن داده شبکههای اجتماعی، از گورستان داده به معدن الماس تبدیل شدند. این گزاره اگرچه اغراقآمیز به نظر میرسد. اما واقعیت آن است که این فناوری توانسته است به لطف ابزارهایی که در اختیار دانشمندان قرار داده، آنها را به دانشی نوین درباره شبکههای اجتماعی هدایت کند. شبکهکاوی میتواند رفتار کاربران در بسترهای متفاوت پلتفرمی را تجزیهوتحلیل کند و به نوبه خود یک مکانیزم عمیق برای کاوش در شبکههای اجتماعی محسوب شود.
این دانش نوین شامل الگوهای متعدد رفتاری است که از طریق تحلیل دادههای کلان استخراج میشود. این موضوع میتواند هم جنبه اجتماعی و فرهنگی داشته باشد و هم جنبه تجاری. به طور مثال با بررسی رفتار کاربران در تلگرام مشخص شد که غالب کاربران این پلتفرم، از آن برای تعامل اجتماعی و بحث و گفتگو استفاده میکنند. در حالی که دادهکاوی نشان داد اینستاگرام بیشتر خصلت تجاری دارد و کاربران از آن برای معرفی محصولاتشان و خرید فروش آنلاین استفاده میکنند.
این استنتاج به کمک تحلیل توصیفی و طبقهبندی رفتار کاربران این دو پلتفرم مشخص گردید. تحلیل این فناوری درباره توییتر منجر شد که بسیاری دریابند کاربران از این پلتفرم بهعنوان یک Daily Note استفاده میکنند که در آن رویدادهای مهم بهصورت تلگرافی، خبری و خلاصهوار نوشته میشود.
در کنار این موارد، در پلتفرمهای فروشگاهی و از جنبه تجاری، فناوری دادهکاوی توانسته است خدمات بزرگی را به کسبوکارها ارائه کند. به طور مثال، در فروشگاههای مطرح کشور نظیر دیجیکالا، رفتار شما بهعنوان کاربر این پلتفرم در توالی زمانی توسط فناوری دادهکاوی بررسی میشود. سپس پلتفرم میفهمد که شما به کالاهای دیجیتال بیش از سایر کالاها علاقهمند هستید. بر همین اساس شما را از جدیدترین محصولات الکترونیک مطلع میکند و پیشنهادات و تخفیفهای هر محصول را به شما اطلاع میدهد. این اقدام میتواند ضریب تعامل کاربران را پلتفرم را بیشتر کرده و مبتنی بر علایق شما شخصیسازی شده و در مجموع ضریب خرید از این فروشگاه را افزایش دهد.
بنابراین اگر بخواهیم اهمیت مفاهیم داده کاوی در تحلیل شبکههای اجتماعی را در یک عبارت بیان کنیم، به این صورت خواهد بود که «مکانیزم و مفاهیم داده کاوی میتواند پرسوناژهای مخاطبان را مشخص کرده و مسیر توسعه هر پلتفرم را روشن نماید». درحالیکه بدون شناخت پرسوناژها، ممکن است مسیر برنامهریزیهایتان به نحوی پیش برود که به تهدید موجودیت کسبوکار شما بینجامد.
کاربردها و مفاهیم داده کاوی و تحلیل شبکههای اجتماعی
هسته اساسی دادهکاوی در شبکههای اجتماعی در سه کلیدواژه خلاصه میشود. نخست، داده بهعنوان عنصر قابل تحلیل. دوم، پایگاهداده بهعنوان مخزن قرارگیری دادهها. سوم، مدلسازی دادهها که به کمک الگوریتمها انجام میشود. این سه هسته در کنار یکدیگر فناوری دادهکاوی را میسازند و همانطور که پیشتر عنوان شد، قابل تعمیم به شبکههای اجتماعی و هر پلتفرمی که گردش اطلاعات بالایی دارد نیز است.
کاربرد تحلیل شبکههای اجتماعی به کمک این فناوری متکی بر این پیشفرض است که در پَس انبوهی دادهها، الگوهای پنهان وجود دارد. همانطور که پیشتر تأکید کردیم، فناوری دادهکاوی در این معنا بهمثابه یک پُل برای رسیدن به دانش منتج شده از دادهها بهحساب میآید؛ بنابراین این فناوری میتواند اطلاعات کلانی درباره رفتار کاربران نظیر علایق آنها، میزان تراکنشهای مالی آنها، بسامد کلیدواژهها و حتی جمعیت آنها بر روی پلتفرم را بادقت بالایی رصد و گزارش کند. خروجی به دست آمده از این فناوری میتواند در توسعه کسبوکارها و پلتفرمهای پر کاربر نقش کلیدی را ایفا کند.
برای این منظور تصور کنید که قصد توسعه یک پلتفرم فروشگاهی را دارید. راههای گوناگونی در پیش روی شما قرار خواهد گرفت. میتوانید بر اساس علایق خودتان برنامهریزی کنید. میتوانید بر احساسات و دریافتهای شهودیتان از پلتفرم تکیه کنید. همچنین، میتوانید بر شور و مشورت با سایر متخصصین سرمایهگذاری نمایید. در تمامی این موارد، دقت عملکرد شما به میزان حالتی که فناوری و مفاهیم داده کاوی را به کار میبرید نخواهد بود. زیرا شما در تمامی این موارد نمیتوانید پرسوناژ کاربرانتان را شناسایی کنید.
نحوه انجام دادهکاوی در شبکههای اجتماعی به چه صورت است؟
کاوش در شبکههای اجتماعی از الگوی کلی فناوری دادهکاوی تبعیت میکند. عموماً کارفرمایان و کسانی که از این فناوری استفاده میکنند، خروجی دادهکاوی را در قالب یک داشبورد مدیریتی در دسترس دارند. اما در عمق کار، فرایند طولانی در جریان است. نخستین مرحله فاز آمادهسازی داده است. در این مرحله دادهها برای یادگیری مدلسازی آماده شده و دادههای غیرقابلتحلیل یا مخدوش، حذف خواهند شد. سپس بر اساس روش کاوش دادهای، دادههای پیش پردازششده مرحله قبل، مدلسازی میشوند. سپس مدل انتخابی، از میان سه نوع دستهبندی، خوشهبندی و استخراج قواعد پیوندی مشخص میشود. در انتها مدل بهدستآمده، روابط دادهها را تفسیر کرده و به دانش قابل کاربرد تبدیل میکند.
اگر دقیقتر بنگریم، حلقه وصل داده خام به دانش تفسیر شده، الگوریتمهای دادهکاوی هستند. امروزه به کمک نرمافزارهای متعدد برنامهنویسی نظیر MATLAB، Weka ، SAS JMP، SPSS Modeler و RapidMiner برای طراحی این الگوریتمها استفاده میشود.
الگوی تحلیل رفتار کاربران بر اساس دادهکاوی شبکههای اجتماعی
برای اینکه بتوانیم قدری در مکانیزمهای کاوش در شبکههای اجتماعی عمیقتر شویم، میکوشیم تا در این بخش یک نمونه پژوهش که از سوی جمعی از متخصصین فناوری دادهکاوی انجام شده است را بررسی کنیم. در این پژوهش دادههای به دست آمده از رفتار کاربران، پس از خوشهبندی مورد تفسیر قرار گرفته است. در مرحله پیشپردازش، کاربرانی که به هدف پژوهش نزدیک بودند شناسایی شده و دادههای رفتاری آنها گردآوری شد. سپس از خلال رفتارهایی که در شبکه اجتماعی انجام دادند، متغیرهای گوناگون استخراج شده و سهم کمی هر متغیر از نظر میزان بساط در رفتار سایر کاربران شناسایی شد. این متغیرها بر اساس طول عضویت کاربران در پلتفرم مربوطه مدنظر قرار گرفت. سپس کاربران در هر خوشه مجدداً بر اساس ویژگیهای رفتاری خردتر تقسیمبندی شدند.
در این پژوهش کاربران بر اساس خوشهبندی K یا K-medoids تقسیمبندی شده و رفتار ایشان مورد شناسایی و طبقهبندی قرار گرفت. در این نوع طبقهبندی که از آن به نام خوشهبندی مرکزی نیز یاد میشود، خوشهها بر اساس کمیت و کیفیت دادهها ایجاد میشوند و در نهایت داده پردازششده در قالب دانش قابل تفسیر ارائه میگردد.
سخن پایانی: دادهکاوی در اینستاگرام
با رشد روزافزون ارزش کاوش در شبکههای اجتماعی، امروزه اغلب پلتفرمهای اجتماعی یا به دادهکاوی مجهز هستند و یا از این فناوری برای برنامهریزی توسعه پلتفرم خود استفاده میکنند. یکی از این پلتفرمها اینستاگرام است که امروزه در میان کاربران بیش از هر چیز با جنبه تجاریاش و راهاندازی صفحات فروشگاه آنلاین شناخته میشود. به نحوی که اگر یک صفحه تجاری راهاندازی کنید، میتوانید رفتار کاربرانتان در ازای پستهای منتشر شده را رصد کنید.
به طور مثال میتوانید آمار دقیقی درباره میزان لایک کردن کاربران بهازای سال یا بهازای هر ماه را مشاهده کنید. همچنین اطلاعات کمی درباره میزان کامنتهایی که کاربران برای هر واحد پست درج کردهاند نیز قابل رصد است. شما در این داشبورد میتوانید از میزان علاقهمندی کاربران به پستهایی که درج میکنید آگاهی پیدا کرده یا به بیان دیگر پرسوناژهای آنها را بشناسید. کاری که هرگز بهتنهایی و بدون فناوری دادهکاوی میسر نیست. بر اساس این دادهها خواهید توانست استراتژیهای دقیقی برای تقویت بازاریابیتان تنظیم کنید و با رصد رفتار کاربرانتان، به سمت توسعه کسبوکارتان پیش بروید.