مفاهیم داده کاوی
آموزش‌های پیشرفته هوش مصنوعیداده کاوی و بیگ دیتا

مفاهیم داده کاوی به‌مثابه ابزارهای مفهومی در راستای توسعه پلتفرم‌های هوشمند

    0
    زمان مطالعه: ۷ دقیقه

    پیش از آنکه با مفاهیم داده کاوی و مکانیزم‌های آن آشنا شویم، بهتر است از نگاهی کلان‌تر به آن نظر افکنده و به چرایی پیدایی این فناوری بپردازیم. به نظر این مقاله تبیین چرایی ایجاد فناوری و مفاهیم داده کاوی می‌تواند در فهم چگونگی آن و آشنایی با کاربردها یا مکانیزم‌های استفاده از این فناوری مفید واقع می‌شود.

    ما امروزه در عصر داده زیست می‌کنیم. باید توجه داشته باشید که داده با اطلاعات تمایز ظریفی دارد. داده نهایی‌ترین بخش از یک موجودیت مجازی است. درحالی‌که اطلاعات شامل تفسیرهای می‌شود که از داده یا داده‌های موجود به دست می‌آید؛ لذا اگرچه مشهور است که در عصر اطلاعات زندگی می‌کنیم، اما مراد از این عبارت مشهور، تذکر این موضوع است که در عصری زیست می‌کنیم که رفته‌رفته به‌وسیله پلتفرم‌ها و داده‌های در حال گردش در آن‌ها احاطه خواهیم شد. از طرفی واقعیت آن است که داده‌ها به‌سرعت در حال افزایش هستند. سخت‌افزارهای ذخیره داده‌ها همواره عمیق‌تر و عظیم‌تر می‌شوند. به طور مثال مقیاس ذخیره داده از ترابایت، به پتابایت و اگزابایت رسیده است. علاوه‌برآن تصور می‌شود که در مسیر توسعه آن‌ها پایانی وجود نخواهد داشت.

    در اوان عصر داده و اختراع ماشین‌های پردازنده، به دلیل آنکه اطلاعات اندک بودند، انسان به طور دستی و بدون کمک از ماشین‌های تحلیل‌گر، به بررسی داده‌ها می‌پرداخت. اما داده‌ها به لحاظ کمی رشد پیدا کردند. همین موضوع دلیلی بود برای اینکه انسان به فکر ایجاد الگوریتم‌های تحلیلگر داده‌هایی با حجم بالا بپردازد. این نقطه به لحاظ زمانی به ۱۹۹۰ بازمی‌گردد که با تأسی از مفاهیم داده کاوی، نخستین الگوریتم‌های تحلیل داده‌های انبوه بر روی پایگاه‌های داده به کار بسته شد.

    بنابراین تعریف دقیق داده کاوی نیز شکل گرفت که عبارت بود از «فراهم‌کردن روش‌های نرم‌افزاری برای تحلیل و اکتشاف در مجموعه‌های بزرگ داده». بر مبنای همین تعریف می‌توان گفت که فناوری داده‌کاوی پلی است که انسان را از داده‌های انبوه موجود در پایگاه‌های داده، به دانش و الگوهای پنهان هدایت می‌کند. به عقیده یکی از دانشمندان این حوزه، تا پیش از فناوری داده‌کاوی، مخازن داده گورستان بودند، اما با تولد این فناوری، گورستان‌های داده‌ها به معادن طلا تبدیل شدند.

    مفاهیم داده کاوی

    هر شاخه از هوش مصنوعی، با تولد خود مفاهیم جدیدی نیز ایجاد می‌کند. در رابطه با فناوری داده‌کاوی نیز از ابتدای دهه ۶۰ میلادی مفاهیم گوناگون ایجاد شد که همگی به‌عنوان مقدمه‌ای بر شکل‌گیری ایده این فناوری به‌حساب می‌آمد. برخی از این مفاهیم شامل Data Fishing، Data Dredging و Data Analytic بود. تمامی این واژگان نشانگر تکاپوهای انسان برای تجزیه‌وتحلیل داده در موازات رشد کمی آن‌ها در مراکز داده بود. امروز که داده‌کاوی به یک دانش مستقل تبدیل شده است، مفاهیم مورد استفاده در آن نیز تخصصی‌تر شده و انسجام بهتری یافته‌اند.

    به طور مثال در حال حاضر دو شیوه داده‌کاوی ایجاد شده است. یکی به نام داده‌کاوی توصیفی و دیگری با عنوان داده‌کاوی پیش‌بینی‌کننده شناخته می‌شود. در داده‌کاوی توصیفی محققان با مقولاتی نظیر آنالیز خوشه‌ای، خلاصه‌سازی، تحلیل سبد بازار و آنالیز مبتنی بر یافتن توالی زمانی مواجه هستند. این مفاهیم در واقع مکانیزم‌های کاربست فناوری داده‌کاوی به‌حساب می‌آید. همچنین، در نوع پیش‌بینی آن، با دسته‌بندی، رگرسیون و توالی زمانی مواجه هستیم که در هر کدام مکانیزم‌های فناورانه می‌کوشند تا بنا بر تحلیل داده‌ها به پیش‌بینی درباره آینده پلتفرم یا سیستمی که داده از بستر آن گردآوری شده است، بپردازند.

    مفاهیم داده کاوی

    شبکه‌کاوی

    مفهوم شبکه‌کاوی یکی از زیرشاخه‌های نوین فناوری داده‌کاوی است. تکنولوژی‌هایی که از فناوری داده‌کاوی متولد می‌شوند، می‌توانند در بسترهای متفاوت و پایگاه‌های گوناگون داده استفاده شوند. شبکه‌کاوی به معنای تجزیه‌وتحلیل داده‌های یک شبکه است. امروزه مهم‌ترین نوع شبکه که داده‌های انبوهی در بستر آن در حال جابه‌جایی است، شبکه‌های اجتماعی هستند.

    کاوش در شبکه‌های اجتماعی

    شبکه‌های اجتماعی امروزه به یکی از شلوغ‌ترین پلتفرم‌های جهان تبدیل شده‌اند. در زمان حاضر، پلتفرم‌های مختلفی وجود دارند که می‌کوشند گوشه‌ای از زندگی ما انسان‌ها را هوشمندسازی کنند. پلتفرم‌های فروشگاهی می‌کوشند خریدوفروش را هوشمندسازی کنند، پلتفرم‌های خدماتی به دنبال هوشمندسازی انواع خدمات آنلاین نظیر سرویس‌های پزشکی، بیمه، تاکسی اینترنتی، خدمات قضایی و اداری هستند. پلتفرم‌های اجتماعی نیز به دنبال هوشمندسازی راه‌های ارتباطی بوده و می‌کوشند با ایجاد شبکه‌های گسترده، شرایط را برای تعامل کاربران فراهم کنند. در بین تمامی پلتفرم‌ها، شبکه‌های اجتماعی پُرکاربردترین بسترهای آنلاین به‌حساب می‌آیند. بر اساس آمار منتشر شده در ۱۷ اکتبر ۲۰۲۱ از سوی مجله اینترنتی Data Reportal، پُرجمعیت‌ترین پلتفرم‌های اجتماعی به ترتیب عبارت‌اند از فیس‌بوک، یوتیوب، واتس‌اَپ و اینستاگرام؛ بنابراین پیداست که این پلتفرم‌ها مناسب‌ترین بستر برای داده‌کاوی و کاوش در شبکه‌های اجتماعی محسوب می‌شوند.

    کاوش در شبکه های اجتماعی

    اهمیت داده‌کاوی در شبکه‌های اجتماعی

    با ظهور فناوری شبکه‌کاوی، مخازن داده شبکه‌های اجتماعی، از گورستان داده به معدن الماس تبدیل شدند. این گزاره اگرچه اغراق‌آمیز به نظر می‌رسد. اما واقعیت آن است که این فناوری توانسته است به لطف ابزارهایی که در اختیار دانشمندان قرار داده، آن‌ها را به دانشی نوین درباره شبکه‌های اجتماعی هدایت کند. شبکه‌کاوی می‌تواند رفتار کاربران در بسترهای متفاوت پلتفرمی را تجزیه‌وتحلیل کند و به نوبه خود یک مکانیزم عمیق برای کاوش در شبکه‌های اجتماعی محسوب شود.

    این دانش نوین شامل الگوهای متعدد رفتاری است که از طریق تحلیل داده‌های کلان استخراج می‌شود. این موضوع می‌تواند هم جنبه اجتماعی و فرهنگی داشته باشد و هم جنبه تجاری. به طور مثال با بررسی رفتار کاربران در تلگرام مشخص شد که غالب کاربران این پلتفرم، از آن برای تعامل اجتماعی و بحث و گفتگو استفاده می‌کنند. در حالی که داده‌کاوی نشان داد اینستاگرام بیشتر خصلت تجاری دارد و کاربران از آن برای معرفی محصولاتشان و خرید فروش آنلاین استفاده می‌کنند.

    این استنتاج به کمک تحلیل توصیفی و طبقه‌بندی رفتار کاربران این دو پلتفرم مشخص گردید. تحلیل این فناوری درباره توییتر منجر شد که بسیاری دریابند کاربران از این پلتفرم به‌عنوان یک Daily Note استفاده می‌کنند که در آن رویدادهای مهم به‌صورت تلگرافی، خبری و خلاصه‌وار نوشته می‌شود.

    در کنار این موارد، در پلتفرم‌های فروشگاهی و از جنبه تجاری، فناوری داده‌کاوی توانسته است خدمات بزرگی را به کسب‌وکارها ارائه کند. به طور مثال، در فروشگاه‌های مطرح کشور نظیر دیجی‌کالا، رفتار شما به‌عنوان کاربر این پلتفرم در توالی زمانی توسط فناوری داده‌کاوی بررسی می‌شود. سپس پلتفرم می‌فهمد که شما به کالاهای دیجیتال بیش از سایر کالاها علاقه‌مند هستید. بر همین اساس شما را از جدیدترین محصولات الکترونیک مطلع می‌کند و پیشنهادات و تخفیف‌های هر محصول را به شما اطلاع می‌دهد. این اقدام می‌تواند ضریب تعامل کاربران را پلتفرم را بیشتر کرده و مبتنی بر علایق شما شخصی‌سازی شده و در مجموع ضریب خرید از این فروشگاه را افزایش دهد.

    بنابراین اگر بخواهیم اهمیت مفاهیم داده کاوی در تحلیل شبکه‌های اجتماعی را در یک عبارت بیان کنیم، به این صورت خواهد بود که «مکانیزم و مفاهیم داده کاوی می‌تواند پرسوناژهای مخاطبان را مشخص کرده و مسیر توسعه هر پلتفرم را روشن نماید». درحالی‌که بدون شناخت پرسوناژها، ممکن است مسیر برنامه‌ریزی‌هایتان به نحوی پیش برود که به تهدید موجودیت کسب‌وکار شما بینجامد.

    کاربردها و مفاهیم داده کاوی و تحلیل شبکه‌های اجتماعی

    هسته اساسی داده‌کاوی در شبکه‌های اجتماعی در سه کلیدواژه خلاصه می‌شود. نخست، داده به‌عنوان عنصر قابل تحلیل. دوم، پایگاه‌داده به‌عنوان مخزن قرارگیری داده‌ها. سوم، مدل‌سازی داده‌ها که به کمک الگوریتم‌ها انجام می‌شود. این سه هسته در کنار یکدیگر فناوری داده‌کاوی را می‌سازند و همان‌طور که پیش‌تر عنوان شد، قابل تعمیم به شبکه‌های اجتماعی و هر پلتفرمی که گردش اطلاعات بالایی دارد نیز است.

    کاربرد تحلیل شبکه‌های اجتماعی به کمک این فناوری متکی بر این پیش‌فرض است که در پَس انبوهی داده‌ها، الگوهای پنهان وجود دارد. همان‌طور که پیش‌تر تأکید کردیم، فناوری داده‌کاوی در این معنا به‌مثابه یک پُل برای رسیدن به دانش منتج شده از داده‌ها به‌حساب می‌آید؛ بنابراین این فناوری می‌تواند اطلاعات کلانی درباره رفتار کاربران نظیر علایق آن‌ها، میزان تراکنش‌های مالی آن‌ها، بسامد کلیدواژه‌ها و حتی جمعیت آن‌ها بر روی پلتفرم را بادقت بالایی رصد و گزارش کند. خروجی به دست آمده از این فناوری می‌تواند در توسعه کسب‌وکارها و پلتفرم‌های پر کاربر نقش کلیدی را ایفا کند.

    برای این منظور تصور کنید که قصد توسعه یک پلتفرم فروشگاهی را دارید. راه‌های گوناگونی در پیش روی شما قرار خواهد گرفت. می‌توانید بر اساس علایق خودتان برنامه‌ریزی کنید. می‌توانید بر احساسات و دریافت‌های شهودی‌تان از پلتفرم تکیه کنید. همچنین، می‌توانید بر شور و مشورت با سایر متخصصین سرمایه‌گذاری نمایید. در تمامی این موارد، دقت عملکرد شما به میزان حالتی که فناوری و مفاهیم داده کاوی را به کار می‌برید نخواهد بود. زیرا شما در تمامی این موارد نمی‌توانید پرسوناژ کاربرانتان را شناسایی کنید.

    نحوه انجام داده‌کاوی در شبکه‌های اجتماعی به چه صورت است؟

    کاوش در شبکه‌های اجتماعی از الگوی کلی فناوری داده‌کاوی تبعیت می‌کند. عموماً کارفرمایان و کسانی که از این فناوری استفاده می‌کنند، خروجی داده‌کاوی را در قالب یک داشبورد مدیریتی در دسترس دارند. اما در عمق کار، فرایند طولانی در جریان است. نخستین مرحله فاز آماده‌سازی داده است. در این مرحله داده‌ها برای یادگیری مدل‌سازی آماده شده و داده‌های غیرقابل‌تحلیل یا مخدوش، حذف خواهند شد. سپس بر اساس روش کاوش داده‌ای، داده‌های پیش پردازش‌شده مرحله قبل، مدل‌سازی می‌شوند. سپس مدل انتخابی، از میان سه نوع دسته‌بندی، خوشه‌بندی و استخراج قواعد پیوندی مشخص می‌شود. در انتها مدل به‌دست‌آمده، روابط داده‌ها را تفسیر کرده و به دانش قابل کاربرد تبدیل می‌کند.

    اگر دقیق‌تر بنگریم، حلقه وصل داده خام به دانش تفسیر شده، الگوریتم‌های داده‌کاوی هستند. امروزه به کمک نرم‌افزارهای متعدد برنامه‌نویسی نظیر MATLAB، Weka ، SAS JMP، SPSS Modeler و RapidMiner برای طراحی این الگوریتم‌ها استفاده می‌شود.

    مفاهیم و کاربردهای داده‌کاوی و تحلیل شبکه‌های اجتماعی

    الگوی تحلیل رفتار کاربران بر اساس داده‌کاوی شبکه‌های اجتماعی

    برای اینکه بتوانیم قدری در مکانیزم‌های کاوش در شبکه‌های اجتماعی عمیق‌تر شویم، می‌کوشیم تا در این بخش یک نمونه پژوهش که از سوی جمعی از متخصصین فناوری داده‌کاوی انجام شده است را بررسی کنیم. در این پژوهش داده‌های به دست آمده از رفتار کاربران، پس از خوشه‌بندی مورد تفسیر قرار گرفته است. در مرحله پیش‌پردازش، کاربرانی که به هدف پژوهش نزدیک بودند شناسایی شده و داده‌های رفتاری آن‌ها گردآوری شد. سپس از خلال رفتارهایی که در شبکه اجتماعی انجام دادند، متغیرهای گوناگون استخراج شده و سهم کمی هر متغیر از نظر میزان بساط در رفتار سایر کاربران شناسایی شد. این متغیرها بر اساس طول عضویت کاربران در پلتفرم مربوطه مدنظر قرار گرفت. سپس کاربران در هر خوشه مجدداً بر اساس ویژگی‌های رفتاری خردتر تقسیم‌بندی شدند.

    در این پژوهش کاربران بر اساس خوشه‌بندی K یا K-medoids تقسیم‌بندی شده و رفتار ایشان مورد شناسایی و طبقه‌بندی قرار گرفت. در این نوع طبقه‌بندی که از آن به نام خوشه‌بندی مرکزی نیز یاد می‌شود، خوشه‌ها بر اساس کمیت و کیفیت داده‌ها ایجاد می‌شوند و در نهایت داده پردازش‌شده در قالب دانش قابل تفسیر ارائه می‌گردد.

    الگوی تحلیل رفتار کاربران

    سخن پایانی: داده‌کاوی در اینستاگرام

    با رشد روزافزون ارزش کاوش در شبکه‌های اجتماعی، امروزه اغلب پلتفرم‌های اجتماعی یا به داده‌کاوی مجهز هستند و یا از این فناوری برای برنامه‌ریزی توسعه پلتفرم خود استفاده می‌کنند. یکی از این پلتفرم‌ها اینستاگرام است که امروزه در میان کاربران بیش از هر چیز با جنبه تجاری‌اش و راه‌اندازی صفحات فروشگاه آنلاین شناخته می‌شود. به نحوی که اگر یک صفحه تجاری راه‌اندازی کنید، می‌توانید رفتار کاربرانتان در ازای پست‌های منتشر شده را رصد کنید.

    به طور مثال می‌توانید آمار دقیقی درباره میزان لایک کردن کاربران به‌ازای سال یا به‌ازای هر ماه را مشاهده کنید. همچنین اطلاعات کمی درباره میزان کامنت‌هایی که کاربران برای هر واحد پست درج کرده‌اند نیز قابل رصد است. شما در این داشبورد می‌توانید از میزان علاقه‌مندی کاربران به پست‌هایی که درج می‌کنید آگاهی پیدا کرده یا به بیان دیگر پرسوناژهای آن‌ها را بشناسید. کاری که هرگز به‌تنهایی و بدون فناوری داده‌کاوی میسر نیست. بر اساس این داده‌ها خواهید توانست استراتژی‌های دقیقی برای تقویت بازاریابی‌تان تنظیم کنید و با رصد رفتار کاربرانتان، به سمت توسعه کسب‌وکارتان پیش بروید.

    این مطلب چه میزان برای شما مفید بوده است؟
    [کل: ۱ میانگین: ۳]

    تمرکز محققان کشورمان برای کاربرد هوش مصنوعی در مدیریت و مصرف بهینه انرژی

    مقاله قبلی

    استفاده آسان از مدل ‌های یادگیری عمیق

    مقاله بعدی

    شما همچنین ممکن است دوست داشته باشید

    نظرات

    پاسخ دهید

    نشانی ایمیل شما منتشر نخواهد شد.