پژوهشها نشان میدهد توقف اخبار جعلی با هوش مصنوعی پیچیده است
طبق گزارش یک تیم تحقیقاتی، تیترهای تَلهکلیک (Clickbait) ممکن است دیگر مانند سابق برای خواننده فریبنده نباشند. این تیم تحقیقاتی همچنین اضافه کرد که ممکن است هوش مصنوعی قادر به تشخیص درست سرخطهای خبری معمولی از تلیهکلیک و اخبار جعلی نباشد.
بر اساس یافتههای محققان، تلهکلیکها، یا به عبارتی تیترهایی که با لحنی فریبنده سعی دارند خواننده را به خواندن بیشتر ترغیب کنند، دیگر مانند گذشته عملکرد خوبی ندارند و در بعضی موارد جذابیت کمتری نسبت به تیترهای معمولی دارند.
به دلیل اینکه یکی از دغدغههای مردم اخبار جعلی منتشر شده در رسانههای اجتماعی است، محققان سعی دارند با استفاده از هوش مصنوعی به طور منظم تلهکلیکها را شناسایی و متوقف کنند. امّا به نقل از شیام سوندار ، پروفسور پیامدهای رسانه در دانشکده ارتباطات دانشگاه دونالد پی بلیساریو ، و جیمز جیمیرو ، همبنیانگذار آزمایشگاه تحقیقاتی تاثیرات رسانه ، نتایج این پژوهشها حاکی از این است که شناسایی اخبار جعلی به وسیله هوش مصنوعی احتمالاً از آنچه تصور میشود، دشوارتر باشد.
سوندار، عضو موسسه علوم محاسبات و دادههای ایالت پنسیلوانیا (ICDS)، اظهار داشت که «مردم تصور میکنند اگر بتوانیم مشکل تلهکلیک را رفع کنیم، بسیاری از مشکلات ناشی از اخبار جعلی را نیز حل نمودهایم. پژوهش ما این باور را کمرنگ میکند و نتایج آن نشان میدهد اخبار جعلی به احتمال زیاد شرایطی کاملاً متفاوت ایجاد میکند؛ نتایج همچنین نشان میدهد تلهکلیکها از آنچه تصور میکردیم پیچیدهتر هستند».
در پژوهش اول، تیم تحقیقاتی هشت نوع سرخط خبری آماده کرده و از 150 مشارکتکننده خواستند به طور تصادفی یکی از سرخطها را بخوانند؛ اگر مشارکتکننده ادامه خبر را میخواند یا آن را به اشتراک میگذاشت، پژوهشگران آن را ثبت و اندازهگیری میکردند. از این هشت سرخط خبری، یکی معمولی و هفت مورد دیگر هر کدام یکی از ویژگیهای تیترهای تلهکلیک را داشتند: یعنی سرتیترهای سوالی، تیترهای فهرستوار، تیترهایی با کلمات پرسشی (مانند چه چیز و چه وقت)، با کلمات اشاره (مانند این و آن)، با صفت تفضیلی مثبت (مانند بهترین و بزرگترین)، با صفات تفضیلی منفی (مانند بدترین و کمترین)، یا تیترهایی با افعال کمکی (مانند توانستن و باید). سرخطهای خبری از منابع اینترنتی معتبر و نامعتبر انتخاب شده و توسط الگوریتمهای شناسایی تلهکلیک طبقهبندی شده بودند.
ماریا مولینا ، استادیار تبلیغات و روابط عمومی دانشگاه ایالتی میشیگان و همچنین نویسنده اصلی پژوهش اول، میگوید «یکی از سوالهایی که ابتدا در ذهن داشتیم این بود که کدام تلهکلیک خواننده بیشتری جذب میکند؟ لذا در صدد آن برآمدیم جزئیات بیشتری در این باره کسب کنیم. با این حال پس از تحلیل نتایج متوجه شدیم که هیچ تفاوت معناداری بین تلهکلیکها وجود ندارد و در اصل توجه مشارکتکنندگان بیشتر به تیترهای معمولی جلب شده است. بنابر این در پژوهشهای بعدی به دنبال علتهای احتمالی آن بودیم».
به گفته مولینا، محققان مطالعه دوم را به منظور کنترل عوامل دیگر، مانند موضوعِ تیتر، و حذف تاثیر آنها بر نتایج انجام دادند.
در پژوهش دوم، 249 مشارکتکننده انتخاب، و همانند قبل، به طور تصادفی یکی از هشت نوع سرخط خبری را خواندند (همانند قبل، هفت سرخط خبری تلهکلیک و یکی تیتر معمولی بود). این بار تمام تیترهای خبری درباره موضوعات سیاسی بودند که یک روزنامهنگار سابق آنها را نوشته بود. طبق گزارش تیم تحقیقاتی، نتایج این پژوهش نیز تفاوت معناداری بین عملکرد تیترهای تلهکلیک و عملکرد تیترهای معمولی نشان نمیداد.
طبق توضیحات دانگوان لی ، استاد علوم اطلاعات و فناوری دانشگاه ایالتی پنسیلوانیا، تیم تحقیقاتی پژوهش سوم را با این هدف طراحی نمود تا عملکرد انواع هوش مصنوعی، یا مدلهای یادگیری ماشین، را بررسی کند. این مدلهای یادگیری در این پژوهش برای دستهبندی تیترها به دو گروه تلهکلیک و تیتر معمولی استفاده شده بودند. نتایج نشان میداد که عملکرد مدلها در دستهبندی تیترها (به تلهکلیک یا تیتر معمولی) یکسان نبوده است.
بر اساس نتایج پژوهش سوم، عملکرد چهار مدل هوش مصنوعی در دستهبندی تلهکلیکها تنها در 47% موارد یکسان بود. از 175 سرخط خبری که هر چهار الگوریتم به طور یکسان دستهبندی کرده بودند، 139 مورد در گروه تلیهکلیک و 36 مورد در گروه تیترهای معمولی قرار داشتند. علاوه بر این، عملکرد مدلها برحسب نوع سرخط خبری یکسان نبود. برای مثال، اگرچه دستهبندی این چهار الگوریتم در مورد تلهکلیکهای حاوی صفت تفضیلی منفی، نسبت به شش تلهکلیک دیگر، مشابه بود ولی عملکرد آنها برای دستهبندی تیترهای معمولی با صفات تفضیلی منفی هیچ شباهتی با هم نداشت.
طبق توضیحات لی، یکی از اعضای ICDS، عملکرد هوش مصنوعی و مدلهای یادگیری ماشین نیز متفاوت بود. محققان تیترهای دستهبندی شده توسط هر یک از مدلها را نسبت به تعداد دفعاتی که مشارکتکنندهها به متن خبر مراجعه کرده بودند ارزیابی کردند. از چهار مدل مورد استفاده در این پژوهش، سه مدل به طور یکسان نشان میدادند که تلهکلیکهای حاوی کلمات اشاره، فهرست، و کلمات پرسشی بیشتر از تیترهای معمولی خوانندگان را جذب میکنند.
به گفته لی این مدلهای یادگیری بسیار قدیمی بودند. در نتیجه محققان با مشاهدات متنوعی مواجه شدند؛ برخی از آنها بسیار ساده، برخی بسیار سریع، برخی پیچیده و برخی از آنها مصرف انرژی بسیار بالایی داشتند. لی اینطور توضیح داد که «درست مانند سرهم کردن یک میز است؛ میتوانید با یک پیچگوشتی 5 دلاری کار کنید اما به احتمال زیاد با یک مته برقی 50 دلاری میتوانید خیلی سریعتر آن را سرهم کنید. بنابراین هر یک از این مدلهای یادگیری، بسته به توان ذاتی و دیتاست آموزشی خود، عملکردی متفاوت و نقاط قوت و ضعف متفاوتی داشتند».
با این حال، نتایج بدست آمده باعث شد در مورد استفاده از هوش مصنوعی برای شناسایی اخبار جعلی از طریق دستهبندی سرخطخبری تردیدهایی شکل بگیرد.
به گفته سوندار «مردم به استفاده از تلهکلیکها برای شناسایی اخبار جعلی بهای زیادی میدهند امّا مطالعات ما این فرض را زیر سوال برد».
وی در ادامه توضیح داد که برنامهنویسانِ الگوریتمهای شناسایی اخبار جعلی، همزمان با هوشیارتر شدن تولیدکنندگان آن و مصرفکنندگان رسانه نسبت به عناصر سازنده این گونه اخبار، باید همواره محصول خود را با شرایط جدید تطبیق دهند.
به گفته سوندار «درست مانند بازی موش و گربه است. ممکن است افرادی که اخبار جعلی مینویسند از ترفندهای آشکارسازهای اخبار جعلی مطلع شده و رویکرد خود را تغییر دهند. همچنین اگر خوانندگان اخبار پیوسته در معرض ترفندهای خاصی قرار بگیرند ممکن است نسبت به آنها بیاعتنا شوند. بنابراین لازم است آشکارسازهای اخبار جعلی به طور مداوم با تغییر سلیقه خوانندگان و همینطور سازندگان آنها تغییر کنند».
به نظر این محققان احتمالاً محبوبیت تیترهای تلهکلیک در گذشته دلیلی برای عدم موفقیت تیترهای معمولی در جذب خوانندگان در این پژوهش بوده است. به عبارت دیگر تلهکلیکها به قدری در رسانههای امروزی فراگیر شدهاند که از جذابیت آنها کاسته شده و دیگر نمیتوانند به اندازه تیترهای معمولی خوانندگان را به خود جلب کنند.
به گفته مولینا محبوبیت تلهکلیک همچنین باعث شده است مردم موشکافانهتر رسانهها را بررسی کنند و در نتیجه احتمالاً شرکتکنندگانِ این پژوهش نسبت به عناوین تلهکلیک رفتار محتاطانهتری داشتهاند.
این تیم تحقیق یافتههای خود را در کنفرانس CHI 2021 ارائه کرد.