تشخیص یک عکس فیک (جعلی) با چند روش ساده
با وجود پیشرفتهای روزافزون هوش مصنوعی، فناوری جعل عمیق (دیپفیک)، هنوز به تکامل نهایی نرسیده است. هوش مصنوعی مولدی که با کمک شبکههای عصبی عمیق به کار گرفته میشود، دارای قابلیتهای بسیار بالایی است.
مدلهای هوش مصنوعی پیشرفتهای که در این حوزه ایجاد شدهاند، توانایی تولید انواع تصاویر، صداها یا حتی فیلم را دارند و میتوان از آنها برای طراحی تصاویری به سبک موردنظر خود استفاده کرد. احتمالاً نام ابزارهای قدرتمندی مثل Midjourney و DALL-E 2 را در حوزه تولید تصاویر شنیده باشید این ابزارها میتوانند در خلق تصاویر دلخواه مورداستفاده قرار گیرند.
جعل عمیق (دیپفیک) چگونه به وجود آمد؟
با ادغام قابلیتهای هوش مصنوعی مولد با دیگر ابزارهای هوش مصنوعی، میتوان به مهارتهای یک متخصص در حوزه جلوههای ویژه دستیافت. تا پیشازاین، انجام چنین کارهایی علاوه بر تخصص به زمان زیاد و سختافزار قوی نیاز داشت؛ اما در حال حاضر، با بهرهگیری از ابزارهای هوش مصنوعی، امکان تغییر کامل چهره یا بدن یک فرد در ویدئو یا عکس وجود دارد. علاوه بر این، این ابزارها قابلیت تولید صدا را نیز فراهم میکنند.
به بیان دیگر، هوش مصنوعی مولد به شما اجازه میدهد تا انواع مختلفی از تصاویر، ویدئوها و صداهای مصنوعی را ایجاد کنید. این تصاویر یا صداهای تولید شده میتواند بسیار شبیه به شخصی واقعی باشد یا به حدی واقعی باشند که تشخیص آنها از تصویر گرفته شده با دوربینهای عکاسی بهراحتی ممکن نباشد.
بااینحال، نباید این نکته را نادیده گرفت که تصاویر، ویدئوها و صداهای تولید شده توسط هوش مصنوعی مولد، جعلی یا فیک به شمار میروند و قطعاً ویژگیهایی در آنها وجود دارد که امکان تمایز آنها از واقعیت را فراهم میکند.
ویژگیهای یک محصول جعل عمیق (دیپفیک)
اولین راه برای شناسایی واقعی یا جعلی بودن یک تصویر، دقت به جزئیات آن است. در تصاویر جعلی، اشیا به طور نامنظم و در مکانهای نادرست قرار دارند. همچنین، بررسی تطابق زاویه دید افرادی که در تصویر حضور دارند با پسزمینه عکس نیز میتواند به ما در تشخیص واقعی یا جعلی بودن تصویر کمک کند.
یکی دیگر از روشهای شناسایی واقعی یا جعلی بودن یک تصویر، تطابق رنگها و سایهها با پسزمینه عکس است. در واقع، باید به دنبال نشانههای غیرعادی در یک تصویر باشید. بهعنوانمثال، ممکن است اندازه بازوهای یک فرد غیرمعمول به نظر برسد یا پای یک شخص به طور غیرطبیعی با درخت ادغام شده باشد.
یکی از نقصهایی که در مدلهای تولید تصویر قدیمی وجود داشت، ضعف آنها در تولید متن یا کشیدن صحیح دستها بود. بسیاری از مدلهای تولید عکس هنوز هم از کشیدن کامل و صحیح تعداد انگشتان دست عاجز هستند. در مورد متن هم همچنین، استفاده درست از متنها در تصویرهای تولید شده، تنها در مدلهای جدید و بسیار پیشرفته ممکن شده است.
بااینحال، باید به این نکته توجه کرد که پیشرفت و توسعه فناوری بهتدریج میتواند این معایب را برطرف کند، اما این خبر چندان خوشایند نیست؛ زیرا در این صورت، تشخیص واقعی یا جعلی بودن یک ویدئو، تصویر یا حتی صدا بهشدت دشوار خواهد شد. این مسئله میتواند منجر به تولید و انتشار اطلاعات نادرست شود که عواقب خطرناکی به همراه خواهد داشت.
راهحلهای تشخیص جعل عمیق (دیپفیک) چیست؟
راهحلهای تشخیص جعل عمیق (دیپفیک) ابزارهایی هستند که برای شناسایی محتوای دیپفیک طراحی شدهاند. معمولاً از الگوریتمهای یادگیری عمیق، مانند شبکههای عصبی کانولوشنی (CNN) و شبکههای عصبی بازگشتی، برای تجزیهوتحلیل الگوها و ناهنجاریها در محتوای رسانهای و شناسایی نشانههای دستکاری استفاده میکنند. همچنین ممکن است از ابزارهای تجزیهوتحلیل تصویر و ویدئو استفاده کنند که به دنبال ناسازگاریها در حرکات صورت، نورپردازی و هماهنگی لبها، ابزارهای تجزیهوتحلیل صوتی که الگوهای گفتار غیرطبیعی، ناهنجاریها در ویژگیهای صدا یا ناسازگاریها در مسیر صوتی را شناسایی میکنند، و ابزارهای تجزیهوتحلیل رفتاری که تمرکزشان روی جنبههای رفتاری غیرمعمول، مانند حرکت چشم و حرکات صورت است، استفاده کنند.
واقعیه؟ یا فیکه؟
بسیاری از جزئیات وجود دارد که چشم انسان قادر به تشخیص آنها نیست؛ اما کامپیوترها میتوانند ردپای هوش مصنوعی و جعل عمیق را ببینند و تشخیص دهند.
بسیاری از شرکتها بزرگ فناوری بهخاطر نگرانیهای اخلاقی و امنیتی که وجود دارد ابزارهایی را توسعه دادهاند که میتواند تصاویر یا تولیدات جعلی به کمک هوش مصنوعی را تشخیص دهد. اینگونه ابزارهای برای متنهای تولید شده باهوش مصنوعی هم وجود دارد که در این مقاله به آنها نمیپردازیم. در ادامه لیستی از ابزارهای تشخیص تصاویر جعلی از واقعی آمده است:
دیپویر (Deepware)
در سال 2018، شرکت Zemana که فعال در زمینه تولید راهحلهای مبارزه با بدافزارهای هست، شرکت Deepware را برای تحقیق در مورد شناسایی محصولات دیپ فیک تاسیس کرد. امروزه، Deepware یک پلتفرم تشخیص عمیق به نام Deepware Scanner را دارد که هدف آن جلوگیری از انتشار تصاویرجعلی و اطلاعات نادرست است. برای دستیابی به این هدف، این پلتفرم دستکاری های صورت انسان را که توسط هوش مصنوعی ایجاد میشود را در ویدیوهای آپلود شده در پلتفرمهایی مانند یوتیوب، فیس بوک و توییتر شناسایی میکند.Deepware Scanner به عنوان یک پلتفرم وب در دسترس است، اما همچنین میتوان از طریق API هم از آن استفاده کرد.
DuckDuckGoose
DuckDuckGoose ارائهدهنده راهحلهای تشخیص دیپفیک است که برای محافظت از سازمانها در برابر تهدیدات احتمالی از جمله دستکاری تصاویر، ویدئوها، صدا و متن طراحی شده است. مجموعه جامع ابزارهای این شرکت نهتنها تأیید میکند که آیا محتوا یک دیپفیک است یا خیر، بلکه توضیحات واضحی در مورد چگونگی شناسایی دستکاریها ارائه میدهد و به کاربر اطمینان بالایی در صحت تشخیص دیپفیک میدهد.
DuckDuckGoose شش ابزار تشخیص محتوای جعل عمیق (دیپفیک) را ارائه میدهد. اولین ابزار میتواند صحت محتوای صوتی را تعیین کند و از هوش مصنوعی برای تشخیص و تمایز بین صداهای واقعی انسان و صداهای تولید شده توسط هوش مصنوعی به هر زبانی در عرض 5 ثانیه استفاده میکند. این ابزار تمام دادههای صوتی را در طول تجزیهوتحلیل رمزگذاری میکند.
ابزار بعدی، متنها را برای بررسی این موضوع که آیا توسط هوش مصنوعی (چتجیپیتی و…) تولید شدهاند یا نه تجزیهوتحلیل میکند. ابزار بعدی که DeepDetector نام دارد با استفاده از الگوریتمهای AI برای شناسایی تکنیکهای دیپفیک مانند تعویض چهره، همگامسازی لب و درستکاری صدا، تصاویر و ویدئوهای جعل عمیق را بهصورت در لحظه بررسی میکند.
این ابزار توضیحات مفصلی از نتایج تجزیه و تحلیل خود ارائه میدهد و کاربران را قادر میسازد تا با اطمینان نسبت به محتوای دیپ فیک اقدام کنند. DuckDuckGoose همچنین یک نسخه آزمایشی از DeepDetector به نام Phocus را ارائه میدهد که کاربران عمومی میتواند از آن استفاده کنند.
DeepfakeProof یک افزونه رایگان مرورگر است که کاربران را قادر میسازد تا تصاویر عمیق جعلی را بهصورت آنلاین تشخیص دهند. این افزونه صفحههای وب را بهصورت در لحظه اسکن میکند و هنگام تشخیص تصاویر ساختهشده توسط هوش مصنوعی یا دیپفیک هشدارهایی را ارائه میدهد.
Google SynthID
دیپ مایند (DeepMind)، آزمایشگاه تحقیقاتی گوگل که بر روی هوش مصنوعی و یادگیری ماشین تمرکز دارد، نسخه بتا SynthID را در دسترس قرار داده است. ابزاری که برای شناسایی محتوای تولید شده توسط هوش مصنوعی طراحی شده است.
SynthID اجازه میدهد تا واترمارکهای دیجیتال در تصاویر، فیلمها و قطعات صوتی ایجاد شده باهوش مصنوعی تعبیه شود و فرایند شناسایی آسان را امکانپذیر میکند. این واترمارک، اگرچه برای حواس انسان غیرقابلتشخیص است، اما به سازندگان محتوای هوش مصنوعی کمک میکند تا منشأ و اصالت محتوا را اثبات کنند و اعتماد به مطالب تولید شده توسط هوش مصنوعی را ارتقا دهند.
SynthID از دو مدل یادگیری عمیق استفاده میکند: یکی مسئول درج واترمارک است و دیگری برای شناسایی آن. واترمارک مستقیماً در پیکسلها جاسازی میشود که از چشم غیرمسلح پنهان میماند، اما بهراحتی توسط SynthID قابلتشخیص است.
اینتل FakeCatcher
اینتل از هوش مصنوعی مسئولیتپذیر خود برای راهاندازی FakeCatcher استفاده کرده است، محصولی که برای شناسایی و علامتگذاری ویدئوهای تقلبی طراحی شده است. FakeCatcher که از طریق یک پلتفرم مبتنی بر وب کار میکند.
جز نرمافزاری FakeCatcher ترکیبی از ابزارهای تخصصی، از جمله الگوریتمهای تشخیص چهره و نقطه عطف متمرکز بر هوش مصنوعی و یک جعبهابزار برای تجزیهوتحلیل تصویر و ویدئو در زمان واقعی است. این سیستم نوآورانه روی یک پردازنده نسل سوم اینتل Xeon Scalable کار میکند که میتواند تا 72 دنباله تشخیص جداگانه را به طور همزمان مدیریت کند.
برخلاف آشکارسازهای سنتی مبتنی بر یادگیری عمیق که با بررسی دقیق دادههای خام به دنبال نشانههایی از عدم اصالت هستند، FakeCatcher از روش منحصربهفردی استفاده میکند که بر تعریف نشانگرهای واقعی و انسانی در ویدئوهای واقعی تمرکز دارد.
بهعنوانمثال، تغییرات پیکسلهای یک ویدئو را شناسایی میکند که نشاندهنده جریان خون در رگهای صورت است و الگوریتم آن، این تغییرات را به نقشههای مکانی – زمانی تبدیل میکند. سپس، با استفاده از یادگیری عمیق، FakeCatcher میتواند تشخیص دهد که یک ویدئو واقعی است یا جعلی.
مدافع واقعیت (Reality Defender)
یک محصول برای مشتریان سازمانی است که کار شناسایی و خنثیکردن دیپفیک در محتوای ویدئویی، صوتی و تصویری انجام میدهد. این محصول از فناوری اثر انگشت محتوای دیپفیک پیشرفته و مولد برای اسکن جامع و فعال استفاده میکند و بینشهای عملی و گزارشهای دقیق را برای سازمانها برای محافظت در برابر محتوای دیجیتال فریبنده ارائه میدهد.
یکی از ویژگیهای قابلتوجه Reality Defender، تشخیص متن تولیدی آن است که میتواند متن تولید شده توسط هوش مصنوعی را شناسایی کند. این ابزار که قادر به اسکن محتوا از مدلهای زبانی متعدد مانند ChatGPT، Bard و Bing AI است، نتایج سریع و عملی را ارائه میدهد و احتمال دستکاری متن را نشان میدهد.
چرا دیپفیکها خطرناک هستند؟
درحالیکه فناوری دیپفیک کاربردهای مثبتی دارد، مانند استفاده برای ایجاد جلوههای ویژه در صنعت سرگرمی، اما میتواند برای ایجاد محتوای فریبنده که افکار عمومی را دستکاری میکند، استفاده شود. یا با تقلید صدا و تصویر افراد اقدام به کلاهبرداری کند.
چه ویژگیهایی باید در یک محصول دیپفیک جستجو کنید؟
تشخیص جعل عمیق یک شاخه جدید در حوزه امنیت سایبری است. بسیاری از این ابزارها هنوز در مراحل بتا یا اولیه توسعه قرار دارند، به این معنی که مجموعه ویژگیهای آنها هنوز در حال تکامل است. بااینحال، برخی ویژگیها وجود دارند که بهتر است در یک محصول تشخیص جعل عمیق (دیپفیک) وجود داشته باشند و شما باید هنگام مقایسه ابزارها آنها را در نظر بگیرید.
تشخیص چندرسانهای: تکنیکهای جعل عمیق (دیپفیک) میتوانند به انواع مختلف رسانهها اعمال شوند، بنابراین به دنبال راهحلی باشید که بتواند دیپفیک را در مدلهای مختلف، از جمله تصاویر، ویدئوها و صداها، تشخیص دهد.
الگوریتمهای یادگیری ماشین و هوش مصنوعی: الگوریتمهای پیشرفته یادگیری ماشین، از جمله شبکههای عصبی عمیق، برای تشخیص مؤثر دیپفیک ضروری هستند، زیرا به راهحل امکان میدهند تا تکنیکهای جدید جعل عمیق را یاد بگیرند و خود را با آنها هماهنگ کنند.
تنوع دادههای آموزشی: ابزار تشخیص دیپفیک قوی باید بر روی مجموعهدادههای متنوعی آموزشدیده باشد که شامل طیف وسیعی از تغییرات دیپفیک است. این موضوع، به مدل کمک میکند تا دیپفیکهای جدیدتر و پیچیدهتر را تشخیص دهد.
پردازش در لحظه (real Time): این قابلیت بهویژه برای محتوای ویدئویی، قابلیتهای پردازش بهموقع ضروری است. به دنبال راهحلهایی باشید که بتوانند بهسرعت دیپفیکها را هنگام ایجاد یا به اشتراک گذاشته شدن تجزیهوتحلیل کنند. این ویژگی میتواند در تماسهای تصویری یا پخش زنده بر بستر اینترنت برای تشخیص تقلب به کمک ما بیاید.
شفافیت: چنین محصولی باید توضیحاتی برای تصمیمات خود ارائه دهد و به کاربران بینشهایی در مورد اینکه چرا یک محتوا یا تصویر بهعنوان دیپفیک شناسایی شده است، بدهد.
بهروزرسانیهای مداوم: دیپفیک به طور مداوم در حال تحول است و تکنیکهای جدید به طور منظم ظاهر میشوند. یک راهحل تشخیص قابلاعتماد باید بهروزرسانیهای منظمی را برای سازگاری با آخرین پیشرفتها در فناوری جعل عمیق ارائه دهد.