سبک نوشتاری متن
آموزش‌های پیشرفته هوش مصنوعیبینایی ماشین

تقلید سبک نوشتاری متن روی تصاویر تنها با استفاده از یک کلمه

    0
    مدت زمان مطالعه: ۲ دقیقه

    شرکت فیسبوک از پروژه هوش مصنوعی جدید خود به نام TextStyleBrush پرده برداشت. این پروژه در واقع نرم‌افزاری است که می‌تواند از سبک نوشتاری متن دست‌نویس یا متن چاپی موجود در یک عکس کپی‌برداری کند، آن هم تنها با استفاده از یک کلمه! کاربران می‌توانند با استفاده از این نرم‌افزار متون درون یک تصویر را تغییر داده یا کلمات دیگری را جایگزین آن‌ها کنند.

    TextStyleBrush یک قدم از تمامی سیستم‌های هوش مصنوعی پیشین که پس از آموزش دیدن با هزاران متن نمونه و پس از تعریف کامل کاری که باید انجام دهند، می‌توانستند سبک نوشتاری متن روی تصاویر را کپی کنند، جلوتر است. هر چند این نرم‌افزار هنوز در مرحله تحقیق قرار دارد، اما دانشمندان امیدوارند TextStyleBrush بتواند به افراد در نوشتن عناوین و پیام‌های خلاقانه و شخصی‌سازی‌شده و همچنین ترجمه بهتر تصاویر در واقعیت افزوده کمک کند.

    سبک نوشتاری متن

    امروزه ساخت تصاویر با استفاده از هوش مصنوعی به منظور بازسازی وقایع تاریخی یا تولید عکسی که شبیه نقاشی‌های ون‌گوگ یا پیر رنوآر باشد، با سرعت بالایی درحال پیشرفت است. و حالا نرم‌افزاری در دست داریم که می‌تواند انواع حروف چاپی و دست‌نویس را ثبت کند و همچنین وعده داده که می‌تواند انواع چرخش‌ها و تبدیلات متن از قبیل حروف دارای انحنا و حروفی که به دلایل رایج مثل اصطکاک بین قلم و کاغذ شکل اصلی خود را از دست داده‌اند را نیز تفسیر کند.

    این نرم‌افزار کارکردی مشابه ابزار قلموی سبک در نرم‌افزارهای پردازش متن دارد. البته این ابزار در TextStyleBrush برای اقتباس ویژگی‌های زیبایی‌شناختی متون نوشته‌شده روی عکس‌ها به کار گرفته شده است. یکی از مهمترین ویژگی‌های این نرم‌افزار، توانایی خودنظارتی آن است که TextStyleBrush را به مستقل‌ترین برنامه کاربردی خروجی گرفتن از متون بصری تبدیل کرده است. برای دیدن یک مثال به تصویر ابتدای مقاله بازگردید. در این تصویر مشاهده می‌کنید که چطور TextStyleBrush توانسته علامت‌های دست‌نویس روی عکس گرفته‌شده از یک میوه فروشی را با کلمات معادل جایگزین کند.

    TextStyleBrush برخلاف روش‌های پیشین تفسیر متن که از پارامترهای از پیش تعریف‌شده‌ای مثل نظارت بر سبک هدف و طرح حروف استفاده می‌کردند، تمامی عناصر موجود در تصویر از قبیل متن و سایر عناصر بصری را مدنظر قرار می‌دهد. سپس با استفاده از یک قاب متنی، نقطه مرجع را در تمامی تصاویر مرتبط مشخص می‌کند تا مجدداً آموزش ببیند.

    علی‌رغم تمامی این نکات مثبت، فیسبوک باید از پتانسیل این فناوری برای استفاده در فعالیت‌های مجرمانه و غیرقانونی از جمله حملات دیپ فیک متن آگاه باشد. فیسبوک گفته که برای جلوگیری از این حملات، معیارهای تحقیقات خود را در اختیار دیتاست «Deepfake Detection Challenge» خواهد گذاشت تا بتوان با افزودن مطالعات انجام گرفته در زمینه متون جعلی به مطالعات پیشین درباره چهره‌های جعلی، اطلاعات بیشتری در خصوص دیپ فیک جمع‌آوری کرد.

    این مطلب چه میزان برای شما مفید بوده است؟
    [کل: ۰ میانگین: ۰]

    فناوری های نوظهور چگونه می‌توانند به احیای شرکت‌های مدیریت ثروت کمک کنند؟

    مقاله قبلی

    سامانه هوشمند حمل و نقل زمینی در کشور در حال توسعه است

    مقاله بعدی

    شما همچنین ممکن است دوست داشته باشید

    نظرات

    پاسخ دهید

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *