گوگل احتمالاً مولد متن به تصویر هوش مصنوعی را به Gboard اضافه می‌کند

تیم تحریریه
۷ اسفند ۱۴۰۱
زمان مطالعه 2 دقیقه

گوگل ممکن است یک مولد متن به تصویر مبتنی بر هوش مصنوعی را به Gboard اضافه کند که به کاربران اجازه می‌دهد از توضیحات متنی، تصاویر موردنظر خود را تولید نمایند.

به گزارش هوشیو، براساس گزارش‌های رسیده از رسانه‌ها، انتظار می‌رود که گوگل در آینده نزدیک مجموعی از ویژگی‌های جدید هوش مصنوعی را برای محصولات خود معرفی کند. از جمله این ویژگی‌ها تولیدکننده متن به تصویر Imagen است که انتظار می‌رود برای محصول Gboardکه مختص سیستم‌های اندروید است، معرفی گردد. این ویژگی به کاربران امکان می‌دهد تصاویری از متن ایجاد کنند و ارتباط با دیگران را با استفاده از تصاویر آسان‌تر می‌سازد.

آخرین نسخه بتای Gboard حاوی کدهایی است که به “صفحه کلید تصویر” اشاره می‌کند. این نشان می‌دهد که گوگل در حال توسعه صفحه‌کلید جدیدی برای دستگاه‌های اندرویدی است که به جای کلمات، بر اساس تصاویر ساخته شده است. این ابزار می‌تواند برای افرادی مفید باشد که در تایپ کردن یا درک زبان نوشتاری مشکل دارند.

ویژگی Imagen در نوار/صفحه میانبرها، در کنار ویژگی‌هایی مانند Clipboard، Translate و One-handed ظاهر می‌شود. این ویژگی به کاربر اجازه می‌دهد تا به سرعت تصاویری را در دستگاه خود ذخیره کرده، یا به تصاویر پیش‌تر ذخیره شده، دسترسی داشته باشد. با استفاده از این ویژگی کاربران قادر خواهند بود، بدون نیاز به جستجو در حافظه داخلی دستگاه خود یا سایر دستگاه ذخیره سازی شده، به سرعت به تصاویر مورد نیاز خود دسترسی پیدا کنند.

برای افرادی که با Imagen آشنایی ندارند، این ویژگی شبیه به مبدل متن به تصویر محبوب DALL-E 2 خواهد بود که متعلق به سازنده ChatGPT یعنی شرکت OpenAI است.

بر مبنای این گزارش، این مبدل براساس درخواستی که کاربران به آن ارسال می‌کنند، قادر به ایجاد تصاویر است. تحقیقات گوگل نشان داده که افراد بیشتری نتایج Imagen را به DALL-E ترجیح می‌دهند.

در این گزارش آمده است که Imagen همچنین در درک روابط مکانی، متن‌های طولانی، کلمات غیر‌معمول و سوالات دشوارتر توانسته بهتر از مدل‌های دیگر باشد.

از آنجایی که این ویژگی‌ها هنوز به طور رسمی در دسترس نیستند، ممکن است در آپدیت بعدی گنجانده نشوند.

در اوایل این ماه، گوگل از سرویس هوش مصنوعی جدید خود با نام «Bard» رونمایی کرد تا با ChatGPT OpenAI رقابت کند. پیش از اینکه شرکت آن را «به صورت گسترده‌تر در دسترس عموم قرار دهد»، دسترسی به آن برای «تست‌کنندگان مورد اعتماد» باز است.