گوگل احتمالاً مولد متن به تصویر هوش مصنوعی را به Gboard اضافه میکند
گوگل ممکن است یک مولد متن به تصویر مبتنی بر هوش مصنوعی را به Gboard اضافه کند که به کاربران اجازه میدهد از توضیحات متنی، تصاویر موردنظر خود را تولید نمایند.
به گزارش هوشیو، براساس گزارشهای رسیده از رسانهها، انتظار میرود که گوگل در آینده نزدیک مجموعی از ویژگیهای جدید هوش مصنوعی را برای محصولات خود معرفی کند. از جمله این ویژگیها تولیدکننده متن به تصویر Imagen است که انتظار میرود برای محصول Gboardکه مختص سیستمهای اندروید است، معرفی گردد. این ویژگی به کاربران امکان میدهد تصاویری از متن ایجاد کنند و ارتباط با دیگران را با استفاده از تصاویر آسانتر میسازد.
آخرین نسخه بتای Gboard حاوی کدهایی است که به “صفحه کلید تصویر” اشاره میکند. این نشان میدهد که گوگل در حال توسعه صفحهکلید جدیدی برای دستگاههای اندرویدی است که به جای کلمات، بر اساس تصاویر ساخته شده است. این ابزار میتواند برای افرادی مفید باشد که در تایپ کردن یا درک زبان نوشتاری مشکل دارند.
ویژگی Imagen در نوار/صفحه میانبرها، در کنار ویژگیهایی مانند Clipboard، Translate و One-handed ظاهر میشود. این ویژگی به کاربر اجازه میدهد تا به سرعت تصاویری را در دستگاه خود ذخیره کرده، یا به تصاویر پیشتر ذخیره شده، دسترسی داشته باشد. با استفاده از این ویژگی کاربران قادر خواهند بود، بدون نیاز به جستجو در حافظه داخلی دستگاه خود یا سایر دستگاه ذخیره سازی شده، به سرعت به تصاویر مورد نیاز خود دسترسی پیدا کنند.
برای افرادی که با Imagen آشنایی ندارند، این ویژگی شبیه به مبدل متن به تصویر محبوب DALL-E 2 خواهد بود که متعلق به سازنده ChatGPT یعنی شرکت OpenAI است.
بر مبنای این گزارش، این مبدل براساس درخواستی که کاربران به آن ارسال میکنند، قادر به ایجاد تصاویر است. تحقیقات گوگل نشان داده که افراد بیشتری نتایج Imagen را به DALL-E ترجیح میدهند.
در این گزارش آمده است که Imagen همچنین در درک روابط مکانی، متنهای طولانی، کلمات غیرمعمول و سوالات دشوارتر توانسته بهتر از مدلهای دیگر باشد.
از آنجایی که این ویژگیها هنوز به طور رسمی در دسترس نیستند، ممکن است در آپدیت بعدی گنجانده نشوند.
در اوایل این ماه، گوگل از سرویس هوش مصنوعی جدید خود با نام «Bard» رونمایی کرد تا با ChatGPT OpenAI رقابت کند. پیش از اینکه شرکت آن را «به صورت گستردهتر در دسترس عموم قرار دهد»، دسترسی به آن برای «تستکنندگان مورد اعتماد» باز است.