توصیف تصویر و دستاورد جدید هوش مصنوعی : دقتی بالاتر از انسان

تیم تحریریه
۴ آبان ۱۴۰۰

زمان مطالعه: 3 دقیقه

توصیف تصویر به گونه‌ای که مشخص نباشد که توسط یک ربات بدون فهم و درک صورت گرفته، از مدت‌ها قبل یکی از اهداف هوش مصنوعی بوده است. در سال 2016 گوگل مدعی شد هوش مصنوعی‌اش می‌تواند با دقت 94% برای تصاویر زیرنویسی انجام دهد و این کار را دقیقا مانند انسان‌ها انجام می‌دهد.

حالا مایکروسافت قدمی بلندتر برداشته و محققانش موفق به ساخت یک سیستم هوش مصنوعی شدند که دقتش از انسان هم بیشتر است و زیرنویسی‌های انجام شده توسط آن این موضوع را ثابت می‌کند. این شرکت همچنین ادعا کرده مدل جدیدش به نسبت مدل قدیمی که از سال 2015 در حال استفاده از آن بوده، 2 برابر بهتر عمل می‌کند.

نکته جالب دیگر این که مایکروسافت تصمیم ندارد این تکنولوژی را فقط برای خودش نگه دارد و آن را به عنوان بخشی از سرویس‌های شناختی آژور Azure در دسترس قرار خواهد داد، در نتیجه هر توسعه دهنده نرم‎‌افزاری امکان استفاده از آن در برنامه‌های خودش را دارد.

همچنین این سیستم هم‌اکنون از طریق بخش برنامه‌های مایکروسافت در دسترس است تا افراد نابینا و کم‌بینا امکان استفاده از آن برای آشنایی با محیط اطراف را داشته باشند. در آینده نزدیک هم قرار است خصوصیتی به این سیستم اضافه شود که بتواند توصیفاتش را از طریق پاورپورنت برای وب، ویندوز و مک ارائه دهد. سیستم توصیف تصویر مایکروسافت به زودی در ورد و اوتلوک هم اضافه خواهد شد.

اریک بوید، مدیر بخش هوش مصنوعی آژور، در گفتگویی با Engadget گفته:«این سیستم نه‌تنها با سرعت زیاد اشیاء را درک می‌کند، بلکه متوجه می‌‎شود که چطور باید آن‌ها را توصیف کند». تکنولوژی‌های توصیفی می‌توانند به هر کاربری کمک کنند تا در موتورهای جستجو راحت‌تر به دنبال تصویر بگردند. همچنین افرادی که مشکل بینایی دارند می‌توانند تجربه بهتری از استفاده از وب و نرم‌افزارها داشته باشند.

فهرست مقاله پنهان

1 محصولات هوش مصنوعی در انتظار تولید انبوه

2 آزمایش در دنیای واقعی

محصولات هوش مصنوعی در انتظار تولید انبوه

این که با نوآوری‌های هوش مصنوعی به خوبی برخورد نشود موضوعی جدید نیست؛ اما این انتظار هم وجود ندارد که محصولات مبتنی بر هوش مصنوعی بتوانند خیلی سریع به تولید انبوده برسند و در دسترس قرار گیرند. ژدونگ هاونگ، مدیر ارشد فناوری سرویس‌های شناختی آژور، درباره سیستم جدید اما فشار زیادی آورد تا بتواند هرچه سریع‌تر آن را در دسترس قرار دهد و دلیلش هم کاربردی بود که این سیستم برای کاربران داشت. تیم او مدلی را آموزش دادند که می‌تواند تصاویر را با کلیدواژه‌های خاص برچسب بزند و با این کار به توسعه نوعی از زبان بصری کمک کند که بیشتر چارچوب‌های هوش مصنوعی آن را در اختیار ندارند. معمولا این نوع از مدل‌ها توسط تصاویر و توصیفات کامل آموزش داده می‌شوند و این کار درک تعامل بین اشیاء را برای مدل‌ها بسیار سخت می‌کند.

توصیف تصویر — ژدونگ هاونگ، مدیر ارشد فناوری سرویس‌های شناختی آژور

هاونگ می‌گوید:« این فرهنگ لغات بصری همان لازمه‌های آموزش یک سیستم هستند و ما در تلاش برای آموزش این حافظه موتوری هستیم». این همان چیزی است که باعث شده در بنچمارک‌ امتیاز بالایی به این مدل داده شود. در مقایسه این مدل‌ها تمرکز بر این است که توانایی آن‌ها برای توصیف تصویر سنجیده شود و اگر امکاناتی داشته باشند که قبلا مشابه آن دیده نشده باشد، امتیاز بالایی به مدل تعلق می‌گیرد.

آزمایش در دنیای واقعی

با این که کسب امتیاز بالا در بنچمارک اهمیت زیادی دارد، آزمایش اصلی برای سیستم جدید مایکروسافت این است که قرار است در دنیای واقعی چطور عمل کند. بوید مدعی شده ساغب شیخ، توسعه‌دهنده سیستم جدید مایکروسافت که خودش هم نابینا است، تجربه استفاده از این سیستم را داشته و به نظرش می‌توان به تغییرات آن به نسبت سیستم‌های قبل لقب «پیشرفت دراماتیک» را داد.

حالا که مایکروسافت مسابقه‌ای جدید تدارک دیده، دیدن این که چطور بخش هوش مصنوعی گوگل و دیگر رقبا قرار است در این مسابقه حاضر شوند مطمئنا بسیار جذاب خواهد بود.

به نظر شما برنده برنده این رقابت از بین غول‌های تکنولوژی کدام شرکت خواهد بود؟

https://hooshio.com/?p=8451

توصیف تصویر و دستاورد جدید هوش مصنوعی : دقتی بالاتر از انسان

محصولات هوش مصنوعی در انتظار تولید انبوه

آزمایش در دنیای واقعی

غول داروسازی و پادشاه AI متحد شدند

هوش مصنوعی جلوی «کور شدن» تلسکوپ جیمز وب را گرفت!

تاریخ‌سازی انویدیا؛ اولین شرکت ۵ تریلیون دلاری جهان

ابزار تولید موسیقی OpenAI در راه است

۵نکته از نوت‌بوک‌ال‌ام برای اینکه روزتان را کمی آسان‌تر کنید

ستاره‌شناسان به کمک هوش مصنوعی نیاز دارند

هوش مصنوعی در پی کشف اسرار کیهان

آیا ما در «عصر طلایی حماقت» زندگی می‌کنیم؟

رسوایی تازه ترامپ با ویدئوی جعلی، «لجن‌پاشی» از آسمان نیویورک!

روایتی از تلاقی علم و صنعت در مسیر خلق ارزش

رونمایی از «یکتابات»؛ نخستین پلتفرم ایرانی فروش هوشمند در دایرکت اینستاگرام

آینده هوش مصنوعی در ایران از نگاه سیاست‌گذاری

غول داروسازی و پادشاه AI متحد شدند

هوش مصنوعی جلوی «کور شدن» تلسکوپ جیمز وب را گرفت!

تاریخ‌سازی انویدیا؛ اولین شرکت ۵ تریلیون دلاری جهان

ابزار تولید موسیقی OpenAI در راه است

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

غول داروسازی و پادشاه AI متحد شدند

هوش مصنوعی جلوی «کور شدن» تلسکوپ جیمز وب را گرفت!

تاریخ‌سازی انویدیا؛ اولین شرکت ۵ تریلیون دلاری جهان

ابزار تولید موسیقی OpenAI در راه است

هوش مصنوعی هفته کاری را ۳ روزه می‌کند

محصولات هوش مصنوعی در انتظار تولید انبوه

آزمایش در دنیای واقعی

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید