نسل بعدی رباتهای انساننمای خوداصلاحگر فیگر رونمایی شد
شرکت فیگر که با حمایت OpenAI در حال ساخت رباتهای هوش مصنوعی برای خانه و کارخانه است، طبق وعده گذشته خود، نسل بعدی ربات انساننمای خود را با نام فیگر 02 معرفی کرد.
فیگر یاد میگیرد
فیگر 02 که در این مرحله در دسترس برخی از شرکتها قرار دارد، ارتقای قابل توجهی نسبت به فیگر 01 است که اوایل امسال برای انجام کارهای ساده مانند جابهجایی ظرفها در خشککن و همزمان گفتگو با مربی خود معرفی شد. همانطور که در فیلم تبلیغاتی منتشر شده دیده میشود، مدل جدید با ساختاری مبتنی بر اسکلت بیرونی طراحی شده تا بتواند راحتتر با وسایل سنگینتر کار کند.
نکته جالب اینجاست که فیگر 02 دارای قابلیتهای استدلال بصری بهبود یافتهای است که به عنوان مغز ربات عمل کرده و به آن کمک میکند تا یک کار را یاد بگیرد و حتی خود را اصلاح کند. این توسعه یک جهش بزرگ در حوزه رباتهای انساننمای مبتنی بر هوش مصنوعی است، حوزهای که چندین استارتاپ دیگر از جمله ایکس رباتیکس و تسلا نیز در آن فعالیت میکنند.
چه چیزی در ربات انسان نمای فیگر 02 جدید است؟
وقتی فیگر، فیگر 01 را به عنوان یک نمونه اولیه اولیه نشان داد، این ربات دارای طراحی ناقص با سیمکشی و عملگرهای آشکار بود. این ربات به راحتی گفتگو و استدلال میکرد اما کند حرکت میکرد و محدودیت حرکتی داشت.
نسخه جدید که قد آن 167 سانتی متر و وزن آن 60 کیلوگرم است، دارای طراحی یکپارچهتر مبتنی بر اسکلت بیرونی است با بستهبندی فشردهتر، سیمکشی پنهان و دستهای هماندازه انسان با 16 درجه آزادی .
به نظر میرسد که به ویژه دستها یک ارتقای عمده هستند که راه را برای قدرت و چابکی معادل یک انسان هموار میکنند. آنها برای کمک به ربات در انجام کارهای شبیه انسان و بلند کردن اجسام تا 20 کیلو طراحی شدهاند.
در رونمایی از فیگر 02 نشان داده شد که قطعهای را در یک کارخانه BMW برداشته و برای کمک به فرآیند مونتاژ آن را در سر جایش قرار میدهد. برت ادکوک، مدیرعامل شرکت میگوید، این ربات انساننمای نسل بعدی، کارهایی از این قبیل را از طریق یک سیستم بینایی مبتنی بر هوش مصنوعی که از شش دوربین ) داخلی واقع در سر، تنه جلو و تنه عقب) استفاده میکند، تجسم، درک و اجرا میکند.
دادههای دوربینها به یک مدل زبان بصری میرود که به عنوان مغز ماشین عمل میکند و به زمینهسازی معنایی و استدلال بصری سریع و مبتنی بر حس مشترک کمک میکند.
پیشرفتهای جدید در فیگر 02 فراتر از ظاهر
استدلال بصری پیشرفته با مکالمات گفتاری به گفتاری کار میکند که توسط مدلهای هوش مصنوعی سفارشی که با همکاری OpenAI آموزش داده شدهاند، پشتیبانی میشود.
بدین ترتیب، کاربر میتواند به صورت شفاهی به ربات دستور دهد و ربات با ترکیب استدلال گفتاری و بصری (با استفاده از هر دو داده فرمان و دوربین) پاسخ داده و اقدامات لازم را انجام دهد. این ربات حتی میتواند با ترکیب این قابلیتها خود را اصلاح کند.
مدل زبان بصری (VLM)
Figure 02 یک مدل زبان بصری داخلی (VLM) دارد. این قابلیت زمینهسازی معنایی و استدلال بصری سریع و مبتنی بر حس مشترک را از طریق دوربینهای ربات فعال میکند.
عملکرد دقیق ربات جدید هنوز مشخص نیست (تاکنون فقط یک ویدیو از آن دیدهایم)، اما این شرکت ادعا میکند که توان محاسباتی و استنتاج هوش مصنوعی آن سه برابر فیگر 01 است و میتواند کارهای دنیای واقعی را به صورت کاملاً خودکار و بسیار سریعتر از ربات اصلی انجام دهد. باتری 2.25 کیلووات ساعتی که در تنه آن قرار گرفته است، 50 درصد انرژی بیشتری نسبت به فیگر 01 ارائه میدهد و تا 20 ساعت در روز کار میکند.
فضای برای بهبود
فیگر به وضوح طراحی و عملکرد ربات خود را بهبود بخشیده و گام قابل توجهی در جهت تجاریسازی فناوری مبتنی بر هوش مصنوعی برداشته است. این شرکت میگوید به تنظیم دقیق ربات ادامه خواهد داد و آن را قادر میسازد تا بیشتر، اگر نگوییم همه، کارهایی را که انسانها در محیطهای پیچیده انجام میدهند، انجام دهد. انتظار میرود این فناوری از حدود سال 2026 با قیمتهای «بسیار مناسب» عرضه شود.
با این وجود، با سطح فعلی قابلیتها، میتوان به راحتی تصور کرد که چگونه فیگر 02 و جانشینان آن میتوانند مفید باشند، به ویژه در محیطهای کارخانه و انبار که شرکتها به کارگرانی نیاز دارند که به سرعت یاد بگیرند و سازگار شوند. آنها جعبهها را جابهجا میکنند، محصولات را مونتاژ میکنند و شاید حتی از تاسیسات محافظت کنند.
همچنین مهم است که توجه داشته باشیم که جنبه سختافزاری فناوری ممکن است هنوز نیاز به کار داشته باشد.
در حال حاضر، فیگر 02 با سرعت متوسط پیادهروی انسان حرکت میکند، اما ممکن است مواردی وجود داشته باشد که نیاز به حرکت سریعتر داشته باشد – چیزی که شرکت میخواهد روی آن کار کند.
علاوه بر این، فیگر همچنین ممکن است گسترش دامنه حرکات ربات را برای اطمینان از انجام کار بیشتر در زمان کمتر در نظر بگیرد. این چیزی است که Boston Dynamics نیز با ربات انساننمای جدید خود Atlas در نظر دارد.
بازیگران دیگری که در این فضا فعالیت میکنند عبارتند از X Robotics (که توسط OpenAI نیز پشتیبانی میشود)، تسلا ایلان ماسک، Agility Robotics، Apptronik، Fourier Intelligence و Unitree Robotics. بسیاری از این بازیگران از هوش مصنوعی چند وجهی «پروژه GR00T» انویدیا برای تامین انرژی عملکرد رباتهای خود استفاده میکنند.