OpenAI میاندیشد، Google آن را عملی میکند
رقابت برای دستیابی به هوش مصنوعی عمومی (AGI) شدت بیشتری پیدا کرده است. پس از این که دیپمایند گوگل به تازگی Veo و Imagen3 را بر روی Google Cloud عرضه کرد، این بار Genie2 را نیز معرفی کرده است. Genie2 یک مدل بزرگ است که میتواند انواع مختلفی از محیطهای سهبعدی قابلتعامل را بسازد.
جهانهای مصنوعی
Genie2 فرایند توسعه عاملهای هوش مصنوعی تجسمی را ساده میکند. این مدل با تبدیل یک تصویر به دنیای مجازی تعاملی، امکان کاوش این فضاها را هم برای انسانها و هم برای هوش مصنوعی از طریق کیبورد و ماوس فراهم میکند.
دیپمایند (Google DeepMind) در پست وبلاگ خود اعلام کرد: «Genie2 میتواند در آینده به عاملهای هوش مصنوعی این امکان را بدهد که در دنیای بیپایانی از محیطهای جدید آموزش ببینند و ارزیابی شوند. این تحقیق همچنین راه را برای ایجاد فرآیندهای جدید و خلاقانه برای ساخت نمونههای اولیه تجربیات تعاملی هموار میکند.»
«دمیس هسابیس»، مدیر ارشد دیپمایند، گفت: «مدل دنیای هوش مصنوعی در حال شکلگیری است.»
نسخه جدید Genie2 بر اساس مدل قبلی خود یعنی Genie1 ساخته شده است. نسخه قبلی محدود به محیطهای 2D بود، اما حالا Genie2 قابلیتهای جدیدی در محیطهای سهبعدی اضافه کرده است. این مدل توانایی شبیهسازی تعاملات فیزیکی، ساخت انیمیشنهای پیچیده و ایجاد محیطهایی با فیزیک واقعی، نورپردازی مناسب و تعاملات واقعی میان اشیاء را دارد. Genie2 که بر اساس یک مجموعه داده ویدئویی بزرگ آموزش دیده، از فناوری جدیدی به نام «Autoregressive Latent Diffusion» برای تولید فریمها بهصورت متوالی و بر اساس واکنشهای کاربر استفاده میکند.
دیپمایند اعلام کرده است که بازیها همیشه نقش مهمی در تحقیقات هوش مصنوعی این شرکت داشتهاند، از آزمایشهای اولیه با بازیهای آتاری گرفته تا پیشرفتهایی مانند AlphaGo و AlphaStar که دستاوردهای مهمی در این زمینه به شمار میروند.
با این حال، یکی از مشکلات اصلی در آموزش هوش مصنوعیهای عمومیتر، محدودیت در محیطهای آموزشی متنوع بوده است. Genie2 این مشکل را حل میکند و با ارائه «ثبات در افق بلندمدت»، امکان شبیهسازی سناریوهای در حال تغییر را فراهم میآورد و به هوش مصنوعیها این امکان را میدهد که به طور پویا در محیطها جستجو کنند.
گوگل دیپمایند یک عامل هوش مصنوعی به نام SIMA را هم معرفی کرد که وظایف مختلفی را در دنیای ایجاد شده توسط Genie2 با پیروی از دستورهای زبان طبیعی انجام میداد. این شرکت اعلام کرد که عملکرد SIMA نشاندهنده توانایی مدل در ایجاد محیطهای آزمایشی منحصربهفرد برای هوش مصنوعیها است و قابلیت تعمیم به وظایف جدید و ناشناخته را به نمایش میگذارد.
ویژگی دیگر Genie2، قابلیت آن در تولید محتوای جدید به طور لحظهای است، بهطوریکه میتواند دنیای ثابت و یکسانی را تا مدت یک دقیقه حفظ کند. این مدل همچنین قادر به تولید دیدگاههای مختلف، مانند نمای اول شخص و ایزومتریک است و میتواند محیطهای دنیای واقعی را با استفاده از تصاویر شبیهسازی کند.
پیشبینی آب و هوا و AGI
علاوه بر این، گوگل دیپمایند مدل جدیدی به نام GenCast معرفی کرده است. این مدل هوش مصنوعی پیشبینیهای وضع هوا را بهبود میبخشد و پیشبینیهایی سریعتر و دقیقتر تا 15 روز آینده ارائه میدهد، در حالی که عدم قطعیتها و خطرات مربوط به وضعیت جوی را نیز برطرف میکند.
گوگل اخیراً مدل آزمایشی هوش مصنوعی خود به نام Gemini-Exp-1121 را معرفی کرده است که رقابتی با مدل GPT-4 OpenAI دارد. این شرکت همچنین در حال آمادهسازی برای عرضه Google Gemini-2 است که انتظار میرود با مدل آینده OpenAI به نام o1 رقابت کند.
«گری مارکوس» بهعنوان منتقد هوش مصنوعی، در یک مصاحبه اختصاصی با AIM گفت که به نظر میرسد دیپمایند در مقایسه با رقبایش در مسیر بهتری به سمت AGI (هوش مصنوعی عمومی) قرار دارد. با این حال، او اشاره کرد که هیچ شرکتی هنوز مسیر قطعی برای رسیدن به AGI پیدا نکرده است. او افزود: «از میان شرکتهای بزرگ که در این زمینه کار میکنند، دیپمایند احتمالاً در مسیر درست قرار دارد.»
گری مارکوس در ادامه گفت: «دیپمایند در این زمینه جالبترین کارها را انجام داده است.» همچنین اضافه کرد: «هرچند AlphaFold به اندازه GPT-4 برای کاربردهای عمومی طراحی نشده است، اما نشاندهنده موفقیت کاربرد هوش مصنوعی عصبی – نمادین در حوزه تا شدن پروتئینها است.»
کریسمس برای OpenAI زودتر آمده است
بعد از جشنگرفتن دومین سالگرد ChatGPT، شرکت OpenAI برنامههایی برای معرفی مدلها و ویژگیهای جدید طی دوازده روز آینده اعلام کرده است. این شرکت در حساب رسمی خود در X نوشت: «۱۲ روز. ۱۲ پخش زنده. مجموعهای از چیزهای جدید، بزرگ و کوچک. ۱۲ روز OpenAI از فردا آغاز میشود.»
«سم آلتمن»، مدیرعامل OpenAI، در X نوشت: «از فردا ساعت ۱۰ صبح به وقت اقیانوس آرام، ما ۱۲ روز OpenAI را شروع میکنیم. هر روز کاری، یک پخش زنده خواهیم داشت با رونمایی یا دمویی که بعضی از آنها بزرگ و بعضیها کوچکتر هستند. چیزهای عالی برای به اشتراک گذاشتن داریم، امیدواریم لذت ببرید! کریسمس مبارک»
طبق گفته آلتمن، ChatGPT بیش از ۳۰۰ میلیون کاربر فعال هفتگی دارد. این شرکت قصد دارد این رقم را طی یک سال آینده تقریباً چهار برابر کند و هدف آن دستیابی به ۱ میلیارد کاربر است. علاوه بر این، طبق آمار OpenAI، روزانه ۱ میلیارد پیام از طریق ChatGPT ارسال میشود و ۱.۳ میلیون توسعهدهنده در ایالات متحده بر روی OpenAI کار کردهاند.
طبق منابع، به نظر میرسد OpenAI قصد دارد مدل مورد انتظار خود برای تولید ویدیو به نام Sora و مدل کامل استدلال خود به نام o1 را منتشر کند. همچنین ممکن است این شرکت نهایتاً موتور صوتی خود را راهاندازی کرده و مرورگر وب خود را به نمایش بگذارد. اخیراً، OpenAI دارین فیشر، یکی از سازندگان اصلی مرورگر گوگل کروم و معاون پیشین مهندسی گوگل، را استخدام کرده است.
همچنین گزارشها حاکی از آن است که OpenAI در نظر دارد عامل هوش مصنوعی خود به نام «اپراتور» (Operator) را عرضه کند که انتظار میرود در ژانویه ۲۰۲۵ منتشر شود. گمانهزنیها نشان میدهند که این قابلیت به ChatGPT کمک میکند تا بهعنوان یک عامل، دسکتاپها را کنترل و مشاهده کند.
امسال OpenAI ویژگیهای جدید زیادی از جمله جستجوی ChatGPT برای دریافت پاسخهای بهروز، رابط کاربری بوم (Canvas) برای نوشتن و کدنویسی، نسخه پیشرفته صدا با لهجههای مختلف، مدل GPT-4o mini با هزینه کمتر، پیشنمایش o1 و نسخه مینی o1 برای استدلال را معرفی کرد.
«گرگ بروکمن»، همبنیانگذار و رئیس OpenAI، اخیراً از مرخصی بازگشته است. با این حال، در پست اخیر خود در X، فاش کرد که در طول این مدت، مشغول آموزش مدلهای بنیادی DNA با همکاری مؤسسه Arc بوده است.
«گرگ بروکمن» در پست خود نوشت: «مدتهاست که معتقدم یادگیری عمیق باید تحولات بزرگی در حوزه پزشکی و بهداشت برای انسانها و حیوانات فراهم کند. به نظرم این پروژه گام مهمی به سمت این هدف است و قدمی اساسی برای مدلسازی سلولهای مجازی محسوب میشود.»
فصل نقل و انتقالات
در خبری دیگر، «شیائوهوا ژای»، محقق قدیمی گوگل دیپمایند، اعلام کرد که به OpenAI ملحق میشود. او در پستی در X نوشت: «پس از یک دهه شگفتانگیز در گوگل دیپمایند، خوشحالم که اعلام میکنم به زودی به OpenAI ملحق خواهم شد! از فرصتی که برای همکاری در ساخت دفتر OpenAI در زوریخ دارم، هیجانزدهام.» ژای با محققان OpenAI، «جف هینتون» و «الکساندر کلسنیکوف» همکاری خواهد کرد تا دفتر زوریخ را تأسیس و گسترش دهند.
OpenAI اخیراً «کیت روچ» را بهعنوان اولین مدیر ارشد بازاریابی خود استخدام کرده است. شرکت اعلام کرد: «تجربه او در بازاریابی مصرفکنندگان و کسبوکارها، نحوه ارتباط ما با قدرت تحولی هوش مصنوعی را شکل خواهد داد.»
جالب اینکه در ۱۸ ماه گذشته، OpenAI از گوگل ۸۵ کارمند جذب کرده است که نیمی از آنها مهندس هستند. این موضوع نشان میدهد که آلتمن به جذب استعدادهای با تجربه اعتقاد دارد و ترجیح میدهد بهجای استخدام برنامهنویسان جوان ۲۴ ساله، از افراد باتجربه استفاده کند.