OpenAI می‌اندیشد، Google آن را عملی می‌کند

تیم تحریریه
۲۵ آذر ۱۴۰۳

زمان مطالعه: 5 دقیقه

رقابت برای دستیابی به هوش مصنوعی عمومی (AGI) شدت بیشتری پیدا کرده است. پس از این که دیپ‌مایند گوگل به تازگی Veo و Imagen3 را بر روی Google Cloud عرضه کرد، این بار Genie2 را نیز معرفی کرده است. Genie2 یک مدل بزرگ است که می‌تواند انواع مختلفی از محیط‌های سه‌بعدی قابل‌تعامل را بسازد.

فهرست مقاله پنهان

1 جهان‌های مصنوعی

2 پیش‌بینی آب و هوا و AGI

3 کریسمس برای OpenAI زودتر آمده است

4 فصل نقل و انتقالات

جهان‌های مصنوعی

Genie2 فرایند توسعه عامل‌های هوش مصنوعی تجسمی را ساده می‌کند. این مدل با تبدیل یک تصویر به دنیای مجازی تعاملی، امکان کاوش این فضاها را هم برای انسان‌ها و هم برای هوش مصنوعی از طریق کیبورد و ماوس فراهم می‌کند.

دیپ‌مایند (Google DeepMind) در پست وبلاگ خود اعلام کرد: «Genie2 می‌تواند در آینده به عامل‌های هوش مصنوعی این امکان را بدهد که در دنیای بی‌پایانی از محیط‌های جدید آموزش ببینند و ارزیابی شوند. این تحقیق همچنین راه را برای ایجاد فرآیندهای جدید و خلاقانه برای ساخت نمونه‌های اولیه تجربیات تعاملی هموار می‌کند.»

«دمیس هسابیس»، مدیر ارشد دیپ‌مایند، گفت: «مدل دنیای هوش مصنوعی در حال شکل‌گیری است.»

نسخه جدید Genie2 بر اساس مدل قبلی خود یعنی Genie1 ساخته شده است. نسخه قبلی محدود به محیط‌های 2D بود، اما حالا Genie2 قابلیت‌های جدیدی در محیط‌های سه‌بعدی اضافه کرده است. این مدل توانایی شبیه‌سازی تعاملات فیزیکی، ساخت انیمیشن‌های پیچیده و ایجاد محیط‌هایی با فیزیک واقعی، نورپردازی مناسب و تعاملات واقعی میان اشیاء را دارد. Genie2 که بر اساس یک مجموعه داده ویدئویی بزرگ آموزش دیده، از فناوری جدیدی به نام «Autoregressive Latent Diffusion» برای تولید فریم‌ها به‌صورت متوالی و بر اساس واکنش‌های کاربر استفاده می‌کند.

دیپ‌مایند اعلام کرده است که بازی‌ها همیشه نقش مهمی در تحقیقات هوش مصنوعی این شرکت داشته‌اند، از آزمایش‌های اولیه با بازی‌های آتاری گرفته تا پیشرفت‌هایی مانند AlphaGo و AlphaStar که دستاوردهای مهمی در این زمینه به شمار می‌روند.

با این حال، یکی از مشکلات اصلی در آموزش هوش مصنوعی‌های عمومی‌تر، محدودیت در محیط‌های آموزشی متنوع بوده است. Genie2 این مشکل را حل می‌کند و با ارائه «ثبات در افق بلندمدت»، امکان شبیه‌سازی سناریوهای در حال تغییر را فراهم می‌آورد و به هوش مصنوعی‌ها این امکان را می‌دهد که به طور پویا در محیط‌ها جستجو کنند.

گوگل دیپ‌مایند یک عامل هوش مصنوعی به نام SIMA را هم معرفی کرد که وظایف مختلفی را در دنیای ایجاد شده توسط Genie2 با پیروی از دستورهای زبان طبیعی انجام می‌داد. این شرکت اعلام کرد که عملکرد SIMA نشان‌دهنده توانایی مدل در ایجاد محیط‌های آزمایشی منحصربه‌فرد برای هوش مصنوعی‌ها است و قابلیت تعمیم به وظایف جدید و ناشناخته را به نمایش می‌گذارد.

ویژگی دیگر Genie2، قابلیت آن در تولید محتوای جدید به طور لحظه‌ای است، به‌طوری‌که می‌تواند دنیای ثابت و یکسانی را تا مدت یک دقیقه حفظ کند. این مدل همچنین قادر به تولید دیدگاه‌های مختلف، مانند نمای اول شخص و ایزومتریک است و می‌تواند محیط‌های دنیای واقعی را با استفاده از تصاویر شبیه‌سازی کند.

پیش‌بینی آب و هوا و AGI

علاوه بر این، گوگل دیپ‌مایند مدل جدیدی به نام GenCast معرفی کرده است. این مدل هوش مصنوعی پیش‌بینی‌های وضع هوا را بهبود می‌بخشد و پیش‌بینی‌هایی سریع‌تر و دقیق‌تر تا 15 روز آینده ارائه می‌دهد، در حالی که عدم قطعیت‌ها و خطرات مربوط به وضعیت جوی را نیز برطرف می‌کند.

گوگل اخیراً مدل آزمایشی هوش مصنوعی خود به نام Gemini-Exp-1121 را معرفی کرده است که رقابتی با مدل GPT-4 OpenAI دارد. این شرکت همچنین در حال آماده‌سازی برای عرضه Google Gemini-2 است که انتظار می‌رود با مدل آینده OpenAI به نام o1 رقابت کند.

«گری مارکوس» به‌عنوان منتقد هوش مصنوعی، در یک مصاحبه اختصاصی با AIM گفت که به نظر می‌رسد دیپ‌مایند در مقایسه با رقبایش در مسیر بهتری به سمت AGI (هوش مصنوعی عمومی) قرار دارد. با این حال، او اشاره کرد که هیچ شرکتی هنوز مسیر قطعی برای رسیدن به AGI پیدا نکرده است. او افزود: «از میان شرکت‌های بزرگ که در این زمینه کار می‌کنند، دیپ‌مایند احتمالاً در مسیر درست قرار دارد.»

گری مارکوس در ادامه گفت: «دیپ‌مایند در این زمینه جالب‌ترین کارها را انجام داده است.» همچنین اضافه کرد: «هرچند AlphaFold به اندازه GPT-4 برای کاربردهای عمومی طراحی نشده است، اما نشان‌دهنده موفقیت کاربرد هوش مصنوعی عصبی – نمادین در حوزه تا شدن پروتئین‌ها است.»

کریسمس برای OpenAI زودتر آمده است

بعد از جشن‌گرفتن دومین سالگرد ChatGPT، شرکت OpenAI برنامه‌هایی برای معرفی مدل‌ها و ویژگی‌های جدید طی دوازده روز آینده اعلام کرده است. این شرکت در حساب رسمی خود در X نوشت: «۱۲ روز. ۱۲ پخش زنده. مجموعه‌ای از چیزهای جدید، بزرگ و کوچک. ۱۲ روز OpenAI از فردا آغاز می‌شود.»

«سم آلتمن»، مدیرعامل OpenAI، در X نوشت: «از فردا ساعت ۱۰ صبح به وقت اقیانوس آرام، ما ۱۲ روز OpenAI را شروع می‌کنیم. هر روز کاری، یک پخش زنده خواهیم داشت با رونمایی یا دمویی که بعضی از آن‌ها بزرگ و بعضی‌ها کوچک‌تر هستند. چیزهای عالی برای به اشتراک گذاشتن داریم، امیدواریم لذت ببرید! کریسمس مبارک»

طبق گفته آلتمن، ChatGPT بیش از ۳۰۰ میلیون کاربر فعال هفتگی دارد. این شرکت قصد دارد این رقم را طی یک سال آینده تقریباً چهار برابر کند و هدف آن دستیابی به ۱ میلیارد کاربر است. علاوه بر این، طبق آمار OpenAI، روزانه ۱ میلیارد پیام از طریق ChatGPT ارسال می‌شود و ۱.۳ میلیون توسعه‌دهنده در ایالات متحده بر روی OpenAI کار کرده‌اند.

طبق منابع، به نظر می‌رسد OpenAI قصد دارد مدل مورد انتظار خود برای تولید ویدیو به نام Sora و مدل کامل استدلال خود به نام o1 را منتشر کند. همچنین ممکن است این شرکت نهایتاً موتور صوتی خود را راه‌اندازی کرده و مرورگر وب خود را به نمایش بگذارد. اخیراً، OpenAI دارین فیشر، یکی از سازندگان اصلی مرورگر گوگل کروم و معاون پیشین مهندسی گوگل، را استخدام کرده است.

همچنین گزارش‌ها حاکی از آن است که OpenAI در نظر دارد عامل هوش مصنوعی خود به نام «اپراتور» (Operator) را عرضه کند که انتظار می‌رود در ژانویه ۲۰۲۵ منتشر شود. گمانه‌زنی‌ها نشان می‌دهند که این قابلیت به ChatGPT کمک می‌کند تا به‌عنوان یک عامل، دسکتاپ‌ها را کنترل و مشاهده کند.

امسال OpenAI ویژگی‌های جدید زیادی از جمله جستجوی ChatGPT برای دریافت پاسخ‌های به‌روز، رابط کاربری بوم (Canvas) برای نوشتن و کدنویسی، نسخه پیشرفته صدا با لهجه‌های مختلف، مدل GPT-4o mini با هزینه کمتر، پیش‌نمایش o1 و نسخه مینی o1 برای استدلال را معرفی کرد.

«گرگ بروکمن»، هم‌بنیان‌گذار و رئیس OpenAI، اخیراً از مرخصی بازگشته است. با این حال، در پست اخیر خود در X، فاش کرد که در طول این مدت، مشغول آموزش مدل‌های بنیادی DNA با همکاری مؤسسه Arc بوده است.

«گرگ بروکمن» در پست خود نوشت: «مدت‌هاست که معتقدم یادگیری عمیق باید تحولات بزرگی در حوزه پزشکی و بهداشت برای انسان‌ها و حیوانات فراهم کند. به نظرم این پروژه گام مهمی به سمت این هدف است و قدمی اساسی برای مدل‌سازی سلول‌های مجازی محسوب می‌شود.»

فصل نقل و انتقالات

در خبری دیگر، «شیائوهوا ژای»، محقق قدیمی گوگل دیپ‌مایند، اعلام کرد که به OpenAI ملحق می‌شود. او در پستی در X نوشت: «پس از یک دهه شگفت‌انگیز در گوگل دیپ‌مایند، خوشحالم که اعلام می‌کنم به زودی به OpenAI ملحق خواهم شد! از فرصتی که برای همکاری در ساخت دفتر OpenAI در زوریخ دارم، هیجان‌زده‌ام.» ژای با محققان OpenAI، «جف هینتون» و «الکساندر کلسنیکوف» همکاری خواهد کرد تا دفتر زوریخ را تأسیس و گسترش دهند.

OpenAI اخیراً «کیت روچ» را به‌عنوان اولین مدیر ارشد بازاریابی خود استخدام کرده است. شرکت اعلام کرد: «تجربه او در بازاریابی مصرف‌کنندگان و کسب‌وکارها، نحوه ارتباط ما با قدرت تحولی هوش مصنوعی را شکل خواهد داد.»

جالب اینکه در ۱۸ ماه گذشته، OpenAI از گوگل ۸۵ کارمند جذب کرده است که نیمی از آن‌ها مهندس هستند. این موضوع نشان می‌دهد که آلتمن به جذب استعدادهای با تجربه اعتقاد دارد و ترجیح می‌دهد به‌جای استخدام برنامه‌نویسان جوان ۲۴ ساله، از افراد باتجربه استفاده کند.

منبع

https://hooshio.com/?p=62921

جدیدترین تحولات هوش مصنوعی را در کانال بله هوشیو بخوانید

OpenAI می‌اندیشد، Google آن را عملی می‌کند

جهان‌های مصنوعی

پیش‌بینی آب و هوا و AGI

کریسمس برای OpenAI زودتر آمده است

فصل نقل و انتقالات

قابلیت Model Council در Perplexity

پایان GPT-4o پیش از ولنتاین؛ کاربران خشمگین و غمگین شدند

افزونه هوش Claude در پاورپوینت

همکاری OpenAI با G42 برای ساخت هوش مصنوعی برای دولت امارات

مهندسی پرامپت: راهنمای جامع از مبتدی تا پیشرفته

معرفی هوش مصنوعی سازمانی

از کدام چت‌بات‌های هوش مصنوعی استفاده کنیم؟

ضرورت بازنگری نقش کمیسیون هوش مصنوعی سازمان نصر ایران در سالگرد تأسیس

رونمایی از نخستین دستیار هوش مصنوعی قضایی ایران

ضرورت بازنگری نقش کمیسیون هوش مصنوعی سازمان نصر ایران در سالگرد تأسیس

سامانه هوش مصنوعی مرکز وکلا قوه قضاییه رونمایی شد

آموزش رایگان هوش مصنوعی برای کودکان محلات کم‌برخوردار

قابلیت Model Council در Perplexity

پایان GPT-4o پیش از ولنتاین؛ کاربران خشمگین و غمگین شدند

افزونه هوش Claude در پاورپوینت

همکاری OpenAI با G42 برای ساخت هوش مصنوعی برای دولت امارات

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

قابلیت Model Council در Perplexity

پایان GPT-4o پیش از ولنتاین؛ کاربران خشمگین و غمگین شدند

افزونه هوش Claude در پاورپوینت

همکاری OpenAI با G42 برای ساخت هوش مصنوعی برای دولت امارات

GPT-5.2 به کشفی تازه در فیزیک نظری رسید

جهان‌های مصنوعی

پیش‌بینی آب و هوا و AGI

کریسمس برای OpenAI زودتر آمده است

فصل نقل و انتقالات

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید