
illustration by Nalini Nirad
تصور متا بدون لاما
سال 2024 بدون لاما کسلکننده میبود. اکوسیستم لاما شاهد رشد سریع بود، به طوری که مدلها تا اوایل سال جاری نزدیک به 350 میلیون دانلود در هاب هوش مصنوعی Hugging Face داشتهاند که این رشد شگفتانگیز، 10 برابر بیشتر از میزان دانلودها در زمان راهاندازی لاما در سال 2023 بود.
برای متا، منبع باز در قلب نوآوری قرار دارد و به استارتاپها و شرکتها این امکان را میدهد تا راهحلهای پیشرفتهای را هم در محیطهای داخلی و هم در فضای ابری توسعه دهند. «مارک زاکربرگ» در یک مصاحبه گفت: «من فکر میکنم در نسل بعدی محاسبات، دوباره به فضایی باز خواهیم گشت که اکوسیستم باز پیشرو باشد.»
قبل از انتشار لاما 3.2، مارک زاکربرگ در یک نامه عمومی گفته بود که هوش مصنوعی متنباز از مدلهای بسته پیشی خواهد گرفت، همانطور که لینوکس از یونیکس جلوتر افتاد. او باور دارد که هوش مصنوعی متنباز پایهگذار آینده این فناوری خواهد بود. در سراسر جهان بهویژه در هند، توسعهدهندگان و کارآفرینان از مدلهای لاما برای ساخت محصولات و راهاندازی شرکتهای جدید استفاده کردهاند.
در ماه آگوست امسال، نسخه لاما 3.2 منتشر شد تا هوش مصنوعی را در دستگاههای لبه (Edge AI) و وظایف مربوط به تصویر بهبود دهد. این نسخه شامل مدلهای بزرگ لاما برای پردازش تصویر (با اندازههای 11B و 90B) و مدلهای سبکتر (1B و 3B) بود که برای استفاده مستقیم روی دستگاهها بهینهسازی شده بودند و از سختافزارهای Qualcomm و MediaTek پشتیبانی میکردند.
بعد از آن، نسخههای فشردهشده لاما 3.2 منتشر شد که عملکرد هوش مصنوعی روی دستگاهها را بهبود بخشید. این نسخهها باعث شدند که سرعت پردازش دادهها تا چهار برابر سریعتر شود، اندازه مدلها 56 درصد کوچکتر شود و مصرف حافظه 41 درصد کاهش یابد.
فراتر از لاما
در سال 2024، مدل Movie Gen متا که توانایی ساخت ویدئو، ویرایش آن و ایجاد افکتهای صوتی را با استفاده از دستورات متنی ساده دارد، تبدیل به یکی از جذابترین نوآوریها شد. این ابزار ویدیو سازی، رقیب جدی مدلهایی مانند Sora و Runway است. اگرچه هنوز این ابزار برای عموم در دسترس نیست، اما کاربردهای آن توجه زیادی را جلب کرده است.
ابزار دیگری که مورد توجه قرار گرفت، Spirit LM بود که به ترکیب گفتار و متن برای ایجاد تعاملات طبیعی پرداخته است. همچنین MarDini که با همکاری دانشگاه KAUST توسعه یافته، ابزار جالبی است که امکان ساخت ویدیوهای با کیفیت و انعطافپذیر را فراهم میکند.
ابزار NotebookLlama که جایگزینی برای NotebookLM گوگل است، بهموقع معرفی شد. این ابزار متنباز که بر اساس مدلهای لاما متا ساخته شده، امکان ایجاد خلاصههای ساده و کاربردی را از فایلهای متنی فراهم میکند.
اما این همه ماجرا نیست. CoTracker3 از متا، عملکرد ردیابی ویدیو را با استفاده از روشی به نام «pseudo labelling» بهبود میدهد. این روش بدون اینکه به دادههای برچسبگذاری شده کامل نیاز داشته باشد، با دقت بیشتری در ردیابی اشیاء خارج از دید کمک میکند. در همین حال، AI Studio دسترسی به ابزارهای هوش مصنوعی را برای افراد بیشتری فراهم میکند و باعث تشویق خلاقیت و تعامل بیشتر در اپلیکیشنهای متا میشود.
«مارک زاکربرگ» اعلام کرد که آمادهسازی اولیه برای لاما 4 آغاز شده است که با استفاده از خوشههای محاسباتی پیشرفته و زیرساختهای دادهای، جهشی فراتر از لاما 3 به حساب میآید. همچنین، معاون ارشد متا، «راگاوان سینویاسان» اشاره کرد که مدلهای نسل بعدی لاما که برای سال 2025 برنامهریزی شدهاند، ویژگیهایی مانند حافظه بهتر، توانایی پردازش زمینهای (context)، ارتباطات میانمدلی، یکپارچگیها، کدنویسی و پشتیبانی بهتر از سختافزار خواهند داشت.
این شرکت تحت نظر «یان لوکون» رئیس بخش هوش مصنوعی متا، در حال پیشرفت در زمینه هوش مصنوعی با سیستمهایی مانند Layer Skip و V-JEPA است که هدف آنها بهبود تواناییهای استدلال و تعامل است. همچنین، متا در حال استفاده از روشهای یادگیری خود نظارتی (self-supervised learning) برای رسیدن به هوش مصنوعی ماشینی (AMI) است.
رباتیک و هوش مصنوعی تعاملی به یکی از محورهای اصلی متا تبدیل شدهاند. در واقع فناوریهایی که تعامل انسان با رباتها را بهبود میبخشند و از هوش ماشینی خودمختار پشتیبانی میکنند، در این مسیر نقش مهمی دارند. متا با پروژههایی مانند Meta Sparsh، Meta Digit 360 و Meta Digit Plexus پیشرفت چشمگیری داشته است. این فناوریها حس لامسه و مهارتهای حرکتی رباتها را تقویت میکنند و آنها را هوشمندتر و کارآمدتر میسازند.
پروژههای متا در حوزه متاورس، شامل فناوریهایی مانند واقعیت ترکیبی و عینکهای هوشمند، به شدت به مدلهای پیشرفته هوش مصنوعی وابسته هستند. به زودی، متا مدلهای لاما را با واقعیت افزوده (AR) و واقعیت مجازی (VR) ترکیب میکند تا پلتفرمهایی ساده و کاربردی برای استفاده روزمره ایجاد کند. در سال 2025، تمرکز متا همچنان بر توسعه مدلهای متنباز و غیرمتمرکز خواهد بود تا دسترسی به نوآوری را برای همه آسانتر کند.
مارک زاکربرگ معتقد است که نباید دنیا به یک سیستم هوش مصنوعی محدود شود. او میگوید: «بهجای یک هوش مصنوعی واحد، باید انواع مختلفی از هوش مصنوعی و خدمات مرتبط وجود داشته باشد. هر فرد در پلتفرمهای ما میتواند عامل هوش مصنوعی شخصی خودش را بسازد و با آن ارتباط برقرار کند.»
این دیدگاه زاکربرگ تفاوت چشمگیری با رویکرد شرکتهایی مانند OpenAI و گوگل دارد که روی ساخت سیستمهای یکپارچهای مانند ChatGPT و Gemini متمرکز هستند و این سیستمها را برای انجام مجموعهای از وظایف طراحی میکنند.
متا پیشبینی میکند که سال آینده با ظهور گسترده عاملهای هوش مصنوعی شکل خواهد گرفت. این عاملها میتوانند نحوه پشتیبانی مشتریان، تعامل در جوامع و بهرهوری فردی را متحول کنند. مارک زاکربرگ معتقد است که هر کسبوکار کوچک و هر خالق محتوا باید بتواند عامل هوش مصنوعی اختصاصی خود را داشته باشد. او این عاملها را به اندازه ایمیل یا شبکههای اجتماعی در زندگی روزمره مهم و ضروری میداند.