امکان اجرای مدلهای پیچیده هوش مصنوعی بر روی سختافزارهای قدیمی با نرمافزار جدید
CentML، یک شرکت متخصص در توسعه هوش مصنوعی، از پیشرفتی در حل یکی از بزرگترین موانع پیشروی صنعت هوش مصنوعی که عبارت از «دسترسی محدود به قدرت محاسباتی» است، خبر داده. نرمافزار جدید این شرکت با افزایش کارایی تراشههای هوش مصنوعی فعلی و قدیمی، راهی برای افزایش دسترسی به قدرت محاسباتی پیدا کرده است. بر این اساس، مدلهای پیچیده هوش مصنوعی با میلیاردها پارامتر میتوانند، روی سختافزارهای قدیمیتر اجرا شوند. این راهحل نیاز توسعهدهندگان به گرانترین و قویترین تراشهها را کاهش میدهد و دیگر برای اجرای مدلهای پیچیده لزوما به همان حجم GPU نیاز ندارند.
به گزارش هوشیو، استارتاپ هوش مصنوعیCentML، که مدلهای یادگیری ماشین را برای انجام کار سریعتر و هزینههای محاسباتی کمتر بهینه میکند، اکنون حضور و فعالیت خود را به صورت عمومی اعلام کرده و از حالت مخفی کاری خارج شده است. این شرکت مستقر در تورنتو قصد دارد به رفع کمبود جهانی پردازندههای گرافیکی مورد نیاز برای آموزش و اجرای مدلهای هوش مصنوعی مولد کمک کند .
به گفته این شرکت، دسترسی محدود به توان محاسباتی یکی از بزرگترین موانع و چالشهای توسعه هوش مصنوعی است و این کمبود تنها با افزایش حجم کار استنتاج (پیشبینی یا نتیجهگیری از دادهها) افزایش مییابد. CentML میگوید: «با افزایش کارایی موجودی تراشههای هوش مصنوعی فعلی و قدیمی بدون تأثیرگذاری بر دقت، میتواند دسترسی به قدرت محاسباتی را در بازار ناپایدار پردازندههای گرافیکی افزایش دهد.»
دسترسی به پردازندههای گرافیکی برای شرکتهای کوچکتر دشوار است
CentML در سال 2022 سرمایه اولیه 3.5 میلیون دلاری را به رهبری Radical Ventures جمعآوری کرد و بر توسعه هوش مصنوعی متمرکز شد. بنیانگذار و مدیرعامل این شرکت، گنادی پخیمنکو که یک معمار سیستم باتجربه است، در مصاحبه با VentureBeat اظهار داشته: «زمانی که سرعت رشد مدلهای زبان بزرگ را از حیث اندازه بررسی کردم، برایم واضح بود که هرکسی که بهترین پشته سختافزاری و نرمافزاری را برای کار با این مدلهای زبان بزرگ در اختیار داشته باشد، در صنعت هوش مصنوعی دارای برتری خواهد بود.»
او گفت: «آنچه شاهد رخ دادن آن هستیم بسیار شفاف است. برای انویدیا فروش گرانترین تراشههای خود مانند آخرین پردازندههای گرافیکی A100 و H100 در اولویت قرار دارد و همین موضوع دسترسی شرکتهای کوچکتر به این تراشهها را دشوار کرده است. با این حال، انویدیا تراشههای ارزانتری نیز دارد که چندان مورد استفاده قرار نمیگیرند، اما همچنان میتوانند مفید باشند»
مدیرعامل CentML افزود: «ما نرمافزاری میسازیم که مدلهای هوش مصنوعی را به طور موثر بر روی این پردازندههای گرافیکی ارزانتر بهینهسازی میکند و فقط مختص گرانترین پردازندههای موجود در فضای ابری نیست. ما در اصل با افزایش دسترسی به قدرت محاسباتی هوش مصنوعی به بخش بزرگتری از بازار خدمت میکنیم.»
از آنجایی که هزینه استنتاج مدلهای زبان بزرگ بهصورت تصاعدی افزایش مییابد (مدلهایی مانند ChatGPT میلیونها دلار هزینه برای اجرا نیاز دارند)، CentML از یک برنامه نرمافزاری منبعباز قدرتمند (کد نرمافزاری که به صورت رایگان در دسترس عموم قرار دارد) برای بهینهسازی خودکار استفاده میکند، تا برای خط لوله استنتاج و سختافزار خاص یک شرکت بهترین کار را انجام دهد. با انجام این کار، CentML استفاده از مدلهای زبان بزرگ برای توسعه هوش مصنوعی را برای شرکتها در دسترستر و مقرونبهصرفهتر میکند
پخیمنکو گفت، رقیبی مانند OctoML نیز بر اساس فناوری کامپایلر (برنامه نرمافزاری) ساخته شده است تا به طور خودکار عملکرد مدل را به حداکثر برساند، اما یک فناوری قدیمی است و راهحل آنها در فضای ابری قابل رقابت نیست. ما می دانستیم که چه کمبودهایی وجود دارد و یک فناوری جدید ساختیم که این کمبودها را ندارد. بنابراین ما از مزایای رقابتی ناشی از داشتن فناوری پیشرفتهتر نسبت به رقبای خود بهرهمند شدیم.
رقابت برای دسترسی به تراشههای هوش مصنوعی مانند بازی تاجوتخت شده
دیوید کاتز، شریک رادیکال ونچرز، میگوید که نبرد برای دستیابی به تراشههای هوش مصنوعی مانند برنامه تلویزیونی محبوب «بازی تاجوتخت» شده است. او به VentureBeat گفت: «نیاز محاسباتی برای اجرای مدلهای هوش مصنوعی به صورت سیریناپذیری ادامه دارد و این نیاز دائمی به قدرت محاسباتی بالا هر روز بیشتر میشود.» او افزود که رادیکال سال گذشته در CentML سرمایهگذاری کرد.
او گفت که محصول پیشنهادی CentML کارایی بیشتری در بازار ایجاد میکند. علاوهبراین، نشان میدهد که مدلهای پیچیده با پارامترهای میلیاردی نیز میتوانند روی سختافزارهای قدیمی اجرا شوند. او گفت: «بنابراین شما برای اجرای مدلهای پیچیده به همان حجم GPU یا لزوماً پردازنده A100 نیاز ندارید. از این منظر، در دسترس بودن پردازندههای گرافیکی و سایر پردازندههای تخصصی مورد استفاده برای اجرای مدلهای پیچیده هوش مصنوعی افزایش مییابد.»