ثبت 16 رکورد جدید توسط Nvidia در تازهترین شاخصهای MLPerf
طبق اعلام شرکت Nvidia ، نتایج حاصل از آزمون شاخص MLPerf نشان میدهد جدیدترین پلتفرمهای این شرکت نسبت به سایر سیستمهای موجود در بازار سرعت بالاتری در آموزش هوش مصنوعی داشتهاند.
واحد پردازش گرافیکی A100 انویدیا و سیستم DGX SuperPOD آن در سومین آزمون سالانه شاخص MLPerf، هر کدام هشت رکورد جدید و در مجموع 16 رکورد به ثبت رساندند. DGX SuperPOD خوشه متراکمی از واحدهای پردازش گرافیکی A100 است و به فنآوری HDR InfiniBand مجهز است.
این آزمونها توسط MLPerf برگزار شد؛ MLPerf یک گروه شاخصگذاری صنعتی است که در ماه مه سال 2018 پایهگذاری شد و شرکتهایی از جمله Amazon.com Inc.، Baidu Inc.، Facebook Inc.، Google LLC، Intel Cpro و Microsoft Corp و همچنین دانشگاه هاروارد و استنفورد از آن پشتیبانی و حمایت میکنند.
نتایج حاصل از این آزمون نشان میدهد عملکرد سختافزار Nvidia تا حد زیادی ارتقا پیدا کرده است؛ این سختافزار در ماه دسامبر سال 2018 در اولین شاخصهای آموزشی MLPerf 6 رکورد و در ماه جولای سال 2019 هشت رکورد جدید به ثبت رساند.
واحد پردازش گرافیکی A100 در ماه مه عرضه شد و اصلیترین قطعه به کار رفته در سیستمهای نسل سوم DGX این شرکت به حساب میآید. از سیستمهای نسل سوم DGX برای توانا ساختن اَبَرکامپیوترهای مختلفی همچون HiPerGator متعلق به دانشگاه فلوریدا استفاده میشود. تراشه A100 نیز به عنوان یک سرویس بر روی Google Cloud قابل دسترس است و شرکتهایی که به دنبال دستیابی به بالاترین سطح عملکرد در حوزههایی از قبیل تحلیل داده، رایانش علمی، ژنومیک، تحلیل لبه ویدئو Edge video analytics و سرویسهای 5G هستند میتوانند از آن استفاده کنند.
به گفته Nvidia نتایجی که سیستم DGX A100 در تازهترین شاخصهای MLPerf کسب کرده نشان میدهد عملکرد این سیستم نسبت به سیستم اصلی DGX ، که از واحدهای پردازش گرافیکی قدیمی V100 استفاده میکند، چهار برابر ارتقا یافته است. هرچند Nvidia اعلام کرده نتایج حاصل از آزمونهای MLPerf نشان میدهد که سرعت سیستم قدیمیتر این شرکت موسوم به DGX-1 به لطف بهینهسازی برخی نرمافزارهای جدید، دو برابر سیستم اصلی DGX است.
تازهترین شاخصهای MLPerf شامل دو آزمون کاملاً جدید و یک آزمون دیگر است که « تغییرات اساسی در آن ایجاد شده است» و به گفته Nvidia سختافزار این شرکت در تمامی آنها عملکرد بهتری نسبت به سایر سیستمها داشته است. برای مثال، تراشه A100 و سیستم DGX SuperPOD در آزمون جدید سیستمهای توصیهگر رتبه اول را کسب کردهاند. آزمون سیستمهای توصیهگر بارکاری متدوال سیستمهای هوش مصنوعی است.
سختافزار Nvidia در بخش پردازش زبان طبیعی که در آن از مدل شبکه عصبی Bi-directional Encoder Representation from Transformers یا با اختصار BERT استفاده شد، موفق به کسب امتیاز برتر شد. علاوه بر این سختافزار این شرکت در آزمون یادگیری تقویتی که در آن از Mini-go و یک تخته بازی GO به اندازه 19× 19 استفاده شد نیز رکوردهای جدیدی ثبت کرد. به گفته Nvidia این آزمون « سختترین آزمون در این دور از آزمونها بود و مسائل مختلفی از جمله بازی کردن و آموزش و غیره را شامل میشد.»
به گفته Nvidia سیستم DGX SuperPOD که بیش از 2000 واحد پردازش گرافیکی A100 را شامل میشود از میان تمامی سیستمهای موجود در بازار توانسته در تمامی آزمونهای شاخص MLPerf به خاطر عملکرد مقیاسپذیر خود امتیاز برتر را کسب کند.
هولگر مولر، تحلیلگر شرکت Constellation Research در گفتوگو با SiliconANGLE اظهار داشت با توجه به اینکه هماکنون کشورها درگیر رقابتی بیسابقه برای دستیابی به هوش مصنوعی هستند و شرکتها بیش از پیش به اهمیت اتوماسیون پی بردهاند، شاخصهای MLPerf در مرکز توجه قرار میگیرند.
به گفته مولر « شیوع ویروس کووید 19 به این روند دامن میزند و شرکتها به دنبال ارائهدهندگان پلتفرمهایی هستند که امکان پشتیبانی از حجم بالای متقضیان استفاده از نرمافزارهای هوش مصنوعی را فراهم کنند.»، وی در ادامه اظهار داشت « اکنون نوبت Nvidia است که رکوردهای جدیدی در تعدادی از شاخصهای MLPerf ثبت کرده است. نکته قابل توجه این است که Nvidia توانسته ظرف یک سال و نیم عملکرد خود را چهار برابر ارتقا دهد. و این ارتقای عملکرد به آنها در ثبت رکودهای جدید در شاخصهای هوش مصنوعی کمک میکند»
علاوه بر Nvidia شرکت گوگل نیز موفق به ثبت رکوردهای جدید شده است. گوگل برخی از سختافزارهای جدید خود را در شاخصهای MLPerf در معرض آزمایش گذاشت و اعلام کرده نتایج حاصل از این آزمونها نشان میدهد سریعترین ابرکامپیوتر آموزش یادگیری ماشین در جهان – با ثبت 6 رکورد جدید – محصول این شرکت است.
اندازه جدیدترین ابرکامپیوتر آموزش یادگیری ماشین شرکت گوگل که به تازهترین Tensor Processing Unit این شرکت مجهز است، چهار برابر Cloud TPU V3 POD است و در شاخصهای سال گذشته سه رکورد ثبت کرد. به گفته گوگل این ابرکامپیوتر که از 4096 تراشه TPU V3 و صدها سرور تشکیل شده که با استفاده از CPU پردازشها را انجام میدهد، عملکرد چشمگیری، بیش از 430 پتافلاپس، داشته است.