پردازنده گرافیکی مبتنی بر معماری امپر انویدیا آماده شد
انویدیا در روز 14 مه 2020 (25 خرداد)، نخستین پردازنده گرافیکی خود که مبتنی بر معماری امپر است را معرفی کرد. فرآیند تولید پردازنده گرافیکی A100انویدیا تکمیل شده است و به زودی به دست مشتریان خواهد رسید.
پردازنده گرافیکی A100 که در طراحی آن از معماری امپر انویدیا استفاده شده، یک موفقیت بزرگ در طراحی GPUها بهشمار میآید. معماری امپر بهعنوان هشتمین نسل GPUهای انویدیا، بزرگترین پیشرفت این شرکت در این حوزه میباشد.
هدف از طراحی پردازنده گرافیکی A100، یکپارچهسازی فرآیندهای آموزش و استنتاج inference هوش مصنوعی و افزایش 20 برابری عملکرد پردازندهها نسبت به نسلهای پیشین بوده است.
پردازنده A100 روند کارها را سرعت میبخشد و میتوان از آن در تحلیل دادهها Data analytics، رایانش علمی Scientific computing و گرافیک ابری نیز استفاده کرد. فنآوریهای رایانهای منعطفی که در پردازنده گرافیکی A100 بهکار برده شده، آن را برای هر نوع استفادهای مناسب میسازد.
قابلیت پردازش همزمان چند نمونه ای multi-instance GPU capability در این پردازنده گرافیکی، آن را قادر ساخته تا توان استنتاجی خود را به طور همزمان به حداکثر 7 هدف مختلف تخصیص دهد. به علاوه، با استفاده از نسل سوم فنآوری اتصالی انویدیا به نام NVLink میتوان چند پردازنده A100 را به یکدیگر متصل کرد و از پردازنده گرافیکی قدرتمند حاصل از این اتصالات، برای اهداف آموزشی بزرگتر استفاده کرد.
پردازنده گرافیکی A100 انویدیا، یک پیشرفت فنی بزرگ در طراحی پردازندههای گرافیکی است. 5 نوآوری کلیدی که زمینهساز این موفقیت بودهاند، عبارتند از:
• معماری امپر انویدیا: جدیدترین معماری پردازندههای گرافیکی انویدیا یعنی امپر، قلب تپنده پردازنده A100 بهشمار میآید. این پردازنده با بهکارگیری معماری امپر توانسته میزبان بیش از ۵۴ میلیارد ترانزیستور باشد. بهرهمندی از این تعداد ترانزیستور، پردازندهی گرافیکی A100 را به بزرگترین پردازندهی ۷ نانومتری دنیا تبدیل کرده است.
• نسل سوم هستههای تنسور TF32: در حال حاضر استفاده از هستههای تنسور پرطرفدار انویدیا راحتتر بوده و سرعت و انعطاف آنها بیشتر شده است. قابلیتهای این هستهها نیز توسعه یافته است که از جمله آنها میتوان به استفاده از TF32 در حوزه هوش مصنوعی اشاره کرد. بهکارگیری TF32 به جای نسل قبلی یعنی FP32، عملکرد الگوریتمهای هوش مصنوعی را تا 20 برابر افزایش میدهد. بهعلاوه نسل جدید هستههای تنسور از FP64 نیز پشتیبانی میکنند که باعث شده قدرت پردازشی این هستهها در زمینه محاسبات عملکرد-بالا تا 5/2 برابر افزایش یابد.
• پردازش چند نمونه Multi-instance GPU: یک پردازنده A100 با داشتن قابلیت MIG یا پردازش همزمان چند نمونه میتواند به حداکثر 7 بخش تقسیم شود و قدرت پردازشی خود را به نسبتهای مختلف بین این بخشها تقسیم کند. این ویژگی باعث استفاده بهینه از منابع و افزایش بازدهی سرمایه خواهد شد.
• نسل سوم فنآوری NVLink انویدیا: این فنآوری سرعت اتصال پردازندههای گرافیکی را به 2 برابر افزایش داده است.
• پراکندگی ساختاری: این تکنیک جدید افزایش بهرهوری، با مهار کردن ذات پراکنده ریاضیات در حوزه هوش مصنوعی، بهرهوری را تا دو برابر افزایش میدهد.
درمجموع، این ویژگیهای جدید، پردازنده A100 انویدیا را به پردازنده گرافیکی ایدهآلی برای حوزههای آموزش و استنتاج هوش مصنوعی، شبیهسازی علمی scientific simulation ، هوش مصنوعی سخنگو، سیستم های توصیه گر recommender systems ، ژنومیک، تحلیل دادههای عملکرد-بالا، مدلسازی در حوزه لرزهنگاری و پیشبینی بازارهای مالی بدل کرده است.