پردازنده گرافیکی
اخبار

پردازنده گرافیکی مبتنی بر معماری امپر انویدیا آماده شد

    0

    انویدیا در روز ۱۴ مه ۲۰۲۰ (۲۵ خرداد)، نخستین پردازنده گرافیکی خود که مبتنی بر معماری امپر است را معرفی کرد. فرآیند تولید پردازنده گرافیکی A100انویدیا تکمیل شده است و به زودی به دست مشتریان خواهد رسید.

    پردازنده گرافیکی A100 که در طراحی آن از معماری امپر انویدیا استفاده شده، یک موفقیت بزرگ در طراحی GPUها به‌شمار می‌آید. معماری امپر به‌عنوان هشتمین نسل GPUهای انویدیا، بزرگترین پیشرفت این شرکت در این حوزه می‌باشد.

    هدف از طراحی پردازنده گرافیکی A100، یکپارچه‌سازی فرآیندهای آموزش و استنتاج inference هوش مصنوعی و افزایش ۲۰ برابری عملکرد پردازنده‌ها نسبت به نسل‌های پیشین بوده است.

    پردازنده A100 روند کارها را سرعت می‌بخشد و می‌توان از آن در تحلیل داده‌ها Data analytics، رایانش علمی Scientific computing و گرافیک ابری نیز استفاده کرد. فن‌آوری‌های رایانه‌ای منعطفی که در پردازنده گرافیکی A100 به‌کار برده شده، آن را برای هر نوع استفاده‌ای مناسب می‌سازد.

    قابلیت پردازش هم‌زمان چند نمونه ای multi-instance GPU capability در این پردازنده گرافیکی، آن را قادر ساخته تا توان استنتاجی خود را به طور هم‌زمان به حداکثر ۷ هدف مختلف تخصیص دهد. به علاوه، با استفاده از نسل سوم فن‌آوری اتصالی انویدیا به نام NVLink می‌توان چند پردازنده A100 را به یک‌دیگر متصل کرد و از پردازنده گرافیکی قدرتمند حاصل از این اتصالات، برای اهداف آموزشی بزرگ‌تر استفاده کرد.

    پردازنده گرافیکی A100 انویدیا، یک پیشرفت فنی بزرگ در طراحی پردازنده‌های گرافیکی است. ۵ نوآوری کلیدی که زمینه‌ساز این موفقیت بوده‌اند، عبارتند از:

    • معماری امپر انویدیا: جدیدترین معماری پردازنده‌های گرافیکی انویدیا یعنی امپر، قلب تپنده پردازنده A100 به‌شمار می‌آید. این پردازنده با به‌کارگیری معماری امپر توانسته میزبان بیش از ۵۴ میلیارد ترانزیستور باشد. بهره‌مندی از این تعداد ترانزیستور، پردازنده‌ی گرافیکی A100 را به بزرگ‌ترین پردازنده‌ی ۷ نانومتری دنیا تبدیل کرده است.

    • نسل سوم هسته‌های تنسور TF32: در حال ‌حاضر استفاده از هسته‌های تنسور پرطرفدار انویدیا راحت‌تر بوده و سرعت و انعطاف آن‌ها بیشتر شده است. قابلیت‌های این هسته‌ها نیز توسعه یافته است که از جمله آن‌ها می‌توان به استفاده از TF32 در حوزه هوش مصنوعی اشاره کرد. به‌کارگیری TF32 به جای نسل قبلی یعنی FP32، عملکرد الگوریتم‌های هوش مصنوعی را تا ۲۰ برابر افزایش می‌دهد. به‌علاوه نسل جدید هسته‌های تنسور از FP64 نیز پشتیبانی می‌کنند که باعث شده قدرت پردازشی این هسته‌ها در زمینه محاسبات عملکرد-بالا تا ۵/۲ برابر افزایش یابد.

    پردازش چند نمونه Multi-instance GPU: یک پردازنده A100 با داشتن قابلیت MIG یا پردازش هم‌زمان چند نمونه می‌تواند به حداکثر ۷ بخش تقسیم شود و قدرت پردازشی خود را به نسبت‌های مختلف بین این بخش‌ها تقسیم کند. این ویژگی باعث استفاده بهینه از منابع و افزایش بازدهی سرمایه خواهد شد.

    • نسل سوم فن‌آوری NVLink انویدیا: این فن‌آوری سرعت اتصال پردازنده‌های گرافیکی را به ۲ برابر افزایش داده است.

    • پراکندگی ساختاری: این تکنیک جدید افزایش بهره‌وری، با مهار کردن ذات پراکنده ریاضیات در حوزه هوش مصنوعی، بهره‌وری را تا دو برابر افزایش می‌دهد.

    درمجموع، این ویژگی‌های جدید، پردازنده A100 انویدیا را به پردازنده گرافیکی ایده‌آلی برای حوزه‌های آموزش و استنتاج هوش مصنوعی، شبیه‌سازی علمی scientific simulation ، هوش مصنوعی سخن‌گو، سیستم ‌های توصیه ‌گر recommender systems ، ژنومیک، تحلیل داده‌های عملکرد-بالا، مدل‌سازی در حوزه لرزه‌نگاری و پیش‌بینی بازارهای مالی بدل کرده است.

    توضیح ساده و جامع مدل پنهان مارکوف (HMM)

    مقاله قبلی

    تسریع گردش کاری یادگیری ماشین پیوسته با NVIDIA RAPIDS

    مقاله بعدی

    شما همچنین ممکن است دوست داشته باشید

    بیشتر در اخبار

    نظرات

    پاسخ دهید

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *