انرژی مصرفی هوش مصنوعی مشکلات زیستمحیطی بههمراه دارد
انرژی مصرفی هوش مصنوعی در مراکز داده و مدلهای بزرگ بسیار بالا است و به محیط زیست آسیب میرسانند. اما کسبوکارها میتوانند در جهت کاهش تأثیرات خود بر محیط زیست اقدام کنند.
آموزش یک مدل پیشرفته هوش مصنوعی مستلزم برخورداری از دادههای با کیفیت، صرف زمان، پول و البته مقدار زیادی انرژی است.
دخیرهسازی دادهها در مراکز داده بزرگمقیاس و بهکارگیری آن دادهها برای آموزش مدل یادگیری عمیق یا یادگیری ماشین انرژی مصرفی هوش مصنوعی را به شدت بالا میبرد. اگرچه سیستم هوش مصنوعی ممکن است مقرونبهصرفه باشد، اما به محیط زیست آسیب میرساند.
انرژی مصرفی هوش مصنوعی هنگام آموزش
برای نمونه برخی از متداولترین مدلهای زبانی را در نظر بگیرید.
شرکت OpenAI مدل GPT-3 را از طریق 45 ترابایت داده آموزش داده است. شرکت Nvidia برای آموزش نسخه نهایی MegatronLM، که یک مدل زبانی مشابه GPT-3 ولی کوچکتر از آن است، 512 پردازنده گرافیکی 100 ولتی را بهمدت 9 روز روشن گذاشته است.
یک پردازنده گرافیکی 100ولتی بین 250 تا 300 وات برق مصرف میکند. اگر مصرف برق را مقدار ثابت 250 وات در نظر بگیریم، 512 پردازنده گرافیکی 100 ولتی معادل 128,000وات (128 کیلو وات) برق مصرف میکنند. و روشن بودن این پردازندهها به مدت 9 روز به این معنا است که آموزش مدل MegatronLM 27,648 کیلو وات ساعت انرژی مصرف کرده است.
طبق گزارش اداره اطلاعات انرژی آمریکا، یک خانوار معمولی سالانه 10,649 کیلوواتساعت انرژی مصرف میکند. بنابراین، انرژی مصرفی هوش مصنوعی برای آموزش نسخه نهایی MegatronLM تقریباً برابر مصرف انرژی سه خانوار در سال است.
در تکنیکهای جدید آموزشی، حجم داده مورد نیاز برای آموزش مدل یادگیری ماشین کاهش یافته است. با این حال، کماکان تعداد زیادی از مدلها برای تکمیل مرحله اولیه آموزش بهدادههای زیاد و برای بهروزرسانی نتایج به دادههای اضافی نیاز دارند.
انرژی مصرفی هوش مصنوعی در مراکز داده
با پیچیدهترشدن AI، انتظار میرود برخی از مدلها به دادههای بیشتری نیاز داشته باشند. این مسئله نیز مشکلساز است زیرا انرژی مصرفی هوش مصنوعی در بسیار بالا است.
به گفته آلن پِلزشارپ، بنیانگذار شرکت تحلیل و بررسی Deep Analysis، «مراکز داده یکی از تأثیرگذارترین عوامل بر محیط زیست خواهند بود».
شرکت آبوهوایی IBM روزانه حدود 400 ترابایت داده را پردازش میکند تا مدلهای آن بتوانند آبوهوای چند روز آینده را در اقصی نقاط جهان پیشبینی کنند. فیسبوک روزانه حدود 4 پتابایت (4،000 ترابایت) داده تولید میکند.
در سال 2020، مردم جهان 64.2 زتابایت داده تولید کردند. طبق تخمین شرکت تحقیقات بازار IDC، این مقدار برابر است با 58،389،559،853 ترابایت داده.
مراکز داده سرتاسر جهان این دادهها را ذخیره میکنند.
در همین حین، بزرگترین مراکز داده بیش از 100مگاوات برق نیاز دارند. به گزارش اندیشکده انرژی و اقلیمِ شرکت Energy Innovations این مقدار نیرو میتواند انرژی 80,000 خانوار در ایالات متحده را تأمین کند.
در حال حاضر حدود 600 مرکز داده با ظرفیت بالا (منظور مراکز دادهای است که بیش از 5،000 سرور داشته و فضایی بیش از 930 مترمربع را اشغال کردهاند) وجود دارد و مقدار انرژی لازم برای ذخیره تمام دادههای ساخته بشر مشخص نیست، اما به احتمال زیاد رقمی سرسامآور خواهد بود.
از دیدگاه زیستمحیطی انرژی مصرفی هوش مصنوعی و مراکز دادهبه کابوس تبدیل شده است.
هوش مصنوعی، داده، و محیط زیست
مصرف انرژی CO2 تولید میکند. این گاز عمدهترین گاز گلخانهای است که انسان تولید کرده است. وجود گازهای گلخانهای مانند CO2 در جو مانع از خروج گرما از سطح زمین میشود و در نتیجه دمای زمین افزایش یافته و تعادل اکوسیستمهای حساس به هم میریزد.
به گفته گِری مکگاورن، مؤلف کتاب پسماند جهانی، «بشر با بحران مصرف انرژی دستوپنجه نرم میکند».
طبق توضیحات او، مصرف انرژی AI بسیار بالا است و هرچه میزان تقاضا برای هوش مصنوعی بیشتر شود، انرژی بیشتری مصرف میشود.
وی معتقد است: «مصرف انرژی تنها به برق مورد نیاز برای آموزش AI محدود نمیشود. ساخت اَبَر کامپیوترها و جمعآوری و ذخیره دادهها به انرژی نیاز دارند».
مکگاورن تخمین زده است که تا سال 2035، بشر بیش از 2,000 زتابایت داده تولید کند و اظهار میکند: «انرژی لازم برای ذخیره این مقدار داده رقمی نجومی خواهد بود».
در حال حاضر، بزرگترین گروه کاربران دادهها اقدام خاصی در قبال ردپای کربنی یا معضل مصرف انرژی AI انجام نمیدهند.
به گفته این نویسنده «برخی از عواملِ ردپای کربنی هوش مصنوعی کاملاً شناخته شده هستند، اما اقدام چندانی برای رفع آنها صورت نگرفته است. مراکز داده که ’منبع تغذیه‘ AI به شمار میآیند، بر بازدهی الکتریکی تمرکز کرده و طی 10 سال گذشته پیشرفتهای عمدهای داشتهاند».
بازدهی مراکز داده در دهه گذشته از نظر مصرف برق بهتر شده است، اما کارشناسان معتقدند مرف برق تنها حدود 10 درصد از انتشار گاز CO2 یک مرکز داده را به خود اختصاص میدهد. زیرساخت یک مرکز داده، از جمله ساختمان و سیستمهای خنککننده، نیز کربن زیادی تولید میکند.
از همه مهمتر اینکه مراکز داده برای سرمایش تبخیری آب زیادی مصرف میکنند. با این روش، مصرف برق کاهش مییابد، اما روزانه در هر مرکز داده با ظرفیت بالا میلیونها لیتر آب مصرف میشود. علاوهبراین، آب مصرفی ممکن است در این فرآیند آلوده شود.
اما مکگاورن میگوید: «کماکان این فرضیه بهطور وسیع وجود دارد که دنیای دیجیتال ذاتاً سبز است و به محیط زیست آسیب نمیرساند».
تاثیر زیستمحیطی کسبوکارها
اگرچه یک کسبوکار معمولی نمیتواند نحوه ذخیره دادهها در شرکتهای بزرگ را تغییر دهد، اما شرکتهایی که نگران ردپای زیستمحیطی خود هستند، میتوانند به جای تولید انبوه دادهها به تولید دادههای با کیفیت بپردازند. مثلاً، میتوانند دادههایی را که دیگر از آنها استفاده نمیکنند حذف کنند؛ طبق توضیحات مکگاورن، 90% دادهها 90 روز پس از ذخیره، بلا استفاده میمانند.
علاوهبراین، کسبوکارها میتوانند نحوه استفاده از هوش مصنوعی یا نوع هوش مصنوعی مورد استفاده خود را تعدیل کنند.
سازمانها میتوانند به کاربردهای مورد نظر خود فکر کرده و از فناوری هوش مصنوعی یا اتوماسیون ویژه آن استفاده کنند. با این حال، انواع مختلف هوش مصنوعی هزینههای اضافی بابت مصرف انرژی در پی دارند.
به گفته پلزشارپ، احتمالاً شرکتها گرفتار این تفکر شدهاند که برای انجام همه کارها لازم است یک سامانه هوش مصنوعی پیشرفته داشته باشند. اما اگر یک شرکت، کاربرد مشخصی در نظر دارد، مانند خودکارسازی صدور فاکتور، به سیستم پیشرفتهای نیاز ندارد. سیستمهای پیشرفته گرانقیمتاند و از دادههای زیادی استفاده میکنند و این یعنی ردپای کربنی بزرگی خواهند داشت.
طبق توضیحات پلزشارپ چون چنین سیستمی بهخوبی شخصی شده، AI با دقیقترین دادههای ممکن آموزش میبیند و حجم دیتاست کوچک میماند. درحالیکه، یک مدل یادگیری عمیق برای انجام موفقیتآمیز هر وظیفهای باید بر روی انبوه دادهها به جریان بیفتد.
مکگاورن معتقد است که در تمام تصمیماتمان باید آنچه برای زمین اتفاق میافتد را بهعنوان یک عامل در نظر بگیریم.