DeepONet: مدلی که عملگرهای خطی و غیرخطی را تقریب میزند
شبکههای عصبی مصنوعی ابزارهای بسیار کارآمدی برای تقریبِ توابع پیوسته هستند؛ توابعی که مقادیرشان به طور ناگهانی تغییر نمییابد. اگرچه مطالعات بسیاری درباره بکارگیری شبکه های عصبی در تقریبِ توابع پیوسته صورت گرفته است، اما قابلیت آنها برای تقریبِ عملگرهای غیرخطی به ندرت بررسی شده است. به تازگی، محققان دانشگاه براون یک مدل جدید مبتنی بر شبکه عصبی تحت عنوان DeepONet ساختهاند که میتواند عملگرهای خطی و غیرخطی را یاد گیرد. این مدل محاسباتی که در یکی از مقالههای منتشر شده در مجله «Nature Machine Intelligence» پوشش داده شده، با الهام از مطالعاتِ گروهی از محققان در دانشگاه فودان طراحی گردیده است.
جورج اِم کارنیاداکیس – یکی از محققان دخیل در این پروژه – در گفتگو با TechXplore اظهار داشت: «حدود پنج سال پیش که مشغول تدریس حساب تغییرات بودم، این سوال برایم پیش آمد که آیا شبکه عصبی میتواند توابع را تقریب بزند یا خیر. بررسیها و جستجوهایم بیحاصل بود؛ تا اینکه بالاخره به مقاله چن (1993) دست یافتم. در این مقاله، محققان با استفاده از یک لایه نورون موفق به تقریب تابع شده بودند. همین محققان مقاله دیگری پیرامون رگرسیون عملگر نوشته بودند که از آن به عنوان نقطه آغاز مطالعه استفاده کردیم. پروفسور چِن با ارسال ایمیلی از بنده به خاطر کشف دوبارهی مقالههای فراموششدهاش تشکر کرد.»
احتمال ساخت یک شبکه عصبی
کارنیاداکیس با الهام از مقالههای پروفسور چِن تصمیم گرفت احتمال ساخت یک شبکه عصبی را بررسی کند که قادر به تقریبِ عملگرهای خطی و غیرخطی باشد. وی این ایده را با یکی از دانشجویان مقطع دکتری به نام «لو لو» در جریان گذاشت. این دانشجو گامهای نخست را در ساخت DeepONet برداشت. برخلاف شبکههای عصبی مرسوم که توابع را تقریب میزنند، DeepONet قابلیت تقریب هر دو عملگر خطی و غیرخطی را دارد. این مدل از دو شبکه عصبی عمیق تشکیل یافته است. یکی از شبکهها فضای تابع ورودی گسسته را کدگذاری میکند و دیگری به کدگذاریِ دامنه توابع خروجی میپردازد. اساساً، DeepONet توابع را به عنوان ورودی یا نهاده در نظر میگیرد که منظور از آن، اشیایی با ابعاد بینهایت است. DeepONet این ورودیها را به توابع دیگری در فضای خروجی تخصیص میدهد.
کارنیاداکیس در ادامه خاطرنشان کرد: «تقریب توابع با شبکههای عصبی استاندارد میسر شده است. این توابع، نقاط داده را به عنوان نقاط داده ورودی و خروجی در نظر میگیرند. بنابراین، DeepONet راهکار کاملاً جدیدی برای بررسی شبکههای عصبی عرضه کرده است چرا که شبکههای آن میتوانند همه عملگرهای شناختهشدهی ریاضی را نشان دهند. همچنین، معادلات دیفرانسیل نیز در فضای خروجی پیوسته به نمایش در میآیند.»
اقدام به پیشبینی
به محض اینکه DeepONet عملگر معینی را یاد گیرد، میتواند عملیات را انجام داده و سریعتر از سایر شبکههای عصبی به پیشبینی بپردازد. کارنیاداکیس و همکارانش در چند مورد ارزیابی اولیه به این نتیجه رسیدند که DeepONet میتواند در عرض چند ثانیه اقدام به پیشبینی کند؛ حتی اگر این پیشبینی مربوط به سیستمهای بسیار پیچیده باشد.
کارنیاداکیس گفت: «DeepONetمیتواند ابزار بسیار مفیدی برای وسایل نقلیه خودران باشد چرا که میتواند در زمان واقعی پیشبینی نماید. DeepONetمیتواند برای شبیهسازیِ سیستم سیستمها و سیستمهای دینامیکی اجتماعی پیچیده نیز به کار برده شود. به دیگر سخن، شبکههایی که ساختیم میتوانند سیستمهای پیچیده جعبه سیاه را پس از آموزش آفلاین نمایش دهند.»
محققان فرمولبندیهای مختلفِ فضای تابع ورودی DeepONet را مورد بررسی قرار داده و تاثیر این فرمولبندیها بر خطای تعمیم را در 16 مورد کاربردی مختلف ارزیابی کردند. آنها به یافتههای بسیار امیدبخشی رسیدهاند؛ مدل آنان میتواند به طور ضمنی انواعی از عملگرهای خطی و غیرخطی را اکتساب کند. DeepONet میتواند در آینده کاربردهای گستردهای داشته باشد. برای نمونه، DeepONet میتواند بستر مناسبی برای ساخت رباتهایی فراهم کند که قادر به حل مسائل حسابان یا معادلات دیفرانسیل باشند. این شبکه میتواند در وسایل نقلیه خودران نیز به کار گرفته شود.
کارنیاداکیس در پایان بیان کرد: «بنده در حال حاضر مشغول همکاری با آزمایشگاههای وزارت انرژی و بسیاری از صنایع هستم تا زمینه را برای بکارگیری DeepONetدر فعالیتهای پیچیده مهیا کنیم.»