DeepONet
آموزش‌های پایه‌ای هوش مصنوعییادگیری عمیق

DeepONet: مدلی که عملگرهای خطی و غیرخطی را تقریب می‌زند

    0

    شبکه‌های عصبی مصنوعی ابزارهای بسیار کارآمدی برای تقریبِ توابع پیوسته هستند؛ توابعی که مقادیرشان به طور ناگهانی تغییر نمی‌یابد. اگرچه مطالعات بسیاری درباره بکارگیری شبکه های عصبی در تقریبِ توابع پیوسته صورت گرفته است، اما قابلیت آنها برای تقریبِ عملگرهای غیرخطی به ندرت بررسی شده است. به تازگی، محققان دانشگاه براون یک مدل جدید مبتنی بر شبکه عصبی تحت عنوان DeepONet ساخته‌اند که می‌تواند عملگرهای خطی و غیرخطی را یاد گیرد. این مدل محاسباتی که در یکی از مقاله‌های منتشر شده در مجله «Nature Machine Intelligence» پوشش داده شده، با الهام از مطالعاتِ گروهی از محققان در دانشگاه فودان طراحی گردیده است.

    DeepONet

    جورج اِم کارنیاداکیس – یکی از محققان دخیل در این پروژه – در گفتگو با TechXplore اظهار داشت: «حدود پنج سال پیش که مشغول تدریس حساب تغییرات بودم، این سوال برایم پیش آمد که آیا شبکه عصبی می‌تواند توابع را تقریب بزند یا خیر. بررسی‌ها و جستجوهایم بی‌حاصل بود؛ تا اینکه بالاخره به مقاله چن (۱۹۹۳) دست یافتم. در این مقاله، محققان با استفاده از یک لایه نورون موفق به تقریب تابع شده بودند. همین محققان مقاله‌ دیگری پیرامون رگرسیون عملگر نوشته بودند که از آن به عنوان نقطه آغاز مطالعه استفاده کردیم. پروفسور چِن با ارسال ایمیلی از بنده به خاطر کشف دوباره‌ی مقاله‌های فراموش‌شده‌اش تشکر کرد.»

    کارنیاداکیس با الهام از مقاله‌های پروفسور چِن تصمیم گرفت احتمال ساخت یک شبکه عصبی را بررسی کند که قادر به تقریبِ عملگرهای خطی و غیرخطی باشد. وی این ایده را با یکی از دانشجویان مقطع دکتری به نام «لو لو» در جریان گذاشت. این دانشجو گام‌های نخست را در ساخت DeepONet برداشت. برخلاف شبکه‌های عصبی مرسوم که توابع را تقریب می‌زنند، DeepONet قابلیت تقریب هر دو عملگر خطی و غیرخطی را دارد. این مدل از دو شبکه عصبی عمیق تشکیل یافته است. یکی از شبکه‌ها فضای تابع ورودی گسسته را کدگذاری می‌کند و دیگری به کدگذاریِ دامنه توابع خروجی می‌پردازد. اساساً، DeepONet  توابع را به عنوان ورودی یا نهاده در نظر می‌گیرد که منظور از آن، اشیایی با ابعاد بی‌نهایت است. DeepONet این ورودی‌ها را به توابع دیگری در فضای خروجی تخصیص می‌دهد.

    DeepONet

    کارنیاداکیس در ادامه خاطرنشان کرد: «تقریب توابع با شبکه‌های عصبی استاندارد میسر شده است. این توابع، نقاط داده را به عنوان نقاط داده ورودی و خروجی در نظر می‌گیرند. بنابراین، DeepONet راهکار کاملاً جدیدی برای بررسی شبکه‌های عصبی عرضه کرده است چرا که شبکه‌های آن می‌توانند همه عملگرهای شناخته‌شده‌ی ریاضی را نشان دهند. همچنین، معادلات دیفرانسیل نیز در فضای خروجی پیوسته به نمایش در می‌آیند.»

    به محض اینکه DeepONet عملگر معینی را یاد گیرد، می‌تواند عملیات را انجام داده و سریع‌تر از سایر شبکه‌های عصبی به پیش‌بینی بپردازد. کارنیاداکیس و همکارانش در چند مورد ارزیابی اولیه به این نتیجه رسیدند که DeepONet می‌تواند در عرض چند ثانیه اقدام به پیش‌بینی کند؛ حتی اگر این پیش‌بینی مربوط به سیستم‌های بسیار پیچیده باشد.

    کارنیاداکیس گفت: «DeepONetمی‌تواند ابزار بسیار مفیدی برای وسایل نقلیه خودران باشد چرا که می‌تواند در زمان واقعی پیش‌بینی نماید. DeepONetمی‌تواند برای شبیه‌سازیِ سیستم سیستم‌ها و سیستم‌های دینامیکی اجتماعی پیچیده نیز به کار برده شود. به دیگر سخن، شبکه‌هایی که ساختیم می‌توانند سیستم‌های پیچیده جعبه سیاه را پس از آموزش آفلاین نمایش دهند.»

    محققان فرمول‌بندی‌های مختلفِ فضای تابع ورودی DeepONet را مورد بررسی قرار داده و تاثیر این فرمول‌بندی‌ها بر خطای تعمیم را در ۱۶ مورد کاربردی مختلف ارزیابی کردند. آنها به یافته‌های بسیار امیدبخشی رسیده‌اند؛ مدل آنان می‌تواند به طور ضمنی انواعی از عملگرهای خطی و غیرخطی را اکتساب کند. DeepONet می‌تواند در آینده کاربردهای گسترده‌ای داشته باشد. برای نمونه، DeepONet می‌تواند بستر مناسبی برای ساخت ربات‌هایی فراهم کند که قادر به حل مسائل حسابان یا معادلات دیفرانسیل باشند. این شبکه می‌تواند در وسایل نقلیه خودران نیز به کار گرفته شود.

    کارنیاداکیس در پایان بیان کرد: «بنده در حال حاضر مشغول همکاری با آزمایشگاه‌های وزارت انرژی و بسیاری از صنایع هستم تا زمینه را برای بکارگیری DeepONetدر فعالیت‌های پیچیده مهیا کنیم.»

    بررسی نظریه تکینگی فناوری: آیا هوش مصنوعی تهدیدی برای بشریت است؟

    مقاله قبلی

    پایتون و نگاهی عمیق به تاریخچه این زبان برنامه‌نویسی

    مقاله بعدی

    شما همچنین ممکن است دوست داشته باشید

    نظرات

    پاسخ دهید

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *