مدل های بنیادی در هوش مصنوعی تغییر پارادایم میدهند
مدل های بنیادی در هوش مصنوعی، بیانگر دستاوردهای بزرگِ هوش مصنوعی هستند؛ آنها وعده یک انقلاب را بهما میدهند. البته نمیتوان با بیگمانی گفت که آینده چه برنامهای برای ما دارد. در ابتدا رشد مدلهای بنیادی خیلی کند بود، ولی امروز با سرعت بیشتری پیشرفتمیکند و رویدادهای بزرگ و مهمی در این زمینه اتفاقمیافتند.
مدل های بنیادی در هوش مصنوعی، تازهترین تحول در یادگیری عمیق هستند. تکنیکی که ده سال قبل همهگیر شد و اکنون فناوریهای دیجیتال را زیر سلطه خود گرفتهاست.
مدل های بنیادی در هوش مصنوعی، نشانمیدهند که سامانههای بزرگ و پیچیده یادگیری عمیق، قابلیتهای تأثیرگذارتر هوش مصنوعی را پدیدار میکند و این رشد مدلهای بنیادی پایانی ندارند. مدلهای بنیادی نشاندهنده شکل جدیدی از هوش خلاقانه غیرانسانی هستند. این مدلها آنقدر پیچیدگی دارند که زبانهای انسانی را بهسادگی میفهمند و نوآوری میآورند. یک هوش ضعیف نمیتواند به کمدی بخندد، ولی مدل های بنیادی در هوش مصنوعی میتوانند توضیحدهند که چرا کمدی خندهآور است.
شاهد رشد مدلهای بنیادی در سال 2022 هستیم
رشد مدلهای بنیادی در سال 2022 بسیار چشمگیر بودهاست. دراینجا منظور از مدل های بنیادی در هوش مصنوعی آن دسته از مدلهایی هستند که روی مقیاسهای بسیاربزرگ آموزشِ عمیق میبینند. یکی از نمونههای نخستین مدلهای بنیادی در چند سال گذشته، مدل «برت»، از گوگل بود که در سال 2018 معرفی شد. بهدنبال رشد مدلهای بنیادی «برت»، شرکت اوپنایآی مدل «جیپیتی3» را در سال 2020 و مدل «دالای» را در سال 2021 وارد بازار کرد.
در سال جاری، رشد مدلهای بنیادی روند بسیار پرسرعتی داشته و به جریان غالب صنایع گوناگون و هوش مصنوعی تبدیل شدهاست. این اتفاقات وامدار قابلیتهای چشمگیر مدل های بنیادی در هوش مصنوعی، مانند «دالای2»، «ایمجن»، «میدجرنی»، «نرمافزار بینایی ماشینِ فلورنس» و «سیستم چندحالتیِ گاتو» از ذهن عمیق بودهاند.
سرعت بالای رشدِ مدلهای بنیادی در این فناوریها و دغدغههای اخلاقی مربوط بهآن، باعثشد تا «مؤسسه هوش مصنوعی انسانمحورِ» مرکز «پژوهش روی مدلهای بنیادی» یا CRFM را تأسیس کند. این گروه همچنین با تدوین گزارشی به نام «فرصتها و ریسکهای ناشی از مدلهای بنیادی» بر پیامدهای متحولکننده این فناوری مُهر تأیید زدهاست.
پرسی لیانگ، استاد علوم کامپیوتر دانشگاه استنفورد و رئیس CRFM در مورد رشد مدل های بنیادی در هوش مصنوعی، توضیح میدهد: «واژه مدلهای بنیادی را برای اولینبار ما بهکار بردیم، چون احساس کردیم این اسم میتواند اهمیت این فناوریها را به خوبی منعکس کند. از آنزمان تاکنون، پیشرفت روزافزون و رشد مدل های بنیادی در هوش مصنوعی ما را بهایننتیجه رسانده است که تصمیمات ما درستبودهاست. با اینحال، علیرغم تمام پیشرفتها، این مدلها لزوم شفافیتِ یکی از چالشهای بزرگ عرصه فناوری را نیز پررنگتر کردهاند.»
وی با تأکید بر این نکته که تشخیص این مدلها و کارکردشان کار آسانی نیست، خاطرنشان میکند سرعت توسعه مدلها به قدری زیاد است که بسیاری از مدلهای بنیادی به کاربرد تجاری درآمدهاند یا بدون اطلاع مردم، مبنای کار سیستمهای دیگر شدهاند.
بههمیندلیل است که لیانگ و همکارانش قصد دارند، اکوسیستم موجود و هرآنچه اتفاق میافتد را ارزیابیکرده و بهثبت برسانند.
مدل های بنیادی در هوش مصنوعی عمومی
بهنظرمیرسد مدل های بنیادی در هوش مصنوعی عمومی و پیشرفت آن نیز تأثیر گذاشتهاند. طبق تعریف مرکز CRFM، مدلهای بنیادی، مدلی هستند که روی دیتاستی بزرگ آموزش ببینند و برای طیف گستردهای از مسائل گوناگون، بهکاربروند. همین گوناگونیِ چالشهای مدلهای بنیادین در هوش مصنوعی عمومی تأثیر بزرگی داشتهاست.
لیانگ دراینباره میگوید: «مدل های بنیادی در هوش مصنوعی به یک قطعه زیرساخت چندکاره و چندمنظوره میمانند، درست برخلاف نسل قبلی مدلها که برای هر کاربرد خاصی، بهصورت سفارشی ساختهمیشدند.»
بهعقیده لیانگ، این تغییر توانسته پارادایم و الگوی ساخت نرمافزارها را متحول کند و آنها را بهسمت هوش مصنوعی عمومی ببرد. وی توضیح میدهد: «اکنون میتوان انواع نرمافزارهای دلخواه را ساخت، نرمافزارهایی که پیشازاین، ساختشان غیرممکن بود یا بهزمان و تلاش فراوان نیاز داشتند.»
ریشی بوماسانی، دانشجوی دکترای علوم کامپیوتر استنفورد، اضافه میکند: «مدل های بنیادی در هوش مصنوعی، همچون DALL-E و GPT-3 فرصتهای جدیدی برای نوآوری در حوزههای مختلف، همچون شیوه تعامل با سیستمها، فراهم میآورند. بهنظر میرسد این مدلها میتوانند مانع ورودی را از میان بردارند؛ بهبیانِ دیگر، بهلطف این مدلها میتوان توضیحات لازم را بهزبانِ طبیعی در اختیار مردم قرار داد و مسیر را برایشان هموار کرد.»
بوماسانی این واقعیت را اتفاقی هیجانانگیز میداند که به سمت هوش مصنوعی عمومی حرکتمیکند و البته ریسکهای بالقوهای نیز بههمراه دارد.
انتشار مدلهای بنیادی، اقدامی سرنوشتساز
طبق توضیحات لیانگ و بوماسانی، چالش اصلی اینجاست که اطلاعات کافی برای ارزیابی اثرگذاری اجتماعی یا بررسی راهکارهای بالقوه برای ریسکهای ناشی از انتشار مدلهای بنیادی (مثل سوگیری احتمالی خروجی مدل) دردست نیست.
درباره مدل های بنیادی در هوش مصنوعی لیانگ ادامه میدهد: «ما سعی داریم اکوسیستم مذکور را بهتصویر بکشیم. در اینراستا، به سؤالاتی مثل اینکه چه دیتاستهایی استفاده شدهاند یا مدلها چطور به کار میروند، میپردازیم. درحالحاضر، سعیداریم با گفتوگو با شرکتها، اطلاعات لازم را در مورد انتشار مدلهای بنیادی جمعآوری کنیم.»
مرکز CRFM در تلاش است تا کاریکند که شرکتها بتوانند جزئیاتِ مربوط به مدل های بنیادی در هوش مصنوعی را با یکدیگر بهاشتراک بگذارند و در عینحال، از منافع و داراییهای خصوصی خود محافظت کنند.
لیانگ باور دارد که مردم از انتشار مدلهای بنیادی خوشحال میشوند، اما اشتراکگذاری بیشازحد هم عواقب منفی درپی خواهدداشت. ازسویدیگر، علیرغم فوایدِ اشتراکگذاری اطلاعات، هیچکس نمیخواهد اولینگام را در این مسیر بردارد.
همین معضلات است که ادامه پیشرفت را با مانع روبرو میکند.
وی اضافه میکند: «حتی ابتداییترین چیزها، مثل امکان انتشار مدل های بنیادی در هوش مصنوعی، میتواند به موضوعی بحثبرانگیز تبدیل شود. امیدوارم جامعه بیشتر در مورد این موضوع گفتمان کند.»
ارزش مدلهای بنیادی در تجارت
پژوهشگران ارزش مدلهای بنیادی را بهخوبی درک میکنند. بههمینخاطر هم داکشی اگراوال، مدیر ارشد فنی گروه هوش مصنوعی IBM گفتهاست: «مدل های بنیادی در هوش مصنوعی الزامات و شرایط موردنیاز برای برچسبگذاری دادهها را بهشدت کاهش دادهاند. بههمیندلیل، این فناوریها را میتوان از آن فرصتهایی دانست که هر دهسال یکبار پیشِروی شرکتها قرار میگیرند.»
در شناخت ارزش مدلهای بنیادی برخی از مواردِ کاربرد، مستلزم دقتی بیشتر از دقت مدلهای معمولی هوش مصنوعی هستند و به گفته اگراوال، مدل های بنیادی در هوش مصنوعی رسیدن به این دقتِ بالا را امکانپذیر میسازند.
مدلهای بنیادی در پردازش زبان طبیعی متولد شدهاند و تاکنون موفق شدهاند این حوزه را متحول و ارزش مدلهای بنیادی را بالا ببرند. نسل چهارم صنعت نیز میتواند در ابعاد گوناگون از مدل های بنیادی در هوش مصنوعی بهرهمند شود. به عنوان مثال، با تکرار دستاوردهای هوش مصنوعی در پردازش زبان و کاربردشان در علم شیمی، میتوان با تکیه بر دادههای موجود از اتمها، مولکولها و خواصشان، زبانِ شیمی را آموخت و انجام مسائلِ گوناگون را امکانپذیر کرد.
اگراوال معتقد است: «حوزههای فراوانی هستند که در آنها، شرکتها بهدنبال استفاده از مدلهای بنیادی هستند. از جمله نمونههای بارز این حوزهها میتوان به ساخت دادههای مصنوعی هایفای یا دستیارهای مکالمهای طبیعیتر اشاره کرد؛ شاید یکسال، یا حتی بیشتر، با این دستاوردها فاصله داشتهباشیم.»
اگراوال خاطرنشان میکند برخی صنایع خاص نسبت به کاربرد و ارزش مدلهای بنیادی زبانی بزرگی که اکنون به صورت عمومی در دسترس هستند، مقاومت نشانمیدهند؛ بههمینخاطر، ضروریاست تا دادههای ورودی این مدلها کنترلشده و قابلاعتماد باشند و خروجی نیز مورد کنترل قرار بگیرد تا عاری از محتوای سوگیرانه و آسیبزا باشد. خروجی مدلها باید با ورودیها و واقعیتهای دنیا نیز همخوانی داشتهباشند و به توهمات و خطاهای شناختی (تفسیری) اجازه ورود ندهد.
اگراوال، بهعنوان مدیرعاملی که مسیر هوش مصنوعی، حرکت شرکتش را کلیدزدهاست، صنایع مذکور را تشویق میکند تا شروع به کاربرد مدل های بنیادی در هوش مصنوعی کنند.
طبق توضیحات وی، بیشتر پروژههای هوش مصنوعی از نظر نسبت «زمان به ارزش» ضعیف هستند؛ اما در مدل های بنیادی در هوش مصنوعی، این نسبت بهشدت کوچک میشود. بههمینخاطر، استفاده از این مدلها به شرکتها کمک میکند تا در زمان و هزینه صرفهجویی کنند. اگراوال به سازمانهایی که مسیر هوش مصنوعی خود را آغاز نکردهاند یا هنوز در مراحل اولیه هستند، پیشنهاد میکند تا مسیرشان را با این نسل از مدل های بنیادی در هوش مصنوعی کلیدبزنند.
آینده مدلهای بنیادی
هرچند که آینده مدلهای بنیادی هنوز کاملاً مشخص نیست، ولی اگراوال معتقد است که با گذر زمان و به لطف سختافزارها و نرمافزارهایی که مختص آموزشِ کارآمدترِ مدل های بنیادی در هوش مصنوعی هستند، هزینه و انرژی موردنیاز برای کاربرد آنها در جاهای گوناگون بهمیزان قابل ملاحظهای کاهش مییابد و همین آینده مدلهای بنیادی را روشن و درخشان میکند.
لیانگ در آخر اضافه میکند: «آینده مدلهای بنیادی بسیار درخشان است و این مدل های بنیادی در هوش مصنوعی، قابلیت تحول دنیا را دارند؛ البته برای تحقق قابلیتهایشان باید رویکردی متوازن و هدفمند در پیشگرفت. نباید اجازه بدهیم تا همهگیری روبهرشد این روزها گمراهمان کند. باید امیدوار باشیم تا طی یکسال برای آینده مدلهای بنیادی، دستکم از نظر قابلیت اتخاذ تصمیمات آگاهانه یا انجام اقدامات آگاهانه، نسبت به امروز پیشرفتکردهباشیم.»
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید