دانشمند هوش مصنوعی
آیا ما به یک «اکوسیستم علمی کاملاً مبتنی بر هوش مصنوعی» نیاز داریم؟
اکتشاف علمی یکی از پیچیدهترین فعالیتهای انسانی است. ابتدا، دانشمندان باید دانش موجود را درک کرده و شکاف چشمگیری را در بین دانستهها بشر شناسایی کنند. سپس، باید پرسشی پژوهشی طرح و آزمایشی برای یافتن پاسخ طراحی و انجام دهند. سپس، باید نتایج آزمایش را تحلیل و تفسیر کنند که ممکن است پرسشهای تحقیقاتی دیگری را مطرح کند.
خودکار شدن علم
آیا چنین فرآیندی پیچیده میتواند خودکار شود؟ هفتۀ گذشته، آزمایشگاه Sakana AI اعلام کرد که «دانشمند هوش مصنوعی» ساخته است؛ سیستم هوش مصنوعی ای که ادعا میکند میتواند به طور کاملاً خودکار، اکتشافات علمی در زمینۀ یادگیری ماشین را انجام دهد.
این سیستم با استفاده از مدلهای زبانی بزرگ (LLM) مانند مدلهای پشت ChatGPT و سایر چتباتهای هوش مصنوعی، میتواند ایدهپردازی کند، ایدۀ امیدوارکننده را انتخاب کند، الگوریتمهای جدید را کدنویسی کند، نتایج را ترسیم کند و مقالهای را برای خلاصهسازی آزمایشها و یافتههای آن، همراه با منابع، بنویسد. Sakana ادعا میکند که این ابزار هوش مصنوعی میتواند چرخه کامل آزمایش علمی را با هزینۀ تنها 15 دلار آمریکا برای هر مقاله انجام دهد، در واقع کمتر از هزینۀ ناهار یک دانشمند.
این ادعاها بسیار بزرگ و مهم هستند. آیا واقعاً میتوان به آنها اعتماد کرد؟ و حتی اگر چنین باشد، آیا ارتشی از دانشمندان هوش مصنوعی که با سرعت غیرانسانی مقالات تحقیقاتی تولید میکنند، واقعاً خبر خوبی برای علم خواهد بود؟
چگونه یک کامپیوتر میتواند «علم تولید کند»
بخش زیادی از علم در فضای باز انجام میشود و تقریباً همۀ دانش علمی جایی نوشتهشده است (یا ما راهی برای دانستن آن خواهیم داشت). میلیونها مقاله علمی رایگان در مخازنی مانند arXiv و PubMed در دسترس هستند.
LLM های آموزشدادهشده با این دادهها، قادرند زبان علم و الگوهای آن را درک میکنند. بنابراین شاید اصلاً تعجبآور نباشد که یک LLM بتواند چیزی تولید کند که شبیه یک مقالۀ علمی خوب باشد.
آنچه کمتر مشخص است، این است که آیا سیستم هوش مصنوعی میتواند مقالۀ علمی جالب تولید کند؟ چیزی که میدانیم این است که ضرورتاً، علم خوب به نوآوری نیاز دارد.
اما آیا این مقالات جالبتوجه هستند؟
دانشمندان نمیخواهند درمورد چیزهایی که از قبل شناخته شدهاند، مطلع شوند. در عوض، آنها میخواهند چیزهای جدید یاد بگیرند، بهویژه چیزهای جدیدی که به طور چشمگیری با آنچه قبلاً شناختهشده است، متفاوت است. این نیاز به قضاوت دربارۀ دامنۀ مقاله و ارزش آن نیاز دارد.
سیستم Sakana سعی میکند جذابیت را از دو طریق مورد بررسی قرار دهد. اول اینکه به ایدههای مقاله جدید، بر اساس شباهت به پژوهشهای موجود (فهرستبندی شده در مخزن Semantic Scholar) امتیاز میدهد. هر چیزی که بیش از حد شبیه باشد، کنار گذاشته میشود.
دوم اینکه سیستم Sakana یک مرحلۀ «داوری همتا» را معرفی میکند، با استفاده از یک LLM دیگر برای قضاوت دربارۀ کیفیت و تازگی مقاله تولیدشده. باز هم نمونههای زیادی از داوری همتا در سایتهایی مانند openreview.net وجود دارد که میتواند نحوه نقد یک مقاله را راهنمایی کند. LLMها این موارد را نیز دریافت کردهاند.
هوش مصنوعی ممکن است قاضی ضعیفی برای خروجی هوش مصنوعی باشد
بازخورد دربارۀ خروجیهای Sakana AI متفاوت است. برخی کار آن را بهعنوان تولید «زبالۀ علمی بیپایان» توصیف کردهاند.
حتی بررسی خود سیستم از خروجیهایش، مقالات را در بهترین حالت ضعیف ارزیابی میکند. این احتمالاً با پیشرفت فناوری بهبود خواهد یافت؛ اما سؤال دربارۀ ارزشمندبودن مقالات علمی خودکار باقی خواهد ماند. توانایی LLMها در قضاوت دربارۀ کیفیت پژوهش نیز سؤالی بیپاسخ است. یک تحقیق نشان میدهد که LLMها در قضاوت دربارۀ خطر تعصب در مطالعات تحقیقات پزشکی عالی نیستند؛ هرچند این نیز ممکن است باگذشت زمان بهبود یابد.
سیستم Sakana اکتشافات را در تحقیقات محاسباتی خودکار میکند که بسیار آسانتر از سایر پژوهشهای علمی است که به آزمایشهای فیزیکی نیاز دارند. آزمایشهای Sakana با کد انجام میشود که همچنین متنی ساختاریافته است که LLMها میتوانند برای تولید آن آموزش ببینند.
ابزارهای هوش مصنوعی برای حمایت از دانشمندان، نه جایگزینی آنها
محققان هوش مصنوعی دههها است که درحالتوسعه سیستمهایی برای حمایت از علم هستند. با توجه به حجم عظیم پژوهشهای منتشرشده، حتی یافتن نشریات مرتبط با یک پرسش علمی خاص میتواند چالشبرانگیز باشد.
ابزارهای جستوجوی تخصصی از هوش مصنوعی برای کمک به دانشمندان در یافتن و ترکیب کارهای موجود استفاده میکنند. این ابزارها شامل Semantic Scholar ذکر شده در بالا، و همچنین سیستمهای جدیدتر مانند Elicit، Research Rabbit، scite و Consensus هستند.
ابزارهای استخراج متن، مانند PubTator، عمیقتر در مقالات حفاری میکنند تا نکات کلیدی، مانند جهشهای ژنتیکی خاص و بیماریها و روابط تثبیتشدۀ آنها را شناسایی کنند. این امر بهویژه برای نگهداری و سازماندهی اطلاعات علمی مفید است.
از یادگیری ماشین نیز برای پشتیبانی از سنتز و تحلیل شواهد پزشکی، در ابزارهایی مانند Robot Reviewer استفادهشده است. خلاصههایی که ادعاها را در مقالات Scholarcy مقایسه و تضاد میکنند، به انجام بررسیهای ادبی کمک میکنند. تمام این ابزارها باهدف کمک به دانشمندان برای انجام کارهای خود به طور مؤثرتر، نه جایگزینکردن آنها، طراحی شدهاند.
تحقیقات هوش مصنوعی ممکن است مشکلات موجود را تشدید کند
درحالیکه Sakana AI بیان میکند که نقش دانشمندان انسانی را در حال کاهش نمیبیند، چشمانداز این شرکت از «اکوسیستم علمی کاملاً مبتنی بر هوش مصنوعی» پیامدهای بزرگی برای علم خواهد داشت.
یکی از نگرانیها این است که اگر مقالات تولیدشده توسط هوش مصنوعی، ادبیات علمی را پر کنند، ممکن است سیستمهای هوش مصنوعی آینده روی خروجی هوش مصنوعی آموزش داده شوند و دچار فروپاشی مدل شوند. این بدان معناست که ممکن است آنها در نوآوری روزبهروز بیاثرتر شوند. بااینحال، پیامدها برای علم فراتر از تأثیرات بر خود سیستمهای علمی هوش مصنوعی است.
در حال حاضر، بازیگران بدی در علم وجود دارند، از جمله «کارخانههای مقاله» که مقالههای جعلی تولید میکنند. این مشکل فقط با تولید یک مقالۀ علمی با 15 دلار آمریکا و یک دستور (پرامپت) ابتدایی مبهم، بدتر خواهد شد.
نیاز به بررسی خطاها در کوهی از تحقیقات تولیدشده به طور خودکار، میتواند بهسرعت ظرفیت دانشمندان واقعی را تحتتأثیر قرار دهد. سیستم داوری همتا به طور چشمگیری از قبل خراب است و ریختن تحقیقات بیشتر باکیفیت مشکوک در این سیستم، آن را اصلاح نخواهد کرد.
علم اساساً بر پایۀ اعتماد است. دانشمندان بر تمامیت فرآیند علمی تأکید میکنند تا بتوانیم مطمئن باشیم درک ما از جهان (و اکنون ماشینهای جهان) معتبر و در حال بهبود است. یک اکوسیستم علمی که در آن سیستمهای هوش مصنوعی نقش اصلی ایفا میکنند، سؤالات اساسی دربارۀ معنی و ارزش این فرآیند و میزان اعتمادی که باید به دانشمندان هوش مصنوعی داشته باشیم، مطرح میکند. آیا این همان نوع اکوسیستم علمی است که میخواهیم؟