ویژهنامه هوش مصنوعی ساینتیفیک امریکن
مسابقه رمزگشایی یک طومار باستانی
چگونه دانشمندان، دانشجویان، گیمرها و سیلیکون ولی یک معمای باستانی به قدمت چند قرن را حل کردند و دانش پاپیروسشناسی را برای همیشه تغییر دادند.
در یک شنبهشب گرم در پایان آگوست ۲۰۲۳، «لوک فریتور» (Luke Farritor) که آن زمان دانشجوی کارشناسی در دانشگاه نبراسکا بود، در گوشهای در یک مهمانی خانگی در اوهاما تنها نشسته بود که آیفونش زنگ خورد. موسیقی با صدای بلند پخش میشد و فریتور که آن زمان ۲۱ساله چهرهای پسرانه و عینکی مستطیلی و مشکی داشت، در میان دانشجویان دیگری که مینوشیدند و معاشرت میکردند بود. او پیام را باز کرد. پیام از طرف «بن کایلز» (Ben Kyles) یک دانشمند کامپیوتر و پیانیست ۴۰ و اندی ساله از بریتیش کلمبیا بود. فریتور، کایلز را با نام «Hari Seldon»، آواتار آنلاین او که به نام شخصیتی در مجموعه «بنیاد» آیزاک آسیموف بود، میشناخت. کایلز یک خبری داشت. او بهتازگی باز کردن دیجیتالی برخی اسکنهای با وضوح بالا از پاپیروس کربنیزه شده را به پایان رسانده بود. او گفت تصاویر را در یک سرور مشترک آپلود کرده است و فریتور پاسخ داد: «رفیق، این عالیه. خیلی زود اجراش میکنم.»
پاپیروس کایلز متعلق به «هرکولانیوم» (Herculaneum) بود، یک شهر باستانی رومی در خلیج ناپل در دامنه کوه «وزوو» (Vesuvius) که خانه تنها کتابخانه حفظشده از دوران باستان کلاسیک است. این مجموعه پاپیروسها که تاکنون حدود ۱۸۰۰ طومار و قطعه عمدتاً ناخوانا از آن استخراج شده است؛ در همان فوران آتشفشانی که شهر «پمپئی» (Pompeii) را در سال ۷۹ میلادی نابود کرد، زیر ۶۰ فوت (حدود ۱۸ متر) از موادی که توسط جریانهای آذرآواری (Pyroclastic) در دماهای بالاتر از ۹۰۰ درجه فارنهایت (۴۸۲ درجه سانتیگراد) نهشته شده بود، دفن شده بود. بدون اکسیژن کافی برای سوختن، طومارها پخته و تبدیل به زغال شدند. موهبتی که به آنها اجازه داد به گنجینه کوچک پاپیروسهایی بپیوندند که توانستهاند از دوران باستان دوام بیاورند که همگی بهنوعی از رطوبت محافظت شدهاند؛ چه آنهایی که در شنهای مصر مدفون شده باشند و چه توسط آتش نیمسوز شده باشند. اما این همچنین بدان معناست که آنها نمیتوانند بدون تبدیلشدن به گردوغبار باز شوند.
فریتور که اکثر شبهای شش ماه گذشته را تا دیروقت بیدار بود و تلاش میکرد طومارها را رمزگشایی کند، با استفاده از موبایل خود از راه دور به کامپیوتر دسکتاپش در اتاق خوابگاهش در لینکلن بهاندازه که یک ساعت رانندگی فاصله داشت، وصل شد. او قطعه پاپیروس جدید کایلز را روی سرور پیدا کرد و بلافاصله آن را بهعنوان خوراک ورودی به آشکارساز مبتنی بر هوش مصنوعی که طی چند هفته گذشته مشغول ساختش بود داد. این آشکارساز برنامهریزی شده بود تا جوهر و بنابراین حروف و کلمات را پیدا کند. او برنامه را اجرا کرد تا کارش را انجام دهد و گوشیاش را کنار گذاشت. بهعنوان «راننده تعیینشده» (کسی که قرار بود رانندگی کند و نباید الکل مینوشید) منتظر ماند تا مهمانی تمام شود تا بتواند دوستانش را به خوابگاههایشان برگرداند.
برای چهار قرن، راهبان، شاهزادگان، پاپیروسشناسان، باستانشناسان، کلاسیکگراها و دانشمندان کامپیوتر چنین تلاشهایی کرده بودند؛ اما نتیجه چندانی نگرفتند تا هرگونه حروف یا کلماتی را در داخل طومارها که شبیه ساندویچ بوریتو قهوهرنگ کوچک و وارفته هستند را بدون نابودکردن آنها در این فرایند شناسایی کنند. همانطور که کلاسیکگراها و پاپیروسشناسان مدتها آرزویش را داشتهاند؛ اگر بتوانیم آنها را بخوانیم ممکن است آثار گمشدهای از ادبیات یا فلسفه کلاسیک یا سوابق تاریخ و علم را کشف کنیم. شاید آنها حاوی سوگنامههایی از «سوفوکل» یا «آیسخولوس» یا نوشتههای گمشده «لیوی» باشند. «دیوید بلانک» (David Blank) استاد مطالعات کلاسیک دانشگاه لسآنجلس میگوید: «احتمالات بسیار زیاد هستند.»

تقریباً تمام ادبیات کلاسیک از طریق راهبان قرونوسطایی به دست ما رسیده است که در آنچه تصمیم به بازنویسیاش میگرفتند، گزینشی عمل میکردند. در نتیجه، مقدار نسبتاً کمی نوشته «اصلی» از دوران باستان وجود دارد که به این معنی است که ادبیات کلاسیک از دیدگاه ما، چشماندازی است که از طریق سوراخ سوزن دیده میشود. ما هفت نمایشنامه از آیسخولوس داریم، اما میدانیم که این تراژدینویس حداقل ۱۰ برابر بیشتر از آن نوشته است. پاپیروسهای حفظشده در هرکولانیوم بهترین شانس ما برای نجات این دست آثار گمشده هستند و برخی متخصصان کلاسیکگرا گمان میکنند که حتی متون بیشتری میتواند در مناطقی که هنوز حفاری نشدهاند، باقیمانده باشد. «آنالیزا مارزانو» (Annalisa Marzano) استاد باستانشناسی کلاسیک دانشگاه بولونیا و متولی انجمنFriends of Herculaneum میگوید: «چه کسی میداند آنجا چه چیزی هست؟» علاوه بر آثاری از بزرگان مانند شاعرانی مثل «ویرجیل» و «هوراس»؛ همچنین احتمال وسوسهانگیز یافتن نوشتههایی از نویسندگانی وجود دارد که مارزانو میگوید «ما مطلقاً هیچچیز دربارهشان نمیدانیم.»
فریتور پس از رساندن دوستانش، بیرون خوابگاهش پارک کرد و درحالیکه به سمت ساختمانش میرفت، گوشیاش را از جیبش بیرون آورد. قفل صفحه را باز کرد. ایستاد. گفت: « Holy cow»؛ هوش مصنوعی خروجی داده بود.
روی صفحه گوشی، در برابر بافت متقاطع خاکستری پاپیروس بافتهشده، سه حرف یونانی کوچک سیاه «پی» (π)، «امیکرون» (ο) و «رو» (ρ) در توالی واضح «πορ» قرار گرفته بودند و هرچند تار؛ اما انکارنشدنی بودند.
اولین کسی که در تقریباً ۲۰۰۰ سال گذشته آن حروف را دید؛ اواخر یک شب تابستانی در پارکینگی در لینکلن پس از نجات آنها از یک فوران باستانی، نگاهی به آنها انداخت. وقتی صحبت کردیم، به من گفت: «من وحشتزده شدم.» او اسکرینشاتی برای مادرش فرستاد. شروع خیرهکنندهای بود. اما فریتور فکر کرد، کلمهای که حاوی آن حروف است چیست؟ و کدام کتاب گمشده آن کلمه را در خود جایداده است؟
همانطور که صنعت هوش مصنوعی در بهار ۲۰۲۳ با انتشار GPT-4 منفجر شد، نگرانی درباره هوش مصنوعی ابرهوشمند (Superintelligent AI) نیز افزایش یافت. بسیاری از توسعهدهندگان و متفکران «بدبین» در سیلیکونولی و فراتر از آن هشدار میدهند که یک سیستم ممکن است روزی تصمیم بگیرد تمدن ما را با نیروی چندین وزوو به خاک و آوار تبدیل کند. این نگرانی باعث میشود که تصمیم صدها رمزگشای آماتور برای صرف وقت خود جهت ساختن هوش مصنوعی به امید دیدن نوشتههای هرگز دیدهنشدهای که در شهری پیدا شده که در پی یک فاجعه وحشتناک منقرض شد؛ تحتتأثیر قرار بگیرد.
«چالش وزوو» (The Vesuvius Challenge) که آن هم در سال ۲۰۲۳ راهاندازی شد، رقابتی برای نجات دانش موجود در این طومارهاست. برای «آرون وین» (Ahron Wayne) مهندس سیتیاسکن صنعتی در میشیگان که در این چالش شرکت کرده است؛ این مأموریت به گفته او «نزدیکترین چیزی است که میتوانید به یک بازی ویدئویی پیدا کنید.»
در مسابقه سال ۲۰۲۳، هیچیک از رقبای قدرتمند هیچ تخصصی در مطالعات کلاسیک نداشتند. اکثر آنها فقط علاقهای گذرا به دنیای باستان و دانش بسیار کمی از آن داشتند. اکثر آنها نه لاتین صحبت میکردند و نه یونانی. البته این یک مشکل فنی بود که توجه آنها را جلب کرد. برای چالش وزوو نیز جایزه جمعی بیش از ۱ میلیوندلاری از سوی برخی از قدرتمندترین بازیگران سیلیکونولی اهدا شد.
این مسابقه ایده درخشان «نت فریدمن» (Nat Friedman) سرمایهگذار منطقه خلیج سانفرانسیسکو بود که تا سال ۲۰۲۱، نیز مدیرعامل GitHub، پلتفرم توسعه نرمافزار متنباز مایکروسافت بود. او همراه با «دنیل گراس» (Daniel Gross) شریک سرمایهگذاری دیرینهاش از اولین تأمینکنندگان مالی هوش مصنوعی امروزی بودند. در دهه ۲۰۱۰ فریدمن و گراس برای پژوهشگران یادگیری ماشین چک مینوشتند و بعداً وقتی این حوزه منفجر شد؛ شروع به تأمین مالی شرکتهای هوش مصنوعی کردند. این دو نفر برای آموزش مدلهای هوش مصنوعی که روی آنها شرط بستهاند، تعداد تراشههای هوش مصنوعی انویدیا بیشتری نسبت به اکثر کشورها در اختیار دارند. شاید شنیده باشید که میلیاردرهای فناوری قصد دارند شهری آرمانی را از صفر در زمینهای کشاورزی شمال سانفرانسیسکو بسازند؛ فریدمن پولش را در آن پروژه هم کاشته است. بااینحال، در بهار ۲۰۲۰، درحالیکه بخش زیادی از جهان در قرنطینه بود، فریدمن صرفاً امیدوار بود ذهنش را از کرونا دور کند.
فریدمن که در خانهاش در سانفرانسیسکو قرنطینه شده بود و بهتازگی مجذوب روم باستان شده بود و مقالات ویکیپدیا را درباره بلایا و مصیبتهای باستانی میخواند. او فهمید که در سال ۱۷۰۹، کارگران در شهر «رزینا» (Resina) در نزدیکی ناپل در حال حفر چاه بودند. در حدود ۶۰ فوت (۱۸ متر) پایینتر بیلهای آنها به بقایای یک تئاتر عظیم برخورد کرد. این ساختمان که ۲۵۰۰ نفر ظرفیت داشت، پر از مجسمههای اسب و نجیبزادگان بود. آنها باید مبهوت شده باشند. وجود هرکولانیوم، یک شهر باستانی در زیر پایشان برای مدتها پیش از حافظه جمعی پاک شده بود.
در طول چند دهه بعدی، یک تعداد زیادی مهندسان نظامی که تشنه آثار هنری باستانی برای تزیین ویلاهای خود بودند، دستور حفر تونلهای زیرزمینی را دادند که از تئاتر منشعب میشد. این فعالیت باعث آسیب شدید به آن شد. در آن زمان روشهای باستانشناسی مبتنی بر حفاظت هنوز توسعه نیافته بود و به تعبیر «یوهان یواخیم وینکلمن» (Johann Joachim Winckelmann) مورخ هنر قرن هجدهم، «یک مهندس نظامی اسپانیایی همانقدر از آثار باستانی میدانست که ماه از خرچنگها میداند.»
در سال ۱۷۵۰ «کارل وبر» (Karl Weber) مهندس سوئیسی با دنبالکردن یک دیوار زیرزمینی، ویلایی مجلل را کشف کرد. این ملک رو به اقیانوس احتمالاً زمانی متعلق به پدرزن ژولیوس سزار، «لوسیوس کالپورنیوس پیسو کایسونینوس» (Lucius Calpurnius Piso Caesoninus) بوده است. در گوشهای از ساختمان، کارگران تودهای از استوانههای سیاه و بدشکل به ارتفاع چند اینچ پیدا کردند. ابتدا تصور میشد این اشیا چوب کربنیزه شده هستند و برخی دور انداخته شدند تا اینکه وبر متوجه شد این اتاق در اصل کتابخانه است. کارگران بیش از ۱۰۰۰ طومار و قطعه پاپیروس را خارج کردند که در یک موزه محلی قرار داده شد.
پاپیروسهای بهجامانده از هرکولانیوم بهترین فرصت ما برای نجات آثار گمشده هستند.
وسوسه یافتن یک اثر ناشناخته ادبیات در این گنجینه، بخش زیادی از اروپا را مجذوب کرد و آزمایشگران رویکردهای مختلفی را برای خواندن پاپیروسها امتحان کردند. یک متصدی موزه با چاقو چند طومار را بهصورت عمودی برش داد و لایهها را تراشید. این روش وحشیانه برخی متون خوانا را آشکار کرد، اما طومارها را نابود کرد. یک شاهزاده ایتالیایی که بهتازگی شنلی ضدآب برای پادشاه آینده اسپانیا اختراع کرده بود؛ چند طومار را در جیوه غوطهور کرد به امید اینکه فلز مایع صفحات را از هم جدا کند که این کار آنها را نابود کرد. دیگران سعی کردند آنها را در معرض یک «گاز گیاهی» بدبو قرار دهند یا طومارها را در گلاب غرق کنند.
در سال ۱۷۵۳ «آنتونیو پیاجو» (Antonio Piaggio) راهبی که بر نسخههای خطی باستانی در کتابخانه واتیکان نظارت داشت از رم فراخوانده شد. پس از رسیدن به ناپل، او ماشینی برای باز کردن تدریجی پاپیروس اختراع کرد که نخهای ابریشمی را به لبه صفحات متصل میکرد و لایهها را بهآرامی با سرعتی شاید یکدهم اینچ (حدوداً ۲۵ میلیمتر) در روز از هم جدا میکرد. پیاجو با این روش موفقیتهایی داشت و توانست آثاری از «فیلودموس» را آشکار کند، کسی که به ویرجیل آموزش داده بود و یکی از فیلسوفان اپیکوری یونانی بود که معتقد بودند اتمهایی که در خلأ منحرف میشوند و با هم برخورد میکنند، جهان را ایجاد کردهاند. اما رویکرد پیاجو همانقدر که کند بود، مخرب هم بود. به نظر میرسید خواندن بیش از ۳۳۰ طومار بازنشده بدون آسیبرساندن به آنها غیرممکن باشد.
چند قرن بعد، فریدمن درباره برخی پیشرفتهای اخیر مطالعه کرد. گروهی در دانشگاه کنتاکی به مدیریت «برنت سیلز» (Brent Seales)استاد علوم کامپیوتر، به نظر میرسید در آستانه موفقیت باشند. در سال ۲۰۱۹ تیم سیلز ترتیب انتقال دو طومار کامل را در محفظههای سفارشی، همراه با چهار قطعه جداشده، به Diamond Light Source، یک شتابدهنده ذرات سنکروترون درOxfordshire دادند. با استفاده از فوتونهای پرانرژی سنکروترون، سیلز و تیمش میکروسیتیاسکنهایی از پاپیروسها با وضوح هشت میکرون؛ یعنی تقریباً بهاندازه قطر یک گلبول قرمز خون گرفتند.
برنامه سیلز این بود که اسکنهای سنکروترون را وارد یک برنامه کامپیوتری با طراحی سفارشی کند تا هر لایه پاپیروس را بهصورت مجازی به امید آشکارکردن جوهر روی سطوح رندر شده باز کند. اما جوهر مبتنی بر کربن که روی طومارها استفاده شده بود، چگالی رادیویی مشابه پاپیروس داشت و این بدان معنا بود که کنتراست (تضاد) کافی برای اینکه جوهر در اسکنها نشان داده شود، وجود نداشت.

برای دورزدن این مشکل، تیم سیلز یک مدل یادگیری ماشین ساخت که روی نسخههای خطی نوشتهشده با جوهر کربن آموزش دیده بود. یک مدل هوش مصنوعی موفق تشخیص جوهر شاید میتوانست سپس روی سطوح بهصورت مجازی بازشده طومارها اعمال شود.
وقتی فریدمن درباره این تلاش خواند، ایدهای به ذهنش رسید: شاید جامعه هوش مصنوعی سیلیکونولی یا با سرمایهگذاری در پروژه یا با ارائه تخصص خود بتواند کمک کند. در سال ۲۰۲۲ فریدمن، سیلز را به Frontier Camp؛ گردهمایی انحصاری و محرمانهای (هیچ حضور آنلاینی ندارد) که فریدمن یکی از سازماندهندگان آن است و در جنگلهای دورافتاده کالیفرنیای شمالی برگزار میشود؛ دعوت کرد. جایی که در حدود ۲۰۰ بنیانگذار و مدیرعامل منتخب گلچینشده از فناوران هر سال چند شب را در سرما کمپ میزنند تا ایدههای خود را ردوبدل کنند.
سیلز ایمیل را نادیده گرفت. او نام فریدمن را شنیده بود؛ اما باور نمیکرد مکاتبه واقعی باشد. بااینحال فریدمن سرسخت بود و در اکتبر ۲۰۲۲ سیلز به محل کمپ تابستانی ساده در جنگلRedwood در سونوما رسید. سیلز آن شب در یکی از ساختمانهای چوبی بیرونی کمپ برای گروهی از مهندسان یادگیری ماشین سخنرانی کرد.
زمانی که سیلز هنوز در حال صحبت بود، فریدمن به گراس گفت: «ما این را در ساعت آینده حل خواهیم کرد.» اما نکردند و وقتی رویداد تمام شد، فریدمن و گراس نگران بودند که سیلز دستخالی به کنتاکی بازگردد. آن شب فریدمن پیشنهاد داد که به جای آن یک مسابقه آزاد ترتیب دهند و به سیلز گفت: «ما مقداری پول برایش میگذاریم.»
سیلز به خانه پرواز کرد تا درباره این ایده با سایر اعضای آزمایشگاهش بحث کند. «استیون پارسونز» (Stephen Parsons) پژوهشگر بازسازی دیجیتال که در حال تکمیل پایاننامه دکتری خود درباره کار آزمایشگاهی بود گفت: «ما نمیخواهیم احمق باشیم و صرفاً تمام این کاری که انجام دادهایم را از دست بدهیم.» درعینحال، آنها ایدههای بیشتری از آنچه خودشان به طور منطقی میتوانستند امتحان کنند، داشتند. هرچه تعداد افراد بیشتری با این مشکل دستوپنجه نرم میکردند، احتمال خواندهشدن طومارها را بیشتر میکرد که هدف نهایی آنها بود. موضوع حل شد. آنها پروژه را به روی جهان باز میکردند. فریدمن تلاش میکرد اشتیاقش را مهار کند. او در توییتر (X کنونی) نوشت: «کارکردن روی یک پروژه جانبی بسیار هیجانانگیز و عجیبوغریب جدید؛ چیز شبیه رؤیایی مادامالعمر.»
گروه با همراهی فریدمن ساختار مسابقه را طراحی کردند. مراحلی از جوایز مستقل برای چالشهای مختلف وجود داشت؛ از جمله تشخیص جوهر، یافتن اولین حروف در طومارها و ساختن نرمافزار متنباز کاربردی. مهلت ارسال آثار برای جایزه بزرگ؛ یعنی برای شناسایی چهار قطعه جداگانه با حداقل ۱۴۰ کاراکتر، ۳۱ دسامبر ۲۰۲۳ تعیین شد. فریدمن در روز «نیمه ماه مارس» یعنی روزی که مسابقه راهاندازی شد که از قضا یک روز پس از انتشار GPT-4 بود در X نوشت: «رومیان باستان چه احساسی میداشتند اگر میدانستند که ۲۰۰۰ سال بعد، ما از شتابدهندههای ذرات و ابرکامپیوترها استفاده میکنیم تا کلماتشان را بخوانیم، آنها را برای ابدیت حفظ کنیم و در گوش یک خدای نوزاد زمزمه کنیم؟»
اندکی پس از افتتاح مسابقه، من به سرور مسابقه در دیسکورد پیوستم؛ پلتفرمی برای پیامرسانی که در اصل برای گیمرها ساخته شده است. من یکی از حدود ۴۰۰ نفری بودم که در چند هفته اول ثبتنام کردند و تا پاییز ۲۰۲۳، این گروه با ۱۴۲۸ عضو بسیار پرجنبوجوش بود. شرکتکنندگان ۵.۵ ترابایت تصاویر اسکنشده دو طومار را که سیلز نام مستعارشان را «پسر موزی» (Banana Boy) و «حرامزاده چاق» (Fat Bastard) گذاشته بود، (نامهای واقعی آنها PHerc_Paris_3 و PHerc_Paris_4 است.) دانلود کرده بودند و در حال بحث بودند که با آنها چه کنند. شرکتکنندگانی که میدانستند جایزه نقدی جدی در میان است، با صراحت شگفتانگیزی ایدهها را ردوبدل میکردند.

دو وظیفه اصلی وجود داشت: بخشبندی (Segmentation) و تشخیص جوهر. برای یافتن حروف، به سطوح تمیز یا قطعاتی از پاپیروس نیاز دارید. پژوهشگران هزاران تصویر اشعه ایکس مقطعی در امتداد محور z هر طومار و از بالابهپایین گرفته بودند. هر سطح مقطع خطوط سفید باریک که در برابر پسزمینهای تیره میچرخند؟ ورقهای پاپیروس لولهشده را مانند حلقههای یک درخت نشان میدهد. باز کردن طومارها و استخراج یک سطح صاف تا ابد طول میکشد و این کار نیازمند استفاده از کلیکهای ماوس برای علامتگذاری موقعیت متغیر یک ورق در هر سطح مقطع است. سپس الگوریتمهای سفارشی، سطح مقطعهای منحصربهفرد را به هم میدوزند تا یک ورق واحد ایجاد کنند. اما این کار با این واقعیت متوقف میشود که کربنیزهشدن برخی از ورقها را به هم جوش داده است. گاهی اوقات پاپیروس روی خودش تا میشود یا جدا میشود، بهطوریکه یک ورق تبدیل به چندین ورق میشود و هیچ راهی برای دانستن اینکه کدام سطح حاوی نوشته است وجود ندارد.
کایلز که توسط فریدمن استخدام شده بود تا بهصورت تماموقت بخشبندی را انجام دهد و نتایج را با جامعه به اشتراک بگذارد میگوید: «اینها تکههای خمیرشده و ذوبشده زغال هستند.» با کمک نرمافزار متنباز توسعهیافته توسط سایر شرکتکنندگان، کایلز و تیمش از توانستند حدود ۰.۲ اینچ مربع (۱.۳ سانتیمتر مربع) از سطح پاپیروس را در هر ساعت تولید کنند. (طول یک طومار هرکولانیوم میتواند بیش از ۳۲ فوت یا کمتر از ۱۰ متر باشد.)
بااینحال، تشخیص هرگونه جوهر روی آن سطوح مسئلهای کاملاً متفاوت بود. برای تقویت پیشرفت در تشخیص جوهر، متولیان امر یک مسابقه یادگیری ماشین در Kaggle؛ یک پلتفرم آنلاین برای مسابقات علم داده با جوایزی به ارزش مجموعاً ۱۰۰ هزاردلار راهاندازی کردند. وظیفه نسبتاً سرراست بود: ساختن یک مدل یادگیری ماشین برای تشخیص جوهر در سیتیاسکنهای قطعات جداشده پاپیروس که نوشته روی آنها از قبل بهوضوح قابلمشاهده بود (رویکردی که تیم کنتاکی قبلاً با موفقیتهایی امتحان کرده بود). متولیان امیدوار بودند که یک مدل تشخیص جوهر که روی قطعات آموزش دیده است بتواند روی بخشهایی از پاپیروس که بهصورت مجازی باز شدهاند، اعمال شود.
مجموعاً ۲۷۶۳ شرکتکننده و تیم از جمله دو دانشجو در مؤسسه فناوری Harbin چین، تیمی از باستانشناسان از کییف، گروه پژوهشی تصویربرداری پزشکی در آلمان و مهندسان یادگیری ماشین در ژاپن و کره جنوبی در این مسابقه ثبتنام کردند. آنها مدلهای هوش مصنوعیای ساختند تا وجود یا عدم وجود جوهر را در هر وکسل از قطعات اسکنشده پیشبینی کنند و نتایج خود را آپلود کردند. ورودیهای آنها با دادههای حاصل از عکسهای مادونقرمز قطعات تأیید شد.
در هفتههای منتهی به پایان مسابقهKaggle در ۱۴ ژوئن ۲۰۲۳، تیمی در سندیگو خود را در پایین جدول امتیازات یافت. همتیمیها هنگام وررفتن با مدل خود در کافه متوجه شدند که جوهر در نواحی خاصی در پاپیروس عمیقتر نفوذ کرده است. مدل آنها داشت یاد میگرفت که به عمق جوهر اهمیت دهد؛ اما این رویکرد داشت آن را گیج میکرد. پژوهشگران مدل را طوری تغییر دادند که عمق جوهر را نادیده بگیرد که منجر به نتایج بهتری شد و گروه را به بالای جدول پرتاب کرد. مدل «مستقل از عمق» (Depth-Invariant) برنده مسابقه تشخیص جوهر شد؛ اما چیزی اشتباه بود.
رومیان باستان چه احساسی میداشتند اگر میدانستند که ۲۰۰۰ سال بعد، ما از شتابدهندههای ذرات و ابرکامپیوترها استفاده میکنیم تا کلماتشان را بخوانیم؟
نت فریدمن – سرمایه گذار خصوصی
وقتی «رایان چسلر» (Ryan Chesler)یکی از اعضای تیم، مدل برنده خود را روی بخش بزرگی از پاپیروس به طور مجازی بازشده کایلز، معروف به «قطعه هیولا» (Monster Segment) اعمال کرد، ناامید شد. هوش مصنوعی هیچ جوهری را تشخیص نمیداد. به نظر میرسید مدلی که روی قطعات آموزش دیده باشد، روی طومارهای کامل کار نمیکند. وین گمان میکرد دلیلش را میداند. او میگوید برندگان جایزه تشخیص جوهر «یک مشت نوابغ لعنتی هستند.»؛ اما آنها داشتند به این معما بهعنوان یک مسئله ریاضی فکر میکردند. وین توضیح میدهد: «دنیای واقعی کمی نامرتبتر است.» مدلهای تشخیص جوهر ممکن است به این دلیل روی طومارها کار نکرده باشند که هوش مصنوعی نتوانسته بود یاد بگیرد پاپیروس کربنیزهشده چه شکلی است. بدون اسکنهای بیشتر از پاپیروس کربنیزهشده، حتی پیچیدهترین الگوریتمها هم به مشکل برمیخوردند.
وین که با اسکن اشیایی مانند موتور موشک و ساز فاگوت آشناتر بود، کارفرمای خود را متقاعد کرد که به او اجازه دهد از یکی از دستگاههای سیتیاسکن پیشرفته آنها در اوقات فراغتش استفاده کند. (او میگوید: «اگر کسی برنده جایزه بزرگ میشد، میتوانست هزینه تقریباً نیمی از یکی از اینها را بپردازد.») او طرحهای پیچیده یونانی را روی پاپیروس کشید، سپس آنها را کربنیزه و اسکن کرد. او نتایج را با دیگران به اشتراک گذاشت و منبع غنیای از دادههای آموزشی ایجاد کرد.
دیگران معتقد بودند شرکتکنندگان بیش از حد روی هوش مصنوعی متمرکز شدهاند. «کیسی هندمر» (Casey Handmer) فیزیکدان سی و چندساله استرالیایی تصمیم گرفت اسکنها را بهصورت چشمی بازرسی کند. او میگوید: «اگر ماشین میتواند آن را ببیند، انسان هم میتواند آن را ببیند.» هندمر توضیح میدهد که اکثر الگوریتمهای یادگیری ماشین برای تشخیص ویژگیهای بصری بر اساس تشخیص انسان ساخته شدهاند و دلیل خوبی هم دارد؛ قشر بینایی ما در شناسایی الگوها و بافتهای ظریف بسیار ماهر است.
هندمر بنیانگذار و مدیرعاملTerraform Industries مستقر در کالیفرنیا است که گاز طبیعی کربنخنثی از خورشید و هوا تولید میکند و دفتر مرکزی آن در یک قلعه قرونوسطایی ساختگی درBurbank است. او ساعتها وقت صرف بازرسی تصاویر کرد که باعث آزردگی فریدمن شد؛ یک سرمایهگذاری در زمینیسازی (Terraform) که حواسپرتی مدیرعامل را تأیید نمیکرد. پس از وقفهای برای چاپ سهبعدی کپیای از اسکلت خودش برای سرگرمی شخصی، هندمر متوجه شد که دارد با ویژگیهای بصری الیاف پاپیروس سوخته آشنا میشود و در مه ۲۰۲۳، هنگام بازرسی «قطعه هیولا» کایلز، متوجه چیز قابلتوجهی شد. او مدام بافتی تکرارشونده را میدید که شبیه گل ترکخوردهای بود که روی سطح پاپیروس پختهشده باشد. بعد از حدود یک ساعت کلنجاررفتن، متوجه یک π وارونه شد. بافت ترکخورده باید جوهر میبود.
هندمر مقدار بیشتری از آن بافت را به شکل حروف دیگر پیدا کرد و حتی معتقد بود کلمه «Καλλιόπη»، نام الهه شعر و موسیقی را کشف کرده است. بااینحال، یافتههای او نتوانست شش پاپیروسشناسی را که ورودی او را در جایزه اولین حروف در ژوئن ۲۰۲۳ ارزیابی کردند، متقاعد کند؛ مسابقهای ۴۰ هزاردلاری برای اولین کسی که ۱۰ حرف را در مساحتی به اندازه ۰.۶ اینچ مربع (حدوداً ۴ سانتیمتر مربع) پیدا کند. اما هندمر اولین جوهر را کشف کرده بود که برای آن جایزهای ۱۰ هزاردلاری دریافت کرد. با به اشتراک گذاشتن کشف خود با جامعه تقریباً در همان لحظه، او راه را برای پیشرفتهای بزرگ بعدی هموار کرد.
فریتور، دانشجوی کالج در نبراسکا، در حال گذراندن کارآموزی درSpaceX در تگزاس بود که از کشف هندمر درباره بافت ترکخورده مطلع شد. او روزهایش را صرف کار در تیم نرمافزار سکوی پرتاب برای استارشیپ میکرد. بااینحال، بعد از کار او بیشتر شب را بیدار میماند و مدل هوش مصنوعی میساخت تا مقدار بیشتری از آن بافت ترکخورده را پیدا کند. در همین حال، «یوسف نادر» (Youssef Nader) دانشجوی مصری تحصیلات تکمیلی علم داده در دانشگاه آزاد برلین، روی سیستمی کار میکرد که آن را از یک مدل موفق مسابقهKaggle اقتباس گرفته بود. هم فریتور و هم نادر در یافتن توالی حروف موفق شدند. نتایج نادر تمیزتر بود، اما روش فریتور سریعتر بود. پس از یافتن πορ در شب مهمانی آگوست ۲۰۲۳، فریتور به اصلاح مدل خود ادامه داد تا اینکه مدل چندین شکل تار در اطراف πορ تشخیص داد که به نظر میرسید آنها هم ممکن است حروف یونانی باشند.
در سپتامبر، پاپیروسشناسان نتایج فریتور را بازرسی کردند. آنها متوجه شدند که πορ فریتور آغاز کلمه یونانی باستان «πορφύραc» به معنی بنفش است. «فدریکا نیکولاردی» (Federica Nicolardi) پاپیروسشناس دانشگاه ناپل که به تأیید کلمه کمک کرد میگوید این یک اصطلاح نادر است و احتمالاً از یک متن جدید است.

مسابقه، فریتور را چند هفته بعد برای شرکت در سمپوزیومی که پیرامون این کشف سازماندهی شده بود، به کنتاکی فرستاد. پس از آن، «جیپی پوسما» (JP Posma) یکی از برگزارکنندگان، یک چک بزرگ ۴۰ هزاردلاری به فریتور داد و نادر که همان کلمه را فقط چند روز بعد پیدا کرده بود، ۱۰ هزاردلار برای مقام دوم دریافت کرد. اما درست زمانی که پاپیروسشناسان داشتند برای سمپوزیوم میرسیدند، نادر بزرگترین پیشرفت را رونمایی کرد؛ او تصویری منتشر کرد که «πορφύραc» را در متن چهار ستون کامل نوشته نشان میداد؛ منظرهای که پاپیروسشناسان انتظار نداشتند در طول عمر خود ببینند. در ستونها کلمات قابلشناسایی دیگری وجود داشت، از جمله عبارت احتمالی «κατά μουσικήν» به معنای چیزی شبیه «مربوط به موسیقی» که طبق گفته نیکولاردی، این طومار را بهاحتمال زیاد به اثری فلسفی تبدیل میکند.
در پایان سال ۲۰۲۳، نادر با فریتور و «جولیان شیلیگر» (Julian Schilliger) دانشجوی رباتیک در سوئیس که نرمافزارش برای تسریع بخشبندی و نقشهبرداری سهبعدی پاپیروس برنده جایزه قبلی شده بود، تیمی تشکیل دادند. آن دسامبر، با ترکیب رویکردهایشان، تیم سهنفره چیزی حیرتانگیز تولید کرد. بر پایه کاری که هر کدام بهصورت انفرادی انجام داده بودند، مدلهای هوش مصنوعی آنها ۲۰۰۰ کاراکتر را در چهار ستون کامل آشکار کرد؛ خیلی فراتر از معیار جایزه بزرگ که چهار قطعه با ۱۴۰ کاراکتر بود. در اوایل فوریه ۲۰۲۴، چالش وزوو جایزه بزرگ ۷۰۰ هزاردلاری را به آنها اعطا کرد.
متن خوانا شامل حدود ۵ درصد از اولین طومار و از همان متنی است که اکتشافات قبلی از آن بود. این رسالهای است که قبلاً خوانده نشده، احتمالاً اثر فیلودموس درباره لذت باشد. آیا چیزهای خوب در مقادیر کم لذتبخشتر از چیزهای خوب فراوان هستند؟ نویسنده نتیجه میگیرد: ابداً. نویسنده مینویسد: «همچنان که در مورد غذا نیز ما فوراً باور نمیکنیم که چیزهای کمیاب مطلقاً دلپذیرتر از چیزهایی باشند که فراوان هستند.»
حوزههای پاپیروسشناسی و مطالعات کلاسیک برای همیشه تغییر کردهاند. تا حد زیادی به لطف گروهی از سازندگان آماتور هوش مصنوعی، ما اکنون ابزارهایی برای خواندن پاپیروسهای بازنشده هرکولانیوم داریم. «توبیاس راینهارت» (Tobias Reinhardt)، محقق کلاسیک در دانشگاه آکسفورد که به تأیید ورودیهای برنده کمک کرد میگوید اگر پیشرفتهای فناوری ادامه یابد و بتواند برای بسیاری از طومارهای بازنشده به کار گرفته شود، «میتوانیم شاهد بازیابی متون باستانی در حجمی باشیم که از زمان رنسانس دیده نشده است.»
فریدمن چیزهای بیشتری میخواهد و متوقف نمیشود. وقتی در اواخر ۲۰۲۳ صحبت کردیم، گفت هدف او برای سال ۲۰۲۴ این است که بر پایه رویکرد تیم برنده، ۹۰ درصد از چهار طوماری که تا آن زمان با استفاده از فیزیک انرژی بالا اسکن شده بودند را بخواند. اگر موفق شود، این کار قفل صدها طومار بازنشده هرکولانیوم را باز خواهد کرد. اما اینها فقط آنهایی هستند که ما از آنها خبر داریم. او در نهایت آرزو دارد مقامات ایتالیایی را متقاعد کند که اجازه حفاریهای جدید در منطقه به امید کشفهای بیشتر را بدهند.
چند مشکل کوچک وجود داشت که قبل از اینکه فرایند بتواند مقیاس پیدا کند، باید رفع میشد. پژوهشگران نیاز داشتند راهی برای خودکارسازی فرایند زمانبر و پرهزینه بخشبندی دستی پیدا کنند. بهعلاوه، اجاره یک شتابدهنده ذرات برای اسکن صدها طومار بسیار هزینهبر است و راهحلهای ارزانتر برای تولید اسکنهای با وضوح بالا باید پیدا شود.
بااینحال، آنچه برای پاپیروسشناسان شگفتآورتر است، سرعتی است که اکنون جربان روش هوش مصنوعی حروف قابلشناسایی را پیدا میکند. «جیانلوکا دل ماسترو» (Gianluca Del Mastro)همکار نیکولاردی و استاد پاپیروسشناسی دانشگاه Campania Luigi Vanvitelli میگوید رفتن از سه حرف به کل کلمات و عبارات و سپس ستونهای متن که برای فریتور، نادر و شیلیگر یک ماه طول کشید، معمولاً برای پاپیروسشناسان بهاندازه ۲۰ سال مطالعه حرفهای زمان میبرد.
سیلز میگوید فناوریای که چالش وزوو به توسعه آن کمک کرد، میتواند برای رمزگشایی سایر متون گمشده فراتر از خلیج ناپل مقیاس شود. گزینههای وسوسهانگیز زیادی وجود دارد. در سال ۱۹۹۳ تعداد ۱۴۰ طومار پاپیروس کربنیزهشده مربوط به قرن ششم میلادی در کلیسایی بیزانسی در پترا اردن کشف شد. آنها سیاه و شکننده و غیرقابلخواندن در نظر گرفته میشدند؛ همچنین دهها هزار قطعه از «طومارهای دریای مرده» هرگز خوانده نشدهاند؛ زیرا بسیاری از آنها به هم چسبیدهاند. آنها اکنون نامزدهای اصلی برای خط باز کردن مجازی تا تشخیص جوهر با هوش مصنوعی چالش وزوو هستند.
ماسکهای مومیایی مصر باستان نیز از پاپیروس ساخته میشدند که در لایههای پوشیده شده با گچ چیده شده بودند؛ مادهای به نام «کارتوناژ» (Cartonnage) که اساساً نوعی خمیر کاغذی یا «پاپیه ماشه» (papier-mâché) است. آن پاپیروس اغلب حاوی نوشتههایی بود که رمزگشایی آن بدون تخریب گچ دشوار بوده است. آن پاپیروسها نیز ممکن است اکنون زندگی پس از مرگ داشته باشند.
در قرن چهارم پیش از میلاد، گزنفون مورخ یونانی در بازگشت از بینالنهرین خاطرنشان کرد که تجارتی پررونق در طومارها در سراسر دریای سیاه وجود دارد. «ریچارد یانکو» (Richard Janko) استاد کلاسیکگرا و پاپیروسشناس دانشگاه میشیگان میگوید این بدان معناست که تقریباً بهطورقطع کشتیهای غرقشدهای در بستر دریا وجود دارند که حاوی جعبههای طومار پاپیروس هستند. این طومارها احتمالاً هنوز در این دریا که اکسیژن و شوری فوقالعاده پایینی برای یک محیط دریایی دارد، حفظ شدهاند. تاکنون هیجان هوش مصنوعی عمدتاً حول محور شبکههای عصبی بوده است که یاد میگیرند چگونه چت کنند. بااینحال جذابتر این است که چگونه آنها چیزهای ساکت را به سخن وامیدارند.
