ویژه‌نامه هوش مصنوعی ساینتیفیک امریکن

مسابقه رمزگشایی یک طومار باستانی

سید محمدجواد فیاض
۳ اسفند ۱۴۰۴

زمان مطالعه: 16 دقیقه

چگونه دانشمندان، دانشجویان، گیمرها و سیلیکون ولی یک معمای باستانی به قدمت چند قرن را حل کردند و دانش پاپیروس‌شناسی را برای همیشه تغییر دادند.

در یک شنبه‌شب گرم در پایان آگوست ۲۰۲۳، «لوک فریتور» (Luke Farritor) که آن زمان دانشجوی کارشناسی در دانشگاه نبراسکا بود، در گوشه‌ای در یک مهمانی خانگی در اوهاما تنها نشسته بود که آیفونش زنگ خورد. موسیقی با صدای بلند پخش می‌شد و فریتور که آن زمان ۲۱ساله چهره‌ای پسرانه و عینکی مستطیلی و مشکی داشت، در میان دانشجویان دیگری که می‌نوشیدند و معاشرت می‌کردند بود. او پیام را باز کرد. پیام از طرف «بن کایلز» (Ben Kyles) یک دانشمند کامپیوتر و پیانیست ۴۰ و اندی ساله از بریتیش کلمبیا بود. فریتور، کایلز را با نام «Hari Seldon»، آواتار آنلاین او که به نام شخصیتی در مجموعه «بنیاد» آیزاک آسیموف بود، می‌شناخت. کایلز یک خبری داشت. او به‌تازگی باز کردن دیجیتالی برخی اسکن‌های با وضوح بالا از پاپیروس کربنیزه شده را به پایان رسانده بود. او گفت تصاویر را در یک سرور مشترک آپلود کرده است و فریتور پاسخ داد: «رفیق، این عالیه. خیلی زود اجراش می‌کنم.»

گزارش حاضر در «ویژه‌نامه هوش مصنوعی ساینتیفیک امریکن» منتشر و در «رسانه تخصصی هوش مصنوعی هوشیو» به زبان فارسی نیز ترجمه شده و در دسترس مخاطبان این حوزه قرار گرفته است.

پاپیروس کایلز متعلق به «هرکولانیوم» (Herculaneum) بود، یک شهر باستانی رومی در خلیج ناپل در دامنه کوه «وزوو» (Vesuvius) که خانه تنها کتابخانه حفظ‌شده از دوران باستان کلاسیک است. این مجموعه پاپیروس‌ها که تاکنون حدود ۱۸۰۰ طومار و قطعه عمدتاً ناخوانا از آن استخراج شده است؛ در همان فوران آتش‌فشانی که شهر «پمپئی» (Pompeii) را در سال ۷۹ میلادی نابود کرد، زیر ۶۰ فوت (حدود ۱۸ متر) از موادی که توسط جریان‌های آذرآواری (Pyroclastic) در دماهای بالاتر از ۹۰۰ درجه فارنهایت (۴۸۲ درجه سانتی‌گراد) نهشته شده بود، دفن شده بود. بدون اکسیژن کافی برای سوختن، طومارها پخته و تبدیل به زغال شدند. موهبتی که به آن‌ها اجازه داد به گنجینه کوچک پاپیروس‌هایی بپیوندند که توانسته‌اند از دوران باستان دوام بیاورند که همگی به‌نوعی از رطوبت محافظت شده‌اند؛ چه آن‌هایی که در شن‌های مصر مدفون شده باشند و چه توسط آتش نیم‌سوز شده باشند. اما این همچنین بدان معناست که آن‌ها نمی‌توانند بدون تبدیل‌شدن به گردوغبار باز شوند.

فریتور که اکثر شب‌های شش ماه گذشته را تا دیروقت بیدار بود و تلاش می‌کرد طومارها را رمزگشایی کند، با استفاده از موبایل خود از راه دور به کامپیوتر دسکتاپش در اتاق خوابگاهش در لینکلن به‌اندازه که یک ساعت رانندگی فاصله داشت، وصل شد. او قطعه پاپیروس جدید کایلز را روی سرور پیدا کرد و بلافاصله آن را به‌عنوان خوراک ورودی به آشکارساز مبتنی بر هوش مصنوعی که طی چند هفته گذشته مشغول ساختش بود داد. این آشکارساز برنامه‌ریزی شده بود تا جوهر و بنابراین حروف و کلمات را پیدا کند. او برنامه را اجرا کرد تا کارش را انجام دهد و گوشی‌اش را کنار گذاشت. به‌عنوان «راننده تعیین‌شده» (کسی که قرار بود رانندگی کند و نباید الکل می‌نوشید) منتظر ماند تا مهمانی تمام شود تا بتواند دوستانش را به خوابگاه‌هایشان برگرداند.

برای چهار قرن، راهبان، شاهزادگان، پاپیروس‌شناسان، باستان‌شناسان، کلاسیک‌گراها و دانشمندان کامپیوتر چنین تلاش‌هایی کرده بودند؛ اما نتیجه چندانی نگرفتند تا هرگونه حروف یا کلماتی را در داخل طومارها که شبیه ساندویچ بوریتو قهوه‌رنگ کوچک و وارفته هستند را بدون نابودکردن آن‌ها در این فرایند شناسایی کنند. همان‌طور که کلاسیک‌گراها و پاپیروس‌شناسان مدت‌ها آرزویش را داشته‌اند؛ اگر بتوانیم آن‌ها را بخوانیم ممکن است آثار گمشده‌ای از ادبیات یا فلسفه کلاسیک یا سوابق تاریخ و علم را کشف کنیم. شاید آن‌ها حاوی سوگ‌نامه‌هایی از «سوفوکل» یا «آیسخولوس» یا نوشته‌های گمشده «لیوی» باشند. «دیوید بلانک» (David Blank) استاد مطالعات کلاسیک دانشگاه لس‌آنجلس می‌گوید: «احتمالات بسیار زیاد هستند.»

صدها طومار پاپیروس در شهر باستانی هرکولانیوم پس از فوران کوه وزوو سالم ماندند. برای هزاران سال، هیچ کس نمی‌توانست بدون وارد کردن خسارات جبران‌ناپذیر آن‌ها را باز کند.

تقریباً تمام ادبیات کلاسیک از طریق راهبان قرون‌وسطایی به دست ما رسیده است که در آنچه تصمیم به بازنویسی‌اش می‌گرفتند، گزینشی عمل می‌کردند. در نتیجه، مقدار نسبتاً کمی نوشته «اصلی» از دوران باستان وجود دارد که به این معنی است که ادبیات کلاسیک از دیدگاه ما، چشم‌اندازی است که از طریق سوراخ سوزن دیده می‌شود. ما هفت نمایشنامه از آیسخولوس داریم، اما می‌دانیم که این تراژدی‌نویس حداقل ۱۰ برابر بیشتر از آن نوشته است. پاپیروس‌های حفظ‌شده در هرکولانیوم بهترین شانس ما برای نجات این دست آثار گمشده هستند و برخی متخصصان کلاسیک‌گرا گمان می‌کنند که حتی متون بیشتری می‌تواند در مناطقی که هنوز حفاری نشده‌اند، باقی‌مانده باشد. «آنالیزا مارزانو» (Annalisa Marzano) استاد باستان‌شناسی کلاسیک دانشگاه بولونیا و متولی انجمنFriends of Herculaneum می‌گوید: «چه کسی می‌داند آنجا چه چیزی هست؟» علاوه بر آثاری از بزرگان مانند شاعرانی مثل «ویرجیل» و «هوراس»؛ همچنین احتمال وسوسه‌انگیز یافتن نوشته‌هایی از نویسندگانی وجود دارد که مارزانو می‌گوید «ما مطلقاً هیچ‌چیز درباره‌شان نمی‌دانیم.»

فریتور پس از رساندن دوستانش، بیرون خوابگاهش پارک کرد و درحالی‌که به سمت ساختمانش می‌رفت، گوشی‌اش را از جیبش بیرون آورد. قفل صفحه را باز کرد. ایستاد. گفت: « Holy cow»؛ هوش مصنوعی خروجی داده بود.

روی صفحه گوشی، در برابر بافت متقاطع خاکستری پاپیروس بافته‌شده، سه حرف یونانی کوچک سیاه «پی» (π)، «امیکرون» (ο) و «رو» (ρ) در توالی واضح «πορ» قرار گرفته بودند و هرچند تار؛ اما انکارنشدنی بودند.

اولین کسی که در تقریباً ۲۰۰۰ سال گذشته آن حروف را دید؛ اواخر یک شب تابستانی در پارکینگی در لینکلن پس از نجات آن‌ها از یک فوران باستانی، نگاهی به آن‌ها انداخت. وقتی صحبت کردیم، به من گفت: «من وحشت‌زده شدم.» او اسکرین‌شاتی برای مادرش فرستاد. شروع خیره‌کننده‌ای بود. اما فریتور فکر کرد، کلمه‌ای که حاوی آن حروف است چیست؟ و کدام کتاب گمشده آن کلمه را در خود جای‌داده است؟

همان‌طور که صنعت هوش مصنوعی در بهار ۲۰۲۳ با انتشار GPT-4 منفجر شد، نگرانی درباره هوش مصنوعی ابرهوشمند (Superintelligent AI) نیز افزایش یافت. بسیاری از توسعه‌دهندگان و متفکران «بدبین» در سیلیکون‌ولی و فراتر از آن هشدار می‌دهند که یک سیستم ممکن است روزی تصمیم بگیرد تمدن ما را با نیروی چندین وزوو به خاک و آوار تبدیل کند. این نگرانی باعث می‌شود که تصمیم صدها رمزگشای آماتور برای صرف وقت خود جهت ساختن هوش مصنوعی به امید دیدن نوشته‌های هرگز دیده‌نشده‌ای که در شهری پیدا شده که در پی یک فاجعه وحشتناک منقرض شد؛ تحت‌تأثیر قرار بگیرد.

«چالش وزوو» (The Vesuvius Challenge) که آن هم در سال ۲۰۲۳ راه‌اندازی شد، رقابتی برای نجات دانش موجود در این طومارهاست. برای «آرون وین» (Ahron Wayne) مهندس سی‌تی‌اسکن صنعتی در میشیگان که در این چالش شرکت کرده است؛ این مأموریت به گفته او «نزدیک‌ترین چیزی است که می‌توانید به یک بازی ویدئویی پیدا کنید.»

در مسابقه سال ۲۰۲۳، هیچ‌یک از رقبای قدرتمند هیچ تخصصی در مطالعات کلاسیک نداشتند. اکثر آن‌ها فقط علاقه‌ای گذرا به دنیای باستان و دانش بسیار کمی از آن داشتند. اکثر آن‌ها نه لاتین صحبت می‌کردند و نه یونانی. البته این یک مشکل فنی بود که توجه آن‌ها را جلب کرد. برای چالش وزوو نیز جایزه جمعی بیش از ۱ میلیون‌دلاری از سوی برخی از قدرتمندترین بازیگران سیلیکون‌ولی اهدا شد.

این مسابقه ایده درخشان «نت فریدمن» (Nat Friedman) سرمایه‌گذار منطقه خلیج سان‌فرانسیسکو بود که تا سال ۲۰۲۱، نیز مدیرعامل GitHub، پلتفرم توسعه نرم‌افزار متن‌باز مایکروسافت بود. او همراه با «دنیل گراس» (Daniel Gross) شریک سرمایه‌گذاری دیرینه‌اش از اولین تأمین‌کنندگان مالی هوش مصنوعی امروزی بودند. در دهه ۲۰۱۰ فریدمن و گراس برای پژوهشگران یادگیری ماشین چک می‌نوشتند و بعداً وقتی این حوزه منفجر شد؛ شروع به تأمین مالی شرکت‌های هوش مصنوعی کردند. این دو نفر برای آموزش مدل‌های هوش مصنوعی که روی آن‌ها شرط بسته‌اند، تعداد تراشه‌های هوش مصنوعی انویدیا بیشتری نسبت به اکثر کشورها در اختیار دارند. شاید شنیده باشید که میلیاردرهای فناوری قصد دارند شهری آرمانی را از صفر در زمین‌های کشاورزی شمال سان‌فرانسیسکو بسازند؛ فریدمن پولش را در آن پروژه هم کاشته است. بااین‌حال، در بهار ۲۰۲۰، درحالی‌که بخش زیادی از جهان در قرنطینه بود، فریدمن صرفاً امیدوار بود ذهنش را از کرونا دور کند.

فریدمن که در خانه‌اش در سان‌فرانسیسکو قرنطینه شده بود و به‌تازگی مجذوب روم باستان شده بود و مقالات ویکی‌پدیا را درباره بلایا و مصیبت‌های باستانی می‌خواند. او فهمید که در سال ۱۷۰۹، کارگران در شهر «رزینا» (Resina) در نزدیکی ناپل در حال حفر چاه بودند. در حدود ۶۰ فوت (۱۸ متر) پایین‌تر بیل‌های آن‌ها به بقایای یک تئاتر عظیم برخورد کرد. این ساختمان که ۲۵۰۰ نفر ظرفیت داشت، پر از مجسمه‌های اسب و نجیب‌زادگان بود. آن‌ها باید مبهوت شده باشند. وجود هرکولانیوم، یک شهر باستانی در زیر پایشان برای مدت‌ها پیش از حافظه جمعی پاک شده بود.

در طول چند دهه بعدی، یک تعداد زیادی مهندسان نظامی که تشنه آثار هنری باستانی برای تزیین ویلاهای خود بودند، دستور حفر تونل‌های زیرزمینی را دادند که از تئاتر منشعب می‌شد. این فعالیت باعث آسیب شدید به آن شد. در آن زمان روش‌های باستان‌شناسی مبتنی بر حفاظت هنوز توسعه نیافته بود و به تعبیر «یوهان یواخیم وینکلمن» (Johann Joachim Winckelmann) مورخ هنر قرن هجدهم، «یک مهندس نظامی اسپانیایی همان‌قدر از آثار باستانی می‌دانست که ماه از خرچنگ‌ها می‌داند.»

در سال ۱۷۵۰ «کارل وبر» (Karl Weber) مهندس سوئیسی با دنبال‌کردن یک دیوار زیرزمینی، ویلایی مجلل را کشف کرد. این ملک رو به اقیانوس احتمالاً زمانی متعلق به پدرزن ژولیوس سزار، «لوسیوس کالپورنیوس پیسو کایسونینوس» (Lucius Calpurnius Piso Caesoninus) بوده است. در گوشه‌ای از ساختمان، کارگران توده‌ای از استوانه‌های سیاه و بدشکل به ارتفاع چند اینچ پیدا کردند. ابتدا تصور می‌شد این اشیا چوب کربنیزه شده هستند و برخی دور انداخته شدند تا اینکه وبر متوجه شد این اتاق در اصل کتابخانه است. کارگران بیش از ۱۰۰۰ طومار و قطعه پاپیروس را خارج کردند که در یک موزه محلی قرار داده شد.

پاپیروس‌های به‌جامانده از هرکولانیوم بهترین فرصت ما برای نجات آثار گمشده هستند.

وسوسه یافتن یک اثر ناشناخته ادبیات در این گنجینه، بخش زیادی از اروپا را مجذوب کرد و آزمایشگران رویکردهای مختلفی را برای خواندن پاپیروس‌ها امتحان کردند. یک متصدی موزه با چاقو چند طومار را به‌صورت عمودی برش داد و لایه‌ها را تراشید. این روش وحشیانه برخی متون خوانا را آشکار کرد، اما طومارها را نابود کرد. یک شاهزاده ایتالیایی که به‌تازگی شنلی ضدآب برای پادشاه آینده اسپانیا اختراع کرده بود؛ چند طومار را در جیوه غوطه‌ور کرد به امید اینکه فلز مایع صفحات را از هم جدا کند که این کار آن‌ها را نابود کرد. دیگران سعی کردند آن‌ها را در معرض یک «گاز گیاهی» بدبو قرار دهند یا طومارها را در گلاب غرق کنند.

در سال ۱۷۵۳ «آنتونیو پیاجو» (Antonio Piaggio) راهبی که بر نسخه‌های خطی باستانی در کتابخانه واتیکان نظارت داشت از رم فراخوانده شد. پس از رسیدن به ناپل، او ماشینی برای باز کردن تدریجی پاپیروس اختراع کرد که نخ‌های ابریشمی را به لبه صفحات متصل می‌کرد و لایه‌ها را به‌آرامی با سرعتی شاید یک‌دهم اینچ (حدوداً ۲۵ میلیمتر) در روز از هم جدا می‌کرد. پیاجو با این روش موفقیت‌هایی داشت و توانست آثاری از «فیلودموس» را آشکار کند، کسی که به ویرجیل آموزش داده بود و یکی از فیلسوفان اپیکوری یونانی بود که معتقد بودند اتم‌هایی که در خلأ منحرف می‌شوند و با هم برخورد می‌کنند، جهان را ایجاد کرده‌اند. اما رویکرد پیاجو همان‌قدر که کند بود، مخرب هم بود. به نظر می‌رسید خواندن بیش از ۳۳۰ طومار بازنشده بدون آسیب‌رساندن به آن‌ها غیرممکن باشد.

چند قرن بعد، فریدمن درباره برخی پیشرفت‌های اخیر مطالعه کرد. گروهی در دانشگاه کنتاکی به مدیریت «برنت سیلز» (Brent Seales)استاد علوم کامپیوتر، به نظر می‌رسید در آستانه موفقیت باشند. در سال ۲۰۱۹ تیم سیلز ترتیب انتقال دو طومار کامل را در محفظه‌های سفارشی، همراه با چهار قطعه جداشده، به Diamond Light Source، یک شتاب‌دهنده ذرات سنکروترون درOxfordshire دادند. با استفاده از فوتون‌های پرانرژی سنکروترون، سیلز و تیمش میکروسی‌تی‌اسکن‌هایی از پاپیروس‌ها با وضوح هشت میکرون؛ یعنی تقریباً به‌اندازه قطر یک گلبول قرمز خون گرفتند.

برنامه سیلز این بود که اسکن‌های سنکروترون را وارد یک برنامه کامپیوتری با طراحی سفارشی کند تا هر لایه پاپیروس را به‌صورت مجازی به امید آشکارکردن جوهر روی سطوح رندر شده باز کند. اما جوهر مبتنی بر کربن که روی طومارها استفاده شده بود، چگالی رادیویی مشابه پاپیروس داشت و این بدان معنا بود که کنتراست (تضاد) کافی برای اینکه جوهر در اسکن‌ها نشان داده شود، وجود نداشت.

برای دورزدن این مشکل، تیم سیلز یک مدل یادگیری ماشین ساخت که روی نسخه‌های خطی نوشته‌شده با جوهر کربن آموزش دیده بود. یک مدل هوش مصنوعی موفق تشخیص جوهر شاید می‌توانست سپس روی سطوح به‌صورت مجازی بازشده طومارها اعمال شود.

وقتی فریدمن درباره این تلاش خواند، ایده‌ای به ذهنش رسید: شاید جامعه هوش مصنوعی سیلیکون‌ولی یا با سرمایه‌گذاری در پروژه یا با ارائه تخصص خود بتواند کمک کند. در سال ۲۰۲۲ فریدمن، سیلز را به Frontier Camp؛ گردهمایی انحصاری و محرمانه‌ای (هیچ حضور آنلاینی ندارد) که فریدمن یکی از سازمان‌دهندگان آن است و در جنگل‌های دورافتاده کالیفرنیای شمالی برگزار می‌شود؛ دعوت کرد. جایی که در حدود ۲۰۰ بنیان‌گذار و مدیرعامل منتخب گلچین‌شده از فناوران هر سال چند شب را در سرما کمپ می‌زنند تا ایده‌های خود را ردوبدل کنند.

سیلز ایمیل را نادیده گرفت. او نام فریدمن را شنیده بود؛ اما باور نمی‌کرد مکاتبه واقعی باشد. بااین‌حال فریدمن سرسخت بود و در اکتبر ۲۰۲۲ سیلز به محل کمپ تابستانی ساده در جنگلRedwood در سونوما رسید. سیلز آن شب در یکی از ساختمان‌های چوبی بیرونی کمپ برای گروهی از مهندسان یادگیری ماشین سخنرانی کرد.

زمانی که سیلز هنوز در حال صحبت بود، فریدمن به گراس گفت: «ما این را در ساعت آینده حل خواهیم کرد.» اما نکردند و وقتی رویداد تمام شد، فریدمن و گراس نگران بودند که سیلز دست‌خالی به کنتاکی بازگردد. آن شب فریدمن پیشنهاد داد که به جای آن یک مسابقه آزاد ترتیب دهند و به سیلز گفت: «ما مقداری پول برایش می‌گذاریم.»

سیلز به خانه پرواز کرد تا درباره این ایده با سایر اعضای آزمایشگاهش بحث کند. «استیون پارسونز» (Stephen Parsons) پژوهشگر بازسازی دیجیتال که در حال تکمیل پایان‌نامه دکتری خود درباره کار آزمایشگاهی بود گفت: «ما نمی‌خواهیم احمق باشیم و صرفاً تمام این کاری که انجام داده‌ایم را از دست بدهیم.» درعین‌حال، آن‌ها ایده‌های بیشتری از آنچه خودشان به طور منطقی می‌توانستند امتحان کنند، داشتند. هرچه تعداد افراد بیشتری با این مشکل دست‌وپنجه نرم می‌کردند، احتمال خوانده‌شدن طومارها را بیشتر می‌کرد که هدف نهایی آن‌ها بود. موضوع حل شد. آن‌ها پروژه را به روی جهان باز می‌کردند. فریدمن تلاش می‌کرد اشتیاقش را مهار کند. او در توییتر (X کنونی) نوشت: «کارکردن روی یک پروژه جانبی بسیار هیجان‌انگیز و عجیب‌وغریب جدید؛ چیز شبیه رؤیایی مادام‌العمر.»

گروه با همراهی فریدمن ساختار مسابقه را طراحی کردند. مراحلی از جوایز مستقل برای چالش‌های مختلف وجود داشت؛ از جمله تشخیص جوهر، یافتن اولین حروف در طومارها و ساختن نرم‌افزار متن‌باز کاربردی. مهلت ارسال آثار برای جایزه بزرگ؛ یعنی برای شناسایی چهار قطعه جداگانه با حداقل ۱۴۰ کاراکتر، ۳۱ دسامبر ۲۰۲۳ تعیین شد. فریدمن در روز «نیمه ماه مارس» یعنی روزی که مسابقه راه‌اندازی شد که از قضا یک روز پس از انتشار GPT-4 بود در X نوشت: «رومیان باستان چه احساسی می‌داشتند اگر می‌دانستند که ۲۰۰۰ سال بعد، ما از شتاب‌دهنده‌های ذرات و ابرکامپیوترها استفاده می‌کنیم تا کلماتشان را بخوانیم، آن‌ها را برای ابدیت حفظ کنیم و در گوش یک خدای نوزاد زمزمه کنیم؟»

اندکی پس از افتتاح مسابقه، من به سرور مسابقه در دیسکورد پیوستم؛ پلتفرمی برای پیام‌رسانی که در اصل برای گیمرها ساخته شده است. من یکی از حدود ۴۰۰ نفری بودم که در چند هفته اول ثبت‌نام کردند و تا پاییز ۲۰۲۳، این گروه با ۱۴۲۸ عضو بسیار پرجنب‌وجوش بود. شرکت‌کنندگان ۵.۵ ترابایت تصاویر اسکن‌شده دو طومار را که سیلز نام مستعارشان را «پسر موزی» (Banana Boy) و «حرام‌زاده چاق» (Fat Bastard) گذاشته بود، (نام‌های واقعی آن‌ها PHerc_Paris_3 و PHerc_Paris_4 است.) دانلود کرده بودند و در حال بحث بودند که با آن‌ها چه کنند. شرکت‌کنندگانی که می‌دانستند جایزه نقدی جدی در میان است، با صراحت شگفت‌انگیزی ایده‌ها را ردوبدل می‌کردند.

اسکن‌های پرانرژی به دانشمندان امکان می‌دهند طومارها را به‌صورت مجازی به تصاویر سه‌بعدی «باز» کنند تا ابزارهای هوش مصنوعی برای جست‌وجوی الگوهای نامرئی در جوهر به کار گرفته شوند.

دو وظیفه اصلی وجود داشت: بخش‌بندی (Segmentation) و تشخیص جوهر. برای یافتن حروف، به سطوح تمیز یا قطعاتی از پاپیروس نیاز دارید. پژوهشگران هزاران تصویر اشعه ایکس مقطعی در امتداد محور z هر طومار و از بالابه‌پایین گرفته بودند. هر سطح مقطع خطوط سفید باریک که در برابر پس‌زمینه‌ای تیره می‌چرخند؟ ورق‌های پاپیروس لوله‌شده را مانند حلقه‌های یک درخت نشان می‌دهد. باز کردن طومارها و استخراج یک سطح صاف تا ابد طول می‌کشد و این کار نیازمند استفاده از کلیک‌های ماوس برای علامت‌گذاری موقعیت متغیر یک ورق در هر سطح مقطع است. سپس الگوریتم‌های سفارشی، سطح مقطع‌های منحصربه‌فرد را به هم می‌دوزند تا یک ورق واحد ایجاد کنند. اما این کار با این واقعیت متوقف می‌شود که کربنیزه‌شدن برخی از ورق‌ها را به هم جوش داده است. گاهی اوقات پاپیروس روی خودش تا می‌شود یا جدا می‌شود، به‌طوری‌که یک ورق تبدیل به چندین ورق می‌شود و هیچ راهی برای دانستن اینکه کدام سطح حاوی نوشته است وجود ندارد.

کایلز که توسط فریدمن استخدام شده بود تا به‌صورت تمام‌وقت بخش‌بندی را انجام دهد و نتایج را با جامعه به اشتراک بگذارد می‌گوید: «این‌ها تکه‌های خمیرشده و ذوب‌شده زغال هستند.» با کمک نرم‌افزار متن‌باز توسعه‌یافته توسط سایر شرکت‌کنندگان، کایلز و تیمش از توانستند حدود ۰.۲ اینچ مربع (۱.۳ سانتیمتر مربع) از سطح پاپیروس را در هر ساعت تولید کنند. (طول یک طومار هرکولانیوم می‌تواند بیش از ۳۲ فوت یا کمتر از ۱۰ متر باشد.)

بااین‌حال، تشخیص هرگونه جوهر روی آن سطوح مسئله‌ای کاملاً متفاوت بود. برای تقویت پیشرفت در تشخیص جوهر، متولیان امر یک مسابقه یادگیری ماشین در Kaggle؛ یک پلتفرم آنلاین برای مسابقات علم داده با جوایزی به ارزش مجموعاً ۱۰۰ هزاردلار راه‌اندازی کردند. وظیفه نسبتاً سرراست بود: ساختن یک مدل یادگیری ماشین برای تشخیص جوهر در سی‌تی‌اسکن‌های قطعات جداشده پاپیروس که نوشته روی آن‌ها از قبل به‌وضوح قابل‌مشاهده بود (رویکردی که تیم کنتاکی قبلاً با موفقیت‌هایی امتحان کرده بود). متولیان امیدوار بودند که یک مدل تشخیص جوهر که روی قطعات آموزش دیده است بتواند روی بخش‌هایی از پاپیروس که به‌صورت مجازی باز شده‌اند، اعمال شود.

مجموعاً ۲۷۶۳ شرکت‌کننده و تیم از جمله دو دانشجو در مؤسسه فناوری Harbin چین، تیمی از باستان‌شناسان از کی‌یف، گروه پژوهشی تصویربرداری پزشکی در آلمان و مهندسان یادگیری ماشین در ژاپن و کره جنوبی در این مسابقه ثبت‌نام کردند. آن‌ها مدل‌های هوش مصنوعی‌ای ساختند تا وجود یا عدم وجود جوهر را در هر وکسل از قطعات اسکن‌شده پیش‌بینی کنند و نتایج خود را آپلود کردند. ورودی‌های آن‌ها با داده‌های حاصل از عکس‌های مادون‌قرمز قطعات تأیید شد.

در هفته‌های منتهی به پایان مسابقهKaggle در ۱۴ ژوئن ۲۰۲۳، تیمی در سن‌دیگو خود را در پایین جدول امتیازات یافت. هم‌تیمی‌ها هنگام وررفتن با مدل خود در کافه‌ متوجه شدند که جوهر در نواحی خاصی در پاپیروس عمیق‌تر نفوذ کرده است. مدل آن‌ها داشت یاد می‌گرفت که به عمق جوهر اهمیت دهد؛ اما این رویکرد داشت آن را گیج می‌کرد. پژوهشگران مدل را طوری تغییر دادند که عمق جوهر را نادیده بگیرد که منجر به نتایج بهتری شد و گروه را به بالای جدول پرتاب کرد. مدل «مستقل از عمق» (Depth-Invariant) برنده مسابقه تشخیص جوهر شد؛ اما چیزی اشتباه بود.

رومیان باستان چه احساسی می‌داشتند اگر می‌دانستند که ۲۰۰۰ سال بعد، ما از شتاب‌دهنده‌های ذرات و ابرکامپیوترها استفاده می‌کنیم تا کلماتشان را بخوانیم؟

نت فریدمن – سرمایه گذار خصوصی

وقتی «رایان چسلر» (Ryan Chesler)یکی از اعضای تیم، مدل برنده خود را روی بخش بزرگی از پاپیروس به طور مجازی بازشده کایلز، معروف به «قطعه هیولا» (Monster Segment) اعمال کرد، ناامید شد. هوش مصنوعی هیچ جوهری را تشخیص نمی‌داد. به نظر می‌رسید مدلی که روی قطعات آموزش دیده باشد، روی طومارهای کامل کار نمی‌کند. وین گمان می‌کرد دلیلش را می‌داند. او می‌گوید برندگان جایزه تشخیص جوهر «یک مشت نوابغ لعنتی هستند.»؛ اما آن‌ها داشتند به این معما به‌عنوان یک مسئله ریاضی فکر می‌کردند. وین توضیح می‌دهد: «دنیای واقعی کمی نامرتب‌تر است.» مدل‌های تشخیص جوهر ممکن است به این دلیل روی طومارها کار نکرده باشند که هوش مصنوعی نتوانسته بود یاد بگیرد پاپیروس کربنیزه‌شده چه شکلی است. بدون اسکن‌های بیشتر از پاپیروس کربنیزه‌شده، حتی پیچیده‌ترین الگوریتم‌ها هم به مشکل برمی‌خوردند.

وین که با اسکن اشیایی مانند موتور موشک و ساز فاگوت آشناتر بود، کارفرمای خود را متقاعد کرد که به او اجازه دهد از یکی از دستگاه‌های سی‌تی‌اسکن پیشرفته آن‌ها در اوقات فراغتش استفاده کند. (او می‌گوید: «اگر کسی برنده جایزه بزرگ می‌شد، می‌توانست هزینه تقریباً نیمی از یکی از این‌ها را بپردازد.») او طرح‌های پیچیده یونانی را روی پاپیروس کشید، سپس آن‌ها را کربنیزه و اسکن کرد. او نتایج را با دیگران به اشتراک گذاشت و منبع غنی‌ای از داده‌های آموزشی ایجاد کرد.

دیگران معتقد بودند شرکت‌کنندگان بیش از حد روی هوش مصنوعی متمرکز شده‌اند. «کیسی هندمر» (Casey Handmer) فیزیکدان سی و چندساله استرالیایی تصمیم گرفت اسکن‌ها را به‌صورت چشمی بازرسی کند. او می‌گوید: «اگر ماشین می‌تواند آن را ببیند، انسان هم می‌تواند آن را ببیند.» هندمر توضیح می‌دهد که اکثر الگوریتم‌های یادگیری ماشین برای تشخیص ویژگی‌های بصری بر اساس تشخیص انسان ساخته شده‌اند و دلیل خوبی هم دارد؛ قشر بینایی ما در شناسایی الگوها و بافت‌های ظریف بسیار ماهر است.

هندمر بنیان‌گذار و مدیرعاملTerraform Industries مستقر در کالیفرنیا است که گاز طبیعی کربن‌خنثی از خورشید و هوا تولید می‌کند و دفتر مرکزی آن در یک قلعه قرون‌وسطایی ساختگی درBurbank است. او ساعت‌ها وقت صرف بازرسی تصاویر کرد که باعث آزردگی فریدمن شد؛ یک سرمایه‌گذاری در زمینی‌سازی (Terraform) که حواس‌پرتی مدیرعامل را تأیید نمی‌کرد. پس از وقفه‌ای برای چاپ سه‌بعدی کپی‌ای از اسکلت خودش برای سرگرمی شخصی، هندمر متوجه شد که دارد با ویژگی‌های بصری الیاف پاپیروس سوخته آشنا می‌شود و در مه ۲۰۲۳، هنگام بازرسی «قطعه هیولا» کایلز، متوجه چیز قابل‌توجهی شد. او مدام بافتی تکرار‌شونده را می‌دید که شبیه گل ترک‌خورده‌ای بود که روی سطح پاپیروس پخته‌شده باشد. بعد از حدود یک ساعت کلنجاررفتن، متوجه یک π وارونه شد. بافت ترک‌خورده باید جوهر می‌بود.

هندمر مقدار بیشتری از آن بافت را به شکل حروف دیگر پیدا کرد و حتی معتقد بود کلمه «Καλλιόπη»، نام الهه شعر و موسیقی را کشف کرده است. بااین‌حال، یافته‌های او نتوانست شش پاپیروس‌شناسی را که ورودی او را در جایزه اولین حروف در ژوئن ۲۰۲۳ ارزیابی کردند، متقاعد کند؛ مسابقه‌ای ۴۰ هزاردلاری برای اولین کسی که ۱۰ حرف را در مساحتی به اندازه ۰.۶ اینچ مربع (حدوداً ۴ سانتیمتر مربع) پیدا کند. اما هندمر اولین جوهر را کشف کرده بود که برای آن جایزه‌ای ۱۰ هزاردلاری دریافت کرد. با به اشتراک گذاشتن کشف خود با جامعه تقریباً در همان لحظه، او راه را برای پیشرفت‌های بزرگ بعدی هموار کرد.

فریتور، دانشجوی کالج در نبراسکا، در حال گذراندن کارآموزی درSpaceX در تگزاس بود که از کشف هندمر درباره بافت ترک‌خورده مطلع شد. او روزهایش را صرف کار در تیم نرم‌افزار سکوی پرتاب برای استارشیپ می‌کرد. بااین‌حال، بعد از کار او بیشتر شب را بیدار می‌ماند و مدل هوش مصنوعی می‌ساخت تا مقدار بیشتری از آن بافت ترک‌خورده را پیدا کند. در همین حال، «یوسف نادر» (Youssef Nader) دانشجوی مصری تحصیلات تکمیلی علم داده در دانشگاه آزاد برلین، روی سیستمی کار می‌کرد که آن را از یک مدل موفق مسابقهKaggle اقتباس گرفته بود. هم فریتور و هم نادر در یافتن توالی حروف موفق شدند. نتایج نادر تمیزتر بود، اما روش فریتور سریع‌تر بود. پس از یافتن πορ در شب مهمانی آگوست ۲۰۲۳، فریتور به اصلاح مدل خود ادامه داد تا اینکه مدل چندین شکل تار در اطراف πορ تشخیص داد که به نظر می‌رسید آن‌ها هم ممکن است حروف یونانی باشند.

در سپتامبر، پاپیروس‌شناسان نتایج فریتور را بازرسی کردند. آن‌ها متوجه شدند که πορ فریتور آغاز کلمه یونانی باستان «πορφύραc» به معنی بنفش است. «فدریکا نیکولاردی» (Federica Nicolardi) پاپیروس‌شناس دانشگاه ناپل که به تأیید کلمه کمک کرد می‌گوید این یک اصطلاح نادر است و احتمالاً از یک متن جدید است.

طومارهای «چالش وزوو» از تنها کتابخانه حفظ‌شده دوران کلاسیک به‌دست آمده‌اند. هرکولانیوم، شهری رومی در کنار خلیج ناپل در فوران کوه وزوو در سال ۷۹ میلادی ویران شد.

مسابقه، فریتور را چند هفته بعد برای شرکت در سمپوزیومی که پیرامون این کشف سازمان‌دهی شده بود، به کنتاکی فرستاد. پس از آن، «جی‌پی پوسما» (JP Posma) یکی از برگزارکنندگان، یک چک بزرگ ۴۰ هزاردلاری به فریتور داد و نادر که همان کلمه را فقط چند روز بعد پیدا کرده بود، ۱۰ هزاردلار برای مقام دوم دریافت کرد. اما درست زمانی که پاپیروس‌شناسان داشتند برای سمپوزیوم می‌رسیدند، نادر بزرگ‌ترین پیشرفت را رونمایی کرد؛ او تصویری منتشر کرد که «πορφύραc» را در متن چهار ستون کامل نوشته نشان می‌داد؛ منظره‌ای که پاپیروس‌شناسان انتظار نداشتند در طول عمر خود ببینند. در ستون‌ها کلمات قابل‌شناسایی دیگری وجود داشت، از جمله عبارت احتمالی «κατά μουσικήν» به معنای چیزی شبیه «مربوط به موسیقی» که طبق گفته نیکولاردی، این طومار را به‌احتمال زیاد به اثری فلسفی تبدیل می‌کند.

در پایان سال ۲۰۲۳، نادر با فریتور و «جولیان شیلیگر» (Julian Schilliger) دانشجوی رباتیک در سوئیس که نرم‌افزارش برای تسریع بخش‌بندی و نقشه‌برداری سه‌بعدی پاپیروس برنده جایزه قبلی شده بود، تیمی تشکیل دادند. آن دسامبر، با ترکیب رویکردهایشان، تیم سه‌نفره چیزی حیرت‌انگیز تولید کرد. بر پایه کاری که هر کدام به‌صورت انفرادی انجام داده بودند، مدل‌های هوش مصنوعی آن‌ها ۲۰۰۰ کاراکتر را در چهار ستون کامل آشکار کرد؛ خیلی فراتر از معیار جایزه بزرگ که چهار قطعه با ۱۴۰ کاراکتر بود. در اوایل فوریه ۲۰۲۴، چالش وزوو جایزه بزرگ ۷۰۰ هزاردلاری را به آن‌ها اعطا کرد.

متن خوانا شامل حدود ۵ درصد از اولین طومار و از همان متنی است که اکتشافات قبلی از آن بود. این رساله‌ای است که قبلاً خوانده نشده، احتمالاً اثر فیلودموس درباره لذت باشد. آیا چیزهای خوب در مقادیر کم لذت‌بخش‌تر از چیزهای خوب فراوان هستند؟ نویسنده نتیجه می‌گیرد: ابداً. نویسنده می‌نویسد: «همچنان که در مورد غذا نیز ما فوراً باور نمی‌کنیم که چیزهای کمیاب مطلقاً دلپذیرتر از چیزهایی باشند که فراوان هستند.»

حوزه‌های پاپیروس‌شناسی و مطالعات کلاسیک برای همیشه تغییر کرده‌اند. تا حد زیادی به لطف گروهی از سازندگان آماتور هوش مصنوعی، ما اکنون ابزارهایی برای خواندن پاپیروس‌های بازنشده هرکولانیوم داریم. «توبیاس راینهارت» (Tobias Reinhardt)، محقق کلاسیک در دانشگاه آکسفورد که به تأیید ورودی‌های برنده کمک کرد می‌گوید اگر پیشرفت‌های فناوری ادامه یابد و بتواند برای بسیاری از طومارهای بازنشده به کار گرفته شود، «می‌توانیم شاهد بازیابی متون باستانی در حجمی باشیم که از زمان رنسانس دیده نشده است.»

فریدمن چیزهای بیشتری می‌خواهد و متوقف نمی‌شود. وقتی در اواخر ۲۰۲۳ صحبت کردیم، گفت هدف او برای سال ۲۰۲۴ این است که بر پایه رویکرد تیم برنده، ۹۰ درصد از چهار طوماری که تا آن زمان با استفاده از فیزیک انرژی بالا اسکن شده بودند را بخواند. اگر موفق شود، این کار قفل صدها طومار بازنشده هرکولانیوم را باز خواهد کرد. اما این‌ها فقط آن‌هایی هستند که ما از آن‌ها خبر داریم. او در نهایت آرزو دارد مقامات ایتالیایی را متقاعد کند که اجازه حفاری‌های جدید در منطقه به امید کشف‌های بیشتر را بدهند.

چند مشکل کوچک وجود داشت که قبل از اینکه فرایند بتواند مقیاس پیدا کند، باید رفع می‌شد. پژوهشگران نیاز داشتند راهی برای خودکارسازی فرایند زمان‌بر و پرهزینه بخش‌بندی دستی پیدا کنند. به‌علاوه، اجاره یک شتاب‌دهنده ذرات برای اسکن صدها طومار بسیار هزینه‌بر است و راه‌حل‌های ارزان‌تر برای تولید اسکن‌های با وضوح بالا باید پیدا شود.

بااین‌حال، آنچه برای پاپیروس‌شناسان شگفت‌آورتر است، سرعتی است که اکنون جربان روش هوش مصنوعی حروف قابل‌شناسایی را پیدا می‌کند. «جیانلوکا دل ماسترو» (Gianluca Del Mastro)همکار نیکولاردی و استاد پاپیروس‌شناسی دانشگاه Campania Luigi Vanvitelli می‌گوید رفتن از سه حرف به کل کلمات و عبارات و سپس ستون‌های متن که برای فریتور، نادر و شیلیگر یک ماه طول کشید، معمولاً برای پاپیروس‌شناسان به‌اندازه ۲۰ سال مطالعه حرفه‌ای زمان می‌برد.

سیلز می‌گوید فناوری‌ای که چالش وزوو به توسعه آن کمک کرد، می‌تواند برای رمزگشایی سایر متون گمشده فراتر از خلیج ناپل مقیاس شود. گزینه‌های وسوسه‌انگیز زیادی وجود دارد. در سال ۱۹۹۳ تعداد ۱۴۰ طومار پاپیروس کربنیزه‌شده مربوط به قرن ششم میلادی در کلیسایی بیزانسی در پترا اردن کشف شد. آن‌ها سیاه و شکننده و غیرقابل‌خواندن در نظر گرفته می‌شدند؛ همچنین ده‌ها هزار قطعه از «طومارهای دریای مرده» هرگز خوانده نشده‌اند؛ زیرا بسیاری از آن‌ها به هم چسبیده‌اند. آن‌ها اکنون نامزدهای اصلی برای خط باز کردن مجازی تا تشخیص جوهر با هوش مصنوعی چالش وزوو هستند.

ماسک‌های مومیایی مصر باستان نیز از پاپیروس ساخته می‌شدند که در لایه‌های پوشیده شده با گچ چیده شده بودند؛ ماده‌ای به نام «کارتوناژ» (Cartonnage) که اساساً نوعی خمیر کاغذی یا «پاپیه ماشه» (papier-mâché) است. آن پاپیروس اغلب حاوی نوشته‌هایی بود که رمزگشایی آن بدون تخریب گچ دشوار بوده است. آن پاپیروس‌ها نیز ممکن است اکنون زندگی پس از مرگ داشته باشند.

در قرن چهارم پیش از میلاد، گزنفون مورخ یونانی در بازگشت از بین‌النهرین خاطرنشان کرد که تجارتی پررونق در طومارها در سراسر دریای سیاه وجود دارد. «ریچارد یانکو» (Richard Janko) استاد کلاسیک‌گرا و پاپیروس‌شناس دانشگاه میشیگان می‌گوید این بدان معناست که تقریباً به‌طورقطع کشتی‌های غرق‌شده‌ای در بستر دریا وجود دارند که حاوی جعبه‌های طومار پاپیروس هستند. این طومارها احتمالاً هنوز در این دریا که اکسیژن و شوری فوق‌العاده پایینی برای یک محیط دریایی دارد، حفظ شده‌اند. تاکنون هیجان هوش مصنوعی عمدتاً حول محور شبکه‌های عصبی بوده است که یاد می‌گیرند چگونه چت کنند. بااین‌حال جذاب‌تر این است که چگونه آن‌ها چیزهای ساکت را به سخن وامی‌دارند.

گزارش حاضر در «ویژه‌نامه هوش مصنوعی ساینتیفیک امریکن» منتشر و در «رسانه تخصصی هوش مصنوعی هوشیو» به زبان فارسی نیز ترجمه شده و در دسترس مخاطبان این حوزه قرار گرفته است.

https://hooshio.com/?p=81755

جدیدترین تحولات هوش مصنوعی را در کانال بله هوشیو بخوانید

مسابقه رمزگشایی یک طومار باستانی

دانشمند ارشد Anthropic با پیامی مرموز استعفا داد

گوگل از سرقت «Gemini» خبر داد

بدون هوش مصنوعی شانسی در رقابت‌های جهانی نداریم

نویسنده «پالپ فیکشن» با کمک هوش مصنوعی صاحب ۳ فیلم جدید شد

یک مدل زبانی بزرگ برای ستارگان

آغاز عصر نوین در اثبات‌های ریاضی