پیشبینی دقیق ساختار سهبعدی پروتئین های ساختهشده در بدن
هوش مصنوعی اجزاء تشکیل دهنده موجودات زنده را شناسایی و راه را برای ورود به برحهای جدید در علم هموار کرده است.
دیپمایند، شرکتی که اکنون به گوگل پیوسته است، ساختار سه بعدی تمام پروتئین های ساخته شده در بدن انسان را با دقتی بیسابقه پیشبینی کرده است.
بیشتر از نیم قرن بشر به دنبال پاسخی برای این چالش عظیم یعنی شناسایی اصلیترین سازهی موجودات زنده بوده است؛ دانشی که ضرورت آن در نبرد با بیماریهای کشنده به اثبات رسیده است. به راحتی میتوان ساختار مولکول آب را تصور کرد: پیوند دو اتم هیدروژن با یک اتم اکسیژن H₂O. اما هموگلوبین، پروتئین غنیکننده خون، فرمول پیچیدهتری دارد: C₂₉₅₂H₄₆₆₄N₈₁₂O₈₃₂S₈Fe₄.
در سال 1969، زیستشناس آمریکایی، سایرس لِوینتال ، پیشبینی کرد که بیش از 14 میلیارد سال _ یعنی مدت زمان شکلگیری جهان_ طول خواهد کشید تا انسان بتواند همه پیکربندیهای احتمالی تنها یک پروتئین را از توالی اسیدهای آمینه آن باز کند. آمینه اسیدها واحد اصلی ساختار درشتمولکولها (مانند پروتئینها) هستند.
با این حال، هوش مصنوعی ایجاد شده توسط یکی از اعضای خانواده بزرگ گوگل، موفق شد تنها ظرف چند دقیقه این سازه را باز کند. پیشبینیهای این فناوری برای تک تک پروتئینهای بدن انسان هفته گذشته منتشر شد. این موفقیت گامی بزرگ در زیست شناسی به شمار میآید و پرده از راز یکی از نقاط کور دانش بشری برداشته است.
دمیس حسابیس؛ پیشتاز تحول زیستشناسی
میتوان از دمیس حسابیس ، عصب شناس انگلیسی، به عنوان یکی از پیشتازان این تحول زیستشناسی نام برد. این محقق 44 ساله در کودکی یک نابغه شطرنج بود که در سال 1997 از بازی استاد بزرگ روس، گری کاسپاروف ، با ابر رایانهی دیپ بلو وحشت داشت. کاسپاروف از ماشین شکست خورد، اما حسابیس همیشه این حس را داشت که ماشین در بازی دوز تنها دستگاهی دست و پا گیر و بیمصرف است. پس از پایان رقابت نهایی انسان و ماشین، این دانشجوی کارشناسی دانشگاه کمبریج به فکر طراحی دستگاهی افتاد که میتوانست هر بازیای را یاد بگیرد.
در سال 2010 ، حسابیس شرکتی به نام «دیپمایند» (DeepMind) تاسیس کرد تا تحقیقات خود را به سمت هوش مصنوعی (AI) سوق دهد. او در سال 2013 اولین اختراع خود را معرفی کرد؛ فناوریای که میتوانست بازیهای مختلف کنسول آتاری افسانهای را فرابگیرد. در سال 2014، گوگل، شرکت دیپمایند را به قیمت 650 میلیون دلار (حدود 500 میلیون یورو با نرخ ارز آن زمان) خریداری کرد.
پس از پشتسرگذاشتن محدودیتهای بازیهای ویدئویی، دانشمندان دیپمایند وظیفه خود دانستند راهکاری برای حل یکی از بزرگترین چالشهای زیست شناسی پیدا کنند. پروتئینها، از جمله هورمونها، آنزیمها و آنتیبادیها، ماشینهای کوچکی هستند که عملکردهای اصلی بدن موجودات زنده را انجام میدهند. آنها، به مثابه یک گردنبند مروارید، از زنجیرهای از مولکولهای کوچکتر، یعنی اسیدهای آمینهها، تشکیل شدهاند. این گردنبندها هرکدام ساختارِ در هم تنیدهی منحصربهفردی دارد که عملکرد مولکول را تعیین میکند. آنتیبادیها دارای ساختاری Y شکل هستند. این دسته از پروتئینها مکانیسم دفاعی بدن انسان در برابر مهاجمانی مانند ویروس کرونا را بر عهده دارند.
آلفافولد
دستورالعمل همه پروتئینهای مورد نیاز در DNA هر سلول نوشته شده است. سیستم شرکت دیپمایند، موسوم به «آلفافولد »، میتواند این اطلاعات را که زنجیرهای از اسیدهای آمینه است، بخواند و ساختار هر پروتئین را پیشبینی کند. دقت این فناوری مشابه دقت پیشبینیهای بدست آمده در آزمایشهای آزمایشگاهی است اما نسبت به آنها زمان و هزینه کمتری دارد. مانند این است که بعد دیدن یک کیک برای اولین بار، اجزاء تشکیلدهندهی آن را حدس بزنید: تخم مرغ، فلفل، نمک، شیر و خامه.
دیپمایند و آزمایشگاه زیستشناسی مولکولی اروپا (EMBL) تا 22 ژوئن بیش از 350،000 ساختار را منتشر کردند؛ این ساختارها شامل 20،000 پروتئین انسانی و 20 موجود دیگر مانند موش آزمایشگاهی و باکتری سل میشود. ونکاترامان راماکریشنان پژوهشگر آزمایشگاه زیستشناسی مولکولی شورای تحقیقات پزشکی کمبریج و برنده جایزه نوبل شیمی 2009، معتقد است این موفقیت «پیشرفتی چشمگیر» با تاثیراتی غیر قابل پیشبینی به شمار میآید. وی میگوید: «این موفقیت بسیار زودتر آنچه انتظار میرفت، رخ داده است و از این پس شاهد تحولات بسیاری در تحقیقات بیولوژیکی خواهیم بود».
برخی از سازمانها در حال حاضر کار با این پایگاه دادهی جدید را شروع کردهاند. برای مثال، طرح «داور برای بیماریهای فراموششده » یک طرح غیرانتفاعی جهانی است که با کمک (سازمان) پزشکانِ بدونِ مرز راه اندازی شده است. محققان این سازمان از ساختار پروتئینهای این پایگاه برای جستجوی درمانهای جدید استفاده میکند. زیرا تقریباً تمام بیماریها، از سرطان گرفته تا آلزایمر و از جمله کووید 19، ساختاری پروتئینی دارند. موسسات دیگر، مانند دانشگاه پورتسموث انگلستان، از این برنامه برای آزمایش و طراحی پروتئینهایی استفاده میکنند که قابلیت بازیافت پلاستیک را دارند.
انتشار 100 میلیون ساختار پروتئینی
حسابیس، مدیر اجرایی دیپمایند، اعلام کرد که این شرکت قصد دارد تا چند ماه آینده 100 میلیون ساختار پروتئینی را منتشر کند. قرار است این شرکت پیشبینی مربوط به ساختار پروتئینهایی را که توالی اسیدهای آمینه آنها شناخته شده است، به صورت رایگان ارائه کند. وی پس از انتشار نتایج تحقیقات دیپمایند در مجله پزشکی Nature اظهار داشت: «معتقدیم که این فناوری بزرگترین سهمی است که هوش مصنوعی تاکنون در دانش بشری داشته است».
ادیت هِرد ، مدیرکل آزمایشگاه زیستشناسی مولکولی اروپا، درباره این فناوری تأکید کرد که تلاش بسیاری برای ساخت آن صورت گرفته است. وی میگوید: «آلفافولد بر روی دادههای متنبازِ ایجاد شده توسط جامعه علمی آموزش دیده است، بنابراین کاملاً منطقی است که استفاده از پیشبینیهای آن نیز برای عموم رایگان باشد». از نظر هِرد، این سیستم مبینِ «تحولی اصیل در علوم زیستی است، مانند تحولی که ژنوم چند دهه پیش ایجاد کرد».
زیرساختهای پرهزینهای برای تعیین ساختار واقعی پروتئینها مورد نیاز است، که از جمله آنها میتوان به مرکز تابشی سینکروترون اروپا اشاره کرد. این تاسیسات نوعی شتابدهنده ذرات به وسعت تقریباً یک کیلومتر مربع است که در گرنوبل فرانسه قرار دارد. تابش ساطع شده از الکترونهایی که در یک مسیر دایرهای شکل حرکت میکنند (تابشی که اساساً از اشعه X تشکیل شده است)، مشاهده اسرار ماده را برای محققان امکانپذیر کرده است.
طبق توضیحات خوزه آنتونیو مارکز ، زیستشناس اسپانیایی، مشخصشدنِ ساختار یک پروتئین با روش سنکروترون یا با روش میکروسکوپ الکترونی کرایو ، ممکن است «ماهها یا حتی سالها به طول بیانجامد». اگرچه الگوریتم alphafold چند درصد خطا دارد، اما میتواند ظرف چند دقیقه به جواب برسد.
دقت 58 درصدی
طبق توضیحات این محقق 52 ساله و رئیس پلتفرم سینکروترونِ آزمایشگاه زیستشناسی مولکولی اروپا در گرنوبل «سخن از پیشبینیهای بدستآمده از رایانه است، نه برآوردهای آزمایشی ساختارهای پروتئینی. بنابراین دقت 58% درصدی پذیرفته است». در شرایط کنونی، اگر دانشمندی بخواهد پروتئین مرتبط با سرطان را مطالعه کند، ممکن است تجزیه و تحلیل ساختار آن ماهها یا سالها طول بکشد.
تنها حدود 180،000 ساختار در پایگاههای متنباز وجود دارد. اطلاعات منتشر شده در پایگاه دیپمایند این تعداد را به دو برابر رسانده است و طی چند ماه آینده تا میلیونها ساختار افزایش خواهد یافت. مارکز که خودش در این پروژه شرکت نکرده است، میگوید: «امروزه کاملاً طبیعی است که نتوانید یک ساختار پروتئینی را در پایگاههای داده پیدا کنید. با استفاده از آلفافولد میتوانید یک ساختار پروتئینی را با 58% دقت پیشبینی کرده و در زمان صرفهجویی کنید». پایین بودن دقت سیستم به دلیل آن قسمتهایی از پروتئین است که برای سازگاری با محیط هیچ ساختاری ندارند.
مارکز از دیگر محدودیتهای آلفافولد سخن میگوید. پروتئینها معمولاً با یکدیگر پیوند دارند؛ اما سیستم دیپمایند برای پیشبنی ساختار یک مولکول مجزا طراحی شده است. آلفافولد هنوز قادر به پیشبینی ساختارهای ترکیبی نیست، با این حال، طراحی سیستم به نحوهی است که به خودی خود یادمیگیرد پیشبینی کند. مارکز امیدوار است: «این فناوری اکتشافات را در تمام حوزههای زیستشناسی سرعت بخشد».
انواع کاربردهای هوش مصنوعی در صنایع مختلف را در هوشیو بخوانید