کاربرد هوش مصنوعی در ژنتیک: متخصصان به دنبال رمزگذاری ذهن انسان
تقریباً از همان سال 1950 که مقالهی معروف آلن تورینگ (ماشینآلات و هوشمندسازی محاسبات Computing Machinery and Intelligence) در ژورنال Mind منتشر شد، متخصصان کامپیوتری با استفاده از کاربرد هوش مصنوعی در ژنتیک ، به دنبال رمزگذاری ذهن انسان بودهاند. ذهن، از نظر تئوری، زیرساختی مستقل است؛ بدین معنی که توانایی پردازش آن لزوماً بسته به خیسافزار مغز نیست. ذهن را میتوان روی کامپیوتر بارگذاری کرد یا حتی ذهنی کاملاً جدید در دنیای نرمافزاری بازآفرینی کرد.
همهی این مطالب را قبلاً هم شنیدهایم. با اینکه هنوز موفق نشدهایم ذهنی در قالب نرمافزاری بسازیم یا بازسازی کنیم (به جز شبکه های عصبی که بازآفرینی ضعیفی از ذهن هستند)، بسیاری از متخصصان کامپیوتر در حال حاضر مشغول کار روی این مسئله هستند.
یکی از کارهای اخیر این حوزه توسط پژوهشگران دانشگاه تارتو (استونی) و دانشگاه پاریس-سکلی Paris-Sacley (فرانسه) انجام شده است.
این پژوهشگران به جای بازسازی تقریبی ذهن در نرمافزار، سؤالی جدید مطرح کردهاند: آیا میتوان برای تولید رمز ژنتیکی افرادی که تا به حال وجود نداشتهاند، از یک الگوریتم استفاده کرد؟ آیا میتوان در راستای کار تورینگ، از فناوری GAN (شبکههای مولد تخاصمی Generative Adversarial Network) استفاده کرد که مدلهای هوش مصنوعی همچون BigSleep را قادر میسازد به جای تولید تصاویر واقعنگرانه، DNA مصنوعی تولید کنند که از یک انسان واقعی قابل تمیز نباشد.
دادههای ژنتیکی مصنوعی
فلورا جی، یکی از محققان دانشگاه پاریس-سکلی که در زمینهی یادگیری ماشین و ژنتیک جمعیت تخصص دارد، به وبسایت خبری Digital Trends میگوید: «کار بسیار دشواری است که بدون کپی مستقیم توالیهای موجود، دادههایی از ژنتیک مصنوعی تولید کنیم که تا حد لازم و قابل قبول واقعگرایانه باشند. دادههای ژنتیکی پیچیده هستند و نمیتوان به سادگی اهمیت یا عدم اهمیت آنها را تشخیص داد.
به همین دلیل، به سراغ آخرین تکنیکهای موجود رفتهایم که در دنیای بینایی کامپیوتری، نوشتار، موسیقی یا مطالعهی پروتئینها به کار میروند. هدف از طراحی شبکههای مولد (GAN و ماشین بولتزمن محدودشده Restricted Boltzmann machines) این بوده است که بتوانند به صورت خودبخودی و تدریجی بیاموزند توالیهای ژنتیکی مصنوعی تولید کنند.»
شبکهی مولد تخاصمی نمونهای از چارچوبهای یادگیری ماشینی است که توسط پژوهشگری به نام ایان گودفلا (یکی از کارکنان حال حاضر اپل) معرفی شد. شبکهی مولد تخاصمی برای بهبود خروجیهای خود، از یک رویکرد رقابتی استفاده میکند.
GAN از دو شبکهی عصبی تشکیل شده است: یک شبکهی مولد Generative network و یک شبکهی متمایزگر Discriminator network. خروجی این دو شبکه بین یکدیگر جابجا میشود.
وظیفهی شبکهی مولد تخاصمی
وظیفهی شبکهی مولد تولید یک چیز (یک تصویر یا چند کد که ژنوم مصنوعی را به صورت 0 و 1 نشان میدهند) است. شبکهی متمایزگر نتیجهی شبکهی مولد را میسنجد و به آن باز میگرداند. شبکهی مولد از این بازخورد میآموزد.
شبکهی متمایزگر به مرور بهتر میتواند حدس بزند که شبکهی مولد چه چیزی ایجاد کرده و شیء اصلی چه بوده است. در نهایت، مولد به حدی در تولید نسخههای جعلی آن چیزی که قصد تولیدش را دارد موفق عمل میکند که میتواند متمایزگر را فریب دهد؛ یعنی شبکهی متمایزگر دیگر نمیتواند آن چیزی که شبکهی مولد تولید کرده است را از چیز واقعی تشخیص دهد.
بوراک یلمن، دانشجوی دکتری مؤسسهی ژنومشناسی دانشگاه تارتو، در گفتگوی خود با Digital Trends در رابطه با کاربرد هوش مصنوعی در ژنتیک بیان کرد: «یکی از مشکلات اساسی این کار، ارزیابی کیفیت ژنومهای مصنوعی است. با نگاه به یک تصویر میتوان واقعی بودن آن را تشخیص داد؛ اما برای ژنوم نمیتوان چنین کاری انجام داد. بیشتر تجزیه و تحلیلهایی که در مطالعات خود انجام دادیم به این هدف بودند که ببینیم آیا ژنومهای مصنوعی که تولید کردیم شبیه به نمونههای واقعی بودهاند یا خیر.»
علیرغم حجم رو به رشد مقالاتی که، به هدف نوشتن رمز ژنتیکی انسان، به دستکاری ژنها پرداختهاند، پژوهش حاضر سعی نمیکند ژنوم انسانهایی بیوالد را بنویسد (کاری که ابرکامپیوترها هم میتوانستند انجام دهند).
به گفتهی جی: «هدف از کار ما درک بهتر و رمزگذاری گسترهی متنوع ژنتیکی موجود از هزاران یا میلیونها انسان در سراسر دنیاست، نه تولید سلولهای مصنوعی. شبکههای عصبی عمیق روی این گوناگونی و تنوع آموزش میبینند؛ به همین دلیل در ناحیههای ژنومی تولیدشده، جهش جدیدی که بتواند کارکرد یک توالی ژن را مختل کند، به وجود نخواهد آمد. این نواحی ژنومی قطعاتی جهشنیافته را در برمیگیرند که میان جوامع انسانی مشترک هستند.»
جی در ادامه در ارتباط با کاربرد هوش مصنوعی در ژنتیک میگوید: «تشخیص اینکه ترکیب خاصی از میلیونها نوکلئوتید تولید شده واقعاً میتواند کارکردی باشند یا خیر کار دشواری است.» به عبارت دیگر، نباید انتظار داشت این کد بعد از کامپیال و اجرا، یک فرد کامل (یا قالب اولیهی آن فرد) را ایجاد کند. بلکه هدف ما دستیابی به چیزی مفیدتر است.
دادهها و حریم شخصی
یلمن میگوید: «دادههای بسیار زیادی در بانکهای اطلاعات پزشکی وجود دارند که در حال افزایش نیز هستند. با این حال، دادههای ژنومی حساسیت بالایی دارند و دسترسی به این بانکها برای پژوهشگران، به دلیل ملاحظات اخلاقی، میتواند کار دشواری باشد. هدف اصلی کار ما تولید جایگزینی باکیفیت برای بانکهای ژنومی و ارائهی راهکاری برای مشکل دسترسیپذیری (در قالب یک چارچوب امن اخلاقی) است. لازم است بدانیم مطالعات ما اولین گام این مسیر به شمار میروند و هنوز راه زیادی در پیش است.»
جی اضافه میکند: «سؤال زیربنایی مطالعات ما این بود که آیا تولید ژنومهای مصنوعی به جای ژنومهای واقعی میتواند به حفظ حریم خصوصی اهداکنندگان ژنوم کمک کند و در عین حال اطلاعات مفیدی برای جامعهی علوم ژنتیک جمعیت فراهم کند
کاربردهای احتمالی ژنومهای مصنوعی بازهی گستردهای را در برمیگیرند: از درک بهتر تاریخچهی تحولی انسانها گرفته تا ارائهی اطلاعات و بینش به حوزهی پزشکی ژنتیک (از جمله افزایش گوناگونی در این حوزه).»
این پژوهش به نوعی یادآورد جریانی است که چند سال پیش مطرح شد؛ جریانی که طی آن شبکه های مولد تخاصمی برای تولید تصاویر افراد و حیوانات فرضی به کار میرفتند. اما این بار، این جریان فقط تصاویر را در برنمیگیرد و خود رمزنویسی را هم شامل میشود.