ویژهنامه هوش مصنوعی مجله تایم
دادههای ژنتیکی ارزشمند و بالقوه خطرناک هستند
شرکت آزمایش ژنتیکی23andMe که دادههای ژنتیکی ۱۵ میلیون نفر را در اختیار دارد، پس از سالها مشکلات مالی، در مارس ۲۰۲۵ اعلام ورشکستگی کرد. این بدان معناست که تمام دادههای بسیار شخصی کاربران ممکن است برای فروش گذاشته شود و کارشناسان میگویند این گنجینه عظیم از دادههای ژنتیکی میتواند توجه شرکتهای هوش مصنوعی را که به دنبال آموزش مجموعهدادههای خود هستند، جلب کند.
«سابودا کومار» (Subodha Kumar) استاد مدرسه کسبوکار فاکس در دانشگاه Temple میگوید: «داده نفت جدید است و این نفت با بالاترین کیفیت ممکن است. با توسعه الگوریتمهای هرچه پیچیدهتر و دقیقتر، این دادهها به منزله یک معدن طلا برای بسیاری از شرکتها هستند.»
اما هر شرکت فعال در حوزه هوش مصنوعی که تلاش کند 23andMe را تصاحب کند، با خطرات سنگین اعتباری روبهرو خواهد شد. بسیاری از مردم از این فکر وحشت دارند که دادههای ژنتیکی خود را که برای ردیابی تبارشان در اختیار این شرکت گذاشتند، اکنون ممکن است بدون رضایتشان در زمینههایی کاملاً متفاوت مورداستفاده قرار گیرد. کومار که مدیر «مرکز تحلیل تجاری و فناوریهای مخرب» در مدرسه فاکس است میگوید: «هر کسی که به این دادهها دست بزند، در حال پذیرش ریسک است. اما درعینحال، اگر به سراغ آن نرود، ممکن است چیز بزرگی را از دست بدهد.»
آموزش مدلهای زبانی بزرگ
شرکتهایی مانند OpenAI و گوگل زمان و منابع فراوانی را صرف تأثیرگذاری در حوزه پزشکی کردهاند و گنجینه دادههای 23andMe ممکن است توجه شرکتهای بزرگ هوش مصنوعی که توان مالی لازم برای خرید آن را دارند، جلب کند. ارزش 23andMe در زمان ورشکستگی حدود ۴۸ میلیون دلار بود، درحالیکه در سال ۲۰۲۱ به اوج ۶ میلیارد دلار رسیده بود.
این شرکتها در تلاشاند قدرتمندترین مدلهای عمومی ممکن را بسازند، مدلهایی که بر حجم عظیمی از دادههای دقیق و جزئی آموزش میبینند. اما پژوهشگران استدلال کردهاند که منابع دادههای باکیفیت در حال کاهش است و همین امر باعث شده منابع جدید و قابلاعتماد ارزش بیشتری پیدا کنند. نظرسنجی TechCrunch در اوایل ۲۰۲۵ از سرمایهگذاران خطرپذیر نشان داد که بیش از نیمی از پاسخدهندگان «کیفیت یا نایابی دادههای انحصاری» را بهعنوان مزیت رقابتی استارتاپهای هوش مصنوعی نسبت به سایرین ذکر کردند.
«داده نفت جدید است و این نفت با بالاترین کیفیت ممکن است.»
سابودا کومار، استاد مدرسه کسبوکار فاکس دانشگاه Temple
«آنا کازلاوسکاس» (Anna Kazlauskas) درباره 23andMe میگوید: «فکر میکنم این دادهها میتواند مجموعهدادهای واقعاً ارزشمند برای برخی از شرکتهای بزرگ هوش مصنوعی باشد، زیرا نشاندهنده دادههای واقعی و بنیادی ژنتیکی است. برخی از خطاهای انسانی که ممکن است در مقالات علمی زیستشناسی وجود داشته باشد را میتوان از این طریق حذف کرد.» کومار اضافه میکند که دادههای 23andMe بهویژه برای شرکتهایی که به دنبال توسعه هوش مصنوعی عاملمحور (Agentic AI) هستند ارزشمند است. هوش مصنوعی عاملمحور یعنی سامانههایی که میتوانند بدون دخالت انسان کارهایی مانند پژوهش پزشکی یا تصمیمگیری سازمانی انجام دهند. کومار میگوید: «هدف کل مدلهای عاملمحور، رویکردی ماژولار است؛ یعنی شما قطعات کوچکتر مسئله را حل میکنید و سپس آنها را کنار هم میگذارید.» نمایندگان گوگل وOpenAI در برابر درخواستها برای اظهارنظر واکنشی نشان ندادند.
ارزش در صنایع مختلف
دادههای 23andMe میتواند در صنایع گوناگونی که از هوش مصنوعی برای تحلیل حجم انبوه داده استفاده میکنند، ارزشمند باشد که در رأس آنها، پژوهشهای پزشکی قرار دارد. 23andMe پیشتر قراردادهایی با شرکتهای داروسازی مانند GlaxoSmithKline داشت که به دادههای این شرکت دسترسی داشتند تا درمانهای جدیدی برای بیماریها توسعه دهند. کومار میگوید که در دانشگاه Temple، او و همکارانش روی پروژهای برای ایجاد درمانهای شخصیسازیشده برای بیماران مبتلا به سرطان تخمدان کار میکنند و دریافتند که دادههای ژنتیکی میتوانند در درک ساختارهایی که پیشتر برای ما ناشناخته بود «بسیار، بسیار قدرتمند» باشند.

بااینحال، «الکس ژاورونکوف» (Alex Zhavoronkov)، بنیانگذار و مدیرعامل Insilico Medicine معتقد است دادههای 23andMe بهویژه در حوزه کشف دارو، ممکن است آنقدرها هم که تصور میشود ارزشمند نباشند. او در ایمیلی به مجله TIME نوشت: «بیشتر میوههای در دسترس از قبل چیده شدهاند و مقدار زیادی از دادهها در حوزه عمومی، همراه با مقالات علمی معتبر منتشر شدهاند.»
اما احتمالاً شرکتهای فعال در بسیاری از صنایع دیگر نیز به این دادهها علاقهمند خواهند شد؛ زیرا چنین چیزی یک مجموعهداده غیرعادی بزرگ و پیچیده است و این حجم از دادههای ژنتیکی بهویژه همراه با سوابق سلامت و پزشکی افراد بهندرت در دسترس عمومی قرار دارد. کازلاوسکاس، مدیرعامل Open Data Labs و خالق شبکه دادهمحور Vana میگوید: «تمام این دادههای زمینهای، این مجموعهداده را واقعاً ارزشمند و درعینحال بسیار دشوار برای دسترسی میسازد.»
صنایعی که ممکن است علاقهمند باشند، شامل شرکتهای بیمه هستند که میتوانند از دادهها برای شناسایی افراد دارای ریسک سلامت بالاتر و افزایش حق بیمهشان استفاده کنند. مؤسسات مالی ممکن است رابطه میان نشانگرهای ژنتیکی و الگوهای هزینهکرد را برای ارزیابی وامها بررسی کنند. شرکتهای تجارت الکترونیک نیز میتوانند از دادهها برای هدفگیری تبلیغات متناسب با شرایط پزشکی خاص استفاده کنند.
دغدغههای اخلاقی و حریم خصوصی
اما شرکتها درگیرشدن با چنین دادههایی را با خطرات اعتباری سنگینی همراه خواهند دید. شرکت 23andMe در سال ۲۰۲۳ قربانی یک هک گسترده شد که دادههای شخصی میلیونها کاربر را فاش کرد و بهشدت به اعتبار شرکت لطمه زد. کومار میگوید خریداران احتمالی از صنایع دیگر ممکن است حتی سازوکارهای حفاظتی ضعیفتری از 23andMe داشته باشند و عنوان میکند: «نگرانی من این است که برخی از این شرکتها تجربه کار با این نوع دادهها را ندارند و ممکن است سازوکارهای نظارتی کافی در اختیار نداشته باشند.»
این امر خطرناک است، زیرا اطلاعات ژنتیکی ذاتاً حساس هستند و در صورت افشا، غیرقابلتغییر باقی میمانند. اطلاعات ژنتیکی اعضای خانواده کسانی که داوطلبانه دادههای خود را به شرکت سپردهاند نیز در معرض خطر قرار میگیرد و باتوجهبه سوگیریهای شناختهشده در هوش مصنوعی، سوءاستفاده از چنین دادههایی میتواند به تبعیض در حوزههایی مانند استخدام، بیمه و وام منجر شود.

در مارس ۲۰۲۵، «راب بونتا» (Rob Bonta) دادستان کل کالیفرنیا، هشداری «فوری» برای مشتریان 23andMe صادر کرد و از آنان خواست طبق قانون حریم خصوصی کالیفرنیا از شرکت بخواهند دادههایشان را حذف و نمونههای ژنتیکیشان را نابود کند.
«اوا گالپرین» (Eva Galperin)، مدیر امنیت Electronic Frontier Foundation، نگران است که دادههای ژنتیکی 23andMe ممکن است در وضعیتی از چرخش دائمی در بازار باقی بمانند و میگوید: «وقتی دادهها فروخته شدند، دیگر محدودیتی برای تعداد دفعات فروش دوباره آنها وجود ندارد.» این امر میتواند منجر به افتادن دادههای ژنتیکی به دست سازمانهایی شود که ممکن است ملاحظات اخلاقی یا سازوکارهای حفاظتی کافی نداشته باشند.
«ژاورونکوف» (Zhavoronkov) از شرکتInsilico Medicine میگوید همه این نگرانیها باعث میشود خریداران بالقوه مرتبط با هوش مصنوعی از خرید23andMe و دادههای آن منصرف شوند. «این مجموعهداده در واقع سمی است. هر شرکتی که آن را بخرد و بر اساس آن مدل آموزش دهد، با بازتاب منفی رسانهای روبهرو میشود و ممکن است مورد تحقیق یا پیگرد قرار گیرد.»
صرفنظر از اینکه در نهایت چه اتفاقی بیفتد، کازلاوسکاس میگوید دستکم خوشحال است که این معما باعث گشودن باب گفتوگوهای گستردهتر درباره حاکمیت دادهها شده است و میگوید: «ما میخواهیم از چنین موقعیتی پرهیز کنیم که فرد تصمیم بگیرد آزمایش ژنتیکی بدهد و پنج سال بعد وقتی شرکت دچار بحران مالی میشود، دادههای ژنتیکیاش در معرض خطر فروش به بالاترین پیشنهاددهنده قرار گیرد. در عصر هوش مصنوعی، این دادهها فوقالعاده ارزشمند هستند.»
