
مدل جدیدی که کنترل دادهها را به صاحبانشان بازمیگرداند
مؤسسه آلن برای هوش مصنوعی (AI2) با ارائه مدل جدیدی به نام فلکسالمو (FlexOlmo)، راهحلی نوآورانه برای رفع یکی از چالشهای بزرگ در حوزه هوش مصنوعی ارائه داده است: امکان حذف دادهها از مدل حتی پس از استفاده از آنها در فرآیند آموزش. این رویکرد میتواند صنعت هوش مصنوعی را متحول کند و به صاحبان دادهها قدرت کنترل بیشتری بر نحوه استفاده از اطلاعاتشان بدهد.
چالش مالکیت دادهها در مدلهای هوش مصنوعی
در دنیای امروز، شرکتهای بزرگ هوش مصنوعی، مانند OpenAI و Meta، دادهها را از منابع مختلف مانند وبسایتها و کتابها جمعآوری میکنند و بدون توجه به مالکیت آنها، مدلهایی میسازند که بهطور کامل در اختیار خودشان باقی میماند. تا به امروز، وقتی دادهای وارد فرآیند آموزش مدل میشد، حذف آن تقریباً غیرممکن بود؛ درست مثل تلاش برای جداکردن تخممرغ از کیکی که پخته شده است.
علی فرهادی، مدیرعامل AI2، میگوید: «وقتی دادههای شما وارد یک مدل میشوند، کنترل خود را از دست میدهید. اگر بخواهید دادههایتان را حذف کنید، مجبورید کل فرآیند آموزش چند میلیون دلاری را دوباره انجام دهید.»
فلکسالمو؛ رویکردی نوین برای کنترل دادهها
مدل فلکسالمو این مشکل را با تقسیم فرآیند آموزش به بخشهای مستقل حل میکند. در این روش، صاحبان دادهها میتوانند بدون نیاز به ارائه مستقیم اطلاعات خود، دادهها را به مدل اضافه کنند. فرآیند آموزش بهصورت زیر انجام میشود:
- مدل عمومی اولیه (انکر) کپی میشود.
- مدل دوم با استفاده از دادههای اختصاصی آموزش میبیند.
- مدل آموزشدیده با مدل انکر ترکیب میشود و یک مدل نهایی ساخته میشود.
این ساختار به صاحبان دادهها اجازه میدهد تا در صورت بروز منازعات حقوقی یا تغییر تصمیم، دادههای خود را از مدل حذف کنند. بهعنوان مثال، یک ناشر میتواند آرشیو مقالات خود را به مدل اضافه کند و در صورت نیاز، زیرمدل آموزشدیده بر اساس آن دادهها را حذف کند.
طراحی مبتنی بر ترکیب کارشناسان
مدل فلکسالمو بر اساس یک ساختار مشهور به ترکیب کارشناسان (mixture of experts) ساخته شده است. این طراحی امکان ترکیب چندین زیرمدل مستقل را برای ایجاد یک مدل قویتر فراهم میکند. نوآوری AI2 در نحوه ادغام این زیرمدلها است. با استفاده از روش جدیدی برای نمایش پارامترها، توانایی هر زیرمدل بهطور جداگانه حفظ شده و در مدل نهایی ترکیب میشود.
آزمایش موفقیتآمیز فلکسالمو
برای بررسی عملکرد فلکسالمو، پژوهشگران مجموعه دادهای جدید به نام فلکسمیکس (Flexmix) از منابع خصوصی مانند کتابها و وبسایتها ساختند. با استفاده از این دادهها، مدلی با ۳۷ میلیارد پارامتر ساخته شد که اندازه آن تقریباً یکدهم بزرگترین مدل متنباز شرکت Meta است. نتایج نشان داد که فلکسالمو در تمام وظایف بهتر از مدلهای منفرد عمل کرده و ۱۰ درصد بهتر از سایر روشهای ادغام مدلها در معیارهای استاندارد بوده است.
علی فرهادی میگوید: «این مدل به ما اجازه میدهد بدون آسیب جدی یا افزایش زمان استنتاج، دادهها را حذف کنیم. این نگرشی کاملاً جدید به آموزش مدلهاست.»
پیامدها برای حریم خصوصی و مالکیت دادهها
این نوآوری میتواند به شرکتها اجازه دهد از دادههای حساس خصوصی با کنترل دقیقتر استفاده کنند. به گفته سئون مین، رهبر فنی پروژه، فرآیند آموزش کاملاً ناهمزمان و مستقل انجام میشود و نیازی به هماهنگی صاحبان دادهها نیست.
با این حال، پژوهشگران هشدار میدهند که ممکن است دادهها از مدل نهایی قابل بازسازی باشند. بنابراین، برای حفظ حریم خصوصی، استفاده از روشهایی مانند حریم خصوصی تفاضلی (differential privacy) توصیه میشود که تضمین ریاضیاتی حفظ حریم دادهها را فراهم میکند.
چشمانداز حقوقی و رقابت در صنعت
مالکیت دادههای آموزش مدلهای هوش مصنوعی به یک موضوع حقوقی مهم تبدیل شده است. برخی ناشران از شرکتهای هوش مصنوعی شکایت کردهاند، درحالیکه دیگران قراردادهایی برای استفاده از محتوایشان منعقد کردهاند. برای مثال، شرکت مادر نشریه WIRED، قراردادی با OpenAI امضا کرده است.
در همین حال، شرکت Meta اخیراً در پروندهای مهم برنده شد که در آن قاضی حکم داد استفاده از کتابهای ۱۳ نویسنده برای آموزش مدل، نقض قانون کپیرایت نبوده است.
آینده مدلهای اشتراکی
سئون مین معتقد است که فلکسالمو میتواند راه را برای ساخت مدلهای اشتراکی باز کند. او میگوید: «این روش به صاحبان دادهها اجازه میدهد بدون از دست دادن حریم خصوصی یا کنترل دادهها، در توسعه مدلهای پیشرفته سهیم شوند.»
جمعبندی:
فلکسالمو، مدل جدید AI2، با ارائه رویکردی نوآورانه برای حفظ کنترل دادهها، میتواند تحولی بزرگ در صنعت هوش مصنوعی ایجاد کند. این مدل نهتنها به صاحبان دادهها اجازه میدهد اطلاعات خود را از مدل حذف کنند، بلکه امکان ساخت مدلهای اشتراکی با حفظ حریم خصوصی را نیز فراهم میکند. این رویکرد، گامی به سوی شفافیت بیشتر و مدیریت بهتر دادهها در عصر هوش مصنوعی است.