علی بابا مدل هوش مصنوعی منبع‌باز Qwen-7B را برای استفاده تجاری منتشر می‌کند

تیم تحریریه
۲۲ مرداد ۱۴۰۲
زمان مطالعه 3 دقیقه

علی بابا یک مدل هوش مصنوعی منبع‌باز با نام Qwen-7B را با ۷ میلیارد پارامتر برای استفاده تجاری رایگان منتشر خواهد کرد. براساس آزمایش‌های اخیر، مدل زبانی تازه توسعه‌یافته Qwen-7B، در آزمون‌های زبان چینی از ChatGPT بهتر عمل کرده است و پتانسیل خود را برای ایجاد تحول در پردازش زبان طبیعی نشان داده است.

به گزارش هوشیو، بخش ابری علی بابا در تلاش برای گسترش دامنه هوش مصنوعی خود، دو مدل زبان بزرگ منبع‌باز عرضه خواهد کرد که این دو مدل برای اکثر کاربران تجاری رایگان است.

Alibaba Cloud دسترسی به Qwen را باز می‌کند که در واقع نسخه کوچکتری از مدل Tongyi Qiawen این شرکت است که در ماه جولای منتشر شد.

این شرکت چینی در حال عرضه دو نسخه از محصولات خود با نام Qwen است. نسخه پایه Qwen-7B نام دارد با هفت پارامتر، درحالی که نسخه دوم با نام Qwen-7B-Chat به طور خاص برای برنامه‌های مکالمه و چت بهینه شده است.

مدل زبانی Qwen بر روی مجموعه بزرگی از متون چینی و انگلیسی، از جمله صفحات وب، کتاب‌ها و کدها، با مجموع ۲.۲ تریلیون توکن، از قبل آموزش داده شده است. این پیش‌آموزش به بهبود توانایی مدل برای ایجاد پاسخ‌های انسان‌مانند و درک تفاوت‌های ظریف زبانی کمک می‌کند.

علی بابا گفته که این مدل زبانی برای استفاده از واژگانی ساخته شده است که «با چندین زبان سازگارتر است و کاربران را قادر می‌سازد تا مهارت‌های زبانی خود را در زبان‌های خاص بدون یادگیری واژگان اضافی افزایش دهند.»

کدها و تنظیمات نرم افزاری مدل‌های Qwen برای استفاده تجاری در دسترس هستند. اگر شرکتی کمتر از ۱۰۰ میلیون کاربر فعال ماهانه داشته باشد، می‌تواند به‌صورت رایگان از مدل‌ها به‌صورت تجاری استفاده کند. با این حال، اگر بیش از ۱۰۰ میلیون کاربر فعال ماهانه داشته باشند، قبل از استفاده از مدل‌ها برای مقاصد تجاری، باید از Alibaba Cloud درخواست مجوز نماید.

محققان همچنین می‌توانند از طریق پلتفرم Alibaba Cloud ModelScope (پلتفرمی که مدل‌های هوش مصنوعی از جمله مدل‌های زبانی Qwen را ذخیره و مدیریت می‌کند.) و همچنین Hugging Face (پلتفرمی است که دسترسی به طیف وسیعی از مدل‌های پردازش زبان طبیعی را فراهم می‌کند) به مدل‌های زبانی Qwen دسترسی داشته باشند .

برای اجرای مدل‌های Qwen کاربر باید نرم‌افزار خاصی از جمله Python 3.8، Pytorch 1.12 و CUDA 11.4 را روی رایانه خود نصب کرده باشد.

علی بابا اخیراً Llama 2 را به یک پروژه منبع‌باز متا تبدیل کرده است که هر کس می‌تواند به آن دسترسی داشته باشد و آن را تغییر دهد، به جز شرکت‌های Hyperscaler که ممکن است برای استفاده از آن ملزم به پرداخت هزینه باشند.

غول تجارت الکترونیک چینی به تعداد فزاینده شرکت‌هایی که به‌دنبال هوش مصنوعی هستند، می‌پیوندد. علی بابا در ماه ژوئن یک مدل متن به تصویر منتشر کرد که می‌تواند ورودی‌های زبان چینی و انگلیسی را مدیریت نماید.

Alibaba Cloud همچنین قبلا ModelScopeGPT را راه‌اندازی کرد، چارچوبی که برای کمک به وظایف هوش مصنوعی در حوزه‌های زبان، بینایی و گفتار از طریق مدل‌های موجود در پلتفرم Model-as-a-Service (MaaS) آن، ModelScope طراحی شده است.

دیگر شرکت‌های چینی به دنبال هوش مصنوعی عبارتند از بایدو، که Ernie، برنامه مکالمه خود را شبیه به استقبال بی‌نظیر ChatGPT در ماه مارس منتشر کرد.

با این حال، سرویس‌های جدید هوش مصنوعی که در چین عرضه می‌شوند، ممکن است مجبور باشند قوانین سفت و سختی را که توسط ناظر بدنام اینترنت این کشور پیشنهاد شده است، رعایت کنند ، از جمله اینکه احتمالاً کسب‌وکارها را مجبور به دریافت مجوز برای انتشار مدل‌های هوش مصنوعی مولد مانند Qwen می‌کند.