علی بابا مدل هوش مصنوعی منبعباز Qwen-7B را برای استفاده تجاری منتشر میکند
علی بابا یک مدل هوش مصنوعی منبعباز با نام Qwen-7B را با 7 میلیارد پارامتر برای استفاده تجاری رایگان منتشر خواهد کرد. براساس آزمایشهای اخیر، مدل زبانی تازه توسعهیافته Qwen-7B، در آزمونهای زبان چینی از ChatGPT بهتر عمل کرده است و پتانسیل خود را برای ایجاد تحول در پردازش زبان طبیعی نشان داده است.
به گزارش هوشیو، بخش ابری علی بابا در تلاش برای گسترش دامنه هوش مصنوعی خود، دو مدل زبان بزرگ منبعباز عرضه خواهد کرد که این دو مدل برای اکثر کاربران تجاری رایگان است.
Alibaba Cloud دسترسی به Qwen را باز میکند که در واقع نسخه کوچکتری از مدل Tongyi Qiawen این شرکت است که در ماه جولای منتشر شد.
این شرکت چینی در حال عرضه دو نسخه از محصولات خود با نام Qwen است. نسخه پایه Qwen-7B نام دارد با هفت پارامتر، درحالی که نسخه دوم با نام Qwen-7B-Chat به طور خاص برای برنامههای مکالمه و چت بهینه شده است.
مدل زبانی Qwen بر روی مجموعه بزرگی از متون چینی و انگلیسی، از جمله صفحات وب، کتابها و کدها، با مجموع 2.2 تریلیون توکن، از قبل آموزش داده شده است. این پیشآموزش به بهبود توانایی مدل برای ایجاد پاسخهای انسانمانند و درک تفاوتهای ظریف زبانی کمک میکند.
علی بابا گفته که این مدل زبانی برای استفاده از واژگانی ساخته شده است که «با چندین زبان سازگارتر است و کاربران را قادر میسازد تا مهارتهای زبانی خود را در زبانهای خاص بدون یادگیری واژگان اضافی افزایش دهند.»
کدها و تنظیمات نرم افزاری مدلهای Qwen برای استفاده تجاری در دسترس هستند. اگر شرکتی کمتر از 100 میلیون کاربر فعال ماهانه داشته باشد، میتواند بهصورت رایگان از مدلها بهصورت تجاری استفاده کند. با این حال، اگر بیش از 100 میلیون کاربر فعال ماهانه داشته باشند، قبل از استفاده از مدلها برای مقاصد تجاری، باید از Alibaba Cloud درخواست مجوز نماید.
محققان همچنین میتوانند از طریق پلتفرم Alibaba Cloud ModelScope (پلتفرمی که مدلهای هوش مصنوعی از جمله مدلهای زبانی Qwen را ذخیره و مدیریت میکند.) و همچنین Hugging Face (پلتفرمی است که دسترسی به طیف وسیعی از مدلهای پردازش زبان طبیعی را فراهم میکند) به مدلهای زبانی Qwen دسترسی داشته باشند .
برای اجرای مدلهای Qwen کاربر باید نرمافزار خاصی از جمله Python 3.8، Pytorch 1.12 و CUDA 11.4 را روی رایانه خود نصب کرده باشد.
علی بابا اخیراً Llama 2 را به یک پروژه منبعباز متا تبدیل کرده است که هر کس میتواند به آن دسترسی داشته باشد و آن را تغییر دهد، به جز شرکتهای Hyperscaler که ممکن است برای استفاده از آن ملزم به پرداخت هزینه باشند.
غول تجارت الکترونیک چینی به تعداد فزاینده شرکتهایی که بهدنبال هوش مصنوعی هستند، میپیوندد. علی بابا در ماه ژوئن یک مدل متن به تصویر منتشر کرد که میتواند ورودیهای زبان چینی و انگلیسی را مدیریت نماید.
Alibaba Cloud همچنین قبلا ModelScopeGPT را راهاندازی کرد، چارچوبی که برای کمک به وظایف هوش مصنوعی در حوزههای زبان، بینایی و گفتار از طریق مدلهای موجود در پلتفرم Model-as-a-Service (MaaS) آن، ModelScope طراحی شده است.
دیگر شرکتهای چینی به دنبال هوش مصنوعی عبارتند از بایدو، که Ernie، برنامه مکالمه خود را شبیه به استقبال بینظیر ChatGPT در ماه مارس منتشر کرد.
با این حال، سرویسهای جدید هوش مصنوعی که در چین عرضه میشوند، ممکن است مجبور باشند قوانین سفت و سختی را که توسط ناظر بدنام اینترنت این کشور پیشنهاد شده است، رعایت کنند ، از جمله اینکه احتمالاً کسبوکارها را مجبور به دریافت مجوز برای انتشار مدلهای هوش مصنوعی مولد مانند Qwen میکند.