Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش خبری
پرامپت‌ نویسی
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
خطرات هوش مصنوعی
دیتاست
مدل‌های بنیادی
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
پیاده‌سازی هوش مصنوعی
گزارش
مصاحبه
هوش مصنوعی در عمل
 مدل جدید و سبک DeepSeek با یک کارت گرافیک اجرا می‌شود

مدل جدید و سبک DeepSeek با یک کارت گرافیک اجرا می‌شود

زمان مطالعه: < 1 دقیقه

آزمایشگاه هوش مصنوعی چینی DeepSeek نسخه‌ای سبک‌شده از مدل استدلالی R1 خود را معرفی کرده که می‌تواند تنها با یک GPU اجرا شود. این مدل که با نام DeepSeek-R1-0528-Qwen3-8B منتشر شده، بر پایه مدل Qwen3-8B شرکت علی‌بابا ساخته شده و در برخی آزمون‌های ریاضی، عملکردی بهتر از مدل‌های هم‌رده مانند Gemini 2.5 Flash گوگل از خود نشان داده است.

این مدل سبک‌شده که با بهره‌گیری از داده‌های تولیدشده توسط نسخه کامل R1 آموزش دیده، از نظر محاسباتی به‌مراتب کم‌هزینه‌تر است و تنها به یک کارت گرافیک ۴۰ تا ۸۰ گیگابایتی نیاز دارد، در حالی که نسخه اصلی R1 به حدود ۱۲ کارت H100 نیاز دارد. DeepSeek این مدل را با مجوز MIT منتشر کرده که استفاده تجاری از آن را بدون محدودیت ممکن می‌سازد.

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]