برترین متخصصین

از سراسر دنیا

مجموعه وبینارهای مدل‌های بزرگ زبانی (LLM)

Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش خبری
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
گزارش
مصاحبه
 مدل هوش مصنوعی متن‌باز DeepSeek رقبای آمریکایی را شگفت‌زده کرد

مدل هوش مصنوعی متن‌باز DeepSeek رقبای آمریکایی را شگفت‌زده کرد

زمان مطالعه: 2 دقیقه

چینی‌ها روز گذشته یک مدل هوش مصنوعی متن‌باز به اسم دیپ سیک (DeepSeek) را عرضه کردند؛ این هوش مصنوعی جدید نه تنها تصورات قبلی درباره هوش مصنوعی را به چالش کشید، بلکه بعضی از تحلیلگران باور دارند در ریزش بازار کریپتو هم مؤثر بود.

عرضه دیپ سیک از سوی شرکت‌های چینی این باور غلط را که چین تنها می‌تواند مدل‌های هوش مصنوعی محدودی را تولید کند، از بین برد و نشان داد که OpenAI  مزیت شکست‌ناپذیری ندارد و همچنین گزارش‌های قبلی مبنی بر اینکه چین در توسعه هوش مصنوعی ۶ ماه از ایالات متحده آمریکا عقب‌تر است را زیر سؤال برد.

DeepSeek چیست و چرا عرضه آن خبرساز شد؟

مدل زبانی بزرگ «DeepSeek-V3» اواخر سال ۲۰۲۴ رونمایی شد و چینی‌ها مدعی شدند که این مدل را فقط در ۲ ماه و با بودجه ۵.۵۸ میلیون دلار ساخته‌اند که در قیاس با بودجه‌های نجومی شرکت‌های هوش مصنوعی مستقر در سیلیکون‌ولی ناچیز است.

ایالات متحده حتی در اکتبر ۲۰۲۲ (مهر ۱۴۰۱) تحریمی برای صادرات تراشه‌های هوش مصنوعی به چین اعمال کرد. این تحریم‌ها مانع صادرات تراشه‌های خاص رایانش پیشرفته از شرکت‌های آمریکایی مانند Nvidia و AMD به این کشور شد.

علی‌رغم این ممنوعیت، شرکت‌های چینی به تولید داخلی روی آوردند یا از پلتفرم‌های رایانش ابری مانند Amazon Cloud Services برای دور زدن محدودیت‌ها و دستیابی به این تراشه‌های پیشرفته استفاده کردند.

چین همچنین در آگوست ۲۰۲۳ (مرداد ۱۴۰۲) مقررات توسعه هوش مصنوعی خود را برای تشویق به نوآوری تسهیل کرد. این کشور برای مثال جریمه‌های مالی شرکت‌هایی را لغو کرد که از مقررات صنعتی تخطی کرده بودند.

برای اینکه اهمیت بودجه ساخت DeepSeek را درک کنیم، باید به این نکته توجه داشته باشیم که هزینه ساخت و توسعه چت جی‌پی‌تی به ۱۵۰ میلیارد دلار می‌رسد. با این حال طبق تخمین‌های موجود هزینه طراحی و تولید دیپ سیک کمتر از ۱۰ میلیون دلار بوده است.

با این وجود، گزارش‌های کاربران در شبکه‌های اجتماعی نیز نشان می‌دهد که عملکرد دیپ سیک از چت جی‌پی‌تی هم بهتر است و این پروتکل داده‌های جدیدتری دارد.

DeepSeek مدل جدیدتری با نام «DeepSeek-R1» را نیز چند روز پیش و در تاریخ ۲۰ ژانویه منتشر کرد. این مدل در تست‌های گوناگون توانست تنه به تنه بزرگانی چون «GPT-4o» و «Claude Sonnet 3.5 Anthropic» بزند و حتی از مدل‌های مشهوری چون «Llama 3.1» کمپانی متا و «Qwen2.5»  شرکت علی‌بابا بهتر عمل کند.

گفته می‌شود که اکنون مدل «R1» در بسیاری از آزمایش‌ها از مدل «o1» شرکت OpenAI نیز پیشی گرفته است. این عملکرد چشمگیر با کسری از هزینه رقبای بزرگ و البته تا حدودی متن‌باز بودن کارشناسان هوش مصنوعی را شگفت‌زده کرده است. حتی برخی به این باور رسیده‌اند که مدل‌های هوش مصنوعی چینی کم‌کم از همتایان آمریکایی خود پیشی خواهند گرفت.

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]