مدل هوش مصنوعی متن‌باز DeepSeek رقبای آمریکایی را شگفت‌زده کرد

نگار علی
۸ بهمن ۱۴۰۳

زمان مطالعه: 2 دقیقه

چینی‌ها روز گذشته یک مدل هوش مصنوعی متن‌باز به اسم دیپ سیک (DeepSeek) را عرضه کردند؛ این هوش مصنوعی جدید نه تنها تصورات قبلی درباره هوش مصنوعی را به چالش کشید، بلکه بعضی از تحلیلگران باور دارند در ریزش بازار کریپتو هم مؤثر بود.

عرضه دیپ سیک از سوی شرکت‌های چینی این باور غلط را که چین تنها می‌تواند مدل‌های هوش مصنوعی محدودی را تولید کند، از بین برد و نشان داد که OpenAI مزیت شکست‌ناپذیری ندارد و همچنین گزارش‌های قبلی مبنی بر اینکه چین در توسعه هوش مصنوعی ۶ ماه از ایالات متحده آمریکا عقب‌تر است را زیر سؤال برد.

DeepSeek چیست و چرا عرضه آن خبرساز شد؟

مدل زبانی بزرگ «DeepSeek-V3» اواخر سال ۲۰۲۴ رونمایی شد و چینی‌ها مدعی شدند که این مدل را فقط در ۲ ماه و با بودجه ۵.۵۸ میلیون دلار ساخته‌اند که در قیاس با بودجه‌های نجومی شرکت‌های هوش مصنوعی مستقر در سیلیکون‌ولی ناچیز است.

ایالات متحده حتی در اکتبر ۲۰۲۲ (مهر ۱۴۰۱) تحریمی برای صادرات تراشه‌های هوش مصنوعی به چین اعمال کرد. این تحریم‌ها مانع صادرات تراشه‌های خاص رایانش پیشرفته از شرکت‌های آمریکایی مانند Nvidia و AMD به این کشور شد.

علی‌رغم این ممنوعیت، شرکت‌های چینی به تولید داخلی روی آوردند یا از پلتفرم‌های رایانش ابری مانند Amazon Cloud Services برای دور زدن محدودیت‌ها و دستیابی به این تراشه‌های پیشرفته استفاده کردند.

چین همچنین در آگوست ۲۰۲۳ (مرداد ۱۴۰۲) مقررات توسعه هوش مصنوعی خود را برای تشویق به نوآوری تسهیل کرد. این کشور برای مثال جریمه‌های مالی شرکت‌هایی را لغو کرد که از مقررات صنعتی تخطی کرده بودند.

برای اینکه اهمیت بودجه ساخت DeepSeek را درک کنیم، باید به این نکته توجه داشته باشیم که هزینه ساخت و توسعه چت جی‌پی‌تی به ۱۵۰ میلیارد دلار می‌رسد. با این حال طبق تخمین‌های موجود هزینه طراحی و تولید دیپ سیک کمتر از ۱۰ میلیون دلار بوده است.

با این وجود، گزارش‌های کاربران در شبکه‌های اجتماعی نیز نشان می‌دهد که عملکرد دیپ سیک از چت جی‌پی‌تی هم بهتر است و این پروتکل داده‌های جدیدتری دارد.

DeepSeek مدل جدیدتری با نام «DeepSeek-R1» را نیز چند روز پیش و در تاریخ ۲۰ ژانویه منتشر کرد. این مدل در تست‌های گوناگون توانست تنه به تنه بزرگانی چون «GPT-4o» و «Claude Sonnet 3.5 Anthropic» بزند و حتی از مدل‌های مشهوری چون «Llama 3.1» کمپانی متا و «Qwen2.5» شرکت علی‌بابا بهتر عمل کند.

گفته می‌شود که اکنون مدل «R1» در بسیاری از آزمایش‌ها از مدل «o1» شرکت OpenAI نیز پیشی گرفته است. این عملکرد چشمگیر با کسری از هزینه رقبای بزرگ و البته تا حدودی متن‌باز بودن کارشناسان هوش مصنوعی را شگفت‌زده کرده است. حتی برخی به این باور رسیده‌اند که مدل‌های هوش مصنوعی چینی کم‌کم از همتایان آمریکایی خود پیشی خواهند گرفت.

https://hooshio.com/?p=64946

مدل هوش مصنوعی متن‌باز DeepSeek رقبای آمریکایی را شگفت‌زده کرد

DeepSeek چیست و چرا عرضه آن خبرساز شد؟

«دیپ‌سیک» پشت دروازه‌های سبز قاره پیر

هوش مصنوعی‌های چینی مانند «جامعه انسانی» فکر می‌کنند

چگونه با NotebookLM بهره‌وری خود را صدبرابر کنیم؟

جهش ۳۰۰ درصدی درآمد OpenAI

ریپازیتوری‌های داخلی در زمان قطعی اینترنت بین‌الملل

هوش مصنوعی چه معنایی برای مشاغل ما دارد

هوش مصنوعی در دادگاه

هوش مصنوعی بومی زیر ذره‌بین

هوش مصنوعی بومی زیر ذره‌بین

ChatGPT و deepseek در برخی اپراتورها در دسترس قرار گرفتند

معرفی برترین سرویس‌های بومی

بن‌بست هوش مصنوعی بومی در روزهای قطعی اینترنت؛ سخت‌افزار ملی، وعده‌ای که محقق نشد

«دیپ‌سیک» پشت دروازه‌های سبز قاره پیر

هوش مصنوعی‌های چینی مانند «جامعه انسانی» فکر می‌کنند

چگونه با NotebookLM بهره‌وری خود را صدبرابر کنیم؟

جهش ۳۰۰ درصدی درآمد OpenAI

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

«دیپ‌سیک» پشت دروازه‌های سبز قاره پیر

هوش مصنوعی‌های چینی مانند «جامعه انسانی» فکر می‌کنند

ریپازیتوری‌های داخلی در زمان قطعی اینترنت بین‌الملل

هوش مصنوعی چه معنایی برای مشاغل ما دارد

هوش مصنوعی در دادگاه

DeepSeek چیست و چرا عرضه آن خبرساز شد؟

مطالب پیشنهادی مرتبط

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب

در جریان مهم‌ترین اتفاقات AI بمانید