مدل هوش مصنوعی متنباز DeepSeek رقبای آمریکایی را شگفتزده کرد
چینیها روز گذشته یک مدل هوش مصنوعی متنباز به اسم دیپ سیک (DeepSeek) را عرضه کردند؛ این هوش مصنوعی جدید نه تنها تصورات قبلی درباره هوش مصنوعی را به چالش کشید، بلکه بعضی از تحلیلگران باور دارند در ریزش بازار کریپتو هم مؤثر بود.
عرضه دیپ سیک از سوی شرکتهای چینی این باور غلط را که چین تنها میتواند مدلهای هوش مصنوعی محدودی را تولید کند، از بین برد و نشان داد که OpenAI مزیت شکستناپذیری ندارد و همچنین گزارشهای قبلی مبنی بر اینکه چین در توسعه هوش مصنوعی ۶ ماه از ایالات متحده آمریکا عقبتر است را زیر سؤال برد.
DeepSeek چیست و چرا عرضه آن خبرساز شد؟
مدل زبانی بزرگ «DeepSeek-V3» اواخر سال ۲۰۲۴ رونمایی شد و چینیها مدعی شدند که این مدل را فقط در ۲ ماه و با بودجه ۵.۵۸ میلیون دلار ساختهاند که در قیاس با بودجههای نجومی شرکتهای هوش مصنوعی مستقر در سیلیکونولی ناچیز است.
ایالات متحده حتی در اکتبر ۲۰۲۲ (مهر ۱۴۰۱) تحریمی برای صادرات تراشههای هوش مصنوعی به چین اعمال کرد. این تحریمها مانع صادرات تراشههای خاص رایانش پیشرفته از شرکتهای آمریکایی مانند Nvidia و AMD به این کشور شد.
علیرغم این ممنوعیت، شرکتهای چینی به تولید داخلی روی آوردند یا از پلتفرمهای رایانش ابری مانند Amazon Cloud Services برای دور زدن محدودیتها و دستیابی به این تراشههای پیشرفته استفاده کردند.
چین همچنین در آگوست ۲۰۲۳ (مرداد ۱۴۰۲) مقررات توسعه هوش مصنوعی خود را برای تشویق به نوآوری تسهیل کرد. این کشور برای مثال جریمههای مالی شرکتهایی را لغو کرد که از مقررات صنعتی تخطی کرده بودند.
برای اینکه اهمیت بودجه ساخت DeepSeek را درک کنیم، باید به این نکته توجه داشته باشیم که هزینه ساخت و توسعه چت جیپیتی به ۱۵۰ میلیارد دلار میرسد. با این حال طبق تخمینهای موجود هزینه طراحی و تولید دیپ سیک کمتر از ۱۰ میلیون دلار بوده است.
با این وجود، گزارشهای کاربران در شبکههای اجتماعی نیز نشان میدهد که عملکرد دیپ سیک از چت جیپیتی هم بهتر است و این پروتکل دادههای جدیدتری دارد.
DeepSeek مدل جدیدتری با نام «DeepSeek-R1» را نیز چند روز پیش و در تاریخ ۲۰ ژانویه منتشر کرد. این مدل در تستهای گوناگون توانست تنه به تنه بزرگانی چون «GPT-4o» و «Claude Sonnet 3.5 Anthropic» بزند و حتی از مدلهای مشهوری چون «Llama 3.1» کمپانی متا و «Qwen2.5» شرکت علیبابا بهتر عمل کند.
گفته میشود که اکنون مدل «R1» در بسیاری از آزمایشها از مدل «o1» شرکت OpenAI نیز پیشی گرفته است. این عملکرد چشمگیر با کسری از هزینه رقبای بزرگ و البته تا حدودی متنباز بودن کارشناسان هوش مصنوعی را شگفتزده کرده است. حتی برخی به این باور رسیدهاند که مدلهای هوش مصنوعی چینی کمکم از همتایان آمریکایی خود پیشی خواهند گرفت.