دستگاههای هوش مصنوعی DeepSeek از چین، توجه جهانیان را به خود جلب کردند و در عرض یک هفته پس از انتشار، به صدر نمودارهای اپ استور اپل و گوگل پلی رسیدند. مدلهای هوش مصنوعی این شرکت با استفاده از تکنیکهای محاسبات کارآمد توسعه یافتهاند، که این موضوع توجه تحلیلگران وال استریت و متخصصان فناوری را جلب کرده و سوالاتی را در مورد اینکه آیا ایالات متحده میتواند پیشرو در رقابت هوش مصنوعی باقی بماند و آیا تقاضا برای چیپهای هوش مصنوعی پایدار خواهد ماند، مطرح کرده است.
اما DeepSeek از کجا آمده و چگونه به این شهرت جهانی دست یافته است؟ DeepSeek توسط High-Flyer Capital Management، یک صندوق سرمایهگذاری کوانتومی چینی که از هوش مصنوعی برای تصمیمگیریهای معاملاتی استفاده میکند، پشتیبانی میشود. لیانگ ونفنگ، یکی از بنیانگذاران High-Flyer در سال ۲۰۱۵، که طی تحصیلات خود در دانشگاه ژجیانگ به معاملات علاقهمند شد، در سال ۲۰۱۹High-Flyer Capital Management را به عنوان یک صندوق سرمایهگذاری تاسیس کرد که بر توسعه و استقرار الگوریتمهای هوش مصنوعی متمرکز بود.
در سال ۲۰۲۳، High-Flyer اقدام به راهاندازی آزمایشگاه DeepSeek به عنوان مرکزی مستقل برای پژوهشهای هوش مصنوعی کرد. از همان روز اول، DeepSeek تاسیسات دیتاسنتر خود را برای تمرین مدلها ساخت. اما مانند سایر شرکتهای چینی در زمینه هوش مصنوعی، DeepSeek از تحریمهای صادراتی ایالات متحده بر روی سختافزار متاثر شد و برای آموزش یکی از مدلهای اخیر خود مجبور به استفاده از چیپهای Nvidia H800 شد.
تیم فنی DeepSeek عمدتاً جوان و انرژیبخش توصیف میشود. این شرکت به شدت از میان دانشجویان برتر دکتری در دانشگاههای چینی نیرو جذب میکند و همچنین افرادی با پسزمینهای غیر از علوم کامپیوتر را به کار میگیرد تا به بهتر فهمیدن طیف گستردهای از موضوعات توسط فناوری خود کمک کند.
DeepSeek نخستین سری از مدلهای خود به نامهای DeepSeek Coder، DeepSeek LLM و DeepSeek Chat را در نوامبر ۲۰۲۳ عرضه کرد. اما با ارائه نسل بعدی مدلهای DeepSeek-V2 در بهار گذشته بود که صنعت هوش مصنوعی به این شرکت توجه ویژهای نشان داد. سیستم DeepSeek-V2، که یک سامانه تحلیلی عمومی برای متن و تصویر است، در مراجع استاندارد هوش مصنوعی عمکرد بالایی داشت و هزینههای اجرایی آن نسبت به مدلهای مشابه در آن زمان به مراتب کمتر بود.
موفقیت مدلهای DeepSeek موجب شد که رقبای داخلی از جمله بایتدنس و علیبابا ناگزیر به کاهش قیمتهای استفاده از برخی مدلهای خود شوند و برخی دیگر را به طور رایگان ارائه کنند. DeepSeek-V3 که در دسامبر ۲۰۲۴ منتشر شد، تنها به شهرت این شرکت افزود.
یکی از دستاوردهای مهم DeepSeek در حوزه مدلهای “استدلال” است. مدل R1، که در ژانویه معرفی شد، به گفته DeepSeek، در مراجع کلیدی به اندازه مدل اوپنایآی عملکرد دارد. این مدل با نقشآفرینی در خودتنظیمی محتوایی، به کاهش اشتباهات رایج در مدلهای معمول کمک کرده است.
همچنین استفاده از مدلهای DeepSeek با چالشهایی نیز همراه است؛ از جمله اینکه این مدلها تحت نظارت مقامات اینترنتی چین هستند تا اطمینان حاصل شود که پاسخهای آنها با ارزشهای سوسیالیستی همخوانی دارد. به عنوان مثال، در اپلیکیشن چتبات DeepSeek، مدل R1 سوالاتی درباره میدان تیانآنمن یا استقلال تایوان را پاسخ نمیدهد.
در حالی که بازدیدهای DeepSeek در ماه مارس به ۱۶.۵ میلیون رسید، این تعداد نسبت به فوریه ۲۵ درصد کاهش یافته است. در مقایسه، چت جیپیتی با استفاده فعال هفتگی ۵۰۰ میلیون کاربر در همان دوره، تفاوت قابل توجهی ایجاد کرده است.
اگرچه مدل کسبوکار DeepSeek کاملاً مشخص نیست، اما محصولات و خدمات خود را با قیمتهایی بسیار پایینتر از بازار عرضه میکند و برخی از آنها را رایگان ارائه میدهد. همچنین علیرغم علاقه زیاد سرمایهگذاران خطرپذیر به این شرکت، DeepSeek هنوز از جذب سرمایههای خارجی خودداری کرده است.
در حال حاضر، توسعهدهندگان نسبت به مدلهای DeepSeek واکنش مثبت نشان دادهاند، خصوصاً که این مدلها تحت مجوزهایی با دسترسی آزاد برای استفاده تجاری بهکار برده میشوند. بنا بر اطلاعاتی از Hugging Face، بیش از ۵۰۰ مدل مشتقشده از R1 ایجاد شدهاند که در مجموع دو و نیم میلیون بار دانلود شدهاند.
موفقیت DeepSeek در مقابل رقبا به عنوان تحولی در صنعت هوش مصنوعی تلقی شده است. این موفقیتها موجب کاهش ۱۸ درصدی قیمت سهام انویدیا در ژانویه شد و همچنین واکنش عمومی از سوی سم آلتمن، مدیرعامل اوپنایآی را در پی داشت. به علاوه، در ماه مارس، دپارتمانهای دولتی ایالات متحده اعلام کردند که دیپسیک بر روی دستگاههای دولتی ممنوع خواهد شد. برخی کشورها و شرکتها نیز استفاده از DeepSeek را ممنوع کردهاند، از جمله کره جنوبی و ایالت نیویورک.
آینده DeepSeek هنوز مشخص نیست، اما بهبود مدلها امری قطعی به نظر میرسد. با این حال، به نظر میرسد دولت ایالات متحده نسبت به نفوذ خارجی که آن را مضر میپندارد، نگران است. به گزارش والاستریت ژورنال، احتمالاً دولت ایالات متحده استفاده از DeepSeek را در دستگاههای دولتی ممنوع خواهد کرد.
این خبر در اصل در ۲۸ ژانویه ۲۰۲۵ منتشر شده و بهطور منظم بهروزرسانی خواهد شد.