دستگاه‌های هوش مصنوعی DeepSeek از چین، توجه جهانیان را به خود جلب کردند و در عرض یک هفته پس از انتشار، به صدر نمودارهای اپ استور اپل و گوگل پلی رسیدند. مدل‌های هوش مصنوعی این شرکت با استفاده از تکنیک‌های محاسبات کارآمد توسعه یافته‌اند، که این موضوع توجه تحلیلگران وال استریت و متخصصان فناوری را جلب کرده و سوالاتی را در مورد اینکه آیا ایالات متحده می‌تواند پیشرو در رقابت هوش مصنوعی باقی بماند و آیا تقاضا برای چیپ‌های هوش مصنوعی پایدار خواهد ماند، مطرح کرده است.

اما DeepSeek از کجا آمده و چگونه به این شهرت جهانی دست یافته است؟ DeepSeek توسط High-Flyer Capital Management، یک صندوق سرمایه‌گذاری کوانتومی چینی که از هوش مصنوعی برای تصمیم‌گیری‌های معاملاتی استفاده می‌کند، پشتیبانی می‌شود. لیانگ ون‌فنگ، یکی از بنیانگذاران High-Flyer در سال ۲۰۱۵، که طی تحصیلات خود در دانشگاه ژجیانگ به معاملات علاقه‌مند شد، در سال ۲۰۱۹High-Flyer Capital Management را به عنوان یک صندوق سرمایه‌گذاری تاسیس کرد که بر توسعه و استقرار الگوریتم‌های هوش مصنوعی متمرکز بود.

در سال ۲۰۲۳، High-Flyer اقدام به راه‌اندازی آزمایشگاه DeepSeek به عنوان مرکزی مستقل برای پژوهش‌های هوش مصنوعی کرد. از همان روز اول، DeepSeek تاسیسات دیتاسنتر خود را برای تمرین مدل‌ها ساخت. اما مانند سایر شرکت‌های چینی در زمینه هوش مصنوعی، DeepSeek از تحریم‌های صادراتی ایالات متحده بر روی سخت‌افزار متاثر شد و برای آموزش یکی از مدل‌های اخیر خود مجبور به استفاده از چیپ‌های Nvidia H800 شد.

تیم فنی DeepSeek عمدتاً جوان و انرژی‌بخش توصیف می‌شود. این شرکت به شدت از میان دانشجویان برتر دکتری در دانشگاه‌های چینی نیرو جذب می‌کند و همچنین افرادی با پس‌زمینه‌ای غیر از علوم کامپیوتر را به کار می‌گیرد تا به بهتر فهمیدن طیف گسترده‌ای از موضوعات توسط فناوری خود کمک کند.

DeepSeek نخستین سری از مدل‌های خود به نام‌های DeepSeek Coder، DeepSeek LLM و DeepSeek Chat را در نوامبر ۲۰۲۳ عرضه کرد. اما با ارائه نسل بعدی مدل‌های DeepSeek-V2 در بهار گذشته بود که صنعت هوش مصنوعی به این شرکت توجه ویژه‌ای نشان داد. سیستم DeepSeek-V2، که یک سامانه تحلیلی عمومی برای متن و تصویر است، در مراجع استاندارد هوش مصنوعی عمکرد بالایی داشت و هزینه‌های اجرایی آن نسبت به مدل‌های مشابه در آن زمان به مراتب کمتر بود.

موفقیت مدل‌های DeepSeek موجب شد که رقبای داخلی از جمله بایت‌دنس و علی‌بابا ناگزیر به کاهش قیمت‌های استفاده از برخی مدل‌های خود شوند و برخی دیگر را به طور رایگان ارائه کنند. DeepSeek-V3 که در دسامبر ۲۰۲۴ منتشر شد، تنها به شهرت این شرکت افزود.

یکی از دستاوردهای مهم DeepSeek در حوزه مدل‌های “استدلال” است. مدل R1، که در ژانویه معرفی شد، به گفته DeepSeek، در مراجع کلیدی به اندازه مدل اوپن‌ای‌آی عملکرد دارد. این مدل با نقش‌آفرینی در خودتنظیمی محتوایی، به کاهش اشتباهات رایج در مدل‌های معمول کمک کرده است.

همچنین استفاده از مدل‌های DeepSeek با چالش‌هایی نیز همراه است؛ از جمله این‌که این مدل‌ها تحت نظارت مقامات اینترنتی چین هستند تا اطمینان حاصل شود که پاسخ‌های آن‌ها با ارزش‌های سوسیالیستی همخوانی دارد. به عنوان مثال، در اپلیکیشن چت‌بات DeepSeek، مدل R1 سوالاتی درباره میدان تیان‌آن‌من یا استقلال تایوان را پاسخ نمی‌دهد.

در حالی که بازدیدهای DeepSeek در ماه مارس به ۱۶.۵ میلیون رسید، این تعداد نسبت به فوریه ۲۵ درصد کاهش یافته است. در مقایسه، چت جی‌پی‌تی با استفاده فعال هفتگی ۵۰۰ میلیون کاربر در همان دوره، تفاوت قابل توجهی ایجاد کرده است.

اگرچه مدل کسب‌وکار DeepSeek کاملاً مشخص نیست، اما محصولات و خدمات خود را با قیمت‌هایی بسیار پایین‌تر از بازار عرضه می‌کند و برخی از آن‌ها را رایگان ارائه می‌دهد. همچنین علی‌رغم علاقه زیاد سرمایه‌گذاران خطرپذیر به این شرکت، DeepSeek هنوز از جذب سرمایه‌های خارجی خودداری کرده است.

در حال حاضر، توسعه‌دهندگان نسبت به مدل‌های DeepSeek واکنش مثبت نشان داده‌اند، خصوصاً که این مدل‌ها تحت مجوزهایی با دسترسی آزاد برای استفاده تجاری به‌کار برده می‌شوند. بنا بر اطلاعاتی از Hugging Face، بیش از ۵۰۰ مدل مشتق‌شده از R1 ایجاد شده‌اند که در مجموع دو و نیم میلیون بار دانلود شده‌اند.

موفقیت DeepSeek در مقابل رقبا به عنوان تحولی در صنعت هوش مصنوعی تلقی شده است. این موفقیت‌ها موجب کاهش ۱۸ درصدی قیمت سهام انویدیا در ژانویه شد و همچنین واکنش عمومی از سوی سم آلتمن، مدیرعامل اوپن‌ای‌آی را در پی داشت. به علاوه، در ماه مارس، دپارتمان‌های دولتی ایالات متحده اعلام کردند که دیپ‌سیک بر روی دستگاه‌های دولتی ممنوع خواهد شد. برخی کشورها و شرکت‌ها نیز استفاده از DeepSeek را ممنوع کرده‌اند، از جمله کره جنوبی و ایالت نیویورک.

آینده DeepSeek هنوز مشخص نیست، اما بهبود مدل‌ها امری قطعی به نظر می‌رسد. با این حال، به نظر می‌رسد دولت ایالات متحده نسبت به نفوذ خارجی که آن را مضر می‌پندارد، نگران است. به گزارش وال‌استریت ژورنال، احتمالاً دولت ایالات متحده استفاده از DeepSeek را در دستگاه‌های دولتی ممنوع خواهد کرد.

این خبر در اصل در ۲۸ ژانویه ۲۰۲۵ منتشر شده و به‌طور منظم به‌روزرسانی خواهد شد.

ساخت تصویر با هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا