DeepSeek؛ همه‌چیز درباره اپ چت‌بات هوش مصنوعی

دیپ‌سیک (DeepSeek)؛ استارتاپ چینی که بازار هوش مصنوعی را تکان داد

دیپ‌سیک (DeepSeek)، آزمایشگاه هوش مصنوعی چینی، طی هفته‌های اخیر توجه جهانی را به خود جلب کرده است. اپلیکیشن چت‌بات این شرکت به صدر نمودارهای اپ استور اپل و گوگل‌پلی راه یافت و باعث شد تحلیل‌گران وال‌استریت و متخصصان فناوری درباره تداوم پیشتازی آمریکا در مسابقه هوش مصنوعی و آینده تقاضای تراشه‌های هوش مصنوعی تردید کنند.

ریشه‌ها و ساختار مالی
دیپ‌سیک توسط صندوق سرمایه‌گذاری کوانتیتیو چینی High-Flyer Capital Management حمایت مالی می‌شود؛ صندوقی که از روش‌های مبتنی بر هوش مصنوعی برای معاملات مالی استفاده می‌کند. لیانگ ون‌فنگ، از علاقه‌مندان به هوش مصنوعی و مؤسس High-Flyer، این صندوق را از 2015 شکل داد و در 2019 آن را به‌عنوان یک هِج‌فاند با تمرکز بر الگوریتم‌های هوش مصنوعی ثبت کرد. در 2023، تیمی مستقل برای تحقیق ابزارهای هوش مصنوعی تأسیس شده که بعدها به شرکت مستقل DeepSeek تبدیل شد.

زیرساخت و چالش‌های تحریمی
از همان ابتدا دیپ‌سیک خوشه‌های دیتاسنتری خود را برای آموزش مدل‌ها ایجاد کرد، اما مانند بسیاری شرکت‌های چینی با محدودیت‌های صادراتی سخت‌افزار از سوی آمریکا مواجه شد. برای نمونه، این شرکت هنگام آموزش برخی مدل‌های اخیر خود ناچار به استفاده از تراشه‌های Nvidia H800 شد که نسخه‌ای کم‌تر توانمند نسبت به H100 است و محدودیت‌های دسترسی به تراشه‌های پیشرفته‌تر را نشان می‌دهد.

تیم و مدل‌ها
تیم فنی دیپ‌سیک عمدتاً جوان توصیف شده و جذب فعال پژوهشگران دکترا از دانشگاه‌های برتر چین جزو سیاست‌های استخدامی آن است. جالب اینکه این شرکت گاهی از افراد غیر کامپیوتر برای تقویت درک مدل‌ها از موضوعات گوناگون هم استفاده می‌کند.

دیپ‌سیک در نوامبر 2023 مجموعه‌ای از مدل‌ها را معرفی کرد: DeepSeek Coder، DeepSeek LLM و DeepSeek Chat. اما نقطه عطف واقعی انتشار خانواده DeepSeek‑V2 در بهار بود؛ یک سیستم عمومی برای تحلیل متن و تصویر که در بنچمارک‌ها عملکرد خوبی داشت و هزینه استنتاج آن به‌مراتب کمتر از رقبای هم‌رده اعلام شد. این کار باعث شد رقبای داخلی مانند بایت‌دنس و علی‌بابا قیمت‌های برخی خدمات خود را کاهش دهند یا آن‌ها را رایگان کنند.

نسل بعدی و مدل‌های استدلالی
DeepSeek‑V3 در دسامبر 2024 توجه‌ها را افزایش داد؛ طبق آزمایش‌های داخلی دیپ‌سیک، V3 در بسیاری از معیارها از مدل‌های قابل دانلود مانند Llama متا و حتی مدل‌های «بسته» قابل دسترسی از طریق API مانند GPT‑4o عملکردی برتر نشان داده است. از دیگر نوآوری‌ها مدل استدلالی R1 است که در ژانویه معرفی شد؛ دیپ‌سیک ادعا می‌کند R1 در معیارهای کلیدی با مدل o1 اپن‌ای‌آی برابری می‌کند. مدل‌های استدلالی معمولاً زمان طولانی‌تری برای پاسخ‌گویی می‌گیرند اما دقت بیشتری در حوزه‌های علمی، فیزیک و ریاضیات از خود نشان می‌دهند و قابلیت «خودبازبینی» یا fact‑checking داخلی دارند که خطاهای معمول را کاهش می‌دهد.

محدودیت‌ها و نظارت‌های دولتی
مدل‌های تولید شده توسط دیپ‌سیک مشمول بنچمارک و نظارت رگولاتوری چین هستند تا پاسخ‌ها «با ارزش‌های اصلی سوسیالیستی» هم‌راستا باشند؛ به همین دلیل R1 در اپ چت‌بات از پاسخ به پرسش‌هایی درباره میدان تیان‌آن‌من یا استقلال تایوان خودداری می‌کند. در عین حال نگرانی‌های امنیت داده و نگرانی‌های سیاسی باعث شده برخی دولت‌ها و شرکت‌ها از جمله دفاتر دولتی ایالات متحده، نیویورک، کره‌جنوبی و حتی برخی کارکنان مایکروسافت استفاده از دیپ‌سیک را محدود یا ممنوع کنند.

پذیرش توسعه‌دهندگان و مدل‌های مشتق
دیپ‌سیک اگرچه مدل‌هایش را «متن‌باز» به معنی مرسوم اعلام نکرده، اما تحت مجوزهای آزادی‌بخش در پلتفرم‌هایی مانند Hugging Face عرضه شده است. به گفته مدیرعامل Hugging Face، بیش از 500 مدل مشتق از R1 توسط توسعه‌دهندگان ساخته شده و مجموعاً بیش از 2.5 میلیون بار دانلود شده‌اند. این پذیرش جامعه توسعه‌دهندگان یکی از عوامل رشد سریع آگاهی عمومی درباره دیپ‌سیک بوده است.

مدل کسب‌وکار نامشخص و واکنش بازار
دیپ‌سیک قیمت‌گذاری محصولات و خدمات خود را پایین‌تر از بازار قرار می‌دهد و حتی برخی خدمات را رایگان عرضه کرده است؛ هم‌چنین فعلاً جذب گسترده سرمایه‌گذاری خارجی نمی‌کند که این موضوع پرسش‌هایی درباره مدل کسب‌وکار و ادعاهای کارایی هزینه‌ای شرکت ایجاد کرده است. برخی کارشناسان ارقام اعلامی دیپ‌سیک را مورد تردید قرار داده‌اند. در عین حال موفقیت این شرکت در مقابل رقبا باعث شد تأثیرات بازار مشاهده شود؛ برای مثال در ژانویه قیمت سهام Nvidia نوسان یافت و واکنش‌هایی از سوی مدیرعامل OpenAI و سایر بازیگران صنعتی رخ داد.

دیدگاه نهایی و آینده
دیپ‌سیک نمونه‌ای از تسریع نوآوری در فضای هوش مصنوعی چین است: تیم‌های جوان، تمرکز بر کارایی محاسباتی، و انتشار مدل‌هایی که توسعه‌دهندگان جهانی آن‌ها را امتحان می‌کنند. با این‌حال، عدم شفافیت کامل در منابع تأمین مالی، نگرانی‌های امنیتی و سیاسی و محدودیت‌های صادراتی سخت‌افزاری موانعی است که آینده این بازیگر را نامشخص نگه می‌دارد. این خبر اصالتاً در 28 ژانویه 2025 منتشر شده و بر اساس تحولات جدید به‌روزرسانی خواهد شد.

ایجاد صوت دیجیتال پیشرفته

DeepSeek؛ همه‌چیز درباره اپ چت‌بات هوش مصنوعی

دیدگاه‌ خود را بنویسید لغو پاسخ