هفته گذشته، آزمایشگاه هوش مصنوعی چینی DeepSeek به یکی از موضوعات داغ روز تبدیل شد، زمانی که اپلیکیشن چتبات این شرکت به صدر جدول فروشگاه اپل و گوگل پلی رسید. مدلهای هوش مصنوعی DeepSeek که با استفاده از تکنیکهای محاسباتی کارآمد آموزش دیدهاند، تحلیلگران والاستریت و تکنولوژیستها را به این فکر انداخته که آیا آمریکا قادر است جایگاه خود را در رقابتهای هوش مصنوعی حفظ کند و آیا تقاضا برای چیپهای AI ادامه خواهد داشت یا خیر. اما DeepSeek از کجا آغاز شد و چگونه به سرعت مطرح شد؟
DeepSeek با حمایت مدیریت سرمایهگذاری High-Flyer، یک صندوق پوشش کمی چینی که از هوش مصنوعی برای تصمیمگیریهای تجاری خود استفاده میکند، تأسیس شده است. لیانگ وِنفنگ، یکی از بنیانگذاران این صندوق، در سال 2015 آن را راهاندازی کرد. او که فعالیت در زمینه معاملات را در دوران تحصیلش در دانشگاه ژجیانگ آغاز کرده بود، در سال 2019 High-Flyer را به عنوان یک صندوق پوشش تأسیس کرد که بر توسعه و استفاده از الگوریتمهای هوش مصنوعی متمرکز بود. در سال 2023، High-Flyer آزمایشگاه DeepSeek را که به تحقیق در زمینه ابزارهای هوش مصنوعی اختصاص دارد، راهاندازی کرد و به تدریج این آزمایشگاه تبدیل به شرکتی مستقل به نام DeepSeek شد.
این شرکت از ابتدای تأسیس، مراکز داده خود را برای آموزش مدلها بنا نهاد. اما مانند دیگر شرکتهای هوش مصنوعی در چین، DeepSeek نیز تحت تأثیر تحریمهای صادراتی ایالات متحده بر سختافزار قرار گرفته است. برای آموزش یکی از مدلهای اخیر، این شرکت ناچار شد از چیپهای Nvidia H800 استفاده کند که نسبت به مدل H100 که برای شرکتهای آمریکایی در دسترس است، کمقدرتتر است.
گزارشها حاکی از آن است که تیم فنی DeepSeek به طور قابل توجهی جوان است و این شرکت به طور فعال برای جذب پژوهشگران دکترای هوش مصنوعی از دانشگاههای معتبر چین فعالیت میکند. همچنین، DeepSeek افرادی را بدون سابقه در علوم کامپیوتر استخدام میکند تا بتوانند دامنه وسیعی از موضوعات علمی را بهتر درک کنند. این شرکت در نوامبر 2023، اولین مجموعه مدلهای خود را با نامهای DeepSeek Coder، DeepSeek LLM و DeepSeek Chat رونمایی کرد. اما توجه صنعت هوش مصنوعی به DeepSeek زمانی جلب شد که این استارتاپ خانواده مدلهای نسل بعدی خود به نام DeepSeek-V2 را منتشر کرد.
مدل DeepSeek-V2 که به صورت عمومی برای تحلیل متن و تصویر طراحی شده، در benchmarkهای مختلف هوش مصنوعی عملکرد خوبی نشان داد و هزینههای اجرایی آن بسیار پایینتر از مدلهای مشابه بود. این نیروهای داخلی را وادار کرد تا قیمت استفاده از برخی مدلهای خود را کاهش دهند یا حتی آنها را به صورت رایگان ارائه دهند.
در دسامبر 2024، DeepSeek V3 رونمایی شد که باز هم به شهرت این شرکت افزود. طبق آزمایشهای داخلی DeepSeek، این مدل فراتر از مدلهای قابل دانلود و همچنین مدلهای “بسته” مانند GPT-4 عمل کرد. همچنین، مدل استدلالی R1 که در ژانویه ارائه شد نیز از دیگر ویژگیهای جالب توجه DeepSeek است. این مدل استدلالی به طوری طراحی شده که قادر است صحت اطلاعات خود را بررسی کند و در زمینههای مختلفی مانند فیزیک و ریاضی به اطمینانپذیری بالایی دست یابد.
با این حال، مدلهای DeepSeek نظیر R1 و V3 به دلیل توسعه آنها در چین، تحت نظارت نهادهای اینترنتی چین قرار دارند تا اطمینان حاصل شود که پاسخهای آنها ارزشهای اجتماعی را منعکس میکند. به عنوان مثال، در چتبات DeepSeek، این مدل به سوالاتی درباره میدان تیانآنمن یا خودمختاری تایوان پاسخ نمیدهد.
در مارس 2025، DeepSeek بیش از 16.5 میلیون بازدیدکننده را ثبت کرد. با این حال، همچنان نسبت به ChatGPT که به بیش از 500 میلیون کاربر فعال در هفته رسیده، فاصله زیادی دارد. نوع مدل کسبوکار DeepSeek مشخص نیست؛ چرا که قیمت محصولات و خدمات آن بهطور قابل توجهی پایینتر از ارزش بازار است و برخی از آنها نیز به صورت رایگان ارائه میشوند. این شرکت در حالی که علاقهمندی زیادی از سوی سرمایهگذاران دریافت کرده، اصرار بر عدم جذب سرمایه دارد.
موفقیت DeepSeek در مقابل رقبای بزرگتر به شدت تحت تاثیر بازار قرار گرفته و تغییرات زیادی را در تعاملات درونصنعتی ایجاد کرده است. در همین راستا، برخی دولتها و کشورها از جمله کره جنوبی و ایالت نیویورک استفاده از DeepSeek را بر روی دستگاههای دولتی ممنوع کردهاند.
آینده DeepSeek همچنان مبهم است. با وجود پیشرفت مدلها، نگرانیها در مورد نفوذ خارجی احتمالی از سوی دولت ایالات متحده رو به افزایش است و احتمال ممنوعیت استفاده از DeepSeek بر روی دستگاههای دولتی به وجود آمده است. برای دریافت اطلاعات بیشتر، میتوانید با ما در بخش اخبار بینا ویرا همراه باشید.