رونمایی از DeepSeek R1-0528؛ چالش قدرتمند متن‌باز برای OpenAI o3 و Google Gemini 2.5 Pro

شرکت چینی دیپ‌سیک، پس از موفقیت‌های اولیه خود در سال جاری، به‌تازگی به‌روزرسانی جدیدی از مدل هوش مصنوعی متن‌باز خود به نام DeepSeek-R1-0528 را معرفی کرده است. این بروزرسانی قدرتمند، قابلیت‌های استدلالی مدل را به سطحی نزدیک به مدل‌های تجاری و پرداختی مانند OpenAI’s o3 و Google Gemini 2.5 Pro رسانده است. هدف از این به‌روزرسانی، بهبود عملکرد در انجام وظایف پیچیده استدلال در زمینه‌های ریاضی، علوم، تجارت و برنامه‌نویسی است.

مدل DeepSeek-R1-0528 تحت مجوز MIT منتشر شده که استفاده تجاری را مجاز کرده و به توسعه‌دهندگان این امکان را می‌دهد که مدل را متناسب با نیازهای خود سفارشی‌سازی کنند. کاربران فعلی API دیپ‌سیک به طور خودکار می‌توانند از نظر استنتاج مدل به R1-0528 ارتقاء یابند و هزینه‌ای اضافی پرداخت نکنند. هزینه فعلی استفاده از API دیپ‌سیک ۰.۱۴ دلار برای هر یک میلیون توکن ورودی در ساعات عادی است که در ساعات تخفیف به ۰.۰۳۵ دلار کاهش می‌یابد.

این به‌روزرسانی شامل پیشرفت‌های قابل توجهی در توانایی مدل برای پردازش وظایف استدلال چالش‌برانگیز است. به‌عنوان مثال، در آزمون AIME 2025، دقت DeepSeek-R1-0528 از ۷۰٪ به ۸۷.۵٪ افزایش یافته و در عملکرد کدنویسی، دقت در مجموعه داده LiveCodeBench از ۶۳.۵٪ به ۷۳.۳٪ رسیده است. همچنین، در آزمون دشوار “آزمون نهایی بشریت”، عملکرد مدل به ۱۷.۷٪ افزایش یافته که بیش از دو برابر نسخه قبلی است.

مدل به‌روزرسانی شده DeepSeek-R1-0528 همچنین ویژگی‌های جدیدی را برای بهبود تجربه کاربری معرفی کرده است. این به‌روزرسانی پشتیبانی از خروجی JSON و فراخوانی توابع را اضافه کرده است و این تغییرات باعث تسهیل در ادغام قابلیت‌های مدل در برنامه‌ها و گردش کار توسعه‌دهندگان می‌شود.

علاوه بر این، یک ویرایش ساده‌تر از مدل نیز به نام DeepSeek-R1-0528-Qwen3-8B به بازار معرفی شده که برای تصمیم‌گیرندگان و توسعه‌دهندگانی که به سخت‌افزار قدرتمند برای اجرای مدل کامل دسترسی ندارند، مناسب است. این نسخه کوچک شده به‌طور خاص در انجام وظایف مرتبط با AIME 2024 عملکردی فراتر از سایر مدل‌های متن‌باز را به نمایش گذاشته است.

با توجه به تعهد دیپ‌سیک به ارائه مدل‌های با کارایی بالا و متن‌باز که بر روی استدلال و کارایی تمرکز دارند، این به‌روزرسانی به عنوان ابزاری ارزشمند برای توسعه‌دهندگان، محققان و علاقه‌مندان که به دنبال استفاده از جدیدترین قابلیت‌های مدل زبان هستند، مطرح می‌شود. دیپ‌سیک امیدوار است که این پیشرفت‌ها به پیشرفت‌های علمی و کاربردهای صنعتی کمک شایانی کند.

تجزیه و تحلیل تصویر با هوش مصنوعی

رونمایی از DeepSeek R1-0528؛ چالش قدرتمند متن‌باز برای OpenAI o3 و Google Gemini 2.5 Pro

دیدگاه‌ خود را بنویسید لغو پاسخ