عنوان: آنتروپیک کلود اپوس 4.6 را معرفی کرد؛ پنجره‌ی کانتکست ۱ میلیون توکنی و «تیم‌های ایجنت» برای کدنویسی خودگردان

آنتروپیک (Anthropic) روز پنج‌شنبه نسخه‌ی جدید و بزرگ مدل پیشرفته خود را با نام Claude Opus 4.6 منتشر کرد. این مدل با قابلیت‌های جدیدی همچون برنامه‌ریزی دقیق‌تر، پایداری در گردش‌های کاری خودگردان طولانی‌تر و پنجره‌ی کانتکست تا یک میلیون توکن، برای استفاده سازمانی طراحی شده و شرکت می‌گوید در بنچمارک‌های کلیدی سازمانی عملکردی برتر نسبت به رقبا از جمله GPT‑5.2 دارد. انتشار این نسخه در شرایط رقابت تنگاتنگ بازار و چند روز پس از عرضه اپ دسکتاپ Codex توسط OpenAI انجام شد که نشان‌دهنده شتاب بالای رقابت در ابزارهای توسعه‌ی نرم‌افزار مبتنی بر هوش مصنوعی است.

خلاصه‌ای از مهم‌ترین تغییرات
– پنجره‌ی کانتکست بسیار بزرگ: اولین‌بار در کلاس Opus، پشتیبانی از کانتکست تا 1,000,000 توکن که به مدل امکان می‌دهد اطلاعات و مکالمات بسیار طولانی را پردازش و استدلال کند.
– خروجی‌های طولانی‌تر: پشتیبانی از خروجی تا 128,000 توکن که برای تکمیل پروژه‌های توسعه، مستندسازی یا تولید اسناد جامع مفید است.
– تیم‌های ایجنت (Agent Teams) در Claude Code: قابلیت پژوهشی که اجازه می‌دهد چند ایجنت هوش مصنوعی به‌صورت هم‌زمان روی بخش‌های مختلف یک پروژه کدنویسی کار و مستقلانه هماهنگ شوند.
– بهبود در «کانتکست روت» (context rot): کاهش افت کیفیت پاسخ در مکالمات بلند و توانایی بهتر در بازیابی اطلاعات پنهان در اسناد طولانی.
– ویژگی‌های جدید API: adaptive thinking برای تصمیم‌گیری درباره‌ی نیاز به استدلال عمیق، چهار سطح تلاش (low، medium، high، max) برای کنترل هزینه/سرعت/دقت، و context compaction (بتا) برای خلاصه‌سازی خودکار بخش‌های قدیمی گفتگو جهت اجرای وظایف بلندمدت.

عملکرد در بنچمارک‌ها و مزیت رقابتی
آنتروپیک اعلام کرده Opus 4.6 در بنچمارک‌هایی مانند Terminal‑Bench 2.0 (ویژه ارزیابی وظایف عامل‌محور) و Humanity’s Last Exam (آزمون چندرشته‌ای استدلال پیچیده) بالاترین امتیازها را کسب کرده است. در بنچمارک GDPval‑AA — که عملکرد در کارهای دارای ارزش اقتصادی در حوزه‌های مالی، حقوقی و مشابه را می‌سنجد — Opus 4.6 به‌زعم شرکت حدود 144 امتیاز ELO بهتر از GPT‑5.2 عمل کرده و به‌معنای کسب نمره بالاتر در حدود 70% موارد است. در آزمون MRCR v2 برای بازیابی اطلاعات در متن‌های حجیم، Opus 4.6 نمره 76% را گزارش کرده که نسبت به نسل قبلی جهش چشمگیری نشان می‌دهد.

قابلیت‌های توسعه‌دهندگان و کنترل هزینه
برای برنامه‌نویسان و تیم‌های فنی، Opus 4.6 از طریق API با شناسه claude-opus-4-6 در دسترس است. قابلیت‌های جدید API به توسعه‌دهندگان اجازه می‌دهد بین دقت و هزینه تعادل برقرار کنند: سطوح تلاش مختلف و adaptive thinking سبب می‌شود مدل در مسائل ساده «کم‌تر فکر کند» تا هزینه و تأخیر کاهش یابد. همچنین context compaction به نگهداری جریان کاری طولانی کمک می‌کند بدون آنکه حافظه‌ی کانتکست سریعاً پر شود.

امنیت، همسو بودن و ابزارهای دفاعی
آنتروپیک، که تمرکز زیادی بر ایمنی مدل‌ها دارد، می‌گوید Opus 4.6 با نرخ پایینی از رفتارهای نامناسب مانند فریب یا چاپلوسی همراه است و کمترین میزان «over‑refusal» (رد پرسش‌های بی‌خطر) را در میان مدل‌های اخیر Claude دارد. شرکت همچنین شش پروب جدید سایبری برای کشف استفاده‌های بالقوه مضر از قابلیت‌های مدل توسعه داده و از همان مدل برای یافتن و رفع آسیب‌پذیری‌های متن‌باز در تلاش‌های دفاعی سایبری بهره می‌برد.

کاربردهای سازمانی و رشد تجاری
آنتروپیک گزارش کرده که محصول Claude Code ظرف شش ماه پس از عرضه عمومی به نرخ درآمدی سالانه (run rate) یک میلیارد دلار رسیده است و مشتریان سازمانی بزرگی از جمله Uber، Salesforce، Accenture، Spotify، Rakuten، Snowflake، Novo Nordisk و Ramp از این فناوری استفاده می‌کنند. این پذیرش سازمانی یکی از عوامل افزایش ارزش‌گذاری و گزینه‌های تأمین مالی گسترده برای آنتروپیک بوده است.

رقابت با OpenAI و تأثیرات بازار
عرضه Opus 4.6 تنها سه روز پس از معرفی اپ دسکتاپ Codex از سوی OpenAI انجام شد؛ حرکتی که رقابت دو بازیگر بزرگ بخش خصوصی هوش مصنوعی را برجسته می‌کند. هم‌زمان، اعلام برخی قابلیت‌های جدید آنتروپیک و افزونه‌های مرتبط با خودکارسازی وظایف سازمانی موجب نوسانات گسترده‌ای در بازار سهام نرم‌افزاری شد؛ با این حال تحلیلگران و مدیران صنعتی درباره این واکنش‌ها اختلاف‌نظر دارند و برخی آن را اغراق‌آمیز می‌دانند. از سوی دیگر، آنتروپیک و OpenAI در رویکرد تجاری نیز تفاوت‌هایی دارند: OpenAI به درآمدزایی از طریق محصولات مصرفی و تبلیغات توجه دارد، در حالی که آنتروپیک تمرکز بیشتری بر فروش سازمانی و اشتراک‌های پریمیوم گذاشته است.

ادغام‌ها و دسترسی به محصولات
آنتروپیک افزونه‌ای برای PowerPoint در وضعیت پژوهشی عرضه کرده تا کاربران بتوانند با همان توانمندی‌های Claude اسلاید ایجاد و ویرایش کنند — اقدامی که جلب توجه می‌کند چون مایکروسافت سهام قابل توجهی در OpenAI دارد. Opus 4.6 بلافاصله روی claude.ai، API کلود و پلتفرم‌های اصلی ابری در دسترس است.

قیمت‌گذاری
آنتروپیک قیمت‌گذاری مدل را بدون تغییر اعلام کرده: ۵ دلار برای هر یک میلیون توکن ورودی و ۲۵ دلار برای هر یک میلیون توکن خروجی. برای درخواست‌هایی که از پنجره‌ی یک میلیون توکنی استفاده می‌کنند و بیش از ۲۰۰٬۰۰۰ توکن هستند، قیمت‌های پرمیوم ۱۰ دلار/۳۷.۵۰ دلار لحاظ می‌شود. شرکت توصیه می‌کند در مواردی که مدل بیش از حد برای کارهای ساده «overthink» می‌کند، سطح تلاش را از high به medium کاهش دهند تا هزینه و تأخیر کاهش یابد.

جمع‌بندی
Claude Opus 4.6 گامی مهم در جهت استفاده سازمانی از مدل‌های بزرگ زبان است: پنجره‌ی کانتکست بسیار وسیع، خروجی‌های طولانی‌تر، ویژگی‌های هماهنگی چندایجنتی و ابزارهای کنترلی برای هزینه و تأخیر، آن را به گزینه‌ای جذاب برای تیم‌های توسعه و تحقیق تبدیل کرده است. همزمان رقابت با OpenAI و واکنش بازار به قابلیت‌های جدید نشان می‌دهد که حرکت به سمت خودکارسازی وظایف سازمانی با هوش مصنوعی، پیامدهای فناوری و اقتصادی قابل توجهی خواهد داشت. ادامه پیشرفت‌ها و نحوه‌ی به‌کارگیری این سیستم‌ها در محیط‌های حساس، تعیین‌کننده خواهد بود.

راهنمای هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا