عنوان: آنتروپیک کلود اپوس 4.6 را معرفی کرد؛ پنجرهی کانتکست ۱ میلیون توکنی و «تیمهای ایجنت» برای کدنویسی خودگردان
آنتروپیک (Anthropic) روز پنجشنبه نسخهی جدید و بزرگ مدل پیشرفته خود را با نام Claude Opus 4.6 منتشر کرد. این مدل با قابلیتهای جدیدی همچون برنامهریزی دقیقتر، پایداری در گردشهای کاری خودگردان طولانیتر و پنجرهی کانتکست تا یک میلیون توکن، برای استفاده سازمانی طراحی شده و شرکت میگوید در بنچمارکهای کلیدی سازمانی عملکردی برتر نسبت به رقبا از جمله GPT‑5.2 دارد. انتشار این نسخه در شرایط رقابت تنگاتنگ بازار و چند روز پس از عرضه اپ دسکتاپ Codex توسط OpenAI انجام شد که نشاندهنده شتاب بالای رقابت در ابزارهای توسعهی نرمافزار مبتنی بر هوش مصنوعی است.
خلاصهای از مهمترین تغییرات
– پنجرهی کانتکست بسیار بزرگ: اولینبار در کلاس Opus، پشتیبانی از کانتکست تا 1,000,000 توکن که به مدل امکان میدهد اطلاعات و مکالمات بسیار طولانی را پردازش و استدلال کند.
– خروجیهای طولانیتر: پشتیبانی از خروجی تا 128,000 توکن که برای تکمیل پروژههای توسعه، مستندسازی یا تولید اسناد جامع مفید است.
– تیمهای ایجنت (Agent Teams) در Claude Code: قابلیت پژوهشی که اجازه میدهد چند ایجنت هوش مصنوعی بهصورت همزمان روی بخشهای مختلف یک پروژه کدنویسی کار و مستقلانه هماهنگ شوند.
– بهبود در «کانتکست روت» (context rot): کاهش افت کیفیت پاسخ در مکالمات بلند و توانایی بهتر در بازیابی اطلاعات پنهان در اسناد طولانی.
– ویژگیهای جدید API: adaptive thinking برای تصمیمگیری دربارهی نیاز به استدلال عمیق، چهار سطح تلاش (low، medium، high، max) برای کنترل هزینه/سرعت/دقت، و context compaction (بتا) برای خلاصهسازی خودکار بخشهای قدیمی گفتگو جهت اجرای وظایف بلندمدت.
عملکرد در بنچمارکها و مزیت رقابتی
آنتروپیک اعلام کرده Opus 4.6 در بنچمارکهایی مانند Terminal‑Bench 2.0 (ویژه ارزیابی وظایف عاملمحور) و Humanity’s Last Exam (آزمون چندرشتهای استدلال پیچیده) بالاترین امتیازها را کسب کرده است. در بنچمارک GDPval‑AA — که عملکرد در کارهای دارای ارزش اقتصادی در حوزههای مالی، حقوقی و مشابه را میسنجد — Opus 4.6 بهزعم شرکت حدود 144 امتیاز ELO بهتر از GPT‑5.2 عمل کرده و بهمعنای کسب نمره بالاتر در حدود 70% موارد است. در آزمون MRCR v2 برای بازیابی اطلاعات در متنهای حجیم، Opus 4.6 نمره 76% را گزارش کرده که نسبت به نسل قبلی جهش چشمگیری نشان میدهد.
قابلیتهای توسعهدهندگان و کنترل هزینه
برای برنامهنویسان و تیمهای فنی، Opus 4.6 از طریق API با شناسه claude-opus-4-6 در دسترس است. قابلیتهای جدید API به توسعهدهندگان اجازه میدهد بین دقت و هزینه تعادل برقرار کنند: سطوح تلاش مختلف و adaptive thinking سبب میشود مدل در مسائل ساده «کمتر فکر کند» تا هزینه و تأخیر کاهش یابد. همچنین context compaction به نگهداری جریان کاری طولانی کمک میکند بدون آنکه حافظهی کانتکست سریعاً پر شود.
امنیت، همسو بودن و ابزارهای دفاعی
آنتروپیک، که تمرکز زیادی بر ایمنی مدلها دارد، میگوید Opus 4.6 با نرخ پایینی از رفتارهای نامناسب مانند فریب یا چاپلوسی همراه است و کمترین میزان «over‑refusal» (رد پرسشهای بیخطر) را در میان مدلهای اخیر Claude دارد. شرکت همچنین شش پروب جدید سایبری برای کشف استفادههای بالقوه مضر از قابلیتهای مدل توسعه داده و از همان مدل برای یافتن و رفع آسیبپذیریهای متنباز در تلاشهای دفاعی سایبری بهره میبرد.
کاربردهای سازمانی و رشد تجاری
آنتروپیک گزارش کرده که محصول Claude Code ظرف شش ماه پس از عرضه عمومی به نرخ درآمدی سالانه (run rate) یک میلیارد دلار رسیده است و مشتریان سازمانی بزرگی از جمله Uber، Salesforce، Accenture، Spotify، Rakuten، Snowflake، Novo Nordisk و Ramp از این فناوری استفاده میکنند. این پذیرش سازمانی یکی از عوامل افزایش ارزشگذاری و گزینههای تأمین مالی گسترده برای آنتروپیک بوده است.
رقابت با OpenAI و تأثیرات بازار
عرضه Opus 4.6 تنها سه روز پس از معرفی اپ دسکتاپ Codex از سوی OpenAI انجام شد؛ حرکتی که رقابت دو بازیگر بزرگ بخش خصوصی هوش مصنوعی را برجسته میکند. همزمان، اعلام برخی قابلیتهای جدید آنتروپیک و افزونههای مرتبط با خودکارسازی وظایف سازمانی موجب نوسانات گستردهای در بازار سهام نرمافزاری شد؛ با این حال تحلیلگران و مدیران صنعتی درباره این واکنشها اختلافنظر دارند و برخی آن را اغراقآمیز میدانند. از سوی دیگر، آنتروپیک و OpenAI در رویکرد تجاری نیز تفاوتهایی دارند: OpenAI به درآمدزایی از طریق محصولات مصرفی و تبلیغات توجه دارد، در حالی که آنتروپیک تمرکز بیشتری بر فروش سازمانی و اشتراکهای پریمیوم گذاشته است.
ادغامها و دسترسی به محصولات
آنتروپیک افزونهای برای PowerPoint در وضعیت پژوهشی عرضه کرده تا کاربران بتوانند با همان توانمندیهای Claude اسلاید ایجاد و ویرایش کنند — اقدامی که جلب توجه میکند چون مایکروسافت سهام قابل توجهی در OpenAI دارد. Opus 4.6 بلافاصله روی claude.ai، API کلود و پلتفرمهای اصلی ابری در دسترس است.
قیمتگذاری
آنتروپیک قیمتگذاری مدل را بدون تغییر اعلام کرده: ۵ دلار برای هر یک میلیون توکن ورودی و ۲۵ دلار برای هر یک میلیون توکن خروجی. برای درخواستهایی که از پنجرهی یک میلیون توکنی استفاده میکنند و بیش از ۲۰۰٬۰۰۰ توکن هستند، قیمتهای پرمیوم ۱۰ دلار/۳۷.۵۰ دلار لحاظ میشود. شرکت توصیه میکند در مواردی که مدل بیش از حد برای کارهای ساده «overthink» میکند، سطح تلاش را از high به medium کاهش دهند تا هزینه و تأخیر کاهش یابد.
جمعبندی
Claude Opus 4.6 گامی مهم در جهت استفاده سازمانی از مدلهای بزرگ زبان است: پنجرهی کانتکست بسیار وسیع، خروجیهای طولانیتر، ویژگیهای هماهنگی چندایجنتی و ابزارهای کنترلی برای هزینه و تأخیر، آن را به گزینهای جذاب برای تیمهای توسعه و تحقیق تبدیل کرده است. همزمان رقابت با OpenAI و واکنش بازار به قابلیتهای جدید نشان میدهد که حرکت به سمت خودکارسازی وظایف سازمانی با هوش مصنوعی، پیامدهای فناوری و اقتصادی قابل توجهی خواهد داشت. ادامه پیشرفتها و نحوهی بهکارگیری این سیستمها در محیطهای حساس، تعیینکننده خواهد بود.
