مدل‌های هوش مصنوعی جدید Claude 4 از Anthropic قادر به استدلال چند مرحله‌ای هستند

در کنفرانس توسعه‌دهندگان inaugural که روز پنجشنبه برگزار شد، شرکت آنتروپیک از دو مدل جدید هوش مصنوعی رونمایی کرد که ادعا می‌کند بهترین‌ها در صنعت هستند، حداقل از نظر عملکرد در معیارهای محبوب. مدل‌های جدید «کلود اوپس ۴» و «کلود سونت ۴» به خانواده مدل‌های کلود ۴ آنتروپیک تعلق دارند و طبق ادعای این شرکت، قادر به تحلیل داده‌های بزرگ، انجام وظایف طولانی‌مدت و اتخاذ اقدام‌های پیچیده‌اند.

آنتروپیک اذعان دارد که هر دو مدل به‌گونه‌ای تنظیم شده‌اند که در وظایف برنامه‌نویسی عملکرد بهتری دارند و به همین دلیل، برای نوشتن و ویرایش کد مناسب هستند. تمامی کاربران پرداخت‌کننده و کاربران اپلیکیشن‌های رایگان چت‌بات‌های این شرکت به مدل سونت ۴ دسترسی خواهند داشت، در حالی که فقط کاربران پرداخت‌کننده می‌توانند از اوپس ۴ بهره‌مند شوند. قیمت مدل اوپس ۴ در API این شرکت، از طریق پلتفرم Bedrock آمازون و Vertex AI گوگل، برای هر میلیون توکن (ورودی/خروجی) ۱۵ تا ۷۵ دلار و برای سونت ۴ این قیمت ۳ تا ۱۵ دلار خواهد بود. توکن‌ها داده‌های خامی هستند که مدل‌های هوش مصنوعی با آن‌ها کار می‌کنند و یک میلیون توکن معادل حدود ۷۵۰,۰۰۰ کلمه است که تقریباً ۱۶۳,۰۰۰ کلمه بیشتر از رمان «جنگ و صلح» می‌باشد.

مدل‌های کلود ۴ با هدف رشد چشمگیر درآمد آنتروپیک عرضه شده‌اند. این شرکت که توسط محققان سابق اوپن‌ای آی تأسیس شده، قصد دارد در سال ۲۰۲۷ به درآمد ۱۲ میلیارد دلاری دست یابد که در مقایسه با پیش‌بینی ۲.۲ میلیارد دلار برای سال جاری قابل توجه است. آنتروپیک به‌تازگی یک تسهیلات اعتباری ۲.۵ میلیارد دلاری را به سرانجام رسانده و میلیاردها دلار از آمازون و سایر سرمایه‌گذاران جمع‌آوری کرده تا برای هزینه‌های فزاینده مرتبط با توسعه مدل‌های پیشرفته آماده باشد.

رقبا کار را برای حفظ جایگاه پیشرو در دنیای هوش مصنوعی دشوار کرده‌اند. در حالی که آنتروپیک مدلی جدید به نام کلود سونت ۳.۷ و ابزاری برای کدنویسی به نام کلود کد را به بازار معرفی کرده، رقبا از جمله اوپن‌ای آی و گوگل در تلاش‌اند تا با مدل‌های قدرتمند و ابزارهای توسعه خود از این شرکت پیشی بگیرند. مدل اوپس ۴ که از دو مدل معرفی شده امروز قوی‌تر است، به ادعای آنتروپیک قابلیت «تمرکز بر تلاش» را در مراحل مختلف یک روند کاری دارد. همچنین، سونت ۴ که به عنوان جایگزینی مستقیم برای سونت ۳.۷ طراحی شده، در زمینه کدنویسی و ریاضیات نسبت به مدل‌های قبلی آنتروپیک پیشرفت‌هایی کرده و به دقت بیشتری به دستورالعمل‌ها پاسخ می‌دهد.

خانواده مدل‌های کلود ۴ ادعا شده است که کمتر از سونت ۳.۷ به رفتارهای «هک پاداش» می‌پردازند. هک پاداش به رفتارهایی اطلاق می‌شود که مدل‌ها برای تکمیل وظایف از میانبرها و خلأها استفاده می‌کنند. با این حال، این بهبودها لزوماً به معنای دستیابی به بهترین مدل‌ها در هر معیار نیست. به عنوان مثال، در حالی که اوپس ۴ در معیار SWE-bench Verified که به ارزیابی توانایی‌های کدنویسی یک مدل می‌پردازد، از گوگل و اوپن‌ای آی پیشی می‌گیرد، اما در ارزیابی چندمنظوره MMMU و سوالات مربوط به بیولوژی، فیزیک و شیمی از مدل‌های مذکور عقب می‌افتد.

آنتروپیک اوپس ۴ را تحت تدابیر ایمنی سخت‌گیرانه‌تری عرضه کرده است، از جمله سیستم‌های شناسایی محتوای مضر و دفاع‌های سایبری تقویت‌شده. طبق ادعای شرکت، آزمایش‌های داخلی نشان داده است که اوپس ۴ ممکن است به طور قابل توجهی توانایی افرادی با زمینه STEM را در به‌دست‌آوردن، تولید یا استقرار سلاح‌های شیمیایی، بیولوژیکی یا هسته‌ای افزایش دهد. هر دو مدل اوپس ۴ و سونت ۴ به‌عنوان مدل‌های «هیبرید» معرفی شده‌اند که می‌توانند پاسخ‌های تقریبا فوری و تفکر گسترده را برای استدلال عمیق‌تر ارائه دهند.

آنتروپیک با هدف افزایش راحتی برنامه‌نویسان، به‌روزرسانی‌هایی برای ابزار کلود کد ارائه کرده است. کلود کد به توسعه‌دهندگان این امکان را می‌دهد که وظایف خاصی را از طریق مدل‌های آنتروپیک مستقیماً از ترمینال اجرا کنند و اکنون با IDEهای مختلف ادغام شده و SDKی را ارائه می‌دهد که به توسعه‌دهندگان اجازه می‌دهد آن را به اپلیکیشن‌های شخص ثالث متصل کنند. اتصال دهنده‌های کلود کد برای VS Code، JetBrains و GitHub نیز به‌روزرسانی شده است.

مدل‌های هوش مصنوعی همچنان با چالش‌هایی در تولید نرم‌افزارهای با کیفیت مواجه هستند. این AIها معمولاً آسیب‌پذیری‌های امنیتی و خطاهایی را به‌دلیل کاستی‌ها در درک منطق برنامه‌نویسی ایجاد می‌کنند. با این حال، وعده آن‌ها در افزایش بهره‌وری کدنویسی باعث شده است که شرکت‌ها و توسعه‌دهندگان به سرعت به استفاده از این ابزارها روی آورند. آنتروپیک به‌خوبی از این موضوع آگاه است و وعده به‌روزرسانی‌های بیشتر مدل‌ها را می‌دهد. این شرکت در بیانیه‌ای اعلام کرده است که به سمت به‌روزرسانی‌های بیشتر و مداوم مدل‌ها حرکت می‌کند تا خدمات خود را به مشتریان با سرعت بیشتری بهبود بخشد.

مشاور صوتی آنلاین

مدل‌های هوش مصنوعی جدید Claude 4 از Anthropic قادر به استدلال چند مرحله‌ای هستند

دیدگاه‌ خود را بنویسید لغو پاسخ