در کنفرانس توسعهدهندگان inaugural که روز پنجشنبه برگزار شد، شرکت آنتروپیک از دو مدل جدید هوش مصنوعی رونمایی کرد که ادعا میکند بهترینها در صنعت هستند، حداقل از نظر عملکرد در معیارهای محبوب. مدلهای جدید «کلود اوپس ۴» و «کلود سونت ۴» به خانواده مدلهای کلود ۴ آنتروپیک تعلق دارند و طبق ادعای این شرکت، قادر به تحلیل دادههای بزرگ، انجام وظایف طولانیمدت و اتخاذ اقدامهای پیچیدهاند.
آنتروپیک اذعان دارد که هر دو مدل بهگونهای تنظیم شدهاند که در وظایف برنامهنویسی عملکرد بهتری دارند و به همین دلیل، برای نوشتن و ویرایش کد مناسب هستند. تمامی کاربران پرداختکننده و کاربران اپلیکیشنهای رایگان چتباتهای این شرکت به مدل سونت ۴ دسترسی خواهند داشت، در حالی که فقط کاربران پرداختکننده میتوانند از اوپس ۴ بهرهمند شوند. قیمت مدل اوپس ۴ در API این شرکت، از طریق پلتفرم Bedrock آمازون و Vertex AI گوگل، برای هر میلیون توکن (ورودی/خروجی) ۱۵ تا ۷۵ دلار و برای سونت ۴ این قیمت ۳ تا ۱۵ دلار خواهد بود. توکنها دادههای خامی هستند که مدلهای هوش مصنوعی با آنها کار میکنند و یک میلیون توکن معادل حدود ۷۵۰,۰۰۰ کلمه است که تقریباً ۱۶۳,۰۰۰ کلمه بیشتر از رمان «جنگ و صلح» میباشد.
مدلهای کلود ۴ با هدف رشد چشمگیر درآمد آنتروپیک عرضه شدهاند. این شرکت که توسط محققان سابق اوپنای آی تأسیس شده، قصد دارد در سال ۲۰۲۷ به درآمد ۱۲ میلیارد دلاری دست یابد که در مقایسه با پیشبینی ۲.۲ میلیارد دلار برای سال جاری قابل توجه است. آنتروپیک بهتازگی یک تسهیلات اعتباری ۲.۵ میلیارد دلاری را به سرانجام رسانده و میلیاردها دلار از آمازون و سایر سرمایهگذاران جمعآوری کرده تا برای هزینههای فزاینده مرتبط با توسعه مدلهای پیشرفته آماده باشد.
رقبا کار را برای حفظ جایگاه پیشرو در دنیای هوش مصنوعی دشوار کردهاند. در حالی که آنتروپیک مدلی جدید به نام کلود سونت ۳.۷ و ابزاری برای کدنویسی به نام کلود کد را به بازار معرفی کرده، رقبا از جمله اوپنای آی و گوگل در تلاشاند تا با مدلهای قدرتمند و ابزارهای توسعه خود از این شرکت پیشی بگیرند. مدل اوپس ۴ که از دو مدل معرفی شده امروز قویتر است، به ادعای آنتروپیک قابلیت «تمرکز بر تلاش» را در مراحل مختلف یک روند کاری دارد. همچنین، سونت ۴ که به عنوان جایگزینی مستقیم برای سونت ۳.۷ طراحی شده، در زمینه کدنویسی و ریاضیات نسبت به مدلهای قبلی آنتروپیک پیشرفتهایی کرده و به دقت بیشتری به دستورالعملها پاسخ میدهد.
خانواده مدلهای کلود ۴ ادعا شده است که کمتر از سونت ۳.۷ به رفتارهای «هک پاداش» میپردازند. هک پاداش به رفتارهایی اطلاق میشود که مدلها برای تکمیل وظایف از میانبرها و خلأها استفاده میکنند. با این حال، این بهبودها لزوماً به معنای دستیابی به بهترین مدلها در هر معیار نیست. به عنوان مثال، در حالی که اوپس ۴ در معیار SWE-bench Verified که به ارزیابی تواناییهای کدنویسی یک مدل میپردازد، از گوگل و اوپنای آی پیشی میگیرد، اما در ارزیابی چندمنظوره MMMU و سوالات مربوط به بیولوژی، فیزیک و شیمی از مدلهای مذکور عقب میافتد.
آنتروپیک اوپس ۴ را تحت تدابیر ایمنی سختگیرانهتری عرضه کرده است، از جمله سیستمهای شناسایی محتوای مضر و دفاعهای سایبری تقویتشده. طبق ادعای شرکت، آزمایشهای داخلی نشان داده است که اوپس ۴ ممکن است به طور قابل توجهی توانایی افرادی با زمینه STEM را در بهدستآوردن، تولید یا استقرار سلاحهای شیمیایی، بیولوژیکی یا هستهای افزایش دهد. هر دو مدل اوپس ۴ و سونت ۴ بهعنوان مدلهای «هیبرید» معرفی شدهاند که میتوانند پاسخهای تقریبا فوری و تفکر گسترده را برای استدلال عمیقتر ارائه دهند.
آنتروپیک با هدف افزایش راحتی برنامهنویسان، بهروزرسانیهایی برای ابزار کلود کد ارائه کرده است. کلود کد به توسعهدهندگان این امکان را میدهد که وظایف خاصی را از طریق مدلهای آنتروپیک مستقیماً از ترمینال اجرا کنند و اکنون با IDEهای مختلف ادغام شده و SDKی را ارائه میدهد که به توسعهدهندگان اجازه میدهد آن را به اپلیکیشنهای شخص ثالث متصل کنند. اتصال دهندههای کلود کد برای VS Code، JetBrains و GitHub نیز بهروزرسانی شده است.
مدلهای هوش مصنوعی همچنان با چالشهایی در تولید نرمافزارهای با کیفیت مواجه هستند. این AIها معمولاً آسیبپذیریهای امنیتی و خطاهایی را بهدلیل کاستیها در درک منطق برنامهنویسی ایجاد میکنند. با این حال، وعده آنها در افزایش بهرهوری کدنویسی باعث شده است که شرکتها و توسعهدهندگان به سرعت به استفاده از این ابزارها روی آورند. آنتروپیک بهخوبی از این موضوع آگاه است و وعده بهروزرسانیهای بیشتر مدلها را میدهد. این شرکت در بیانیهای اعلام کرده است که به سمت بهروزرسانیهای بیشتر و مداوم مدلها حرکت میکند تا خدمات خود را به مشتریان با سرعت بیشتری بهبود بخشد.