آمازون روز دوشنبه از Nova Act، یک عامل هوش مصنوعی عمومی که قادر به کنترل مرورگر وب و انجام مستقل برخی کارهای ساده است، پرده برداشت. آمازون همراه با این مدل هوش مصنوعی جدید، کیت توسعه نرمافزاری (SDK) Nova Act را نیز معرفی کرده است که به توسعهدهندگان امکان میدهد با Nova Act پروتوتایپهای عاملی ایجاد کنند. Nova Act که در آزمایشگاه AGI جدید آمازون در سانفرانسیسکو توسعه یافته، به ویژگیهای کلیدی نسخه ارتقاء یافته Alexa+، دستیار صوتی پرطرفدار آمازون با هوش مصنوعی مولد، قدرت خواهد بخشید. نسخهای از Nova Act که از امروز در دسترس است، به عنوان پیشنمایش تحقیقاتی عرضه شده و ممکن است هنوز بهطور کامل تکمیل نشده باشد.
توسعهدهندگان میتوانند از طریق وبسایت nova.amazon.com، به ابزارهای Nova Act دسترسی پیدا کنند و همچنین با مدلهای بنیادین مختلف این تکنولوژی از آمازون آشنا شوند. Nova Act تلاش آمازون برای رقابت با OpenAI و Anthropic در حوزه فناوری عوامل هوش مصنوعی عمومی است. شرکتهای برتر فناوری معتقدند که عوامل هوش مصنوعی که قادرند برای کاربران به گشتوگذار در وب بپردازند، باعث افزایش کارایی چتباتهای کنونی خواهند شد.
آمازون هرچند نخستین توسعهدهنده این نوع فناوری نیست، اما احتمالاً از طریق Alexa+ به بیشترین تعداد کاربران دست خواهد یافت. به گفته آمازون، توسعهدهندگان با استفاده از SDK Nova Act میتوانند اقدامات ابتدایی مانند سفارش سالاد از Sweetgreen یا رزرو شام را بهصورت خودکار انجام دهند. این ابزار به توسعهدهندگان امکان میدهد سامانههایی ایجاد کنند که یک عامل هوش مصنوعی قادر به گشتوگذار در صفحات وب، پر کردن فرمها یا انتخاب تاریخ در یک تقویم باشد.
آمازون ادعا میکند Nova Act در چندین آزمایش داخلی شرکت، نسبت به عوامل OpenAI و Anthropic برتری داشته است. برای مثال، در آزمون ScreenSpot Web Text که نحوه تعامل یک عامل هوش مصنوعی با متن روی صفحه را اندازهگیری میکند، Nova Act امتیاز ۹۴٪ را کسب کرده و از CUA (با امتیاز ۸۸٪) و Claude 3.7 Sonnet (با امتیاز ۹۰٪) پیشی گرفته است. با این حال، آمازون Nova Act را بر اساس ارزیابیهای رایجتری مانند WebVoyager، بررسی نکرده است.
Nova Act نخستین محصول عمومی است که از آزمایشگاه AGI آمازون به رهبری دیوید لوآن و پیتر آبیل، که قبلاً خود شرکتهای استارتاپی موفقی تأسیس کرده بودند، بیرون آمده است. به گفته لوآن، عوامل هوش مصنوعی یک گام کلیدی در جهت ایجاد سیستمهای هوش مصنوعی فوقالعاده هوشمند است. او AGI را به عنوان سیستمی تعریف میکند که قادر است هر کاری را که انسان توانایی انجام آن را با کامپیوتر دارد، انجام دهد.
آزمایشهای اولیه Nova Act میتواند نگاهی به قابلیتهای نسخه ارتقاء یافته Alexa+ ارائه دهد، که ممکن است لحظهای حیاتی برای تلاشهای هوش مصنوعی آمازون باشد. یکی از مشکلات عمده عوامل هوش مصنوعی اولیه از OpenAI، گوگل و Anthropic، قابلیت اطمینان در دامنههای مختلف است. این سیستمها در آزمونهای TechCrunch کند عمل کرده و در طولانی مدت بهطور مستقل قادر به عملکرد نیستند و معمولا اشتباهاتی را مرتکب میشوند که یک انسان آنها را انجام نمیدهد. به زودی خواهیم دید که آیا آمازون توانسته چالشهای این حوزه را برطرف کند یا عوامل آن مشابه نقصهای رقبای خود خواهند بود.