در جریان رویداد GTC انویدیا، این غول صنعت هوش مصنوعی خبر از ارتقاء جدیدی در حوزه مدلهای استنتاج منبع باز داد. این شرکت اعلام کرد مجموعهای از مدلهای Llama Nemotron را توسعه داده که برای تسریع در انجام وظایف پیچیده هوش مصنوعی طراحی شدهاند. مدلهای Llama Nemotron، توسعهیافته از مدلهای اولیه Nemotron هستند که ابتدا در نمایشگاه CES معرفی شدند. این مدلها به علت افزایش نیاز به مدلهای استنتاج در سال ۲۰۲۵ بهبود یافتهاند و با ارائه قدرت و کارایی بالا، برای استفاده در سناریوهای تجاری آمادهاند.
به گفته کاری بریسکی، معاون مدیریت محصولات نرمافزاری هوش مصنوعی تولیدی در انویدیا، عاملها سیستمهای نرمافزاری هستند که مانند انسانها نیاز به تحلیل و درک دارند تا بتوانند به درخواستهای پیچیده پاسخ دهند و در لحظه به رفتارهای جدید واکنش نشان دهند. بر اساس مدلهای متن باز Llama از شرکت Meta، انویدیا این مدلها را بهینهسازی کرده و نیازهای محاسباتی آنها را کاهش داده است. استفاده از دادههای مصنوعی و تکنیکهای پیشرفته پس از آموزش نیز از جمله نوآوریهای به کار رفته در این مدلهاست.
مدلهای Llama Nemotron شامل سه مدل متمایز برای استفاده در سناریوهای مختلف ارائه شدهاند. از ویژگیهای برجستهی این مدلها میتوان به امکان فعال یا غیرفعالسازی قابلیت استنتاج اشاره کرد که قابلیت جدیدی در بازار AI محسوب میشود. این توانایی به سیستمها اجازه میدهد که برای پرسشهای ساده، مراحل استنتاج پیچیده را کنار بگذارند و زمان و منابع محاسباتی را کاهش دهند.
همچنین انویدیا از AI-Q به عنوان یک چارچوب متن باز برای ارتباط عاملهای هوش مصنوعی با سیستمها و منابع داده سازمانی پرده برداشت. AI-Q، که در ماه آوریل معرفی خواهد شد، به تیمهای عاملهای متصل اجازه میدهد که به دادههای متنی، تصویری و ویدئویی دسترسی پیدا کنند و از ابزارهای خارجی نظیر جستجوی وب بهره ببرند.
این اعلامیهها به کسبوکارها امکان میدهد تا مدلهای هوش مصنوعی استنتاجی را در زیرساختهای خودشان پیادهسازی کنند، که نه تنها نگرانیهای مربوط به حاکمیت داده و حریم خصوصی را کاهش میدهد، بلکه به دلیل رویکرد تلفیقی در استنتاج، قابلیت انتخاب بین دقت و سرعت را نیز ارائه میدهند.
با حرکت هوش مصنوعی سازمانی به سمت وظایف پیچیدهتر، عرضه مدلهای کارآمد و چارچوبهای تلفیقی توسط انویدیا، این شرکتها را قادر میسازد تا عاملهای هوش مصنوعی پیشرفتهتری را برای حل مشکلات منطقی چندمرحلهای با انعطافپذیری بیشتر و بهینهسازی هزینهها پیادهسازی کنند.