پیشرفت‌های جدید در هوش مصنوعی: معرفی مدل بصری Command A Vision از کوهیر

کوهیر، یکی از شرکت‌های پیشرو در زمینه هوش مصنوعی در کانادا، با به‌روزرسانی‌های اخیر خود، یک مدل بصری جدید به نام Command A Vision را معرفی کرده است که به ویژه برای کاربردهای سازمانی طراحی شده است. این مدل که بر پایه مدل Command A ساخته شده، حاوی ۱۱۲ میلیارد پارامتر است و با هدف استخراج بینش‌های قیمتی از داده‌های بصری و اتخاذ تصمیمات دقیق مبتنی بر داده از طریق شناسایی نوری کاراکترها (OCR) و تحلیل تصاویر، توسعه داده شده است.

از جمله قابلیت‌های کلیدی Command A Vision، توانایی آن در تجزیه و تحلیل انواع رایج تصاویر مورد نیاز سازمان‌ها، از جمله نمودارها، جداول، دیاگرام‌ها و اسناد اسکن شده است. این مدل به سازمان‌ها کمک می‌کند تا با تجزیه و تحلیل و استخراج اطلاعات از مدارک بصری، کارایی خود را افزایش دهند و زمان مورد نیاز برای انجام کارهای تکراری را کاهش دهند.

کوهیر تأکید کرده است که Command A Vision به گونه‌ای طراحی شده است که فقط به دو GPU نیاز دارد و در عین حال قابلیت‌های متنی مدل Command A را نیز حفظ می‌کند؛ به این معنا که می‌تواند متن‌های موجود در تصاویر را بخواند و حداقل به ۲۳ زبان مختلف درک کند.

علاوه بر این، مدل جدید کوهیر هزینه‌های مالکیت کلی را برای سازمان‌ها کاهش می‌دهد و به طور کامل برای موارد استفاده مربوط به بازیابی اطلاعات بهینه‌سازی شده است. بر اساس معماری Llava، این مدل قابلیت‌های بصری را به توکن‌های نرم بصری تبدیل کرده و به سیستم متنی Command A منتقل می‌کند.

در آزمایش‌های انجام شده، Command A Vision نشان داد که در مقایسه با مدل‌های دیگر با قابلیت‌های بصری مشابه، عملکرد بهتری داشته است. در تست‌های منحصر به فردی مانند ChartQA و OCRBench، این مدل به خوبی در رقابت با مدل‌های مشابهی چون GPT-4.1 از OpenAI و Llama 4 Maverick از Meta عمل کرده است.

کوهیر همچنین این مدل را در قالب یک سیستم وزن باز ارائه کرده است، تا سازمان‌ها بتوانند به راحتی به آن دسترسی پیدا کنند و از مدل‌های بسته و اختصاصی دور شوند. به طور کلی، با توجه به روند رو به رشد تحقیق عمیق و نیاز به مدل‌هایی که قادر به خواندن و تحلیل اطلاعات غیرساختاریافته باشند، Command A Vision یک پیشرفت مهم در مسیر تحول هوش مصنوعی برای صنعت به حساب می‌آید.

این فن‌آوری نوین، می‌تواند به سازمان‌ها در درک بهتر داده‌ها و اتخاذ تصمیمات هوشمندانه کمک کند و بدین ترتیب، به بهینه‌سازی روندهای کاری و افزایش بهره‌وری منجر شود.

تبدیل متن‌های فارسی به صوت طبیعی و روان

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا