شرکت‌های بزرگ فناوری اغلب به بهبود مدل‌های هوش مصنوعی با تریلیون‌ها پارامتر و نیاز به کلستری های گران‌قیمت GPU می‌نازند. اما استارتاپ Fastino رویکردی متفاوت را اتخاذ کرده است. این شرکت مستقر در پالو آلتو ادعا می‌کند که نوع جدیدی از معماری مدل‌های هوش مصنوعی را ابداع کرده که به‌طور عمدی کوچک و خاص برای اهداف مشخص طراحی شده‌اند. به گفته Fastino، این مدل‌ها به‌حدی کوچک هستند که با استفاده از GPUهای گیمینگ ارزان قیمت که مجموع ارزش آنها کمتر از 100,000 دلار است، آموزش داده می‌شوند. این روش توجه زیادی را جلب کرده است و این استارتاپ توانسته است 17.5 میلیون دلار سرمایه در مرحله ابتدایی تأمین مالی کند که توسط Khosla Ventures، سرمایه‌گذار اولیه مشهور OpenAI، رهبری می‌شود. با این تأمین مالی، مجموع سرمایه‌گذاری‌های Fastino به نزدیک به 25 میلیون دلار می‌رسد. این شرکت در نوامبر گذشته نیز 7 میلیون دلار در یک دور پیش‌تأمین مالی تحت هدایت بازوی سرمایه‌گذاری مایکروسافت، M12 و Insight Partners جذب کرد.

آش لوئیس، مدیر عام و یکی از بنیان‌گذاران Fastino، می‌گوید: “مدل‌های ما سریع‌تر، دقیق‌تر و با هزینه‌ای اندک آموزش داده می‌شوند، در حالی که در انجام وظایف خاص از مدل‌های پرچم‌دار جلوتر هستند.” Fastino مجموعه‌ای از مدل‌های کوچک را برای مشتریان شرکتی ایجاد کرده است که هر مدل بر روی یک وظیفه خاص تمرکز دارد، مانند پاکسازی داده‌های حساس یا خلاصه‌سازی اسناد شرکتی. این شرکت هنوز عملکرد اولیه یا کاربران خود را اعلام نکرده است، اما به گفته لوئیس، عملکرد این مدل‌ها کاربران اولیه را شگفت‌زده کرده است. به عنوان مثال، به دلیل کوچک بودن، این مدل‌ها می‌توانند یک پاسخ کامل را در یک توکن ارائه دهند و در کسری از ثانیه به سوالات پاسخ می‌دهند.

هنوز زود است که بگوییم آیا رویکرد Fastino موفق خواهد شد یا خیر. فضای هوش مصنوعی شرکتی شلوغ است و شرکت‌هایی مانند Cohere و Databricks نیز مدل‌هایی را معرفی کرده‌اند که در انجام وظایف خاص برتری دارند. همچنین سازندگان مدل‌های کوچک و متمرکز بر نیازهای شرکتی، از جمله Anthropic و Mistral، نیز در این حوزه فعال هستند. البته، این موضوع نیز بر کسی پوشیده نیست که آینده هوش مصنوعی مولد برای شرکت‌ها احتمالاً در مدل‌های زبان کوچک‌تر و متمرکزتر خواهد بود.

Fastino در حال حاضر بر ساخت تیم نوآور هوش مصنوعی متمرکز است و محققین در بهترین آزمایشگاه‌های هوش مصنوعی را هدف قرار داده که به دنبال ساخت بزرگ‌ترین مدل یا شکست رکوردها نیستند. لوئیس می‌گوید: “استراتژی استخدام ما به شدت بر روی محققینی متمرکز است که ممکن است رویکردی مخالف با طرز تفکر کنونی درباره ساخت مدل‌های زبانی داشته باشند.”

گفتگوی هوشمند آنلاین

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا