شرکتهای بزرگ فناوری اغلب به بهبود مدلهای هوش مصنوعی با تریلیونها پارامتر و نیاز به کلستری های گرانقیمت GPU مینازند. اما استارتاپ Fastino رویکردی متفاوت را اتخاذ کرده است. این شرکت مستقر در پالو آلتو ادعا میکند که نوع جدیدی از معماری مدلهای هوش مصنوعی را ابداع کرده که بهطور عمدی کوچک و خاص برای اهداف مشخص طراحی شدهاند. به گفته Fastino، این مدلها بهحدی کوچک هستند که با استفاده از GPUهای گیمینگ ارزان قیمت که مجموع ارزش آنها کمتر از 100,000 دلار است، آموزش داده میشوند. این روش توجه زیادی را جلب کرده است و این استارتاپ توانسته است 17.5 میلیون دلار سرمایه در مرحله ابتدایی تأمین مالی کند که توسط Khosla Ventures، سرمایهگذار اولیه مشهور OpenAI، رهبری میشود. با این تأمین مالی، مجموع سرمایهگذاریهای Fastino به نزدیک به 25 میلیون دلار میرسد. این شرکت در نوامبر گذشته نیز 7 میلیون دلار در یک دور پیشتأمین مالی تحت هدایت بازوی سرمایهگذاری مایکروسافت، M12 و Insight Partners جذب کرد.
آش لوئیس، مدیر عام و یکی از بنیانگذاران Fastino، میگوید: “مدلهای ما سریعتر، دقیقتر و با هزینهای اندک آموزش داده میشوند، در حالی که در انجام وظایف خاص از مدلهای پرچمدار جلوتر هستند.” Fastino مجموعهای از مدلهای کوچک را برای مشتریان شرکتی ایجاد کرده است که هر مدل بر روی یک وظیفه خاص تمرکز دارد، مانند پاکسازی دادههای حساس یا خلاصهسازی اسناد شرکتی. این شرکت هنوز عملکرد اولیه یا کاربران خود را اعلام نکرده است، اما به گفته لوئیس، عملکرد این مدلها کاربران اولیه را شگفتزده کرده است. به عنوان مثال، به دلیل کوچک بودن، این مدلها میتوانند یک پاسخ کامل را در یک توکن ارائه دهند و در کسری از ثانیه به سوالات پاسخ میدهند.
هنوز زود است که بگوییم آیا رویکرد Fastino موفق خواهد شد یا خیر. فضای هوش مصنوعی شرکتی شلوغ است و شرکتهایی مانند Cohere و Databricks نیز مدلهایی را معرفی کردهاند که در انجام وظایف خاص برتری دارند. همچنین سازندگان مدلهای کوچک و متمرکز بر نیازهای شرکتی، از جمله Anthropic و Mistral، نیز در این حوزه فعال هستند. البته، این موضوع نیز بر کسی پوشیده نیست که آینده هوش مصنوعی مولد برای شرکتها احتمالاً در مدلهای زبان کوچکتر و متمرکزتر خواهد بود.
Fastino در حال حاضر بر ساخت تیم نوآور هوش مصنوعی متمرکز است و محققین در بهترین آزمایشگاههای هوش مصنوعی را هدف قرار داده که به دنبال ساخت بزرگترین مدل یا شکست رکوردها نیستند. لوئیس میگوید: “استراتژی استخدام ما به شدت بر روی محققینی متمرکز است که ممکن است رویکردی مخالف با طرز تفکر کنونی درباره ساخت مدلهای زبانی داشته باشند.”