Moonshot AI مدل متن-تصویر-ویدیو متنباز «Kimi K2.5» را معرفی کرد؛ تمرکز ویژه روی کدنویسی و درک ویدیویی
شرکت چینی Moonshot AI، از پشتوانههایی چون Alibaba و HongShan (در گذشته Sequoia China) برخوردار است و امروز نسخه متنباز مدل نسل جدید خود با نام Kimi K2.5 را منتشر کرد. این مدل بهصورت ذاتی چندحالته (multimodal) طراحی شده و قادر به پردازش و درک متن، تصویر و ویدیو است؛ ویژگیای که برای طیف وسیعی از کاربردهای تحقیقاتی و صنعتی اهمیت دارد.
چرا Kimi K2.5 قابل توجه است؟
– آموزش عظیم: شرکت اعلام کرده مدل بر مبنای تقریبا 15 تریلیون توکن ترکیبی تصویری و متنی آموزش دیده است که همین موضوع به تواناییهای چندحالته ذاتی آن کمک کرده است.
– عملکرد در کدنویسی: Kimi K2.5 توانمندی بالایی در وظایف مرتبط با برنامهنویسی دارد و در بنچمارکهای منتشر شده در برخی معیارها عملکردی برابر یا بهتر از مدلهای اختصاصی رقیب نشان میدهد.
– درک ویدیو: این مدل در ارزیابیهای مربوط به فهم ویدیو (مانند VideoMMMU) از برخی مدلهای پیشرفته مانند GPT-5.2 و Claude Opus 4.5 پیش افتاده است.
نتایج بنچمارکها (خلاصه)
– در آزمونهای کدنویسی، Kimi K2.5 در معیار SWE-Bench Verified از Gemini 3 Pro پیشی گرفته و در نسخه چندزبانه این بنچمارک (SWE-Bench Multilingual) نمرهای بالاتر از GPT-5.2 و Gemini 3 Pro کسب کرده است.
– در حوزه درک ویدیو، مدل در معیار VideoMMMU عملکردی بهتر از GPT-5.2 و Claude Opus 4.5 نشان داده است. (توضیح: VideoMMMU معیاری است که توانایی مدلها را در استدلال و تحلیل محتوای ویدیویی چندرشتهای میسنجد.)
قابلیتهای تعاملی برای توسعهدهندگان: Kimi Code
برای بهرهبرداری از توانمندیهای کدنویسی مدل، Moonshot یک ابزار متنباز به نام Kimi Code راهاندازی کرده است. این ابزار رقابتی با محصولاتی مانند Claude Code از Anthropic و Gemini CLI گوگل خوانده میشود و توسعهدهندگان میتوانند آن را از طریق ترمینال استفاده کرده یا در محیطهای توسعهای محبوب مانند VSCode، Cursor و Zed ادغام کنند. نکته مهم این است که Kimi Code امکان استفاده از تصاویر و ویدیوها بهعنوان ورودی را نیز فراهم میکند تا از نمونههای بصری برای تولید یا بازتولید رابطها و کدها بهره برده شود.
زمینه مالی و رقابت بازار
ابزارهای کدنویسی مبتنی بر هوش مصنوعی به سرعت محبوب شده و به منبع درآمد قابلتوجهی برای آزمایشگاههای هوش مصنوعی تبدیل شدهاند؛ برای مثال Anthropic اعلام کرد Claude Code به درآمد بازگشتی سالانه (ARR) یک میلیارد دلاری دست یافته است. در همین فضا، رقبا نیز فعالند: گزارشها حاکی از آن است که رقیب چینی Moonshot، Deepseek، ماه آینده مدل جدیدی با تمرکز بر کدنویسی عرضه خواهد کرد.
خلاصهای از تاریخچه و سرمایهگذاری
Moonshot AI توسط پژوهشگر سابق Google و Meta، Yang Zhilin، تاسیس شده است. شرکت دورهای از جذب سرمایه را پشت سر گذاشته و در یک دور Series B مبلغی معادل 1 میلیارد دلار جذب کرده بود که ارزشگذاری آن را 2.5 میلیارد دلار اعلام کردند. طبق گزارش بلومبرگ، ماه گذشته سرمایهای 500 میلیون دلاری با ارزشگذاری 4.3 میلیارد دلار جذب شده و شرکت در پی جذب دور جدیدی با هدف ارزشگذاری حدود 5 میلیارد دلار است.
جمعبندی
معرفی Kimi K2.5 و ابزار متنباز Kimi Code گام مهمی در رقابت مدلهای چندحالته و ابزارهای کدنویسی هوش مصنوعی بهشمار میرود. تمرکز روی پردازش ترکیبی متن، تصویر و ویدیو و نتایج امیدوارکننده در بنچمارکهای کدنویسی و درک ویدیو، این مدل را به گزینهای جذاب برای پژوهشگران و توسعهدهندگان تبدیل کرده است. ادامه رقابت میان بازیگران بزرگ حوزه هوش مصنوعی و ورود مدلهای جدید میتواند سرعت نوآوری و بهبود ابزارهای تولیدی را افزایش دهد.
