Moonshot AI مدل متن-تصویر-ویدیو متن‌باز «Kimi K2.5» را معرفی کرد؛ تمرکز ویژه روی کدنویسی و درک ویدیویی

شرکت چینی Moonshot AI، از پشتوانه‌هایی چون Alibaba و HongShan (در گذشته Sequoia China) برخوردار است و امروز نسخه متن‌باز مدل نسل جدید خود با نام Kimi K2.5 را منتشر کرد. این مدل به‌صورت ذاتی چندحالته (multimodal) طراحی شده و قادر به پردازش و درک متن، تصویر و ویدیو است؛ ویژگی‌ای که برای طیف وسیعی از کاربردهای تحقیقاتی و صنعتی اهمیت دارد.

چرا Kimi K2.5 قابل توجه است؟
– آموزش عظیم: شرکت اعلام کرده مدل بر مبنای تقریبا 15 تریلیون توکن ترکیبی تصویری و متنی آموزش دیده است که همین موضوع به توانایی‌های چندحالته ذاتی آن کمک کرده است.
– عملکرد در کدنویسی: Kimi K2.5 توانمندی بالایی در وظایف مرتبط با برنامه‌نویسی دارد و در بنچمارک‌های منتشر شده در برخی معیارها عملکردی برابر یا بهتر از مدل‌های اختصاصی رقیب نشان می‌دهد.
– درک ویدیو: این مدل در ارزیابی‌های مربوط به فهم ویدیو (مانند VideoMMMU) از برخی مدل‌های پیشرفته مانند GPT-5.2 و Claude Opus 4.5 پیش افتاده است.

نتایج بنچمارک‌ها (خلاصه)
– در آزمون‌های کدنویسی، Kimi K2.5 در معیار SWE-Bench Verified از Gemini 3 Pro پیشی گرفته و در نسخه چندزبانه این بنچمارک (SWE-Bench Multilingual) نمره‌ای بالاتر از GPT-5.2 و Gemini 3 Pro کسب کرده است.
– در حوزه درک ویدیو، مدل در معیار VideoMMMU عملکردی بهتر از GPT-5.2 و Claude Opus 4.5 نشان داده است. (توضیح: VideoMMMU معیاری است که توانایی مدل‌ها را در استدلال و تحلیل محتوای ویدیویی چندرشته‌ای می‌سنجد.)

قابلیت‌های تعاملی برای توسعه‌دهندگان: Kimi Code
برای بهره‌برداری از توانمندی‌های کدنویسی مدل، Moonshot یک ابزار متن‌باز به نام Kimi Code راه‌اندازی کرده است. این ابزار رقابتی با محصولاتی مانند Claude Code از Anthropic و Gemini CLI گوگل خوانده می‌شود و توسعه‌دهندگان می‌توانند آن را از طریق ترمینال استفاده کرده یا در محیط‌های توسعه‌ای محبوب مانند VSCode، Cursor و Zed ادغام کنند. نکته مهم این است که Kimi Code امکان استفاده از تصاویر و ویدیوها به‌عنوان ورودی را نیز فراهم می‌کند تا از نمونه‌های بصری برای تولید یا بازتولید رابط‌ها و کدها بهره برده شود.

زمینه مالی و رقابت بازار
ابزارهای کدنویسی مبتنی بر هوش مصنوعی به سرعت محبوب شده و به منبع درآمد قابل‌توجهی برای آزمایشگاه‌های هوش مصنوعی تبدیل شده‌اند؛ برای مثال Anthropic اعلام کرد Claude Code به درآمد بازگشتی سالانه (ARR) یک میلیارد دلاری دست یافته است. در همین فضا، رقبا نیز فعالند: گزارش‌ها حاکی از آن است که رقیب چینی Moonshot، Deepseek، ماه آینده مدل جدیدی با تمرکز بر کدنویسی عرضه خواهد کرد.

خلاصه‌ای از تاریخچه و سرمایه‌گذاری
Moonshot AI توسط پژوهشگر سابق Google و Meta، Yang Zhilin، تاسیس شده است. شرکت دوره‌ای از جذب سرمایه را پشت سر گذاشته و در یک دور Series B مبلغی معادل 1 میلیارد دلار جذب کرده بود که ارزش‌گذاری آن را 2.5 میلیارد دلار اعلام کردند. طبق گزارش بلومبرگ، ماه گذشته سرمایه‌ای 500 میلیون دلاری با ارزش‌گذاری 4.3 میلیارد دلار جذب شده و شرکت در پی جذب دور جدیدی با هدف ارزش‌گذاری حدود 5 میلیارد دلار است.

جمع‌بندی
معرفی Kimi K2.5 و ابزار متن‌باز Kimi Code گام مهمی در رقابت مدل‌های چندحالته و ابزارهای کدنویسی هوش مصنوعی به‌شمار می‌رود. تمرکز روی پردازش ترکیبی متن، تصویر و ویدیو و نتایج امیدوارکننده در بنچمارک‌های کدنویسی و درک ویدیو، این مدل را به گزینه‌ای جذاب برای پژوهشگران و توسعه‌دهندگان تبدیل کرده است. ادامه رقابت میان بازیگران بزرگ حوزه هوش مصنوعی و ورود مدل‌های جدید می‌تواند سرعت نوآوری و بهبود ابزارهای تولیدی را افزایش دهد.

دستیار هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا