در روز سه‌شنبه، متا اولین کنفرانس توسعه‌دهندگان LlamaConAI را در مقر خود واقع در منلو پارک برگزار می‌کند. هدف این کنفرانس ترغیب توسعه‌دهندگان به ایجاد برنامه‌های کاربردی با استفاده از مدل‌های هوش مصنوعی باز Llama است. یک سال پیش، این کار چندان دشوار به نظر نمی‌رسید، اما در ماه‌های اخیر متا در رقابت با آزمایشگاه‌های هوش مصنوعی “باز” مانند DeepSeek و رقباي تجاری بسته‌ای مانند OpenAI در حال عقب‌ماندن است. LlamaCon در این نقطه بحرانی برای متا در مسیر ایجاد یک اکوسیستم بزرگ Llama قرار دارد. جذب توسعه‌دهندگان ممکن است به سادگی ارائه مدل‌های بهتری باشد، اما این کار به‌سادگی که به نظر می‌رسد، ممکن است به دست نیاید.

عرضه Llama 4 در اوایل این ماه واکنش سردی را از توسعه‌دهندگان به دنبال داشت و بسیاری از امتیازات آن پایین‌تر از مدل‌هایی نظیر R1 و V3 از DeepSeek بود. این وضعیت به‌طور چشمگیری با گذشته Llama تفاوت دارد؛ وقتی متا مدل Llama 3.1 405B را در تابستان گذشته معرفی کرد، مدیرعامل این شرکت، مارک زاکربرگ، آن را به عنوان دستاوردی بزرگ توصیف کرد. متا در یک پست بلاگ، این مدل را “قابل‌ترین مدل بنیادین در دسترس” خواند و ادعا کرد که در آن زمان، عملکردی برابر با بهترین مدل OpenAI، یعنی GPT-4 دارد. درواقع این مدل و دیگر مدل‌های خانواده Llama 3، متا را در میان توسعه‌دهندگان هوش مصنوعی محبوب کرده بود.

امروزه، مدل Llama 3.3 بیشتر از Llama 4 دانلود می‌شود. متأسفانه، واکنش‌ها به خانواده Llama 4 چندان مثبت نبوده است. این در حالی است که Llama 4 از ابتدا بحث‌برانگیز بود. متا نسخه‌ای از یکی از مدل‌های Llama 4 به نام Llama 4 Maverick را برای “گفتگوپذیری” بهینه‌سازی کرد که به آن کمک کرد در لیست برترین‌های معیار LM Arena قرار بگیرد. اما متا هرگز این مدل را به‌طور عمومی منتشر نکرد و نسخه‌ای که به‌طور گسترده عرضه شد، در لیست LM Arena عملکرد بسیار ضعیف‌تری داشت. گروه پشت LM Arena اذعان کرد که متا باید درباره این تضاد “شفاف‌تر” باشد.

یک نقص بزرگ در خانواده Llama 4، عدم ارائه یک مدل استدلال هوش مصنوعی است؛ در سال گذشته، بسیاری از شرکت‌های فعال در صنعت هوش مصنوعی مدل‌های استدلالی منتشر کرده‌اند که معمولاً در معیارهای خاص عملکرد بهتری دارند. متا در حال عیان‌سازی یک مدل استدلال Llama 4 است، اما تاریخ عرضه آن مشخص نیست. ناتان لمبرت، پژوهشگر در Ai2، می‌گوید که عدم عرضه یک مدل استدلالی همراه با Llama 4 نشان می‌دهد که ممکن است متا در راه‌اندازی مدل عجله کرده باشد.

شرکت‌های رقیب مدل‌های باز نزدیک به مرز توسعه هستند و اکنون در اشکال و اندازه‌های مختلفی ظاهر می‌شوند که فشار بر متا را افزایش می‌دهد. به‌عنوان مثال، رویترز گزارش داده است که علی‌بابا مجموعه‌ای از مدل‌ها به نام Qwen 3 را منتشر کرده که به‌طور ادعایی از برخی بهترین مدل‌های کدنویسی OpenAI و گوگل برتر عمل کرده است. به‌منظور جبران فاصله با رقبای باز، متا صرفاً نیاز به ارائه مدل‌های برتر دارد.

آیا متا در موقعیتی است که بتواند ریسک‌های بزرگ بپذیرد؟ این سؤال هنوز روشن نیست. کارکنان و مدیران پیشین متا به‌طور مکرر درباره وضعیت نامساعد آزمایشگاه هوش مصنوعی این شرکت صحبت کرده‌اند. با برگزاری LlamaCon، متا فرصتی خواهد داشت تا نشان دهد که چه طرح‌هایی را برای رقابت با عرضه‌های آینده از آزمایشگاه‌های هوش مصنوعی مانند OpenAI و گوگل در نظر گرفته است. در غیر این صورت، امکان دارد این شرکت در فضای بسیار رقابتی هوش مصنوعی، بیش از پیش عقب‌تر برود.

خوانش متن با صدای طبیعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا