مسئله «دستور پخت براونی»: چرا مدل‌های زبانی بزرگ برای نتایج بلادرنگ به زمینه‌ی دقیق نیاز دارند

چالش «دستور پخت براونی»: چرا مدل‌های زبان بزرگ در سفارش‌دهی لحظه‌ای هنوز به مشکل برمی‌خورند

مدل‌های زبان بزرگ (LLM) در توانمندی‌های استنباط و استدلال پیشرفت قابل‌توجهی داشته‌اند، اما در پردازش «زمینه واقعی» و اطلاعات زمان‌محور هنوز با محدودیت‌هایی روبه‌رو هستند؛ محدودیتی که در سامانه‌های سفارش‌دهی لحظه‌ای مثل Instacart به‌خوبی نمود پیدا می‌کند. آنیرابان کوندو، مدیر ارشد فناوری Instacart، این موضوع را «مسئله دستور پخت براونی» نامیده است: صرف گفتن «می‌خواهم براونی درست کنم» به یک مدل کافی نیست — مدل برای کمک مؤثر باید بداند چه اقلامی بر اساس ترجیحات کاربر (مثلاً تخم‌مرغ ارگانیک در مقابل معمولی) در بازار محلی قابل تهیه هستند و چه زمان تحویلی برای جلوگیری از فساد مواد غذایی منطقی است.

تعادل بین زمینه و تأخیر: معمای تجربه کاربری
کوندو در یک رویداد صنعتی تأکید کرد که چالش اصلی ترکیب «دنیای استدلال» (reasoning) با «دنیای وضعیت» (state) است؛ یعنی درک هم‌زمان نیت کاربر، تاریخچه خرید، وضعیت کاتالوگ محصولات و شرایط فیزیکی مثل دمای حمل‌ونقل. اما بارگذاری کامل تاریخچه و سبد خرید کاربر در یک مدل استدلالی باعث می‌شود اندازه مدل به‌طرز غیرقابل کنترلی افزایش یابد و زمان پاسخ‌دهی بالا رود — در حالی که تجربه مطلوب کاربر نیازمند پاسخ در کمتر از یک ثانیه است. اگر خود فرایند استدلال ۱۵ ثانیه طول بکشد، کاربر به سادگی از سرویس خارج می‌شود.

معماری تقسیم‌بندی شده: مدل بنیادین و مدل‌های کوچک تخصصی
راه‌حل Instacart تقسیم پردازش به بلوک‌های مجزا است. ابتدا داده‌ها به یک مدل بنیادین بزرگ وارد می‌شوند تا نیت کاربر را تشخیص داده و محصولات را دسته‌بندی کند. سپس خروجی به مدل‌های زبان کوچک (SLM) فرستاده می‌شود که هر کدام برای زمینه‌های خاص آموزش دیده‌اند: یکی برای «زمینه کاتالوگ» — تعیین اینکه کدام محصولات با هم می‌آیند و چه جایگزین‌هایی مناسب‌اند — و دیگری برای «فهم معنایی» — تشخیص دقیق نیازهای کاربر (مثلاً تعریف «تنقلات سالم برای کودک ۸ ساله» و انتخاب محصولات مناسب).

اهمیت جایگزینی کالا و منطق تحویلی
جایگزین‌های مناسب در برخی مناطق بیش از یک مورد حیاتی‌اند؛ کوندو می‌گوید مواردی وجود دارد که محصول اولیه در بازار محلی موجود نیست و نرخ موارد نیازمند جایگزینی دو رقمی است. علاوه بر این، مدل باید محدودیت‌های لجستیکی را نیز در نظر بگیرد: بستنی سریعاً آب می‌شود، سبزیجات منجمد در دمای بالا آسیب می‌بینند — بنابراین زمان قابل‌تحویل باید براساس ماهیت کالا محاسبه شود تا کیفیت حفظ شود.

معماری عامل‌محور و مدیریت همپارچه‌سازی‌ها
Instacart به‌جای یک «مونو لیت» هوش مصنوعی، از ترکیبی از عوامل (agents) کوچک و متمرکز استفاده می‌کند؛ رویکردی شبیه فلسفه یونیکس که ابزارهای کوچک و تخصصی را ترجیح می‌دهد. این میکرواژنت‌ها با سامانه‌های متعددی مانند POS و کاتالوگ فروشندگان در ارتباط هستند، هر یک با رفتار، قابلیت اطمینان و فواصل بروزرسانی متفاوت. برای استانداردسازی و تسهیل اتصال مدل‌ها به ابزارها و داده‌های مختلف، تیم کوندو از پروتکل‌های استانداردی چون OpenAI مدل کانتکست پروتکل (MCP) و استاندارد باز Google Universal Commerce Protocol (UCP) استفاده کرده است تا عوامل بتوانند مستقیماً با سیستم‌های فروشندگان تعامل کنند.

محدودیت‌ها و درس‌های عملی
با وجود امکانات فنی، مشکل اصلی قابلیت اطمینان و تاخیر در یکپارچه‌سازی‌ها باقی می‌ماند؛ کشف سرویس‌های مناسب برای هر کار و مدیریت حالت‌های خطا دشوار است. کوندو اعتراف می‌کند که تیم او بخش عمده‌ای از زمان خود — حدود دو سوم — را صرف رفع حالت‌های خطا و کاهش تأخیرهای ناشی از یکپارچه‌سازی‌ها می‌کند.

پیامدها برای تجارت مبتنی بر هوش مصنوعی
تجربه Instacart نشان می‌دهد که برای ارائه تجربه واقعی و کارآمد در تجارت الکترونیک مبتنی بر هوش مصنوعی، لازم است بین دانش زمینه‌ای دقیق و سرعت پاسخ تعادل برقرار شود، معماری‌ها ماژولار و انعطاف‌پذیر باشند و استانداردهای تبادل داده برای همگام‌سازی سریع و قابل‌اطمینان میان ابزارها پذیرفته شوند. این درس‌ها برای هر شرکتی که می‌خواهد هوش مصنوعی را در جریان‌های سفارش‌گیری و تحویل به کار گیرد، حیاتی خواهند بود.

ایجاد تصاویر خلاقانه با هوش مصنوعی

مسئله «دستور پخت براونی»: چرا مدل‌های زبانی بزرگ برای نتایج بلادرنگ به زمینه‌ی دقیق نیاز دارند

دیدگاه‌ خود را بنویسید لغو پاسخ