چالش «دستور پخت براونی»: چرا مدلهای زبان بزرگ در سفارشدهی لحظهای هنوز به مشکل برمیخورند
مدلهای زبان بزرگ (LLM) در توانمندیهای استنباط و استدلال پیشرفت قابلتوجهی داشتهاند، اما در پردازش «زمینه واقعی» و اطلاعات زمانمحور هنوز با محدودیتهایی روبهرو هستند؛ محدودیتی که در سامانههای سفارشدهی لحظهای مثل Instacart بهخوبی نمود پیدا میکند. آنیرابان کوندو، مدیر ارشد فناوری Instacart، این موضوع را «مسئله دستور پخت براونی» نامیده است: صرف گفتن «میخواهم براونی درست کنم» به یک مدل کافی نیست — مدل برای کمک مؤثر باید بداند چه اقلامی بر اساس ترجیحات کاربر (مثلاً تخممرغ ارگانیک در مقابل معمولی) در بازار محلی قابل تهیه هستند و چه زمان تحویلی برای جلوگیری از فساد مواد غذایی منطقی است.
تعادل بین زمینه و تأخیر: معمای تجربه کاربری
کوندو در یک رویداد صنعتی تأکید کرد که چالش اصلی ترکیب «دنیای استدلال» (reasoning) با «دنیای وضعیت» (state) است؛ یعنی درک همزمان نیت کاربر، تاریخچه خرید، وضعیت کاتالوگ محصولات و شرایط فیزیکی مثل دمای حملونقل. اما بارگذاری کامل تاریخچه و سبد خرید کاربر در یک مدل استدلالی باعث میشود اندازه مدل بهطرز غیرقابل کنترلی افزایش یابد و زمان پاسخدهی بالا رود — در حالی که تجربه مطلوب کاربر نیازمند پاسخ در کمتر از یک ثانیه است. اگر خود فرایند استدلال ۱۵ ثانیه طول بکشد، کاربر به سادگی از سرویس خارج میشود.
معماری تقسیمبندی شده: مدل بنیادین و مدلهای کوچک تخصصی
راهحل Instacart تقسیم پردازش به بلوکهای مجزا است. ابتدا دادهها به یک مدل بنیادین بزرگ وارد میشوند تا نیت کاربر را تشخیص داده و محصولات را دستهبندی کند. سپس خروجی به مدلهای زبان کوچک (SLM) فرستاده میشود که هر کدام برای زمینههای خاص آموزش دیدهاند: یکی برای «زمینه کاتالوگ» — تعیین اینکه کدام محصولات با هم میآیند و چه جایگزینهایی مناسباند — و دیگری برای «فهم معنایی» — تشخیص دقیق نیازهای کاربر (مثلاً تعریف «تنقلات سالم برای کودک ۸ ساله» و انتخاب محصولات مناسب).
اهمیت جایگزینی کالا و منطق تحویلی
جایگزینهای مناسب در برخی مناطق بیش از یک مورد حیاتیاند؛ کوندو میگوید مواردی وجود دارد که محصول اولیه در بازار محلی موجود نیست و نرخ موارد نیازمند جایگزینی دو رقمی است. علاوه بر این، مدل باید محدودیتهای لجستیکی را نیز در نظر بگیرد: بستنی سریعاً آب میشود، سبزیجات منجمد در دمای بالا آسیب میبینند — بنابراین زمان قابلتحویل باید براساس ماهیت کالا محاسبه شود تا کیفیت حفظ شود.
معماری عاملمحور و مدیریت همپارچهسازیها
Instacart بهجای یک «مونو لیت» هوش مصنوعی، از ترکیبی از عوامل (agents) کوچک و متمرکز استفاده میکند؛ رویکردی شبیه فلسفه یونیکس که ابزارهای کوچک و تخصصی را ترجیح میدهد. این میکرواژنتها با سامانههای متعددی مانند POS و کاتالوگ فروشندگان در ارتباط هستند، هر یک با رفتار، قابلیت اطمینان و فواصل بروزرسانی متفاوت. برای استانداردسازی و تسهیل اتصال مدلها به ابزارها و دادههای مختلف، تیم کوندو از پروتکلهای استانداردی چون OpenAI مدل کانتکست پروتکل (MCP) و استاندارد باز Google Universal Commerce Protocol (UCP) استفاده کرده است تا عوامل بتوانند مستقیماً با سیستمهای فروشندگان تعامل کنند.
محدودیتها و درسهای عملی
با وجود امکانات فنی، مشکل اصلی قابلیت اطمینان و تاخیر در یکپارچهسازیها باقی میماند؛ کشف سرویسهای مناسب برای هر کار و مدیریت حالتهای خطا دشوار است. کوندو اعتراف میکند که تیم او بخش عمدهای از زمان خود — حدود دو سوم — را صرف رفع حالتهای خطا و کاهش تأخیرهای ناشی از یکپارچهسازیها میکند.
پیامدها برای تجارت مبتنی بر هوش مصنوعی
تجربه Instacart نشان میدهد که برای ارائه تجربه واقعی و کارآمد در تجارت الکترونیک مبتنی بر هوش مصنوعی، لازم است بین دانش زمینهای دقیق و سرعت پاسخ تعادل برقرار شود، معماریها ماژولار و انعطافپذیر باشند و استانداردهای تبادل داده برای همگامسازی سریع و قابلاطمینان میان ابزارها پذیرفته شوند. این درسها برای هر شرکتی که میخواهد هوش مصنوعی را در جریانهای سفارشگیری و تحویل به کار گیرد، حیاتی خواهند بود.
