معرفی WebMCP: پروتکل جدیدی که تعامل عامل‌های هوشمند با وب را متحول می‌کند

تیم کروم گوگل این هفته در نسخه آزمایشی Chrome 146 Canary پیش‌نمایش WebMCP (Web Model Context Protocol) را منتشر کرد — پروتکلی که به صورت مشترک توسط مهندسان گوگل و مایکروسافت و در بستر گروه جامعه Web Machine Learning در W3C توسعه یافته است. WebMCP از طریق API جدیدی به نام navigator.modelContext به وب‌سایت‌ها امکان می‌دهد ابزارهای ساختارمند و قابل فراخوانی را مستقیماً در اختیار عامل‌های هوش مصنوعیِ اجراشونده در مرورگر قرار دهند. این تغییر می‌تواند نحوه تعامل عامل‌های هوش مصنوعی با صفحات وب و معماری راهکارهای سازمانی را عمیقاً متحول کند.

WebMCP چیست و چرا مهم است؟
– مشکل امروز: عامل‌های هوش مصنوعی که در مرورگر کار می‌کنند معمولاً باید از روش‌های ناپایدار و پرهزینه مانند اسکرین‌شات‌گیریِ تصویری یا خام‌خوانی DOM (HTML/JS) استفاده کنند تا عناصر صفحه را حدس بزنند. این روش‌ها هزینه‌ی پردازشی و توکنی بالا، تأخیر زیاد و خطای‌پذیری ناشی از تغییرات رابط کاربری را به همراه دارند.
– راه‌حل WebMCP: به جای حدس‌زدن، وب‌سایت‌ها می‌توانند قراردادهای ابزار (tool contracts) را منتشر کنند — توصیف دقیق عملکردها، پارامترها و قالب خروجی — تا عامل‌ها بتوانند با فراخوانی توابع ساختارمندِ ثبت‌شده مثل searchProducts(query, filters) مستقیماً داده‌های JSON دریافت کنند. این تعامل کلاینت‌ساید و مبتنی بر navigator.modelContext است.

دو API مکمل در WebMCP
– Declarative API: برای فرم‌ها و عملگرهای استاندارد HTML مناسب است. توسعه‌دهندگان با افزودن نام ابزار و توضیحات به مارک‌آپ موجود، می‌توانند فرم‌ها را به‌سرعت برای عامل‌ها قابل‌فراخوانی کنند. اگر فرم‌های HTML شما تمیز و ساختارمند است، بخش عمده کار انجام‌پذیر است.
– Imperative API: برای تعاملات پویا و نیازمند اجرای JavaScript طراحی شده است. از طریق registerTool() می‌توان توابع کاملاً مشخص با اسکیمای پارامترها و توضیحات زبان طبیعی تعریف کرد که مستقیماً در مرورگر اجرا می‌شوند و پاسخ‌های ساختارمند برمی‌گردانند.

مزایا برای سازمان‌ها و تیم‌های فنی
– کاهش هزینه‌ها: تماس‌های متعدد اسکرین‌شات و استنتاج چندرسانه‌ای یا ارسال HTML خام به مدل‌ها هزینه توکنی و محاسباتی بالایی دارند. جایگزینی با فراخوانی‌های واحد و ساختارمند، مصرف توکن و هزینه‌ها را به‌طور قابل‌توجهی کاهش می‌دهد.
– افزایش قابل‌اطمینان بودن: با انتشار قرارداد ابزارها، عامل‌ها دیگر نیازی به حدس‌زدن ساختار صفحه ندارند؛ در نتیجه خطاهای ناشی از تغییرات UI، بارگذاری دینامیک یا تشخیص عناصر کاهش می‌یابد.
– تسریع توسعه: تیم‌های فرانت‌اند می‌توانند از منطق JavaScript موجود استفاده کنند و نیازی به راه‌اندازی سرورهای واسط MCP پایتون یا نود جداگانه نیست. این امر هزینه نگهداری و پیچیدگی زیرساخت را کاهش می‌دهد.

نمونه کاربرد واقعی
در سایت تجارت الکترونیک، ثبت یک ابزار searchProducts می‌تواند به عامل اجازه دهد با یک فراخوان ساختارمند فهرست محصولات را دریافت کند؛ به‌جای کلیک‌های پیاپی روی فیلترها، اسکرول صفحات و گرفتن اسکرین‌شات. یک تعامل که برای انسان در چند ثانیه انجام می‌شود، قبلاً ممکن بود ده‌ها فراخوان استنتاجی برای عامل داشته باشد؛ WebMCP آن را به یک تماس واحد تبدیل می‌کند.

محدودیت‌ها و فلسفه طراحی
– WebMCP بر همکاری انسان و عامل (human-in-the-loop) تمرکز دارد و صراحتاً حالات خودکار تمام‌عیار یا headless را هدف قرار نمی‌دهد. برای سناریوهای بدون رابط کاربری یا خودمختار، پروتکل‌های دیگری مانند Agent-to-Agent (A2A) پیشنهاد شده‌اند.
– WebMCP جایگزین پروتکل‌های بک‌اند مانند Anthropic MCP نیست؛ آن‌ها مکمل یکدیگرند: MCP برای خدمات سرویس‌به‌سرویس و WebMCP برای تعاملات درون‌مرورگری با حضور کاربر مناسب است.

نکات امنیتی، حفظ حریم خصوصی و تجربه کاربری
– هر پیاده‌سازی WebMCP باید به رضایت کاربر، کنترل‌های اشتراک‌گذاری داده، محدودسازی دسترسی و اعتبارسنجی پارامترها توجه کند. ابزارهای منتشرشده نوع و دامنه عملیات را اعلام می‌کنند؛ بنابراین مدیریت مجوزها و لاگینگ تراکنش‌ها برای سازمان‌ها حیاتی است.
– طراحی قرارداد ابزار باید مشخص و حداقلی باشد تا از افشای ناخواسته داده‌ها جلوگیری شود و تجربه تعاملی برای کاربر شفاف باقی بماند.

وضعیت فعلی و مسیر پیش‌رو
– دسترسی فعلی: WebMCP در Chrome 146 Canary و پشت فلگ “WebMCP for testing” در دسترس است (chrome://flags). توسعه‌دهندگان می‌توانند با پیوستن به Chrome Early Preview Program به مستندات و دموها دسترسی یابند.
– پشتیبانی مرورگرها و زمان‌بندی: مایکروسافت در تدوین استاندارد مشارکت داشته و احتمال پشتیبانی Edge بالاست، اما اعلام رسمی مرورگرها برای پذیرش عمومی هنوز منتشر نشده است. تحلیل‌گران صنعت احتمال می‌دهند معرفی گسترده‌تر و اطلاع‌رسانی رسمی تا اواسط تا اواخر 2026 رخ دهد، و فرایند انتقال از مرحله جامعه W3C به پیش‌نویس رسمی در جریان است.
– پیامد برای معماری سازمانی: WebMCP می‌تواند هزینه و پیچیدگی ادغام عامل‌های مبتنی بر مرورگر را کاهش دهد، اما موفقیت نهایی بستگی به پذیرش توسعه‌دهندگان وب و مرورگرها دارد.

نتیجه‌گیری
WebMCP تلاش دارد یک رابط استاندارد و ساده‌شده بین وب‌سایت‌ها و عامل‌های هوش مصنوعی مرورگرمحور فراهم کند — مشابه اینکه USB-C استانداردی واحد برای اتصال‌ها فراهم کرد. اگر این چشم‌انداز محقق شود، وب‌سایت‌ها و شرکت‌ها می‌توانند تعاملات هوشمند و قابل‌اعتمادتر با عامل‌های هوش مصنوعی فراهم کنند، بدون نیاز به اسکرپینگ شکننده یا بازطراحی زیرساخت‌های بک‌اند. برای تیم‌های توسعه و معماران فناوری اطلاعات، گام بعدی آزمودن WebMCP در Chrome Canary، بررسی سناریوهای نمونه و برنامه‌ریزی برای پیاده‌سازی‌های پایلوت در صفحات مشتری‌محور خواهد بود.

چت آنلاین با هوش مصنوعی

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا