معرفی WebMCP: پروتکل جدیدی که تعامل عاملهای هوشمند با وب را متحول میکند
تیم کروم گوگل این هفته در نسخه آزمایشی Chrome 146 Canary پیشنمایش WebMCP (Web Model Context Protocol) را منتشر کرد — پروتکلی که به صورت مشترک توسط مهندسان گوگل و مایکروسافت و در بستر گروه جامعه Web Machine Learning در W3C توسعه یافته است. WebMCP از طریق API جدیدی به نام navigator.modelContext به وبسایتها امکان میدهد ابزارهای ساختارمند و قابل فراخوانی را مستقیماً در اختیار عاملهای هوش مصنوعیِ اجراشونده در مرورگر قرار دهند. این تغییر میتواند نحوه تعامل عاملهای هوش مصنوعی با صفحات وب و معماری راهکارهای سازمانی را عمیقاً متحول کند.
WebMCP چیست و چرا مهم است؟
– مشکل امروز: عاملهای هوش مصنوعی که در مرورگر کار میکنند معمولاً باید از روشهای ناپایدار و پرهزینه مانند اسکرینشاتگیریِ تصویری یا خامخوانی DOM (HTML/JS) استفاده کنند تا عناصر صفحه را حدس بزنند. این روشها هزینهی پردازشی و توکنی بالا، تأخیر زیاد و خطایپذیری ناشی از تغییرات رابط کاربری را به همراه دارند.
– راهحل WebMCP: به جای حدسزدن، وبسایتها میتوانند قراردادهای ابزار (tool contracts) را منتشر کنند — توصیف دقیق عملکردها، پارامترها و قالب خروجی — تا عاملها بتوانند با فراخوانی توابع ساختارمندِ ثبتشده مثل searchProducts(query, filters) مستقیماً دادههای JSON دریافت کنند. این تعامل کلاینتساید و مبتنی بر navigator.modelContext است.
دو API مکمل در WebMCP
– Declarative API: برای فرمها و عملگرهای استاندارد HTML مناسب است. توسعهدهندگان با افزودن نام ابزار و توضیحات به مارکآپ موجود، میتوانند فرمها را بهسرعت برای عاملها قابلفراخوانی کنند. اگر فرمهای HTML شما تمیز و ساختارمند است، بخش عمده کار انجامپذیر است.
– Imperative API: برای تعاملات پویا و نیازمند اجرای JavaScript طراحی شده است. از طریق registerTool() میتوان توابع کاملاً مشخص با اسکیمای پارامترها و توضیحات زبان طبیعی تعریف کرد که مستقیماً در مرورگر اجرا میشوند و پاسخهای ساختارمند برمیگردانند.
مزایا برای سازمانها و تیمهای فنی
– کاهش هزینهها: تماسهای متعدد اسکرینشات و استنتاج چندرسانهای یا ارسال HTML خام به مدلها هزینه توکنی و محاسباتی بالایی دارند. جایگزینی با فراخوانیهای واحد و ساختارمند، مصرف توکن و هزینهها را بهطور قابلتوجهی کاهش میدهد.
– افزایش قابلاطمینان بودن: با انتشار قرارداد ابزارها، عاملها دیگر نیازی به حدسزدن ساختار صفحه ندارند؛ در نتیجه خطاهای ناشی از تغییرات UI، بارگذاری دینامیک یا تشخیص عناصر کاهش مییابد.
– تسریع توسعه: تیمهای فرانتاند میتوانند از منطق JavaScript موجود استفاده کنند و نیازی به راهاندازی سرورهای واسط MCP پایتون یا نود جداگانه نیست. این امر هزینه نگهداری و پیچیدگی زیرساخت را کاهش میدهد.
نمونه کاربرد واقعی
در سایت تجارت الکترونیک، ثبت یک ابزار searchProducts میتواند به عامل اجازه دهد با یک فراخوان ساختارمند فهرست محصولات را دریافت کند؛ بهجای کلیکهای پیاپی روی فیلترها، اسکرول صفحات و گرفتن اسکرینشات. یک تعامل که برای انسان در چند ثانیه انجام میشود، قبلاً ممکن بود دهها فراخوان استنتاجی برای عامل داشته باشد؛ WebMCP آن را به یک تماس واحد تبدیل میکند.
محدودیتها و فلسفه طراحی
– WebMCP بر همکاری انسان و عامل (human-in-the-loop) تمرکز دارد و صراحتاً حالات خودکار تمامعیار یا headless را هدف قرار نمیدهد. برای سناریوهای بدون رابط کاربری یا خودمختار، پروتکلهای دیگری مانند Agent-to-Agent (A2A) پیشنهاد شدهاند.
– WebMCP جایگزین پروتکلهای بکاند مانند Anthropic MCP نیست؛ آنها مکمل یکدیگرند: MCP برای خدمات سرویسبهسرویس و WebMCP برای تعاملات درونمرورگری با حضور کاربر مناسب است.
نکات امنیتی، حفظ حریم خصوصی و تجربه کاربری
– هر پیادهسازی WebMCP باید به رضایت کاربر، کنترلهای اشتراکگذاری داده، محدودسازی دسترسی و اعتبارسنجی پارامترها توجه کند. ابزارهای منتشرشده نوع و دامنه عملیات را اعلام میکنند؛ بنابراین مدیریت مجوزها و لاگینگ تراکنشها برای سازمانها حیاتی است.
– طراحی قرارداد ابزار باید مشخص و حداقلی باشد تا از افشای ناخواسته دادهها جلوگیری شود و تجربه تعاملی برای کاربر شفاف باقی بماند.
وضعیت فعلی و مسیر پیشرو
– دسترسی فعلی: WebMCP در Chrome 146 Canary و پشت فلگ “WebMCP for testing” در دسترس است (chrome://flags). توسعهدهندگان میتوانند با پیوستن به Chrome Early Preview Program به مستندات و دموها دسترسی یابند.
– پشتیبانی مرورگرها و زمانبندی: مایکروسافت در تدوین استاندارد مشارکت داشته و احتمال پشتیبانی Edge بالاست، اما اعلام رسمی مرورگرها برای پذیرش عمومی هنوز منتشر نشده است. تحلیلگران صنعت احتمال میدهند معرفی گستردهتر و اطلاعرسانی رسمی تا اواسط تا اواخر 2026 رخ دهد، و فرایند انتقال از مرحله جامعه W3C به پیشنویس رسمی در جریان است.
– پیامد برای معماری سازمانی: WebMCP میتواند هزینه و پیچیدگی ادغام عاملهای مبتنی بر مرورگر را کاهش دهد، اما موفقیت نهایی بستگی به پذیرش توسعهدهندگان وب و مرورگرها دارد.
نتیجهگیری
WebMCP تلاش دارد یک رابط استاندارد و سادهشده بین وبسایتها و عاملهای هوش مصنوعی مرورگرمحور فراهم کند — مشابه اینکه USB-C استانداردی واحد برای اتصالها فراهم کرد. اگر این چشمانداز محقق شود، وبسایتها و شرکتها میتوانند تعاملات هوشمند و قابلاعتمادتر با عاملهای هوش مصنوعی فراهم کنند، بدون نیاز به اسکرپینگ شکننده یا بازطراحی زیرساختهای بکاند. برای تیمهای توسعه و معماران فناوری اطلاعات، گام بعدی آزمودن WebMCP در Chrome Canary، بررسی سناریوهای نمونه و برنامهریزی برای پیادهسازیهای پایلوت در صفحات مشتریمحور خواهد بود.
