عنوان: تخلفات استارتاپ هوش مصنوعی Perplexity در زمینه سرقت محتوای وب

طبق گزارش اخیر شرکت زیرساخت اینترنتی Cloudflare، استارتاپ هوش مصنوعی Perplexity با کشتن و جمع‌آوری محتوا از وب‌سایت‌هایی که به‌صراحت اعلام کرده‌اند تمایلی به این عمل ندارند، در حال فعالیت است. این شرکت در روز دوشنبه تحقیقی منتشر کرد که نشان می‌دهد این استارتاپ به راحتی امیدوار به نادیده گرفتن محدودیت‌ها و پنهان‌سازی فعالیت‌های خود در زمینه جمع‌آوری محتوا است.

به گفته محققان Cloudflare، Perplexity در تلاش برای دور زدن خواسته‌های وب‌سایت‌ها، هویت خود را مخفی کرده و اقدام به جمع‌آوری اطلاعات از صفحات وب می‌کند. محصولات هوش مصنوعی مانند خدمات Arplexity به مقدار زیادی داده از اینترنت وابسته‌اند و استارتاپ‌های هوش مصنوعی تاریخی طولانی در جمع‌آوری متن، تصویر و ویدیو از وب‌سایت‌ها بدون داشتن مجوز دارند.

در پاسخ به این چالش، وب‌سایت‌ها تلاش کرده‌اند تا با استفاده از استاندارد وب Robots.txt، موتورهای جست‌وجو و شرکت‌های هوش مصنوعی را از نحوه ایندکس کردن صفحات مطلع سازند. این تلاش‌ها تا کنون نتایج متنوعی داشته است. اما به نظر می‌رسد Perplexity عمداً در حال زمینه‌سازی برای دور زدن این محدودیت‌ها از طریق تغییر در “user agent” ربات‌های خود و شبکه‌های سیستم اتونوم خود (ASN) است. Cloudflare در این رابطه بیان کرد که این فعالیت‌ها در ده‌ها هزار دامنه و میلیون‌ها درخواست در روز مشاهده شده است.

جسی دوایر، سخنگوی Perplexity، با dismiss کردن نوشته Cloudflare آن را به‌عنوان یک “تبلیغ تجاری” توصیف کرد و در ایمیلی به TechCrunch ادعا کرد که عکس‌های موجود در پست نشان می‌دهد که «هیچ محتوایی دسترسی پیدا نکرده است». همچنین، دوایر در ایمیل دومی اعلام کرد که ربات نامبرده در پست Cloudflare “حتی متعلق به ما نیست”.

Cloudflare اعلام کرد که اولین بار پس از شکایت مشتریان خود مبنی بر جمع‌آوری و سرقت اطلاعات توسط Perplexity متوجه رفتارهای این استارتاپ شده و سپس با انجام آزمایشات، تایید کرد که Perplexity در حال دور زدن این بلوک‌هاست. به گفته Cloudflare، این شرکت متوجه شد که Perplexity علاوه بر استفاده از “user-agent” اعلام‌شده، از یک مرورگر عمومی که به‌طور خاص برای شبیه‌سازی Google Chrome در macOS طراحی شده است، هنگامی که ربات اعلام‌شده آن مسدود می‌شود، استفاده می‌کند.

این شرکت همچنین اعلام کرد که فهرست ربات‌های Perplexity را از لیست تأیید شده خود حذف کرده و تکنیک‌های جدیدی برای مسدود کردن آن‌ها اضافه کرده است.

Cloudflare اخیراً در راستای مقابله با ربات‌های هوش مصنوعی، موضع عمومی‌تری اتخاذ کرده است. این شرکت ماه گذشته از راه‌اندازی یک بازار خبر داد که به صاحبان وب‌سایت‌ها و ناشران این امکان را می‌دهد که از ربات‌های هوش مصنوعی که به سایت‌هایشان مراجعه می‌کنند، هزینه دریافت کنند. مت کالات، مدیر عامل Cloudflare، در آن زمان صدای خطر را به‌صدا درآورد و گفت که هوش مصنوعی در حال شکستن مدل کسب‌وکار اینترنت، به‌ویژه برای ناشران است.

این اولین باری نیست که Perplexity به سرقت محتوای غیر مجاز متهم می‌شود. سال گذشته، رسانه‌های خبری همچون Wired مدعی شدند که Perplexity مطالب آن‌ها را سرقت کرده است. در ادامه، مدیرعامل Perplexity، آراوین سینویاس، نتوانست بلافاصله پاسخ دهد که آیا تعریفی برای سرقت ادبی ارائه می‌دهد یا خیر، هنگامی که در مصاحبه‌ای در کنفرانس Disrupt 2024 با دیوان کلدووی از TechCrunch مورد پرسش قرار گرفت.

ایجاد متن‌های دقیق از فایل‌های صوتی شما

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا