عنوان: تخلفات استارتاپ هوش مصنوعی Perplexity در زمینه سرقت محتوای وب
طبق گزارش اخیر شرکت زیرساخت اینترنتی Cloudflare، استارتاپ هوش مصنوعی Perplexity با کشتن و جمعآوری محتوا از وبسایتهایی که بهصراحت اعلام کردهاند تمایلی به این عمل ندارند، در حال فعالیت است. این شرکت در روز دوشنبه تحقیقی منتشر کرد که نشان میدهد این استارتاپ به راحتی امیدوار به نادیده گرفتن محدودیتها و پنهانسازی فعالیتهای خود در زمینه جمعآوری محتوا است.
به گفته محققان Cloudflare، Perplexity در تلاش برای دور زدن خواستههای وبسایتها، هویت خود را مخفی کرده و اقدام به جمعآوری اطلاعات از صفحات وب میکند. محصولات هوش مصنوعی مانند خدمات Arplexity به مقدار زیادی داده از اینترنت وابستهاند و استارتاپهای هوش مصنوعی تاریخی طولانی در جمعآوری متن، تصویر و ویدیو از وبسایتها بدون داشتن مجوز دارند.
در پاسخ به این چالش، وبسایتها تلاش کردهاند تا با استفاده از استاندارد وب Robots.txt، موتورهای جستوجو و شرکتهای هوش مصنوعی را از نحوه ایندکس کردن صفحات مطلع سازند. این تلاشها تا کنون نتایج متنوعی داشته است. اما به نظر میرسد Perplexity عمداً در حال زمینهسازی برای دور زدن این محدودیتها از طریق تغییر در “user agent” رباتهای خود و شبکههای سیستم اتونوم خود (ASN) است. Cloudflare در این رابطه بیان کرد که این فعالیتها در دهها هزار دامنه و میلیونها درخواست در روز مشاهده شده است.
جسی دوایر، سخنگوی Perplexity، با dismiss کردن نوشته Cloudflare آن را بهعنوان یک “تبلیغ تجاری” توصیف کرد و در ایمیلی به TechCrunch ادعا کرد که عکسهای موجود در پست نشان میدهد که «هیچ محتوایی دسترسی پیدا نکرده است». همچنین، دوایر در ایمیل دومی اعلام کرد که ربات نامبرده در پست Cloudflare “حتی متعلق به ما نیست”.
Cloudflare اعلام کرد که اولین بار پس از شکایت مشتریان خود مبنی بر جمعآوری و سرقت اطلاعات توسط Perplexity متوجه رفتارهای این استارتاپ شده و سپس با انجام آزمایشات، تایید کرد که Perplexity در حال دور زدن این بلوکهاست. به گفته Cloudflare، این شرکت متوجه شد که Perplexity علاوه بر استفاده از “user-agent” اعلامشده، از یک مرورگر عمومی که بهطور خاص برای شبیهسازی Google Chrome در macOS طراحی شده است، هنگامی که ربات اعلامشده آن مسدود میشود، استفاده میکند.
این شرکت همچنین اعلام کرد که فهرست رباتهای Perplexity را از لیست تأیید شده خود حذف کرده و تکنیکهای جدیدی برای مسدود کردن آنها اضافه کرده است.
Cloudflare اخیراً در راستای مقابله با رباتهای هوش مصنوعی، موضع عمومیتری اتخاذ کرده است. این شرکت ماه گذشته از راهاندازی یک بازار خبر داد که به صاحبان وبسایتها و ناشران این امکان را میدهد که از رباتهای هوش مصنوعی که به سایتهایشان مراجعه میکنند، هزینه دریافت کنند. مت کالات، مدیر عامل Cloudflare، در آن زمان صدای خطر را بهصدا درآورد و گفت که هوش مصنوعی در حال شکستن مدل کسبوکار اینترنت، بهویژه برای ناشران است.
این اولین باری نیست که Perplexity به سرقت محتوای غیر مجاز متهم میشود. سال گذشته، رسانههای خبری همچون Wired مدعی شدند که Perplexity مطالب آنها را سرقت کرده است. در ادامه، مدیرعامل Perplexity، آراوین سینویاس، نتوانست بلافاصله پاسخ دهد که آیا تعریفی برای سرقت ادبی ارائه میدهد یا خیر، هنگامی که در مصاحبهای در کنفرانس Disrupt 2024 با دیوان کلدووی از TechCrunch مورد پرسش قرار گرفت.
