تحقیقات جدید محققان گوگل به ایجاد فریمورکی نوآورانه برایagentهای تحقیقاتی هوش مصنوعی منجر شده است که عملکرد آن از سیستمهای برتر رقبایی مانند OpenAI و Perplexity در معیارهای کلیدی فراتر رفته است. این agent جدید که «پژوهشگر عمیق دیفوسیون در زمان آزمایش» (TTD-DR) نام دارد، از فرآیند نوشتن انسان الهام گرفته و شامل مراحل پیشنویس، جستجوی اطلاعات و اصلاحات متوالی است. سیستم مذکور با استفاده از مکانیسمهای دیفوسیون و الگوریتمهای تکاملی، تحقیقاتی کاملتر و دقیقتر در موضوعات پیچیده ارائه میدهد.
فریمورک TTD-DR میتواند به نسل جدیدی از دستیاران تحقیق سفارشی برای انجام وظایف حساس که سیستمهای سنتی مانند تولید افزوده بازیابی (RAG) در آنها با چالش روبرو هستند، منجر شود. بهعنوان مثال، ایجاد تحلیل رقابتی یا گزارش ورود به بازار از جمله کارهایی است که این سیستم بهخوبی میتواند انجام دهد.
بر اساس گفتههای نویسندگان مقاله، استفادههای واقعی تجاری مورد نظر این سیستم بوده است. agentهای تحقیق عمیق (DR) برای پاسخ به پرسشهای پیچیده طراحی شدهاند که فراتر از یک جستجوی ساده هستند. این سیستمها از مدلهای زبان بزرگ (LLMs) برای برنامهریزی، استفاده از ابزارهایی مانند جستجوی وب برای جمعآوری اطلاعات و سپس تلفیق یافتهها بهصورت یک گزارش مفصل استفاده میکنند.
با این حال، بسیاری از این سیستمها محدودیتهای طراحی بنیادینی دارند. اکثر agentهای DR عمومی بهدلیل عدم وجود ساختاری که رفتار شناختی انسان را شبیهسازی کند، عملیاتی را بهصورت خطی یا موازی دنبال میکنند و این امر موجب میشود تا تعامل بین مراحل مختلف تحقیق دشوار گردد. بهعلاوه، این مسئله میتواند منجر به از دست رفتن زمینه کلان تحقیقی و نادیدهگرفتن ارتباطهای ضروری بین قطعات مختلف اطلاعات شود.
محققان گوگل با بررسی فرآیند تحقیق انسان دریافتند که میتوان این فرآیند را با مکانیزم مدل دیفوسیون که با یک مؤلفه جستجو ترکیب شده است، شبیهسازی کرد. این فریمورک ایجاد گزارش تحقیق را بهعنوان یک فرآیند دیفوسیون تلقی میکند که در آن پیشنویس ابتدایی بهصورت تدریجی به یک گزارش نهایی و شفاف تبدیل میشود. این کار از طریق دو مکانیسم اصلی انجام میشود: اولی «تصفیه با جستجو» نام دارد که از یک پیشنویس اولیه شروع میشود و آن را بهطور تدریجی بهبود میبخشد. در هر مرحله، agent از پیشنویس فعلی برای فرمولهکردن پرسوجوهای جدید استفاده میکند، اطلاعات خارجی را جمعآوری کرده و با ادغام آن، گزارش را از نادرستیها درست کرده و جزئیات بیشتری به آن اضافه میکند.
دومی «تکامل خود» است که تضمین میکند هر جزء از agent (برنامهریز، تولیدکننده پرسش، و سنتزکننده پاسخ) بهطور مستقل عملکرد خود را بهینهسازی کند. این روش تکمیلی به بهبود فرآیند تصفیه گزارش کمک کرده و در نهایت به تولید خروجیهایی دقیقتر و منطقیتر منجر میشود.
TTD-DR با استفاده از کیت توسعه agent گوگل طراحی و تست شده است و در معیارهای مختلف از رقبای خود پیشی گرفته است. نتایج نشان میدهد که این سیستم بهطور مستمر نسبت به رقبایی همچون OpenAI Deep Research در کیفیت ایجاد گزارشهای بلندمدت و پاسخ به سوالات پیچیده برتری داشته است. این فریمورک بهواسطه قابلیت تطبیق بالا، پتانسیل گسترش به دامنههای مختلف مانند تولید کد نرمافزار، ایجاد مدلهای مالی دقیق و طراحی کمپینهای چند مرحلهای بازاریابی را دارد.
بهطور کلی، TTD-DR نهتنها میتواند در حوزههای مختلفی مانند مالی، بیومدیکال، تفریح و فناوری کاربرد داشته باشد، بلکه بهعنوان یک رقیب جدی برای محصولات تحقیق عمیق دیگر نیز شناخته میشود. نتایج این پژوهش ممکن است به شکلگیری نسل جدیدی از agents پیچیده و چندمرحلهای هوش مصنوعی منجر شود.
