الون ماسک اعتراف کرد: شرکتهای بزرگ هوش مصنوعی «تا حدودی» از تکنیکهای استخراج دانش (distillation) برای آموزش مدلهای جدید استفاده میکنند
در یک جلسه دادگاه فدرال کالیفرنیا که مربوط به شکایت الون ماسک علیه OpenAI و مدیران آن است، مدیرعامل xAI بهطور تلویحی پذیرفت که شرکتهای فعال در حوزه هوش مصنوعی از تکنیکهای موسوم به «distillation» — که به فارسی میتوان آن را «استخراج دانش از چتباتها» یا «تقطیر مدل» نامید — برای آموزش مدلهای جدید بهره میگیرند. هنگام پرسش قضات درباره اینکه آیا xAI از مدلهای OpenAI برای تمرین و آموزش مدل Grok استفاده کرده است، ماسک پاسخ داد که این روش «تا حدودی» توسط شرکتهای هوش مصنوعی متداول است.
تقطیر مدل چیست و چرا مهم است؟
تقطیر (distillation) فرایندی است که در آن با ارسال پرسشها و پاسخگیری گسترده از یک چتبات یا API عمومی، رفتار و قابلیتهای یک مدل بزرگ «بازآفرینی» میشود تا مدل جدیدی با وزنهای باز (open-weight) یا با هزینه کمتر ساخته شود. این روش میتواند به رقبا و شرکتهای کوچک امکان دهد مدلهایی تقریباً همسطح با مدلهای گرانقیمت بسازند، بدون آنکه سرمایهگذاری عظیم در زیرساختهای محاسباتی لازم باشد. از همین رو، تقطیر بهعنوان تهدیدی برای برتریِ شرکتهایی که میلیاردها دلار در سختافزار و آموزش سرمایهگذاری کردهاند مطرح شده است.
زمینه حقوقی و مسائل مالکیت داده
سؤال اصلی در اینجا آن است که آیا انجام تقطیر قانونی یا اخلاقی است. تا کنون مشخص نیست که بهطور صریح غیرقانونی باشد؛ با این حال احتمال نقض شرایط استفاده (Terms of Service) پلتفرمها یا حتی تخطی از قوانین حق مؤلف (copyright) وجود دارد، مخصوصاً وقتی شرکتها برای جمعآوری دادههای آموزشی دست به عملهای گسترده و سیستماتیک میزنند. چند شرکت بزرگ از جمله OpenAI، Anthropic و گوگل در قالب ابتکاری به نام Frontier Model Forum همکاریهایی را برای تبادل اطلاعات و مقابله با تلاشهای تقطیر، بهویژه از سمت بازیگران خارجی، آغاز کردهاند. اقدامات عملی رایج برای مقابله شامل محدودسازی نرخ درخواستها، تشخیص الگوهای پرسشگذاری حجمی و وضع سیاستهای منع استفاده از دادههای مشکوک است.
اهمیت اظهارات ماسک در جریان دادگاه
اعتراف «تا حدودی» ماسک در دادگاه اهمیت دارد زیرا نشان میدهد تکنیکی که پیشتر عمدتاً درباره شرکتهای چینی یا تلاشهای متنباز گفته میشد، بین خودِ بازیگران آمریکایی نیز کاربرد دارد. این امر فشار رقابتی و پیچیدگیهای اخلاقی و قانونی توسعه مدلهای هوش مصنوعی را برجسته میکند. ماسک همچنین در جریان دفاعیات خود، رتبهبندی شرکتهای پیشروی حوزه هوش مصنوعی را اعلام کرد و Anthropic را در صدر، سپس OpenAI، گوگل و مدلهای متنباز چینی را در ردههای بعدی قرار داد. او شرکت xAI را شرکتی نسبتاً کوچک با چند صد کارمند توصیف کرد که در سال ۲۰۲۳ تاسیس شد و درصدد پیشی گرفتن از رقبای بزرگ بود.
پیامدها برای صنعت هوش مصنوعی
پذیرش استفاده از تقطیر توسط بازیگران مطرح، نشاندهنده افزایش رقابت و تغییر معادلات مزیت رقابتی در صنعت است؛ شرکتهایی که بر سرمایهگذاری در زیرساخت تکیه کردهاند ممکن است با تقلید هوشمندانه رفتار مدلها توسط دیگران، بخشی از برتری خود را از دست دهند. از طرف دیگر، شفافیت در روشها و وضع چارچوبهای قانونی و قراردادی روشن میتواند به حفظ تعادل میان نوآوری و حفاظت از حقوق مالکیت فکری کمک کند.
دادگاه ادامه دارد و اظهارات اخیر میتواند در روند بررسی ادعاها علیه ساختار و عملکرد OpenAI و مدیرانش اثرگذار باشد. پاسخ رسمی OpenAI به این اظهارات تا زمان تنظیم این خبر دریافت نشد.
