رونمایی از تکنولوژی TAO توسط شرکت Databricks: انقلاب در بهینهسازی مدلهای زبان بزرگ در هوش مصنوعی
شرکت Databricks، پیشرو در ارائه خدمات دیتا لیکهوس (Data Lakehouse)، این هفته از رویکرد جدیدی بهینهسازی مدلهای زبان بزرگ (LLM) به نام Test-time Adaptive Optimization (TAO) پرده برداشت که میتواند تحولی در نحوه آموزش و شخصیسازی مدلهای هوش مصنوعی ایجاد کند. این تکنولوژی جدید با استفاده از دادههای ورودی بدون نیاز به برچسبگذاری، عملکردی فراتر از روشهای سنتی یادگیری تحت نظارت ارائه میدهد.
چالش برچسبگذاری داده در راهحلهای هوش مصنوعی
در دنیای هوش مصنوعی، دادههای برچسبگذاری شده یکی از عناصر کلیدی برای آموزش مدلهای یادگیری ماشین (ML) و هوش مصنوعی مولد محسوب میشوند. این دادهها معمولاً توسط کارشناسان حوزههای مختلف تولید میشوند تا به مدلها کمک کنند زمینه و مفهوم اطلاعات را در مراحل یادگیری درک کنند. اما روند جمعآوری، آمادهسازی و برچسبگذاری دادههای تخصصی میتواند ماهها زمان ببرد. این فرآیند، که آن را “مالیات برچسبگذاری داده” مینامند، اغلب باعث تاخیر در توسعه سیستمهای هوش مصنوعی یا عملکرد کمتر از حد انتظار مدلهای عمومی میشود.
تکنولوژی TAO: راهحلی نوین برای چالشهای موجود
Databricks با معرفی روش TAO قصد دارد این تنگنا را از میان بردارد. بر خلاف روشهای سنتی Fine-Tuning که به دادههای برچسبگذاری شده نیاز دارند، TAO از مکانیزمی پیشرفته برای آموزش مدلها بهره میبرد که نیاز به برچسبگذاری را حذف کرده و تنها با استفاده از دادههای ورودی اولیه، نتایجی فراتر از تنظیمات سنتی ارائه میدهد.
نحوه عملکرد TAO: ترکیبی از نوآوری و کارایی
این تکنولوژی از چهار مکانیزم اصلی تشکیل شده است:
1. تولید پاسخ تجربی: مدل با استفاده از تکنیکهای پیشرفته هدایت دستورات، پاسخهای مختلفی را برای دادههای ورودی تولید میکند.
2. مدلسازی پاداش منطبق با نیازهای سازمانی: پاسخهای تولید شده توسط مدل پاداشدهی (Databricks Reward Model) ارزیابی و بر اساس معیارهایی مانند صحت و تطابق با وظایف سازمانی درجهبندی میشوند.
3. بهینهسازی مدل مبتنی بر یادگیری تقویتی: با استفاده از روشهای یادگیری تقویتی، پارامترهای مدل برای تولید پاسخهای با امتیاز بالا بهینهسازی میشوند.
4. چرخه داده پیوسته: تعامل کاربران با سیستم باعث جمعآوری دادههای جدید شده و این چرخه خود-بهبودی بدون نیاز به تلاش انسانی ادامه پیدا میکند.
مقایسه TAO با روشهای دیگر
در حالی که مفهوم محاسبات زمان تست قبلاً در مدلهایی مانند OpenAI o1 و DeepSeek R1 مورد استفاده قرار گرفته است، ویژگی منحصربهفرد TAO این است که تنها در مرحله آموزش نیاز به محاسبات اضافی دارد و هزینه استنتاج مدل پس از آموزش مشابه مدل اولیه باقی میماند. این قابلیت برای کاربردهای تجاری که هزینههای استنتاج با مقیاس استفاده افزایش مییابد، مزیت بزرگی محسوب میشود.
دستاوردهای فنی TAO: عملکرد پیشرفته با هزینه کمتر
نتایج تحقیقات Databricks نشان میدهد که TAO نه تنها عملکرد مدلهای سنتی Fine-Tuning را تطابق میدهد بلکه در برخی موارد آن را بهبود میبخشد. به عنوان مثال:
– در آزمون FinanceBench، عملکرد مدل Llama 3.1 8B با روش TAO 24.7 درصد و مدل Llama 3.3 70B حدود 13.4 درصد ارتقا یافت.
– در تولید SQL با استفاده از معیار BIRD-SQL، بهبودهایی به میزان 19.1 و 8.7 درصد مشاهده شد.
این موارد نشاندهنده ارزش افزوده TAO در کاهش زمان و هزینههای مرتبط با دادههای برچسبگذاری شده است.
مزیت استراتژیک TAO برای سازمانها
تکنولوژی TAO فرصتهای بزرگی برای سازمانهایی با دادههای غیرساختاری و نیازهای تخصصی ایجاد میکند. این روش به کسبوکارها اجازه میدهد با سرعت بیشتری مدلهای هوش مصنوعی را توسعه داده و بدون نیاز به فرآیندهای طولانی برچسبگذاری، به نتایج قابل توجهی دست یابند. برای مثال:
– شرکتهای خدمات مالی میتوانند تحلیل قراردادها را تنها با استفاده از نمونه قراردادها بهینهسازی کنند.
– سازمانهای بهداشتی میتوانند سیستمهای تصمیمگیری بالینی را با کوئریهای پزشکان بهبود دهند.
آینده TAO و چشمانداز هوش مصنوعی
تکنولوژیهای پیشرفته مانند TAO نشاندهنده نقطه عطفی در نحوه پیادهسازی سیستمهای هوش مصنوعی تخصصی هستند. با کاهش زمان مورد نیاز برای توسعه مدلها و حذف نیاز به دادههای برچسبگذاری شده، این رویکرد میتواند سازمانها را به سمت بهرهوری و رقابتپذیری بیشتر سوق دهد.
در حال حاضر، TAO فقط بر بستر Databricks قابل دسترس بوده و در مرحله پیشنمایش خصوصی قرار دارد. این تکنولوژی نوین میتواند روند پذیرش هوش مصنوعی در سازمانها را متحول کند و راه را برای توسعه سریعتر، کمهزینهتر و بهینهتر مدلهای تخصصی باز کند.
برای دریافت اخبار بیشتر درباره جدیدترین فناوریهای هوش مصنوعی، به سایت بینا ویرا مراجعه کنید و از خبرنامههای ما بهرهمند شوید.