اصطلاحات هوش مصنوعی را که فقط شنیده‌اید، حالا ساده و کاربردی بیاموزید

واژه‌نامه کاربردی هوش مصنوعی: توضیح اصطلاحات کلیدی برای خوانندگان بینا ویرا

هوش مصنوعی دنیا را سریع تغییر می‌دهد و هم‌زمان زبانی تازه برای توصیف این تغییر پدید آورده است. اگر پنج دقیقه در مورد AI بخوانید با عبارت‌هایی مثل LLM، RAG، RLHF و ده‌ها اصطلاح دیگر مواجه می‌شوید که حتی افراد حرفه‌ای را هم گیج می‌کند. این واژه‌نامه تلاش ما برای شفاف‌سازی این اصطلاحات است و به‌عنوان یک سند زنده به‌طور منظم به‌روزرسانی می‌شود.

AGI — هوش مصنوعی عمومی:
اصطلاحی مبهم که معمولاً به سیستمی اشاره دارد که در بسیاری از وظایف، از جمله تفکر و حل مسئله، دست‌کم به اندازه یک انسان معمولی توانمند باشد. تعاریف بین نهادها متفاوت است؛ برای مثال برخی آن را «سیستمی خودکار که در بیشتر کارهای اقتصادی از انسان جلو می‌زند» توصیف می‌کنند. موضوع هنوز محل بحث و پژوهش گسترده است.

عامل هوش مصنوعی (AI agent):
برنامه‌ای است که به‌طور خودکار مجموعه‌ای از کارها را برای کاربر انجام می‌دهد — فراتر از گفت‌وگو ساده با یک چت‌بات — مانند ثبت هزینه‌ها، رزرو بلیت یا نوشتن و نگهداری کد. عامل‌ها ممکن است از چند سیستم AI و همچنین ارتباط با سرویس‌های خارجی (از طریق API) برای تکمیل وظایف چندمرحله‌ای استفاده کنند.

نقاط پایان API (API endpoints):
قابلیت‌های پنهان نرم‌افزارها که برنامه‌ها می‌توانند از طریق آن‌ها به عملکردها و داده‌ها دسترسی یابند. توسعه‌دهندگان از این رابط‌ها برای ادغام سرویس‌ها و ایجاد خودکارسازی استفاده می‌کنند. عامل‌های هوشمند با یافتن و استفاده از این نقاط پایان می‌توانند وظایف را بدون مداخله انسان انجام دهند.

زنجیره تفکر (Chain-of-thought reasoning):
روش شکستن یک مسئله پیچیده به گام‌های میانی برای بهبود کیفیت پاسخ مدل‌های زبان بزرگ. در کاری مثل حل معادلات یا استدلال منطقی، این رویکرد زمان بیشتری می‌طلبد اما دقت خروجی را افزایش می‌دهد. مدل‌های استدلالی به‌صورت خاص برای این نوع تفکر بهینه‌سازی می‌شوند.

عامل کدنویس (Coding agent):
نسخه‌ای تخصصی از عامل‌های هوش مصنوعی که می‌تواند کد بنویسد، تست کند و اشکال‌زدایی نماید. این عامل‌ها قادرند در سراسر یک پایگاه کد حرکت کرده، باگ‌ها را کشف و اصلاحات را پیشنهاد یا اعمال کنند؛ با این حال بازبینی انسانی اغلب لازم است.

محاسبات (Compute):
منظور از «کامپیوتر» در متون AI معمولاً توان محاسباتی لازم برای آموزش و اجرا (inference) مدل‌هاست؛ شامل GPU، CPU، TPU و سخت‌افزار مخصوص شتاب‌دهی AI. مقدار و هزینه compute یکی از عوامل کلیدی در توسعه مدل‌های بزرگ است.

یادگیری عمیق (Deep learning) و شبکه‌های عصبی:
زیرمجموعه‌ای از یادگیری ماشینی که از شبکه‌های عصبی چندلایه (ANN) استفاده می‌کند تا ویژگی‌های مهم داده را خودکار کشف کند. یادگیری عمیق برای بسیاری از پیشرفت‌های اخیر در پردازش تصویر، صدا و زبان کاربرد دارد، اما معمولاً به داده و زمان آموزش فراوان نیاز دارد.

دیفیوزن (Diffusion):
یکی از تکنیک‌های مولد که در تولید تصویر، صدا یا متن استفاده می‌شود. ایده این است که ابتدا ساختار داده با افزودن نویز «تخریب» می‌شود و سپس مدل فرایند را معکوس یاد می‌گیرد تا دادهٔ معنادار را از نویز بازتولید کند. این روش در بسیاری از ابزارهای تولید هنر و موسیقی کاربرد دارد.

تقطیر مدل (Distillation):
روش «معلم-شاگرد» برای استخراج دانش از یک مدل بزرگ و آموزش یک مدل کوچک‌تر و سریع‌تر با تقلید از خروجی‌های مدل بزرگ. هدف کاهش هزینه‌ها و افزایش سرعت اجرا با حداقل افت کیفیت است.

تنظیم دقیق (Fine-tuning):
آموزش بیشتر یک مدل از پیش‌تربیت‌شده روی داده‌های تخصصی‌تر برای بهبود عملکرد در یک حوزه یا کار خاص. این روش برای تجاری‌سازی مدل‌های عمومی در صنایع مختلف رایج است.

RAG — بازیابی همراه با تولید (Retrieval-Augmented Generation):
روش ترکیبی که مدل تولیدی (مثلاً LLM) را با یک لایه بازیابی دانش (مثلاً پایگاه داده یا وب) تلفیق می‌کند تا پاسخ‌ها دقیق‌تر و با استنادتر باشند. مخصوصاً برای کاهش خطاها و ساخت پاسخ‌های مبتنی بر منابع واقعی مفید است.

GAN — شبکه‌های مولد تخاصمی:
چارچوبی با دو شبکه عصبی (مولد و تشخیص‌دهنده) که با رقابت با یکدیگر داده‌های واقعی شبیه‌سازی‌شده تولید می‌کنند. GANها در ایجاد تصاویر و ویدئوهای واقعی کاربرد دارند و زیربنای برخی ابزارهای تولید محتوا هستند.

هالوسینیشن (Hallucination):
وقتی مدل‌های AI اطلاعات نادرست یا ساختگی تولید می‌کنند به آن هالوسینیشن می‌گویند. این مسئله ریسک‌آفرین است، به‌ویژه در حوزه‌هایی مانند پزشکی یا قانون، و یکی از دلایل رشد مدل‌های تخصصی و روش‌هایی مثل RAG برای استنادپذیری بیشتر است.

استدلال یا اجرای استنتاج (Inference):
فرایند استفاده از مدل آموزش‌دیده برای تولید پاسخ یا پیش‌بینی. سرعت و هزینه این مرحله به سخت‌افزار بستگی دارد؛ اجرای مدل‌های خیلی بزرگ روی لپ‌تاپ معمولی ممکن است غیرعملی باشد.

مدل‌های زبان بزرگ (LLM — Large Language Models):
شبکه‌های عصبی عمیق با میلیاردها پارامتر که الگوهای زبانی را از حجم عظیمی از متن می‌آموزند و قادر به تولید متن طبیعی، ترجمه، خلاصه‌سازی و پاسخ‌گویی به پرسش‌ها هستند. مثال‌ها شامل ChatGPT، Google Gemini و مدل‌های متن‌باز مانند Llama هستند.

حافظه کش و KV caching:
بهینه‌سازی‌های عملکردی برای افزایش سرعت inference با ذخیره محاسبات تکراری. KV (کلید-مقدار) کش در معماری ترنسفورمرها کاربرد دارد و پاسخ‌ها را سریع‌تر و با هزینه محاسباتی کمتر تولید می‌کند.

متغیرها و وزن‌ها (Weights):
وزن‌ها پارامترهای عددی شبکه عصبی هستند که اهمیت ویژگی‌های ورودی را تعیین می‌کنند. فرایند آموزش با تنظیم وزن‌ها مدل را به سمت پاسخ‌های دقیق‌تر هدایت می‌کند.

آموزش (Training) و validation loss:
آموزش فرایندی است که مدل از داده‌ها الگوها را می‌آموزد. validation loss مقدار خطایی است که روی مجموعه‌ دادهٔ اعتبارسنجی اندازه‌گیری می‌شود و معیار مهمی برای تشخیص کارایی و جلوگیری از بیش‌برازش (overfitting) است.

یادگیری انتقالی (Transfer learning):
استفاده از یک مدل آموزش‌دیده به‌عنوان نقطه شروع برای یادگیری وظیفه‌ای جدید که سریع‌تر و با داده کمتر منجر به نتایج قابل قبول می‌شود. اغلب همراه با fine-tuning به‌کار می‌رود.

یادگیری تقویتی (Reinforcement Learning) و RLHF:
روش آموزشی که در آن مدل از طریق دریافت پاداش‌ها و بازخوردها رفتار خود را بهبود می‌بخشد. RLHF (یادگیری تقویتی از بازخورد انسانی) شامل استفاده از بازخورد انسان برای هدایت رفتار مدل است و در بهبود کمک‌پذیری و ایمنی مدل‌ها کاربرد فراوان دارد.

مدل‌های استدلالی (Reasoning models):
مدل‌هایی که از LLMها مشتق شده و برای انجام استدلال چندمرحله‌ای یا زنجیره‌ای بهینه شده‌اند؛ مناسب کارهای منطقی، ریاضی یا کدنویسی که نیاز به خروجی‌های دقیق‌تر دارند.

توکن‌ها و توکن‌سازی:
توکن‌ها واحدهای خرد متن هستند که مدل‌ها روی آن‌ها کار می‌کنند؛ اغلب بخش‌هایی از کلمات یا کاراکترها. هزینه استفاده از LLMها معمولاً بر اساس تعداد توکن‌ها محاسبه می‌شود، بنابراین بهینه‌سازی توکن‌ها برای کاربردهای تجاری اهمیت دارد.

تراوش (Throughput):
میزان پردازش قابل انجام در بازه زمانی مشخص؛ در زمینه توکن‌ها، نشان‌دهندهٔ تعداد توکن‌هایی است که سیستم می‌تواند هم‌زمان پردازش کند. افزایش throughput برای پاسخ‌دهی سریع به کاربران و بهره‌وری زیرساخت حیاتی است.

Parallelization — موازی‌سازی:
اجرای هم‌زمان محاسبات روی چندین هسته یا تراشه که برای آموزش و inference مدل‌های بزرگ لازم است و به کاهش زمان و هزینه کمک می‌کند.

RAMageddon:
اصطلاحی که به کمبود جهانی حافظه RAM اشاره دارد؛ افزایش تقاضای مراکز داده AI و خرید گستردهٔ حافظه توسط شرکت‌ها باعث کمبود و افزایش قیمت‌ها در سایر صنایع شده است.

بازگشت و بهبود خودی (Recursive self-improvement):
مفهومی که در آن مدل‌های AI می‌توانند خودشان را بهبود دهند و نسل‌های جدیدتری از خود طراحی کنند. اگرچه برخی این سناریو را تهدیدآمیز توصیف می‌کنند، فعلاً بیشتر به‌عنوان یک محور پژوهشی و هدف بلندمدت مطرح است.

متن منبع و شفافیت (Open source vs Closed source):
نرم‌افزار و مدل‌های متن‌باز امکان دسترسی، بررسی و توسعه توسط جامعه را می‌دهند که به تسریع پیشرفت و امکان بررسی‌های ایمنی کمک می‌کند. در مقابل مدل‌های بسته (مثلاً برخی نسخه‌های GPT) کد و داده‌های درونی را محرمانه نگه می‌دارند — تفاوتی که بحث‌های متعدد حقوقی، اخلاقی و فنی را به‌همراه داشته است.

این مطلب به‌طور منظم به‌روزرسانی می‌شود تا با تکامل سریع حوزه هوش مصنوعی همگام بماند.

تبدیل گفتار به نوشتار فارسی

اصطلاحات هوش مصنوعی را که فقط شنیده‌اید، حالا ساده و کاربردی بیاموزید

دیدگاه‌ خود را بنویسید لغو پاسخ