واژهنامه کاربردی هوش مصنوعی: توضیح اصطلاحات کلیدی برای خوانندگان بینا ویرا
هوش مصنوعی دنیا را سریع تغییر میدهد و همزمان زبانی تازه برای توصیف این تغییر پدید آورده است. اگر پنج دقیقه در مورد AI بخوانید با عبارتهایی مثل LLM، RAG، RLHF و دهها اصطلاح دیگر مواجه میشوید که حتی افراد حرفهای را هم گیج میکند. این واژهنامه تلاش ما برای شفافسازی این اصطلاحات است و بهعنوان یک سند زنده بهطور منظم بهروزرسانی میشود.
AGI — هوش مصنوعی عمومی:
اصطلاحی مبهم که معمولاً به سیستمی اشاره دارد که در بسیاری از وظایف، از جمله تفکر و حل مسئله، دستکم به اندازه یک انسان معمولی توانمند باشد. تعاریف بین نهادها متفاوت است؛ برای مثال برخی آن را «سیستمی خودکار که در بیشتر کارهای اقتصادی از انسان جلو میزند» توصیف میکنند. موضوع هنوز محل بحث و پژوهش گسترده است.
عامل هوش مصنوعی (AI agent):
برنامهای است که بهطور خودکار مجموعهای از کارها را برای کاربر انجام میدهد — فراتر از گفتوگو ساده با یک چتبات — مانند ثبت هزینهها، رزرو بلیت یا نوشتن و نگهداری کد. عاملها ممکن است از چند سیستم AI و همچنین ارتباط با سرویسهای خارجی (از طریق API) برای تکمیل وظایف چندمرحلهای استفاده کنند.
نقاط پایان API (API endpoints):
قابلیتهای پنهان نرمافزارها که برنامهها میتوانند از طریق آنها به عملکردها و دادهها دسترسی یابند. توسعهدهندگان از این رابطها برای ادغام سرویسها و ایجاد خودکارسازی استفاده میکنند. عاملهای هوشمند با یافتن و استفاده از این نقاط پایان میتوانند وظایف را بدون مداخله انسان انجام دهند.
زنجیره تفکر (Chain-of-thought reasoning):
روش شکستن یک مسئله پیچیده به گامهای میانی برای بهبود کیفیت پاسخ مدلهای زبان بزرگ. در کاری مثل حل معادلات یا استدلال منطقی، این رویکرد زمان بیشتری میطلبد اما دقت خروجی را افزایش میدهد. مدلهای استدلالی بهصورت خاص برای این نوع تفکر بهینهسازی میشوند.
عامل کدنویس (Coding agent):
نسخهای تخصصی از عاملهای هوش مصنوعی که میتواند کد بنویسد، تست کند و اشکالزدایی نماید. این عاملها قادرند در سراسر یک پایگاه کد حرکت کرده، باگها را کشف و اصلاحات را پیشنهاد یا اعمال کنند؛ با این حال بازبینی انسانی اغلب لازم است.
محاسبات (Compute):
منظور از «کامپیوتر» در متون AI معمولاً توان محاسباتی لازم برای آموزش و اجرا (inference) مدلهاست؛ شامل GPU، CPU، TPU و سختافزار مخصوص شتابدهی AI. مقدار و هزینه compute یکی از عوامل کلیدی در توسعه مدلهای بزرگ است.
یادگیری عمیق (Deep learning) و شبکههای عصبی:
زیرمجموعهای از یادگیری ماشینی که از شبکههای عصبی چندلایه (ANN) استفاده میکند تا ویژگیهای مهم داده را خودکار کشف کند. یادگیری عمیق برای بسیاری از پیشرفتهای اخیر در پردازش تصویر، صدا و زبان کاربرد دارد، اما معمولاً به داده و زمان آموزش فراوان نیاز دارد.
دیفیوزن (Diffusion):
یکی از تکنیکهای مولد که در تولید تصویر، صدا یا متن استفاده میشود. ایده این است که ابتدا ساختار داده با افزودن نویز «تخریب» میشود و سپس مدل فرایند را معکوس یاد میگیرد تا دادهٔ معنادار را از نویز بازتولید کند. این روش در بسیاری از ابزارهای تولید هنر و موسیقی کاربرد دارد.
تقطیر مدل (Distillation):
روش «معلم-شاگرد» برای استخراج دانش از یک مدل بزرگ و آموزش یک مدل کوچکتر و سریعتر با تقلید از خروجیهای مدل بزرگ. هدف کاهش هزینهها و افزایش سرعت اجرا با حداقل افت کیفیت است.
تنظیم دقیق (Fine-tuning):
آموزش بیشتر یک مدل از پیشتربیتشده روی دادههای تخصصیتر برای بهبود عملکرد در یک حوزه یا کار خاص. این روش برای تجاریسازی مدلهای عمومی در صنایع مختلف رایج است.
RAG — بازیابی همراه با تولید (Retrieval-Augmented Generation):
روش ترکیبی که مدل تولیدی (مثلاً LLM) را با یک لایه بازیابی دانش (مثلاً پایگاه داده یا وب) تلفیق میکند تا پاسخها دقیقتر و با استنادتر باشند. مخصوصاً برای کاهش خطاها و ساخت پاسخهای مبتنی بر منابع واقعی مفید است.
GAN — شبکههای مولد تخاصمی:
چارچوبی با دو شبکه عصبی (مولد و تشخیصدهنده) که با رقابت با یکدیگر دادههای واقعی شبیهسازیشده تولید میکنند. GANها در ایجاد تصاویر و ویدئوهای واقعی کاربرد دارند و زیربنای برخی ابزارهای تولید محتوا هستند.
هالوسینیشن (Hallucination):
وقتی مدلهای AI اطلاعات نادرست یا ساختگی تولید میکنند به آن هالوسینیشن میگویند. این مسئله ریسکآفرین است، بهویژه در حوزههایی مانند پزشکی یا قانون، و یکی از دلایل رشد مدلهای تخصصی و روشهایی مثل RAG برای استنادپذیری بیشتر است.
استدلال یا اجرای استنتاج (Inference):
فرایند استفاده از مدل آموزشدیده برای تولید پاسخ یا پیشبینی. سرعت و هزینه این مرحله به سختافزار بستگی دارد؛ اجرای مدلهای خیلی بزرگ روی لپتاپ معمولی ممکن است غیرعملی باشد.
مدلهای زبان بزرگ (LLM — Large Language Models):
شبکههای عصبی عمیق با میلیاردها پارامتر که الگوهای زبانی را از حجم عظیمی از متن میآموزند و قادر به تولید متن طبیعی، ترجمه، خلاصهسازی و پاسخگویی به پرسشها هستند. مثالها شامل ChatGPT، Google Gemini و مدلهای متنباز مانند Llama هستند.
حافظه کش و KV caching:
بهینهسازیهای عملکردی برای افزایش سرعت inference با ذخیره محاسبات تکراری. KV (کلید-مقدار) کش در معماری ترنسفورمرها کاربرد دارد و پاسخها را سریعتر و با هزینه محاسباتی کمتر تولید میکند.
متغیرها و وزنها (Weights):
وزنها پارامترهای عددی شبکه عصبی هستند که اهمیت ویژگیهای ورودی را تعیین میکنند. فرایند آموزش با تنظیم وزنها مدل را به سمت پاسخهای دقیقتر هدایت میکند.
آموزش (Training) و validation loss:
آموزش فرایندی است که مدل از دادهها الگوها را میآموزد. validation loss مقدار خطایی است که روی مجموعه دادهٔ اعتبارسنجی اندازهگیری میشود و معیار مهمی برای تشخیص کارایی و جلوگیری از بیشبرازش (overfitting) است.
یادگیری انتقالی (Transfer learning):
استفاده از یک مدل آموزشدیده بهعنوان نقطه شروع برای یادگیری وظیفهای جدید که سریعتر و با داده کمتر منجر به نتایج قابل قبول میشود. اغلب همراه با fine-tuning بهکار میرود.
یادگیری تقویتی (Reinforcement Learning) و RLHF:
روش آموزشی که در آن مدل از طریق دریافت پاداشها و بازخوردها رفتار خود را بهبود میبخشد. RLHF (یادگیری تقویتی از بازخورد انسانی) شامل استفاده از بازخورد انسان برای هدایت رفتار مدل است و در بهبود کمکپذیری و ایمنی مدلها کاربرد فراوان دارد.
مدلهای استدلالی (Reasoning models):
مدلهایی که از LLMها مشتق شده و برای انجام استدلال چندمرحلهای یا زنجیرهای بهینه شدهاند؛ مناسب کارهای منطقی، ریاضی یا کدنویسی که نیاز به خروجیهای دقیقتر دارند.
توکنها و توکنسازی:
توکنها واحدهای خرد متن هستند که مدلها روی آنها کار میکنند؛ اغلب بخشهایی از کلمات یا کاراکترها. هزینه استفاده از LLMها معمولاً بر اساس تعداد توکنها محاسبه میشود، بنابراین بهینهسازی توکنها برای کاربردهای تجاری اهمیت دارد.
تراوش (Throughput):
میزان پردازش قابل انجام در بازه زمانی مشخص؛ در زمینه توکنها، نشاندهندهٔ تعداد توکنهایی است که سیستم میتواند همزمان پردازش کند. افزایش throughput برای پاسخدهی سریع به کاربران و بهرهوری زیرساخت حیاتی است.
Parallelization — موازیسازی:
اجرای همزمان محاسبات روی چندین هسته یا تراشه که برای آموزش و inference مدلهای بزرگ لازم است و به کاهش زمان و هزینه کمک میکند.
RAMageddon:
اصطلاحی که به کمبود جهانی حافظه RAM اشاره دارد؛ افزایش تقاضای مراکز داده AI و خرید گستردهٔ حافظه توسط شرکتها باعث کمبود و افزایش قیمتها در سایر صنایع شده است.
بازگشت و بهبود خودی (Recursive self-improvement):
مفهومی که در آن مدلهای AI میتوانند خودشان را بهبود دهند و نسلهای جدیدتری از خود طراحی کنند. اگرچه برخی این سناریو را تهدیدآمیز توصیف میکنند، فعلاً بیشتر بهعنوان یک محور پژوهشی و هدف بلندمدت مطرح است.
متن منبع و شفافیت (Open source vs Closed source):
نرمافزار و مدلهای متنباز امکان دسترسی، بررسی و توسعه توسط جامعه را میدهند که به تسریع پیشرفت و امکان بررسیهای ایمنی کمک میکند. در مقابل مدلهای بسته (مثلاً برخی نسخههای GPT) کد و دادههای درونی را محرمانه نگه میدارند — تفاوتی که بحثهای متعدد حقوقی، اخلاقی و فنی را بههمراه داشته است.
این مطلب بهطور منظم بهروزرسانی میشود تا با تکامل سریع حوزه هوش مصنوعی همگام بماند.
