ابتکار چن-زاکربرگ: rBio با سلول‌های مجازی هوش مصنوعی را بدون نیاز به آزمایشگاه آموزش می‌دهد

چن زاکربرگ اینیشیتیو (Chan Zuckerberg Initiative) نسخه‌ای جدید از هوش مصنوعی در زیست‌شناسی به نام rBio معرفی کرد؛ مدلی که برای نخستین‌بار با روش «شبیه‌سازی‌های مجازی سلولی» و بدون تکیه عمده بر آزمایش‌های پرهزینه آزمایشگاهی آموزش دیده و قادر به «استدلال» دربارهٔ فرایندهای سلولی است. این دستاورد می‌تواند سرعت تحقیقات بیومدیکال و کشف دارو را به‌طرز چشمگیری افزایش دهد.

خلاصه‌ای از نوآوری
rBio برپایهٔ رویکردی نوین به نام «تأیید نرم» (soft verification) آموزش داده شده است؛ به این معنی که به‌جای استفاده صرف از داده‌های آزمایشی قطعی، مدل از پیش‌بینی‌های تولیدشده توسط مدل‌های مجازی سلولی به‌عنوان سیگنال آموزش استفاده می‌کند. تیم تحقیقاتی CZI این روش را در مقاله‌ای منتشرشده در bioRxiv تشریح کرده‌اند و نشان داده‌اند که می‌توان فرضیه‌های زیستی را ابتدا به‌صورت محاسباتی آزمون کرد و تنها در صورت لزوم وارد آزمایشگاه شد.

پی‌ریزی داده‌ای و مدل‌های پایه
rBio دانش خود را از TranscriptFormer استخراج کرده است؛ یک مدل مجازی سلولی آموزش‌دیده‌شده روی 112 میلیون سلول از 12 گونه مختلف که گویای 1.5 میلیارد سال تکامل است. TranscriptFormer و منابع داده‌ای مرتبط، از جمله مخزن CZ CELLxGENE که شامل آتلـاس‌های تک‌سلولی با کنترل کیفیت و توجه به تنوع جمعیتی است، پایه‌ای محکم برای آموزش rBio فراهم کرده‌اند. این دقت در گردآوری داده، نقطه‌تمایز مهمی نسبت به بسیاری از پروژه‌های تجاری مبتنی بر داده‌های عمومی و بالقوه مغرضانه است.

روش آموزش: تقویت یادگیری با پاداش نسبی
یکی از ابداعات اصلی rBio، به‌کارگیری یادگیری تقویتی با «پاداش‌های نسبی» است. برخلاف مدل‌های استدلالی متداول که روی سوالات با پاسخ‌های قطعی آموزش می‌بینند، مسائل زیستی معمولاً نااطمینانی و احتمال را شامل می‌شوند. در روش CZI، پاسخ‌های مدل با توجه به احتمال هم‌خوانی آن‌ها با نتایج شبیه‌سازی‌های مجازی، پاداش‌دهی می‌شوند و نه به‌صورت باینری درست/نادرست. این تکنیک به rBio امکان می‌دهد به پرسش‌های پیچیده‌ای مانند «آیا سرکوب ژن A منجر به افزایش فعالیت ژن B می‌شود؟» پاسخ‌های علمی و با مبنای سلولی بدهد.

عملکرد و نتایج آزمایشی
rBio در بنچمارک استاندارد PerturbQA که برای ارزیابی پیش‌بینی اثرات دست‌کاری ژنی به‌کار می‌رود، عملکردی رقابتی در مقایسه با مدل‌های آموزش‌دیده روی داده‌های آزمایشی نشان داده است. این سیستم نسبت به ال‌ال‌ام‌های عمومی عملکرد بهتری داشت و در برخی معیارها با مدل‌های تخصصی زیستی برابری کرد. همچنین نشان داده شد که rBio توانایی‌های قوی «یادگیری انتقالی» (transfer learning) دارد؛ یعنی الگوهای هم‌بیان‌شدگی ژنی را از TranscriptFormer به وظایف متفاوت مانند پیش‌بینی اختلال ژنی منتقل می‌کند. با افزودن تکنیک‌های chain-of-thought برای استدلال گام‌به‌گام، rBio به عملکرد سطح‌بالا و در مواردی بهتر از مدل پیشین SUMMER دست یافت.

کاربردها و اهمیت بالینی
کاهش هزینه و زمان در مراحل اولیه کشف دارو از مهم‌ترین کاربردهای rBio است. قابلیت پیش‌بینی اثرات اختلالات ژنی و تغییرات سلولی می‌تواند به شناسایی سریع‌تر هدف‌های دارویی و درک بهتر بیماری‌های پیچیده مانند بیماری‌های نورودژنراتیو (مثلاً آلزایمر) کمک کند. تشخیص و پیش‌بینی دقیق‌تر تعاملات ژنی می‌تواند مسیر مداخلات زودهنگام را هموار سازد.

دسترسی باز و زیرساخت پژوهشی
CZI تاکید دارد که rBio و سایر مدل‌های خود را به‌صورت متن‌باز و از طریق Virtual Cell Platform منتشر می‌کند و همراه با آموزش‌هایی که روی Google Colab قابل اجرا هستند در دسترس پژوهشگران قرار می‌دهد. این رویکرد دموکراتیک کردن ابزارهای پیشرفته زیستی می‌تواند مؤسسات پژوهشی کوچک و استارتاپ‌ها را توانمند کند و روند نوآوری را تسریع نماید.

محدودیت‌ها و چالش‌های پیش رو
با وجود نتایج امیدوارکننده، rBio هنوز محدودیت‌هایی دارد: تمرکز فعلی آن بیشتر بر پیش‌بینی اختلالات ژنی است و نیاز به بهبود تجربهٔ کاربری، پیاده‌سازی مکانیزم‌های حفاظتی برای جلوگیری از خروجی‌های خارج از حوزه تخصصی و تلفیق بهتر داده‌های چندرشته‌ای (ترنسکریپتومیکس، پروتئومیکس، تصویربرداری و غیره) احساس می‌شود. پژوهشگران CZI نیز به این نکات واقف‌اند و روی توسعهٔ «مدل‌های جهانی سلولی» برای یکپارچه‌سازی داده‌ها کار می‌کنند.

زمینهٔ رقابتی و اثرات بلندمدت
این معرفی در حالی صورت گرفته که شرکت‌های دارویی و فناوری سرمایه‌گذاری‌های گسترده‌ای در حوزهٔ هوش مصنوعی زیستی انجام داده‌اند. رویکرد متن‌باز CZI می‌تواند شتاب انتقال این تکنولوژی‌ها به جامعهٔ پژوهشی را افزایش دهد و در شرایط احتمالی کاهش بودجه عمومی پژوهش (مانند پیشنهادات کاهش بودجه NIH) نقش پشتیبان مهمی ایفا کند.

جمع‌بندی
rBio گامی مهم در تحول روش‌های پژوهش زیستی است؛ نشان می‌دهد که شبیه‌سازی‌های مجازی سلولی می‌توانند به‌عنوان منبع آموزش معتبری برای مدل‌های استدلالی عمل کنند و بار مالی و زمانی آزمایش‌های فیزیکی را کاهش دهند. اگر این رویکرد در گسترهٔ وسیع‌تری موفق عمل کند، می‌تواند نحوهٔ کشف دارو و پاسخ به پرسش‌های بنیادی زیست‌شناسی را متحول سازد و سرعت تبدیل یافته‌های پایه‌ای به درمان‌های بالینی را بالا ببرد.

تشخیص گفتار هوشمند

ابتکار چن-زاکربرگ: rBio با سلول‌های مجازی هوش مصنوعی را بدون نیاز به آزمایشگاه آموزش می‌دهد

دیدگاه‌ خود را بنویسید لغو پاسخ