چن زاکربرگ اینیشیتیو (Chan Zuckerberg Initiative) نسخهای جدید از هوش مصنوعی در زیستشناسی به نام rBio معرفی کرد؛ مدلی که برای نخستینبار با روش «شبیهسازیهای مجازی سلولی» و بدون تکیه عمده بر آزمایشهای پرهزینه آزمایشگاهی آموزش دیده و قادر به «استدلال» دربارهٔ فرایندهای سلولی است. این دستاورد میتواند سرعت تحقیقات بیومدیکال و کشف دارو را بهطرز چشمگیری افزایش دهد.
خلاصهای از نوآوری
rBio برپایهٔ رویکردی نوین به نام «تأیید نرم» (soft verification) آموزش داده شده است؛ به این معنی که بهجای استفاده صرف از دادههای آزمایشی قطعی، مدل از پیشبینیهای تولیدشده توسط مدلهای مجازی سلولی بهعنوان سیگنال آموزش استفاده میکند. تیم تحقیقاتی CZI این روش را در مقالهای منتشرشده در bioRxiv تشریح کردهاند و نشان دادهاند که میتوان فرضیههای زیستی را ابتدا بهصورت محاسباتی آزمون کرد و تنها در صورت لزوم وارد آزمایشگاه شد.
پیریزی دادهای و مدلهای پایه
rBio دانش خود را از TranscriptFormer استخراج کرده است؛ یک مدل مجازی سلولی آموزشدیدهشده روی 112 میلیون سلول از 12 گونه مختلف که گویای 1.5 میلیارد سال تکامل است. TranscriptFormer و منابع دادهای مرتبط، از جمله مخزن CZ CELLxGENE که شامل آتلـاسهای تکسلولی با کنترل کیفیت و توجه به تنوع جمعیتی است، پایهای محکم برای آموزش rBio فراهم کردهاند. این دقت در گردآوری داده، نقطهتمایز مهمی نسبت به بسیاری از پروژههای تجاری مبتنی بر دادههای عمومی و بالقوه مغرضانه است.
روش آموزش: تقویت یادگیری با پاداش نسبی
یکی از ابداعات اصلی rBio، بهکارگیری یادگیری تقویتی با «پاداشهای نسبی» است. برخلاف مدلهای استدلالی متداول که روی سوالات با پاسخهای قطعی آموزش میبینند، مسائل زیستی معمولاً نااطمینانی و احتمال را شامل میشوند. در روش CZI، پاسخهای مدل با توجه به احتمال همخوانی آنها با نتایج شبیهسازیهای مجازی، پاداشدهی میشوند و نه بهصورت باینری درست/نادرست. این تکنیک به rBio امکان میدهد به پرسشهای پیچیدهای مانند «آیا سرکوب ژن A منجر به افزایش فعالیت ژن B میشود؟» پاسخهای علمی و با مبنای سلولی بدهد.
عملکرد و نتایج آزمایشی
rBio در بنچمارک استاندارد PerturbQA که برای ارزیابی پیشبینی اثرات دستکاری ژنی بهکار میرود، عملکردی رقابتی در مقایسه با مدلهای آموزشدیده روی دادههای آزمایشی نشان داده است. این سیستم نسبت به الالامهای عمومی عملکرد بهتری داشت و در برخی معیارها با مدلهای تخصصی زیستی برابری کرد. همچنین نشان داده شد که rBio تواناییهای قوی «یادگیری انتقالی» (transfer learning) دارد؛ یعنی الگوهای همبیانشدگی ژنی را از TranscriptFormer به وظایف متفاوت مانند پیشبینی اختلال ژنی منتقل میکند. با افزودن تکنیکهای chain-of-thought برای استدلال گامبهگام، rBio به عملکرد سطحبالا و در مواردی بهتر از مدل پیشین SUMMER دست یافت.
کاربردها و اهمیت بالینی
کاهش هزینه و زمان در مراحل اولیه کشف دارو از مهمترین کاربردهای rBio است. قابلیت پیشبینی اثرات اختلالات ژنی و تغییرات سلولی میتواند به شناسایی سریعتر هدفهای دارویی و درک بهتر بیماریهای پیچیده مانند بیماریهای نورودژنراتیو (مثلاً آلزایمر) کمک کند. تشخیص و پیشبینی دقیقتر تعاملات ژنی میتواند مسیر مداخلات زودهنگام را هموار سازد.
دسترسی باز و زیرساخت پژوهشی
CZI تاکید دارد که rBio و سایر مدلهای خود را بهصورت متنباز و از طریق Virtual Cell Platform منتشر میکند و همراه با آموزشهایی که روی Google Colab قابل اجرا هستند در دسترس پژوهشگران قرار میدهد. این رویکرد دموکراتیک کردن ابزارهای پیشرفته زیستی میتواند مؤسسات پژوهشی کوچک و استارتاپها را توانمند کند و روند نوآوری را تسریع نماید.
محدودیتها و چالشهای پیش رو
با وجود نتایج امیدوارکننده، rBio هنوز محدودیتهایی دارد: تمرکز فعلی آن بیشتر بر پیشبینی اختلالات ژنی است و نیاز به بهبود تجربهٔ کاربری، پیادهسازی مکانیزمهای حفاظتی برای جلوگیری از خروجیهای خارج از حوزه تخصصی و تلفیق بهتر دادههای چندرشتهای (ترنسکریپتومیکس، پروتئومیکس، تصویربرداری و غیره) احساس میشود. پژوهشگران CZI نیز به این نکات واقفاند و روی توسعهٔ «مدلهای جهانی سلولی» برای یکپارچهسازی دادهها کار میکنند.
زمینهٔ رقابتی و اثرات بلندمدت
این معرفی در حالی صورت گرفته که شرکتهای دارویی و فناوری سرمایهگذاریهای گستردهای در حوزهٔ هوش مصنوعی زیستی انجام دادهاند. رویکرد متنباز CZI میتواند شتاب انتقال این تکنولوژیها به جامعهٔ پژوهشی را افزایش دهد و در شرایط احتمالی کاهش بودجه عمومی پژوهش (مانند پیشنهادات کاهش بودجه NIH) نقش پشتیبان مهمی ایفا کند.
جمعبندی
rBio گامی مهم در تحول روشهای پژوهش زیستی است؛ نشان میدهد که شبیهسازیهای مجازی سلولی میتوانند بهعنوان منبع آموزش معتبری برای مدلهای استدلالی عمل کنند و بار مالی و زمانی آزمایشهای فیزیکی را کاهش دهند. اگر این رویکرد در گسترهٔ وسیعتری موفق عمل کند، میتواند نحوهٔ کشف دارو و پاسخ به پرسشهای بنیادی زیستشناسی را متحول سازد و سرعت تبدیل یافتههای پایهای به درمانهای بالینی را بالا ببرد.
