طراحی پروتئین با AI بالاخره به آزمایشگاه تر میرسد

طراحی پروتئین با AI از مرحلهای که هر پیشرفت در نمودار بنچمارک قرار میگرفت، عبور کرده است. تغییر جذابتر اکنون عملی است: مدلهای محاسباتی بالاخره شروع به دوام آوردن در تماس با wet lab کردهاند. این موضوع اهمیت دارد زیرا drug discovery هرگز از کمبود پیشبینیهای هوشمندانه رنج نبرده است. بلکه از فرسایش بیرحمانهای رنج برده که وقتی ایدههای ظریف in silico با زیستشناسی آشفته، سنتز پرهزینه و واقعیت تجربی روبرو میشوند، اتفاق میافتد.
داستان جدید در علم و biotech این نیست که AI میتواند پروتئینهای جدیدی را تصور کند. بلکه این است که تعداد فزایندهای از گروههای تحقیقاتی و شرکتها در حال ساخت سیستمهایی هستند که حلقه بین خروجی مدل، سنتز، assay و طراحی مجدد را میبندند. این حلقه بازخورد جایی است که protein design از یک نمایش به زیرساختی برای therapeutics، enzyme engineering و diagnostics تبدیل میشود.
Protein design در حال ترک دوران leaderboard است
در چند سال گذشته، AI در زیستشناسی تحت سلطه چند قابلیت اصلی بوده است. AlphaFold پیشبینی protein structure را به طرز چشمگیری مفیدتر کرد. Protein language models نشان دادند که دادههای توالی را میتوان کمی شبیه به زبان طبیعی در نظر گرفت. سپس generative systems وعده طراحی پروتئینهای کاملاً جدید با خواص مطلوب را دادند. این پیشرفتها واقعی بودند، اما همچنین یک حالت شکست آشنا را تشویق کردند: این حوزه در جشن گرفتن عملکرد مدل بسیار خوب شد، قبل از اینکه توجه کافی به این موضوع شود که آیا یک پروتئین پیشنهادی واقعاً میتواند در آزمایشگاه بیان، تا شود و validate شود.
این نگرانی دلیل این است که لحظه کنونی معنادارتر به نظر میرسد. گزارشهای اخیر و کارهای منتشر شده به یک گذار گستردهتر از ارزیابی مبتنی بر بنچمارک به experimental validation اشاره دارند. Drug Target Review اخیراً مجموعهای از مطالعات سال 2026 را برجسته کرده است که در آنها مولکولها و ابزارهای بیولوژیکی طراحی شده با AI نه تنها به صورت محاسباتی تولید شدند، بلکه در محیطهای preclinical نیز آزمایش شدند. این ممکن است افزایشی به نظر برسد، اما استاندارد شواهد را تغییر میدهد. یک مدل دیگر تنها با اینکه آیا یک کاندید امیدوارکننده را پیشبینی میکند، قضاوت نمیشود. بلکه با اینکه آیا کاندید از سنتز جان سالم به در میبرد، طبق انتظار متصل میشود و یک اثر بیولوژیکی قابل اندازهگیری تولید میکند، قضاوت میشود.
هنگامی که این به معیار تبدیل شود، اقتصاد این حوزه شروع به تغییر میکند. مدلی که هفتهها غربالگری را صرفهجویی میکند اما همچنان کاندیداهای با کیفیت پایین تولید میکند، کمتر از مدلی جذاب است که فضای جستجو را کاهش میدهد و در عین حال نرخ موفقیت experimental را حفظ میکند. در drug discovery، هدف مولکولهای قابل قبولتر روی یک اسلاید نیست. بلکه هدف، بنبستهای پرهزینه کمتر است.
سختترین اهداف چیزی است که این موضوع را جالب میکند
یکی از دلایلی که protein design توجه زیادی را به خود جلب کرده این است که زیستشناسی هنوز حاوی مناطق وسیعی از تاریکی therapeutic است. بسیاری از پروتئینهای مرتبط با بیماری به دلیل عدم ارائه binding pockets پایدار و خوشرفتار، دشوار هدفگیری هستند. Intrinsically disordered regions یک مثال کلاسیک هستند. آنها در سرطان و بیماریهای neurodegenerative اهمیت دارند، اما ساختارهای انعطافپذیر و متغیر آنها باعث میشود که برای small-molecule discovery سنتی مناسب نباشند.
به همین دلیل کار اخیر آزمایشگاه David Baker توجه زیادی را به خود جلب کرد. همانطور که توسط Chemistry World پوشش داده شد، تیم از یک رویکرد generative design به نام logos برای ایجاد binders برای disordered protein regions استفاده کرد که مدتها به عنوان عملاً undruggable تلقی میشدند. اعداد گزارش شده قابل توجه بودند: 39 tight binders از 43 هدف آزمایش شده. اما مهمتر از نسبت، چیزی بود که این موضوع دلالت داشت. اگر طراحی هدایت شده با AI بتواند binders برای اهداف متحرک و از نظر ساختاری مبهم تولید کند، آنگاه کلاس پروتئینهایی را که محققان میتوانند به طور منطقی دنبال کنند، گسترش میدهد، به جای اینکه فقط همان اهداف قابل دستیابی را که همه دیگران دنبال میکنند، بهینهسازی کنند.
اینجاست که AI به جای اینکه صرفاً از نظر عملیاتی کارآمد باشد، از نظر علمی ارزشمند میشود. این به زیستشناسان کمک میکند تا مناطقی از فضای molecular design را کشف کنند که قبلاً برای جستجو با روشهای سنتی بسیار گران، بسیار نامطمئن یا بسیار کار فشرده بودند.
ابزارهای Design در حال قابل استفاده شدن برای زیستشناسان فعال هستند
یک تغییر کمتر مورد توجه، قابلیت استفاده است. یک مدل پروتئینی عالی تأثیر محدودی دارد اگر تنها گروه کوچکی از متخصصان machine learning بتوانند آن را اداره کنند. MIT اخیراً OpenProtein.AI را معرفی کرد، شرکتی که توسط محققانی با ریشههای MIT تأسیس شده است و در تلاش است تا ابزارهای پیشرفته protein-design را از طریق یک رابط no-code قابل دسترس کند. این موضوع مهمتر از آن چیزی است که به نظر میرسد. در اکثر سازمانهای علوم زیستی، bottleneck تنها کیفیت مدل نیست. بلکه لایه ترجمه بین computational methods و افرادی است که واقعاً آزمایشها را انجام میدهند.
هنگامی که protein engineers میتوانند دادهها را آپلود کنند، کاندیداها را مقایسه کنند و گردش کار را بدون ساخت ML pipelines سفارشی از ابتدا تنظیم کنند، پذیرش بسیار متفاوت به نظر میرسد. پلتفرمسازی این ابزارها میتواند برای computational biology کاری را انجام دهد که زیرساخت ابری برای software startups انجام داد: کاهش انرژی فعالسازی مورد نیاز برای امتحان کارهای بلندپروازانه.
یک پیامد استراتژیک نیز در اینجا وجود دارد. بهترین سیستمهای AI بیولوژیکی ممکن است آنهایی نباشند که دارای مدلهای خام پر زرق و برق هستند. آنها ممکن است آنهایی باشند که دسترسی به مدل، ردیابی آزمایش، بازخورد assay و گردش کار همکاری را در یک محیط واحد که تیمهای wet-lab میتوانند به آن اعتماد کنند، ادغام میکنند. به عبارت دیگر، مزیت رقابتی ممکن است به طور فزایندهای در چرخه design-build-test قرار گیرد تا فقط در model checkpoint.
Pharma با AI به عنوان machinery pipeline رفتار میکند، نه یک پروژه جانبی
شرکتهای داروسازی بزرگ در مورد این تغییر صریحتر شدهاند. برای مثال، AstraZeneca در اواخر سال 2025 اعلام کرد که بیش از 90 درصد از pipeline small-molecule discovery آن با AI کمک میشود، در حالی که AI را عمیقتر به biologics و peptide design نیز سوق میدهد. کار MapDiff آن در inverse protein folding نشاندهنده یک حرکت گستردهتر در صنعت است: استفاده از AI نه به عنوان یک آزمایش جداگانه در innovation lab، بلکه به عنوان لایهای که در سراسر discovery و design جاسازی شده است.
این ادغام اهمیت دارد زیرا اکثر چرخههای hype در biotech در نقطه تحویل فرو میریزند. یک مدل در یک مقاله تأثیرگذار است، اما هرگز بخشی از یک سیستم عامل پایدار برای تیمهای تحقیقاتی نمیشود. هنگامی که یک شرکت بزرگ pharma شروع به توصیف AI به عنوان بخشی از machinery discovery روزمره میکند، نشان میدهد که این حوزه از موفقیت فنی جداگانه به تغییر فرآیند در حال بلوغ است.
این همچنین نشان میدهد که شرکتها واقعاً به چه چیزی اهمیت میدهند. آنها سیستمهایی میخواهند که شناسایی موفقیت را بهبود بخشند، به بهینهسازی سریعتر کاندیداها کمک کنند، ضایعات assay را کاهش دهند و احتمال اینکه برنامههایی که وارد کار preclinical میشوند، شواهد اساسی قویتری داشته باشند را افزایش دهند. در عمل، ابزارهای برنده آنهایی خواهند بود که تصمیمات portfolio را بهبود میبخشند، نه فقط زیباییشناسی پروتئین را.
چه چیزی هنوز مانع میشود
هیچ یک از اینها به این معنی نیست که AI protein design حل شده است. زیستشناسی همچنان بیرحم است. Training data ناهموار هستند، شرایط assay متفاوت است و بهینهسازی همزمان بسیاری از ویژگیهای مطلوب دشوار است. یک کاندید ممکن است به خوبی متصل شود و همچنان به دلیل manufacturability، stability، immunogenicity، toxicity یا رفتار ضعیف in vivo شکست بخورد. wet lab هنوز جایی است که خوشبینی برای ممیزی میرود.
همچنین این خطر وجود دارد که این حوزه بیش از حد به نوع جدیدی از hype اصلاح شود. Experimental validation بهتر از synthetic benchmarks است، اما چند مطالعه موردی قوی با قابلیت اطمینان گسترده و قابل تکرار در سراسر کلاسهای هدف یکسان نیست. دانشمندان هنوز باید سوالات سختی در مورد specificity، reproducibility و اینکه این مدلها چقدر خوب فراتر از نمایشهای با دقت انتخاب شده تعمیم مییابند، بپرسند.
و سپس bottleneck عملی تولید داده وجود دارد. مزیت بعدی ممکن است از سازمانهایی باشد که میتوانند automated experimentation، high-throughput screening و ثبت بازخورد غنی را به مدلهای design خود متصل کنند. در protein engineering، مدلهای خوب مهم هستند. حلقههای خوب مهمتر هستند.
چرا این حوزه اکنون اهمیت دارد
دلیل تماشای AI protein design در سال 2026 این نیست که به طور جادویی هزینه و پیچیدگی drug discovery را از بین میبرد. این کار را نخواهد کرد. دلیل تماشای آن این است که این رشته بالاخره به سوال درست نزدیک میشود: آیا AI میتواند به دانشمندان کمک کند تا مولکولهایی تولید کنند که در جهان کار میکنند، نه فقط روی کاغذ؟
این ممکن است متواضعانه به نظر برسد، اما دقیقاً جاهطلبی درست است. اگر پاسخ به سمت بله ادامه یابد، تأثیر میتواند قابل توجه باشد. محققان چرخههای تکرار سریعتری پیدا میکنند. تیمهای کوچکتر میتوانند اهداف سختتر را دنبال کنند. برنامههای دارویی که زمانی به سالها جستجوی کور نیاز داشتند، ممکن است با priorهای بهتر شروع شوند. و مرز بین computational design و experimental biology هر سال کمتر سفت و سخت میشود.
wet lab هنوز قاضی نهایی است. آنچه تغییر کرده این است که AI در حال تبدیل شدن به یک شاهد معتبرتر است.