AI coding agentها قبل از autonomy بیشتر، به observability نیاز دارند

بحث اصلی دیگر این نیست که AI میتواند کد بنویسد یا نه. در بسیاری از تیمها، این بخش عملاً حل شده است. مسئله واقعی حالا این است که آیا تیمها میتوانند ببینند agent دقیقاً چه کرده، چه contextی دیده، چه toolهایی را صدا زده و چرا به یک تغییر خاص رسیده است یا نه.
اینجاست که observability اهمیت پیدا میکند. اگر فقط diff نهایی را ببینید، خیلی از ریسکهای واقعی پنهان میمانند. تیمها به trace، log، execution graph و policy checkpoint نیاز دارند تا رفتار agent را مثل یک سیستم زیرساختی بررسی کنند.
همزمان evals هم بخشی از همین stack است. بدون ارزیابی تکرارپذیر، dashboard زیبا اعتماد واقعی تولید نمیکند. سازمان باید بداند agent در codebase و ruleهای خودش چقدر قابلاعتماد است، نه فقط روی benchmarkهای عمومی.
اگر autonomy قرار است بیشتر شود، observability دیگر feature لوکس نیست. شرط لازم برای اعتماد، کنترل و استفاده عملی از AI coding agents است.