Codex’in arkasındaki teknoloji: AI kodlama ajanlarının detayları

Geçtiğimiz cuma, OpenAI mühendisi Michael Bolin, şirketin Codex CLI kodlama ajanının nasıl çalıştığını teknik detaylarıyla paylaştı. Geliştiriciler, AI tabanlı bu araçların kod yazma, test çalıştırma ve hataları düzeltme süreçlerini insan gözetiminde nasıl yönettiğini artık daha iyi anlayabiliyor. Bolin’in açıklamaları, Aralık ayında yayımladığımız “AI ajanlar nasıl çalışıyor?” makalesini tamamlayıcı nitelikte.

Claude Code ve GPT-5.2 destekli Codex gibi AI kodlama ajanları, prototipleri hızlıca üretme, arayüzleri oluşturma ve standart kod bloklarını otomatik yazma konularında yeni bir seviyeye ulaştı. OpenAI’nin paylaşımı, Codex’in tasarım felsefesini ve AI ajanların günlük işlerde nasıl pratik hale geldiğini gözler önüne seriyor.

Sınırlamalar ve insan gözetimi

Bu araçlar kusursuz değil ve bazı yazılım geliştiricileri tarafından hâlâ tartışmalı. OpenAI, Codex’i kendi ürününü geliştirmek için kullandığını belirtiyor. Bizim deneyimlerimiz de gösteriyor ki, basit görevlerde oldukça hızlı çalışıyorlar ama eğitim verisinin ötesinde hassas ve hataya açık olabiliyorlar. Temel proje çerçevesi hızlıca ortaya çıkıyor, ama detayların tamamlanması çoğu zaman hata ayıklama ve sınırlamaları aşmak için ekstra insan müdahalesi gerektiriyor.

Mühendislik zorluklarına açıklık

Bolin’in paylaşımı, bu zorluklardan kaçınmıyor. Quadratic prompt büyümesinin verimsizliğinden, önbellek hatalarının performansı düşürmesinden ve MCP araçlarının tutarsız listelenmesi gibi hatalardan bahsediyor.

OpenAI, genellikle ürünlerinin iç işleyişine dair bu kadar teknik detay paylaşmıyor. Ancak Codex için yapılan bu açıklama, programlama görevlerinin büyük dil modelleri için ne kadar uygun olduğunu gösteriyor. Ayrıca, OpenAI Codex CLI istemcisini GitHub üzerinden açık kaynak olarak sunuyor; ChatGPT veya Claude web arayüzlerinde ise bu imkan yok.

Agent Loop: Kodlama Ajanının Kalbi

Bolin’in yazısı, “agent loop” olarak adlandırdığı sürece odaklanıyor. Bu döngü, kullanıcı, AI modeli ve modelin kodlama işlerini gerçekleştirmek için çağırdığı yazılım araçları arasındaki etkileşimi yönetiyor.

AI ajanlarının merkezinde tekrar eden bir döngü bulunuyor. Kullanıcıdan alınan giriş, modele gönderilecek metinsel prompt hâline geliyor. Model ya doğrudan cevap üretiyor ya da bir araç çağrısı talep ediyor (örneğin, bir dosya okuma veya komut çalıştırma). Araç çağrısı gerçekleştiğinde, ajan çıktıyı prompt’a ekliyor ve modeli tekrar sorguluyor. Bu süreç, model araç çağrmayı bırakıp kullanıcıya doğrudan yanıt verene kadar devam ediyor.

İlk prompt nasıl oluşturuluyor?

Codex, OpenAI’nin Responses API’sine gönderilecek ilk prompt’u birkaç bileşen kullanarak oluşturuyor. Her bileşenin önceliği farklı: sistem, geliştirici, kullanıcı veya asistan.

Instructions: Kullanıcı tarafından belirlenmiş yapılandırma dosyasından veya CLI ile gelen temel talimatlardan geliyor.

Tools: Modelin çağırabileceği işlevler; shell komutları, planlama araçları, web arama ve MCP sunucuları aracılığıyla sağlanan özel araçları kapsıyor.

Input: Sandbox izinleri, opsiyonel geliştirici talimatları, ortam bilgisi ve kullanıcının mesajını içeriyor.
Sohbetler ilerledikçe, her yeni tur önceki mesaj ve araç çağrılarını içeriyor. Bu, prompt’un her etkileşimde büyümesine yol açıyor ve performansı etkiliyor. Codex, “previous_response_id” kullanmadığı için her API çağrısı tamamen stateless; yani tüm geçmişi tekrar gönderiyor. Bu yaklaşım, veri saklamayan kullanıcılar için sistemi basitleştiriyor ve “Zero Data Retention” seçeneğini destekliyor.

Performans ve önbellek yönetimi

Prompt uzunluğunun sürekli artması, AI modelinin tek seferde işleyebileceği metin miktarını sınırlayan context window ile ilgili. Codex, token sayısı eşik değerini aştığında sohbetleri otomatik olarak sıkıştırıyor ve önceki versiyonlardaki manuel komut ihtiyacını ortadan kaldırıyor.

Bolin, ilerleyen paylaşımlarda CLI’nin mimarisi, araç uygulamaları ve Codex’in sandbox modeli hakkında daha fazla teknik detay vereceğini belirtiyor.