Pekin Üniversitesi ekibinden iki aşamalı sistem: Cebir sorusunu doğal dilde planlayıp Lean 4 ile kilitlemek

Matematikte “çözüm” kelimesi ağırlığını ancak her adımı denetlenebilir bir zincire bağladığında kazanır. Son günlerde Pekin Üniversitesi çevresindeki bir araştırma grubunun—basında Dong Bin liderliğinde anılan ekibin—Amerikalı matematikçi Dan Anderson’ın 2014’te literatüre taşıdığı ve uzun süredir açık kaldığı söylenen bir cebir problemini, insan müdahalesini en aza indirgenmiş bir iş akışıyla kapattığını duyurması tam da bu yüzden ilgi topluyor. Bulgular şimdilik ön baskı kanallarında; dolayısıyla son söz hakemli süreçte olacak. Buna rağmen anlatılan mimari, yapay zekanın matematikte nereye yaslanması gerektiğine dair dersleri net biçimde ortaya koyuyor.

Sorun yalnızca “cevap üretmek” değil

Büyük dil modelleri uzun metinlerde akıcıdır; fakat akıcılık, doğruluk anlamına gelmez. Özellikle soyut cebir gibi alanlarda, tek bir sembol kayması tüm ispatı çürütebilir. Bu yüzden araştırmacılar tek bir “sihirli sohbet” yerine iki katmanlı bir tasarım anlatıyor: önce yöntem ve araştırma planı, ardından bu planın makine tarafından denetlenen bir dile çevrilmesi.

Bu ayrım, klasik bilgisayar destekli cebir araçlarından farklı bir motivasyon taşıyor. Amaç yalnızca denklemi sadeleştirmek değil; literatürde birikmiş teknikleri tarayıp yeni bir strateji önermek ve bu stratejinin her adımını başka bir sistemle tekrar doğrulatmak.

İki bileşenli hat: sezgi ile kilitleme

Paylaşılan çerçevede birinci bileşen—haber akışında “Rethlas” adıyla anılan kısım—matematikçilerin günlük çalışmasına benzeyen bir rol üstleniyor: kütüphane tarayıp yol haritası çıkarmak, denemeleri sıraya koymak, ara sonuçları birbirine bağlamak. İkinci bileşen, “Archon” olarak geçen katman, bu yol haritasını etkileşimli bir teorem ispatlayıcı ortamında, yani Lean 4 ekosisteminde somut bir formal iskelete döküyor. Lean tarafı “güzel anlatım”dan çok sentaks ve tip kurallarıyla konuştuğu için, modelin ürettiği fikir burada sert bir filtreye giriyor.

Bu ikili yapı, halüsinasyon riskini sıfırlamaz; fakat hatayı üretim anında yakalama olasılığını artırır. Doğal dilde üretilen iddia, formal tarafta derlenmezse süreç ilerlemez; dolayısıyla hata bedeli erkenden ödenir.

Zaman ölçeği ve otomasyon iddiası

Açıklamalarda işin yaklaşık seksen saat sürdüğü ve bu sürenin büyük kısmının makine tarafından yürütüldüğü belirtiliyor. Bu tür süreler tek başına mucizevi değil; fakat literatür taraması, deneme yanılma ve formalizasyonun aynı hatta toplanması, insan gücüyle yapıldığında aylarca sürebilecek işleri sıkıştırıyor olabilir. Burada asıl mesele hızın kendisi değil, tekrarlanabilir bir şablonun ortaya çıkması: benzer sınıftaki problemlerde aynı hattın uyarlanıp uyarlanamayacağı.

Gelişmiş Yapay Zekalar Mythos 5 ve Fable 5 Yeniden Kullanıma Açıldı

ABD, güvenlik endişeleriyle erişimini durdurduğu Anthropic'in Mythos 5 ve Fable 5 yapay zeka modellerine yönelik kısıtlamaları kaldırdı. Modeller yeniden devrede.

Neden Yasaklandığı Belli Oldu: Anthropic Mythos ABD'nin Dijital Kalesine Sızdı

Anthropic'in gizemli modeli Mythos'un sızma testlerinde NSA sistemlerini saatler içinde aştığı iddiası gündeme bomba gibi düştü. ABD'nin yasak kararı...

Hakemsiz metinlerle çalışmanın disiplini

Bulguların henüz geleneksel hakem denetiminden geçmemiş olması, heyecanı körüklerken temkinli okumayı da zorunlu kılıyor. Ön baskı, bilimsel iletişimin hızlı kanalıdır; ancak hata düzeltme mekanizması daha yavaş işler. Bu yazıda anlatılan teknik detayları “kesin gerçek” yerine “rapor edilen tasarım” olarak konumlandırmak gerekir. Yine de yöntem tartışması bağımsız değerlidir: Lean gibi araçların yapay zeka hatlarına bağlanması, endüstride güvenlik kritik yazılımda gördüğümüz “model + doğrulayıcı” ikilisinin matematiksel bir varyantı gibi düşünülebilir.

Matematikçiler için pratik çıkarımlar

Araştırmacı veya mühendis perspektifinden bakıldığında üç sonuç öne çıkıyor:

1. Formal araçlar artık yardımcı değil, denetim katmanı. Lean 4 öğrenme eğrisi dik olsa da, üretilen fikirleri güvence altına almak için doğrudan entegrasyon hedefi haline geliyor. 2. Literatür erişimi otomasyonla birleşince yeni keşif türleri açılıyor. Model, tek başına deha değil; ama insanın gözden kaçırdığı bağlantıları hızla deneyebilen bir “paralel stajyer” gibi konumlanabilir. 3. İnsan denetimi bitmiyor; yer değiştiriyor. Süreç uçtan uca otonom görünse de, hangi aksiyomların kabul edildiği, hangi kütüphanelerin güvenildiği ve hangi formal çevirinin yapıldığı insanın kurduğu çerçeveye bağlı kalıyor.

Hızlı üretim, yavaş teyit

Yapay zeka matematikte “konuşmayı” hızlandırdı; Lean benzeri sistemler ise bu konuşmayı “imzalayan noter”e dönüştürme şansı veriyor. Bu hikâyenin kalıcı etkisi, tek bir problemin rekor sürede çözülmüş olmasından çok, benzer hatların akademi ve yazılım dünyasında standartlaşmasıyla ölçülecek. Hakemli yayın gelene kadar sonuçları ihtiyatlı okumak gerekir; fakat mimari fikir, zaten kapıda duran soruya net bir yanıt veriyor: ileri seviye akıl yürütmede doğrulama, üretimin peşinden koşmaz; onu aynı anda kısıtlar ve şekillendirir.