Alibaba Destekli Moonshot'tan Yeni Kimi K2: ChatGPT ve Claude'u Kodlamada Geride Bıraktı

Alibaba Destekli Moonshot'tan Yeni Kimi K2: ChatGPT ve Claude'u Kodlamada Geride Bıraktı

OpenAI'nin ChatGPT'sine meydan okuyan en yeni Çin yapımı üretken yapay zeka modeli, kodlama yeteneklerini daha düşük fiyatla sunuyor.

Alibaba destekli startup Moonshot, Cuma gecesi geç saatlerde Kimi K2 modelini piyasaya sürdü: düşük maliyetli, açık kaynak büyük dil modeli - Ocak ayında Çin merkezli DeepSeek'in endüstri disruption'unun temelini oluşturan iki faktör. Açık kaynak teknoloji, kaynak koduna ücretsiz erişim sağlar; Meta ve bir ölçüde Google dışında, ABD teknoloji devlerinin pek azının benimsediği bir yaklaşım.

Tesadüfen, OpenAI CEO'su Sam Altman Cumartesi sabahı erken saatlerde, güvenlik endişeleri nedeniyle ilk açık kaynak modellerinin bir kez daha süresiz ertelendiğini duyurdu. OpenAI, Kimi K2 hakkında CNBC'nin yorum talebine hemen yanıt vermedi.

Kodlama Odaklı Güçlü Performans

Kimi K2'nin güçlü yanlarından biri, uygulamalar için bilgisayar kodu yazma konusundaki yeteneği - işletmelerin üretken yapay zeka ile personeli azaltma veya değiştirme potansiyeli gördüğü bir alan. OpenAI'nin ABD rakibi Anthropic, Mayıs ayının sonlarında piyasaya sürdüğü Claude Opus 4 modeliyle kodlamaya odaklandı.

X ve GitHub sosyal medya platformlarındaki lansman duyurusunda Moonshot, Kimi K2'nin iki benchmark'ta Claude Opus 4'ü geçtiğini ve çeşitli endüstri ölçütlerine göre OpenAI'nin kodlama odaklı GPT-4.1 modelinden daha iyi genel performans sergilediğini iddia etti.

Counterpoint'te yapay zeka ana analisti Wei Sun, Pazartesi günü gönderdiği e-postada "Kuşkusuz [Kimi K2] küresel rekabet gücüne sahip bir model ve açık kaynak" dedi.

Ham kodlama gelişmelerine rağmen Sun, Kimi K2'nin diğer teknoloji sistemleriyle etkili entegrasyon için araçlar geliştirmeye devam ettiğini belirtti. Bu da geliştiricilerin rakip tekliflerden Kimi'ye geçişini zorlaştırabilir ve kodlama yeteneklerindeki gelişmeyi "oyun değiştirici olmaktan uzaklaştırabilir" dedi.

Daha Uygun Fiyat Seçeneği

Yeni K2 modeli ayrıca "daha düşük token maliyetlerine sahip, bu da onu büyük ölçekli veya bütçe duyarlı dağıtımlar için çekici kılıyor" dedi Sun.

Model, aylık abonelik ücreti alan ChatGPT veya Claude'un aksine, Kimi'nin uygulama ve tarayıcı arayüzü üzerinden ücretsiz olarak kullanılabiliyor.

Kimi ayrıca web sitesine göre her 1 milyon giriş token'ı için sadece 15 sent ve 1 milyon çıkış token'ı için 2,50 dolar ücret alıyor. Token'lar yapay zeka modeli işleme için veri ölçme yöntemidir.

Buna karşın Claude Opus 4, giriş için 100 kat daha fazla (milyon token başına 15 dolar) ve çıkış için 30 kat daha fazla (milyon token başına 75 dolar) ücret alıyor. GPT-4.1 ise her bir milyon token için giriş için 2 dolar ve çıkış için 8 dolar ücret alıyor.

Moonshot AI, GitHub'da geliştiricilerin K2'yi istedikleri gibi kullanabileceklerini, tek şartın ticari ürün veya hizmetin aylık 100 milyon aktif kullanıcısı olması veya aylık 20 milyon dolar gelire eşdeğer gelir elde etmesi durumunda kullanıcı arayüzünde "Kimi K2" görüntülemesi olduğunu söyledi.

Sıcak Yapay Zeka Pazarındaki Yankılar

K2'nin hem İngilizce hem de Çince sosyal medyadaki ilk değerlendirmeleri büyük ölçüde olumlu oldu, ancak üretken yapay zekada yaygın bir sorun olan ve modellerin bilgi uydurması anlamına gelen halüsinasyon raporları da var.

Yine de K2, tasarım için yapay zeka araçları sunan MagicPath startup'ının kurucusu Pietro Schirano'nun X'teki paylaşımına göre "Claude 3.5 Sonnet'ten beri üretimde rahatça kullanmayı hissettiğim ilk model".

Küresel Yapay Zeka Rekabetinde Çin'in Yükselişi

Moonshot daha önce bazı yapay zeka modellerini açık kaynak yaptı. Şirketin chatbot'u geçen yıl başlarında Çin'de resmi olarak mevcut olmayan ChatGPT'nin alternatifi olarak popülaritesi arttı. Ancak o zamandan beri ByteDance ve Tencent'ten benzer chatbot'lar pazarı doldurdu, teknoloji devi Baidu ise temel arama motorunu yapay zeka araçlarıyla yeniledi.

Kimi'nin en son yapay zeka sürümü, yatırımcıların küresel yapay zeka rekabetinde ABD teknolojisine Çinli alternatiflere baktığı bir dönemde geliyor.

Yine de DeepSeek hakkındaki heyecana rağmen, özel şirket henüz R1 ve V3 modeline büyük bir güncelleme duyurmadı. Bu arada, bu yıl başlarında başka bir DeepSeek benzeri startup olarak ortaya çıkan Çinli startup Manus AI, merkezini Singapur'a taşıdı.

ABD'de ise OpenAI henüz GPT-5'i açıklamamış durumda.

Counterpoint'ten Sun, GPT-5 üzerindeki çalışmanın mühendislik kaynaklarını kullanabileceğini ve OpenAI'nin açık kaynak modelinde ilerleme kaydetmesini engelleyebileceğini söyledi. Ayrıca güçlü bir açık kaynak model piyasaya sürmenin, mülkiyet modelinin rekabet avantajını baltalamadan zor olduğunu ekledi.

Grok 4 ile Rekabet

Kimi K2, şirketin tek son sürümü değil. Moonshot geçen ay bir Kimi araştırma modeli başlattı ve Google'ın Gemini Deep Research'ünün 26,9 puanına eşit olduğunu ve "İnsanlığın Son Sınavı" adlı bir benchmark'ta OpenAI versiyonunu geçtiğini iddia etti.

Kimi araştırma modeli, geçen hafta Elon Musk'ın xAI'sinin Grok 4 sürümü sırasında bile anılmıştı - kendi başına "İnsanlığın Son Sınavı" benchmark'ında 25,4 puan aldı, ancak çeşitli yapay zeka araçları ve web araması kullanmasına izin verildiğinde 44,4 puan elde etti.

NYU Hukuk Fakültesi'nden misafir profesör Winston Ma, "Kimi-Researcher, agentic yapay zekada paradigma değişimini temsil ediyor" dedi. Yapay zekanın karmaşık bir görevi tamamlamak için kendi başına aynı anda birkaç karar verme kabiliyetine atıfta bulunuyordu.

"Sadece akıcı yanıtlar üretmek yerine, uzman düzeyinde özerk akıl yürütme sergiliyor - daha önce LLM'lerden eksik olan karmaşık bilişsel çalışma türü" dedi Ma. Aynı zamanda "The Digital War: How China's Tech Power Shapes the Future of AI, Blockchain and Cyberspace" kitabının yazarı.

Bu gelişmeler, yapay zeka pazarındaki rekabetin giderek kızıştığını ve Çin merkezli şirketlerin ABD teknoloji devlerine ciddi meydan okuma başlattığını gösteriyor.

Makale Bilgileri

Yazar: İsmail Hakkı EREN

İlgili Yazılar

Claude Code geldi

Claude Code geldi

Yapay zeka destekli kod editörleri artık geliştiricilerin vazgeçilmezi haline geldi. Bugün size, aynı Claude-3.7 modelin...

Devamını Oku