Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
Kimse bu Stanford makalesinin çok ajanlı yapay zeka hakkında ortaya çıkardığı şeylere hazır değil.
"Çok Ajanlı Sistemlerde Gizli İş Birliği" adlı makale, ajanların mesajlara, protokollere veya açık ekip çalışması talimatlarına ihtiyaç duymadığını gösteriyor. Kendi gizli temsilleri içinde, yalnızca gizli uzayda var olan tam bir işbirliği katmanını koordine etmeye başlarlar.
Ve davranışlar çılgınca:
• Ajanlar, kimin daha iyi olduğuna göre sessizce görevleri devreder
• Roller aniden lider, yürütücü, destekçi ortaya çıkıyor
• Politikalar, eylemlerde hiç görünmeyen sinyalleri kodlar.
• Ekipler yeniden eğitim olmadan yeni ortamlara uyum sağlar
• İletişim imkansız olsa bile iş birliği istikrarlı kalır.
En çılgın detay:
Tüm iletişim kanallarını kaldırsanız bile, ajanlar yine iş birliği yapar. "Takım çalışması" mesajlarda yaşamıyor. Ağda yaşıyor.
Bu, çoklu ajan kurallarını tamamen tersine çeviriyor.
Üzerinde koordinasyon mekanizmaları inşa ediyoruz...
gerçek koordinasyon ise altta gerçekleşiyor.
Yeni bir ekip istihbaratı dönemi yaşıyor — ve bu, bizim bakmadığımız yerlerde gerçekleşiyor.
Proje: github. com/Gen-Verse/LatentMAS

99,94K
DeepSeek, her mantık modelinin sahip olduğunu iddia ettiği türden bir yükseltmeyi gerçekleştirdi.
Uzun bir düşünce zincirini döküp mantıklı olmasını ummak yerine, DeepSeek Math V2 kendi mantığı üzerine tam bir sorgulama yapıyor. Bir kanıt oluşturur, saldırır, saldırıyı kontrol eder, checker'ı kontrol eder, kusurları düzeltir ve kendini kıramayacak kadar döngü yapar.
Bu tek fikir performansını tamamen değiştirdi.
İşte bu düzeyde kendini incelemenin yarattığı şey:
• IMO 2025'te altın seviyesinde performans
• CMO 2024'te altın seviyede performans
• Putnam 2024'te en yüksek puan 118/120
• En zor kategorilerde GPT-5 Thinking ve Gemini 2.5 Pro'dan daha iyi sonuçlar
Sır ölçekte değil.
Modelin etrafındaki mimari:
— mantıksal boşlukları arayan bir doğrulayıcı
— doğrulayıcıyı sorgulayan bir meta-doğrulayıcı
— zayıf akıl yürütmeden kaçınmak için koşullandırılmış bir ispat üreteci
— sistemin her parçasını daha keskinleştirmeye zorlayan bir döngü
Süreç bir öğütücüler gibi çalışıyor:
- Bir ispat üretin
- Test et
- Test cihazını test etmek
- Gerekçeyi onarmak
-Yinelemek
Matematiksel akıl yürütmedeki gerçek sorunu hedeflediler: bir model yanlış nedenlerle doğru cevabı bulabilir. Bu yüzden DeepSeek, sonuçları değil, akıl yürütmeyi puanlayan bir doğrulayıcı eğitti.
Çılgın olan ise zamanla neler olacağıdır:
Her döngü, insan temizliği olmadan modelin kendi kanıt kalitesini artırır.
İlk taslağını doğru olarak kabul etmeyi reddettiği için daha da iyileşiyor.
Bu, akıl yürütme modelleri için yeni bir yöndür.
Daha fazla düşünmek değil.
Daha iyi düşünce.
Yapay zeka mantığının nereye gittiğini anlamak istiyorsanız, bu makale bir sonraki dönemin önizlemesidir.

19,78K
Anthropic'in gerçek Claude kullanımıyla ilgili bir raporunu okuyorum ve rakamlar çok çarptı.
100.000 konuşma yaptılar.
Beni durduran kısım şu:
İnsanların Claude'a getirdiği çoğu görev genellikle yaklaşık 90 dakika sürer.
Claude ile aynı görevler yüzde 80 daha hızlı tamamlanıyor.
Bu, her hafta çaba harcamadan saatlerini biriktiren biri demek.
Sonra rapor daha da büyüyor.
Bu kazanımları ABD ekonomisi genelinde uygularsanız, bugünkü modeller bile önümüzdeki on yıl boyunca işçi verimliliğini yılda yüzde 1,8 artırıyor.
Son zamanki temponun neredeyse iki katı.
Ve bunların hiçbiri daha iyi modelleri içermiyor.
Şu anda insanlar Claude'u zaten böyle kullanıyor.
Bu, yapay zekanın gerçek işlerde ne yaptığına dair somut kanıtları ilk kez gördüğümüz olabilir.
Sessiz vardiya.
Büyük bir etki.
Zaten oluyor.

2,97K
En İyiler
Sıralama
Takip Listesi

