🚀 Hallo, Kimi K2 Thinking!
Das Open-Source Thinking Agent Model ist hier.
🔹 SOTA bei HLE (44,9%) und BrowseComp (60,2%)
🔹 Führt bis zu 200 – 300 aufeinanderfolgende Toolaufrufe ohne menschliches Eingreifen aus
🔹 Hervorragend in der Argumentation, agentischem Suchen und Programmierung
🔹 256K Kontextfenster
Als Denkagent entwickelt, markiert K2 Thinking unsere neuesten Bemühungen im Testzeit-Skalieren – sowohl das Skalieren von Denk-Token als auch von Toolaufrufen.
K2 Thinking ist jetzt im Chatmodus live, der vollständige agentische Modus kommt bald. Es ist auch über die API zugänglich.
🔌 API ist live:
🔗 Tech-Blog:
🔗 Gewichte & Code:
NVIDIA DGX Spark ist da!
Es ist so aufregend, Ollama auf @nvidia DGX Spark zum Laufen zu bringen.
Super beeindruckend, 128 GB einheitlichen Speicher und die Grace Blackwell Architektur zu sehen.
👇👇👇