🚀 Hej, Kimi K2 Tänkande!
Open-Source Thinking Agent Model är här.
🔹 SOTA på HLE (44,9 %) och BrowseComp (60,2 %)
🔹 Utför upp till 200 – 300 sekventiella verktygsanrop utan mänsklig inblandning
🔹 Utmärker sig i resonemang, agentisk sökning och kodning
🔹 Kontextfönster för 256 kB
K2 Thinking är byggt som en tänkande agent och markerar våra senaste ansträngningar inom testtidsskalning – skalning av både tänkande tokens och verktygsanropande turer.
K2 Thinking är nu live i chatt-läge, med fullt agent-läge som kommer snart. Den är också tillgänglig via API.
🔌 API:et är live:
🔗 Teknisk blogg:
🔗 Vikter och kod:
NVIDIA DGX Spark är här!
Det är så spännande att få Ollama att köras på @nvidia DGX Spark.
Super fantastiskt att se 128 GB enhetligt minne och Grace Blackwell-arkitekturen.
👇👇👇