Kimi K2-leverantörer: Groq betjänar Kimi K2 med > 400 outputtokens/s, 40 gånger snabbare än Moonshots förstaparts-API Grattis till ett antal leverantörer för att de var snabba med att lansera API:er för Kimi K2, inklusive @GroqInc, @basetenco, @togethercompute, @FireworksAI_HQ, @parasail_io, @novita_labs, @DeepInfra och naturligtvis @Kimi_Moonshot. Detta är imponerande med tanke på modellens storlek på 1 biljon totala parametrar. Groq utmärker sig för blixtrande snabb hastighet. DeepInfra, Novita och Baseten sticker ut för sin prissättning och är de enda leverantörerna som prissätter liknande eller billigare än Moonshots förstaparts-API. Se nedan för ytterligare jämförelser mellan leverantörerna. Vi förväntar oss snabba ökningar av hastigheten hos vissa leverantörer när teamen optimerar för K2-modellen - våra siffror nedan visar medianhastigheter under de senaste 72 timmarna, men vi ser redan att DeepInfra hoppar upp till 62 tokens/s i dagens mätningar
52,18K