Provedores Kimi K2: A Groq está a fornecer Kimi K2 a >400 tokens de saída/s, 40X mais rápido do que a API de primeira linha da Moonshot. Parabéns a vários provedores por serem rápidos a lançar APIs para Kimi K2, incluindo @GroqInc, @basetenco, @togethercompute, @FireworksAI_HQ, @parasail_io, @novita_labs, @DeepInfra e, claro, @Kimi_Moonshot. Isso é impressionante considerando o tamanho do modelo com 1 trilhão de parâmetros no total. A Groq destaca-se pela velocidade impressionante. A DeepInfra, Novita e Baseten destacam-se pelos seus preços, sendo os únicos provedores a cobrar de forma semelhante ou mais barata do que a API de primeira linha da Moonshot. Veja abaixo mais comparações entre os provedores. Esperamos aumentos rápidos na velocidade entre alguns provedores à medida que as equipas otimizam para o modelo K2 - nossos números abaixo mostram velocidades medianas das últimas 72 horas, mas já estamos a ver a DeepInfra subir para 62 tokens/s nas medições de hoje.
52,17K