Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Apresentando ':exacto', endpoints de chamada de ferramentas de precisão
O OpenRouter agora oferece um subconjunto selecionado de provedores nos principais modelos de código aberto com precisão de chamada de ferramenta mensurável maior, proporcionando um uso de ferramenta mais confiável.

Leia os detalhes completos em nossa postagem no blog: ou continue lendo o tópico para o resumo.

Por que isso importa:
Mesmo quando os provedores hospedam *os mesmos pesos de modelo*, a qualidade da inferência do mundo real pode ser diferente.
A execução de bilhões de solicitações por mês dá ao OpenRouter um ponto de vista exclusivo para detectar essas variações e exibir os provedores mais precisos automaticamente.
Como medimos a qualidade do uso da ferramenta:
• Validade JSON
• Nome da ferramenta e correspondências de esquema
• Propensão ao uso de ferramentas (tende a chamar ferramentas)
• Preferências de ignorar/colocar na lista negra do usuário
• Benchmarks externos (τ²-Bench, LiveMCPBench via @GroqInc OpenBench)

Esses dados revelam que a precisão da chamada de ferramentas varia muito mais entre os provedores do que os benchmarks convencionais sugerem, mesmo para o mesmo modelo de peso aberto.
Por isso, construímos endpoints que roteiam *apenas* para os mais confiáveis.

Os modelos de lançamento incluem:
'moonshotai/kimi-k2-0905:exacto'
'deepseek/deepseek-v3.1-terminus:exacto'
'z-ai/glm-4.6:exacto'
'openai/gpt-oss-120b:exacto'
'qwen / qwen3-coder: exacto'
Veja todos eles aqui.

Combos de modelos Exacto + provedores:
Kimi K2: @GroqInc e @Kimi_Moonshot
GLM-4.6: @novita_labs, @DeepInfra e @Zai_org
gpt-oss-120b: Groq, DeepInfra, Novita
Codificador Qwen3: @basetenco, @cerebras e @GoogleAI
Terminal DeepSeek: @AtlasCloud_AI, DeepInfra e Novita
Use-os como qualquer outro modelo, basta acrescentar ':exacto':
'''bash
cacho\
-H "Autorização: Portador $OPENROUTER_API_KEY" \
-d '{"model": "moonshotai/kimi-k2-0905:exacto", "messages":[{"role":"user","content":"Qual é a capital da França?"}]}'
```
Benchmarks e avaliações internas mostram um aumento significativo nas taxas de sucesso de chamada de ferramenta em todos os modelos ':exacto', menos JSONs inválidos, menos incompatibilidades de esquema e maior confiabilidade no mundo real. Um salve para o OpenBench da @GroqInc pelo harness eval e o recém-adicionado LiveMCPBench.

A variante ':exacto' é focada puramente na precisão de chamada de ferramentas, não em uma classificação geral da qualidade do provedor.
Continuaremos a expandir esses endpoints e compartilhar mais dados agregados ainda este ano.
139,19K
Melhores
Classificação
Favoritos

