我仍然认为 llama4 maverick 是一个不错的模型,而你们只是使用了 vllm 和 open router,实际上并没有真正使用经过训练的模型。它与 gpt4o 非常接近,工具调用更好。虽然不是我最喜欢的,但在工具调用方面被 qwen3 超越了,但也并不糟糕。
10.87K