是否有任何遊樂場或等效工具可以查看不同模型的工具使用/代理性能? 我基本上想給它5個工具和我通常的提示 然後遊樂場生成約5-10個案例並運行所有選定的模型 然後我觀察+更改模型、提示
4.42K