DeepPHY 對於物理推理的代理 VLMs 進行基準測試
與作者討論:
9.94K