Tento benchmark obchodování s umělou inteligencí je k popukání. Každý model dostal 10 000 dolarů na investování. Je to Den 5: - Čínské open-source modely: vydělávání peněz - Všechny americké modely: ztráta peněz - GPT-5 se podařilo ztratit 66 % svých peněz... Zajímalo by mě, jestli by se Llama 4 umístila na #1, kdyby byla zahrnuta.
Tomuto benchmarku moc nevěřím, stejně jako mnoha jiným benchmarkům. Místo toho, aby dali každému modelu 10 000 dolarů jednou, měli by dát 10 dolarů každému modelu a provést 1 000 experimentů, aby to skutečně něco znamenalo Měli by také zveřejnit výzvy a nástroje, které modely používají.
3,4K