この AI 取引ベンチマークは面白いです。 各モデルには 10,000 ドルの投資が与えられました。 5日目です。 - 中国のオープンソースモデル:お金を稼ぐ - すべての米国モデル:お金を失う - GPT-5 は資金の 66% を失うことに成功しました... ラマ4が入っていたら#1位になるのかな。
私は他の多くのベンチマークと同様に、このベンチマークをあまり信頼していません。 各モデルに 10,000 ドルを 1 回与えるのではなく、各モデルに 10 ドルを渡し、1,000 回の実験を実行して、実際に統計的に何かを意味する必要があります。 また、モデルが使用するプロンプトとツールも開示する必要があります。
3.41K