GPT-5にとてもがっかりしました。迅速な遵守が不十分で、私が求めたものを与えるようにいじめなければなりません。 単純な画像認識タスク(スクリーンショットから曲名を抽出する)でひどいパフォーマンスを発揮し、リストにある39曲のうち32曲が得られました。Claude Opus 4.1 は初めてそれを見事に見事にしました。
私の言葉では、それは耐え難いほど悪いことです。@samaこれはひどいことです。
6.01K