Menilai keberhasilan OpenAI berdasarkan model Evals terasa sedikit tidak masuk akal dan semacam suka menilai Facebook awal berdasarkan beberapa ukuran yang mengevaluasi efektivitas grafik sosialnya
5,28K