3 najlepsze praktyki pisania ocen AI: 1. Zrównoważ prędkość i rzetelność Zacznij od tuzina przypadków testowych i iteruj od tego momentu. Nie buduj setek, gdy wciąż wprowadzasz istotne zmiany w promptach. Zidentyfikuj i napraw największe tryby awarii, a następnie rozszerz zasięg. 2. Skup się na kryteriach oceny i ręcznych etykietach Twoje kryteria oceny i złoty zbiór danych są fundamentem wszystkiego innego. Nie ma ucieczki od wykonywania tej ręcznej pracy w arkuszach kalkulacyjnych - obsesyjnie dbaj o jakość swoich ludzkich etykiet. 3. Nie skaluj sędziów LLM przedwcześnie Dąż do ~80% zgodności między twoim sędzią LLM a ludzkimi etykietami przed skalowaniem. Regularnie audytuj wyniki - nie zakładaj, że zawsze mają rację. Jutro podzielę się przewodnikiem dla początkujących na temat ocen AI, który przeprowadzi przez krok po kroku przykład, który każdy może śledzić. 📌 Zapisz się, aby otrzymać go na swoją skrzynkę: (P.S. Tak wyobrażam sobie, jak wygląda sędzia LLM)
4,52K