Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
3 parasta käytäntöä tekoälyarviointien kirjoittamiseen:
1. Tasapainota nopeus ja kurinalaisuus
Aloita tusinalla testitapauksella ja iteroi sieltä. Älä rakenna 100:aa, kun teet vielä suuria nopeita muutoksia. Tunnista ja korjaa suurimmat vikatilat ja laajenna sitten kattavuutta.
2. Pakkomielle arvokkaista kriteereistä ja manuaalisista merkinnöistä
Eval-kriteerisi ja kultainen tietojoukkosi ovat kaiken muun perusta. Tätä manuaalista työtä ei voi kiertää laskentataulukoissa - pakkomielle tehdä ihmisetiketeistäsi hyviä.
3. Älä skaalaa LLM-tuomaria ennenaikaisesti
Pyri ~80 %:n linjaukseen LLM-tuomarin ja ihmisten merkitsejien välillä ennen skaalausta. Tarkasta tulokset säännöllisesti - älä oleta, että se on aina oikein.
Huomenna jaan aloittelijan oppaan tekoälyarvioinneista, jossa käydään läpi vaiheittainen esimerkki, jota kuka tahansa voi seurata.
📌 Rekisteröidy saadaksesi sen postilaatikkoosi:
(P.S. Näin kuvittelen, miltä LLM-tuomari näyttää)

4,72K
Johtavat
Rankkaus
Suosikit