Ikke år, @FractionAI_xyz gjør det akkurat nå
jack morris
jack morris19. aug., 23:49
det ser ut til at de neste årene med AI-utvikling vil være mye RL med LLM-som-en-dommer-belønningsfunksjoner. merkelige tider vi lever i Hvor kan jeg lære mer om dette paradigmet? Hva er de mest relevante bloggene og papirene?
10,01K