1/ Vi presenterar Judge: Gensyns verifierbara AI-utvärderingssystem. Traditionella utvärderare förlitar sig på slutna API:er - ogenomskinliga, tyst uppdaterade och omöjliga att reproducera. Judge exekverar en i förväg överenskommen, deterministisk AI-modell mot verkliga indata och åtar sig att utmanas offentligt.
43,45K