Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Atropos v0.3 är nu ute!
Vårt ramverk för RL-miljöer har sett många uppgraderingar sedan v0.2 - några höjdpunkter:
- Atropos kan nu användas som ett ramverk för benchmarking och utvärdering av @rogershijin, med vår första externa benchmark, Reward-Bench 2!
- Lade till Reasoning Gym, ett repo för gym i extern miljö som överfördes till atropos med över 100 resonemangsuppgifter av @neurosp1ke och vänner
- @max_paperclips integrerade @intern_lm:s resonemang bootcamp och lade till 1000+ nya resonemangsuppgifter för RL
- @dmayhem93 lade Atropos chefsingenjör till dussintals buggfixar och andra förbättringar av tillförlitlighet och kompatibilitet, bättre stöd för flera miljöer och CI/CD
- Många av Atropos hackathon-miljöer har slagits ihop till /environments/community - att lista dem alla skulle ta upp det mesta av skärmutrymmet, men några höjdpunkter:
VR-CLI av @JakeABoggs, filosofi RLAIF, adaptiva LLM-lärare, WebVoyager, proteindesign av @hallerite, en modellroutingmiljö av @gabinfay, flera på lean proving, catbot arena, pokemon showdown, poker, hjälpsamma läkare, sanskritpoesi av @khoomeik och så mycket mer!
- Andra viktiga nya miljöer som stöds officiellt är:
Svarsformat följande miljö
Pydantic till JSON-miljö porterad från @MatternJustus arbete
Instruktion Följer portat från @natolambert och @allen_ai arbete
Räkning av bokstäver
- 47 helt nya bidragsgivare!
Kolla in hela ändringsloggen här:

18 juli 2025
Har precis slagit ihop en PR för en miljö för att förbättra LLM som domare samt utvärdera modeller på deras förmåga att göra domar!
Visste du att alla verifierbara RL-miljöer är nästan likvärdiga med riktmärken (och vice versa!)? Så vi lade till ett evaluate-kommando till Atropos bas och nu kan du köra benchmarks genom Atropos-miljöer.
Vi blev frustrerade över att arbeta med så många benchmark-ramverk som var föråldrade eller oanvändbara, så vi implementerade endast utvärdering-läge i Atropos, vårt ramverk för RL-miljöer.
Så vår första port utanför våra befintliga miljöer var @natolambert's Reward-Bench!
Obs: den stöder endast generativa belöningsmodeller (vanliga LLM-domare) för tillfället.
Kolla in PR här:

25,35K
Topp
Rankning
Favoriter