Tässä on tämän viikon Ritual Research Digest, uutiskirje, joka kattaa viimeisimmät tiedot LLM:ien maailmasta ja Crypto x AI:n risteyskohdasta. Viikoittain julkaistaan satoja lehtiä, joten on mahdotonta pysyä ajan tasalla uusimmasta uutisesta. Me teemme lukemisen, jotta sinun ei tarvitse.
Matalan todennäköisyyden tokenit ylläpitävät vahvistusoppimisen tutkimista todennettavissa olevalla palkkiolla Tässä artikkelissa todetaan, että päättelymallien pullonkaula voi johtua matalan todennäköisyyden tutkivien tokenien poistamisesta (he kutsuvat niitä päättelykipinöiksi).
He ottavat käyttöön Lp-Regin säilyttääkseen arvokkaita matalan todennäköisyyden tokeneita regularisoinnin avulla. Lp-Reg hylkää ensin meluisat matalan todennäköisyyden tokenit ja jakaa sitten todennäköisyysmassan uudelleen jäljellä olevien ehdokkaiden kesken. Qwen3-14B:n 5 matematiikan vertailuarvossa ne paranevat 2,66 %.
Lämpötilanäytteenoton roolista testiaikaskaalauksessa Viimeaikainen testiaikaskaalauksen (TTS) skaalaus on noussut Pass@k 1024:ään, mutta olemmeko saavuttaneet TTS-suorituskyvyn katon? Artikkelit osoittavat lämpötilanäytteiden avulla, että voimme skaalata TTS:ää edelleen.
Paperit osoittavat, että lämpötila voi olla uusi ulottuvuus skaalauksessa testiaikana. Qwen3:n (0,6B, 1,7B, 4B, 8B) ja viiden vertailuarvon kokeiden avulla lämpötilan skaalaus tuottaa 7,3 pistettä yhden lämpötilan TTS:ään verrattuna. He suunnittelevat myös tehokkaan menetelmän T-skaalaukseen.
DiffuSpec: Diffuiokielimallien avaaminen spekulatiivista dekoodausta varten Diffuusiomallit spekulatiivisen dekoodauksen laatijoina sopivat hyvin, koska niiden vaihekohtainen token-ehdotusten suorituskyky on suurempi ja ehdotusten laatu on vahvempi.
Diffuusiomallit kärsivät kuitenkin syy-seuraussuhteisiin ja syväyksen pituuteen liittyvistä ongelmista. Näiden ongelmien ratkaisemiseksi artikkelissa esitellään DiffuSpec, koulutusvapaa menetelmä. Erilaisissa tehtävissä se tarjoaa jopa 3 × seinäkellon nopeuden, mikä ylittää muut harjoitteluttomat perustasot.
Tuottamalla synteettistä dataa, jonka luettavuuden vaikeusaste vaihtelee, he huomaavat, että luettavuus ei ole avain pienten kielimallien yhtenäisyyteen. Heidän havaintonsa viittaavat siihen, että tilastollinen yksinkertaisuus ennustaa vahvemmin SLM:n opittavuutta.
Seuraa meitä @ritualdigest saadaksesi lisätietoja kaikesta krypto x AI -tutkimuksesta ja @ritualnet oppia lisää siitä, mitä Ritual rakentaa.
1,45K