Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
En todellakaan sano, että tämä pätee Andrej, vuohiin, mutta se vihjaa todennäköisestä tulevaisuudesta, jossa on jännite toimijuutemme tehtävässä ja työkalun kyvyn välillä *päihittää meidät sen jokaisessa osassa*.

10.8. klo 00.53
Olen huomannut, että pitkän horisontin tehtävien (luulen?) suuren vertailuarvon vuoksi LLM:istä on tulossa oletuksena hieman liian agenttisia, hieman keskimääräistä käyttötapaukseni yläpuolella.
Esimerkiksi koodauksessa malleilla on nyt taipumus järkeillä melko pitkään, heillä on taipumus alkaa listata ja tarttua tiedostoja koko arkistoon, he tekevät toistuvia verkkohakuja, he ylianalysoivat ja ajattelevat liikaa pieniä harvinaisia reunatapauksia jopa koodissa, joka on tietoisesti epätäydellistä ja aktiivisessa kehityksessä, ja palaavat usein ~minuutteja myöhemmin jopa yksinkertaisiin kyselyihin.
Tämä saattaa olla järkevää pitkäkestoisissa tehtävissä, mutta se ei sovi yhtä hyvin "silmukassa" iteroituun kehitykseen, jota teen edelleen paljon, tai jos etsin vain nopeaa pistokoketta ennen skriptin suorittamista, siltä varalta, että sain indeksoinnin väärin tai tein jonkin tyhmän virheen. Niinpä huomaan lopettavani LLM:t melko usein muunnelmilla "Lopeta, ajattelet tätä liikaa. Katso vain tätä yhtä tiedostoa. Älä käytä työkaluja. Älä suunnittele liikaa" jne.
Periaatteessa, kun oletusarvo alkaa hitaasti hiipiä "ultrathink"-superagenttitilaan, tunnen tarvetta päinvastaiselle ja yleisemmin hyville tavoille osoittaa tai kommunikoida aikomuksia/panoksia, "katso vain nopeasti" aina "mene pois 30 minuutiksi, tule takaisin, kun olet täysin varma".
1,59K
Johtavat
Rankkaus
Suosikit