Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
Denne MIT-artikkelen blåste meg av det 🤯 blå
Artikkelen handler om "ARC" og det endret fullstendig hvordan jeg ser på referansepunktet.
Forskerne behandlet ikke ARC som et logisk puslespill i det hele tatt. De behandlet hver oppgave som en visuell transformasjon.
Grid inn → grid out. Ingenting er mer komplisert enn det.
De bygde en liten Vision Transformer, trente den fra bunnen av på ARCs lille datasett, og brukte et enkelt lerretstriks for å plassere hvert eksempel som et bilde.
Deretter la de til skalaendringer, translasjoner og grunnleggende visuelle forutsetninger som man ser i klassisk datamaskinsynsarbeid.
Det er det.
Ingen tankerekke, ingen påminnelser, ingen smarte symbolske triks.
Bare en modell som ser på piksler og lærer hvordan former beveger seg, snur, vokser, kollapser eller overføres over.
Den ville delen?
Denne lille modellen når 54,5 % alene og 60,4 % når den kombineres med en U-Net.
Det er omtrent gjennomsnittlig menneskelig ytelse med en modell som passer inn i størrelsen til en liten mobilapp.
Å se ARC løst på denne måten gjør at hele benchmarken føles annerledes.
Oppgavene ser plutselig ut som bildekartlegginger i stedet for skjulte regler. Refleksjonsoppgaver ser faktisk ut som refleksjoner.
Symmetrioppgaver ser ut som symmetri. Gravitasjonsoppgaver ser ut som biter som «faller» rett ned lerretet.
Jeg holder ærlig talt fortsatt på å bearbeide det.
Dette kan være det mest jordnære ARC-resultatet jeg har lest på mange år, og det kom fra å behandle benchmarken på den mest bokstavelige måten noen noen gang har gjort.

2,56K
De kraftigste AI-agentbyggerne 👇
1. n8n
2. LangChain
3. CrewAI
4. OpenAIs agentbygger
Hvilken bruker du akkurat nå?
Jeg har prøvd alle i ekte prosjekter, og n8n dukker stadig opp som det sterkeste verktøyet på bordet. Den tar seg av det virkelige arbeidet. Det rotete arbeidet. Arbeidet som berører faktiske systemer i stedet for å leve i en chatboble.
Her er hva som fikk meg til å holde ut:
N8N lot meg bygge agenter som åpner e-poster, leser dem, henter ut nyttige data og sender dem dit de skal. Det lot meg koble disse agentene til CRM-systemer, regneark, databaser, Slack, Notion, API-er og alt annet arbeidsflyten min var avhengig av.
Jeg kunne stable steg, bygge løkker, prøve oppgaver på nytt, og se alt kjøre med full oversikt.
LangChain ga meg fleksibilitet, men arbeidsflytene ble raskt sammenfiltrede.
CrewAI gjorde tidlige eksperimenter enkle, men komplekse prosesser presset grensene.
OpenAIs Agent Builder har potensial, men veggene dukker raskt opp når du trenger dypere kontroll.
N8n håndterte hele pipelinen fra resonnement til handling uten at jeg måtte bygge en backend eller lime sammen verktøy for hånd. Det fikk agenten til å føle seg som en ekte operatør i stedet for en chatbot med ekstra trinn.
Det virkelige skiftet kom da jeg så hvor rent jeg kunne gjøre en enkelt arbeidsflyt om til noe som kunne gjentas. Ikke en demo. Et fungerende system. Noe en bedrift kan stole på hver dag.
Hvis du bygger agenter i år, former plattformen du velger alt.
Så jeg er nysgjerrig på hvilken du bygger med og hva som fikk deg til å velge den.

4,21K
Topp
Rangering
Favoritter


