Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
Questo articolo del MIT mi ha davvero stupito 🤯
L'articolo parla di "ARC" e ha completamente cambiato il modo in cui vedo il benchmark.
I ricercatori non hanno trattato ARC come un rompicapo logico. Hanno considerato ogni compito come una trasformazione visiva.
Griglia in → griglia out. Niente di più complicato di così.
Hanno costruito un piccolo Vision Transformer, addestrato da zero sul piccolo dataset di ARC, e hanno usato un semplice trucco di canvas per posizionare ogni esempio come un'immagine.
Poi hanno aggiunto cambiamenti di scala, traduzioni e basi visive che vedresti nel lavoro classico di computer vision.
Ecco tutto.
Nessuna catena di pensiero, nessun prompt, nessun trucco simbolico ingegnoso.
Solo un modello che guarda i pixel e impara come le forme si muovono, si girano, crescono, collassano o si trasferiscono.
La parte sorprendente?
Questo piccolo modello raggiunge il 54,5% da solo e il 60,4% quando combinato con un U-Net.
È proprio intorno alla prestazione media umana con un modello che si adatta alle dimensioni di una piccola app mobile.
Vedere ARC risolto in questo modo fa sentire tutto il benchmark diverso.
I compiti sembrano improvvisamente mappature di immagini invece di regole nascoste. I compiti di riflessione sembrano effettivamente riflessioni.
I compiti di simmetria sembrano simmetria. I compiti di gravità sembrano pezzi che "cadono" dritti giù per il canvas.
Onestamente, sto ancora elaborando tutto questo.
Questo potrebbe essere il risultato di ARC più concreto che abbia letto in anni e proviene dal trattare il benchmark nel modo più letterale che chiunque abbia mai fatto.

3,53K
I costruttori di agenti AI più potenti 👇
1. n8n
2. LangChain
3. CrewAI
4. Costruttore di agenti di OpenAI
Quale stai usando in questo momento?
Li ho provati tutti in progetti reali, e n8n continua a mostrarsi come lo strumento più forte sul tavolo. Gestisce il lavoro reale. Il lavoro disordinato. Il lavoro che tocca i sistemi reali invece di vivere in una bolla di chat.
Ecco cosa mi ha fatto rimanere con esso:
n8n mi ha permesso di costruire agenti che aprono email, le leggono, estraggono i dati utili e li inviano dove devono andare. Mi ha permesso di collegare quegli agenti a CRM, fogli di calcolo, database, Slack, Notion, API e qualsiasi altra cosa di cui dipendessero i miei flussi di lavoro.
Potevo impilare passaggi, costruire cicli, riprovare compiti e osservare tutto funzionare con piena visibilità.
LangChain mi ha dato flessibilità, ma i flussi di lavoro si sono rapidamente ingarbugliati.
CrewAI ha reso facili i primi esperimenti, ma i processi complessi hanno superato i suoi limiti.
Il Costruttore di agenti di OpenAI ha potenziale, ma i limiti si presentano rapidamente quando hai bisogno di un controllo più profondo.
n8n ha gestito l'intero pipeline dal ragionamento all'azione senza costringermi a costruire un backend o incollare strumenti insieme a mano. Ha fatto sentire l'agente come un vero operatore invece di un chatbot con passaggi extra.
Il vero cambiamento è arrivato quando ho visto quanto facilmente potessi trasformare un singolo flusso di lavoro in qualcosa di ripetibile. Non una demo. Un sistema funzionante. Qualcosa su cui un'azienda può contare ogni giorno.
Se stai costruendo agenti quest'anno, la piattaforma che scegli plasma tutto.
Quindi sono curioso di sapere con quale stai costruendo e cosa ti ha fatto scegliere.

4,27K
Principali
Ranking
Preferiti


