Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Arvind Narayanan
Princeton CS prof. Directeur @PrincetonCITP. J’utilise X pour partager mes recherches et mes commentaires sur l’impact sociétal de l’IA.
LIVRE : Huile de serpent AI. Vues les miennes.
J'ai dit cela cent fois, mais je vais continuer à le dire : l'adoption de l'IA et le changement de comportement sont lents — et resteront lents — peu importe la rapidité avec laquelle les capacités s'améliorent. La statistique dans la capture d'écran mérite d'être méditée : près d'un an après la sortie des modèles "pensants", seule une infime fraction d'utilisateurs les utilisait (jusqu'à ce que le commutateur automatique de GPT-5 augmente discrètement les chiffres).
C'est exactement ce à quoi nous devrions nous attendre. Le récit dominant est que l'IA est adoptée à une vitesse sans précédent, mais cela repose sur le nombre de personnes qui l'ont essayée, en ignorant comment elles l'utilisent, combien de temps elles l'utilisent chaque jour et combien elles en tirent. Même les innovations salvatrices mettent du temps à se diffuser dans la population. C'est une caractéristique du comportement humain, pas de la technologie en question, donc nous ne devrions pas nous attendre à ce que l'IA soit différente. (Pour en savoir plus, voir l'IA comme technologie normale.)
Certains soutiendront que le commutateur automatique de GPT-5 prouve que les développeurs peuvent essentiellement forcer l'IA sur les gens rapidement. Absolument pas. Le commutateur de modèle était un problème créé par OpenAI, donc OpenAI a pu le résoudre. Passer à un modèle pensant en arrière-plan ne nécessite pas que l'utilisateur apprenne de nouvelles compétences ou comportements ou change ses flux de travail. Il est révélateur qu'OpenAI n'ait pas pu intégrer de manière similaire Deep Research ou le Mode Agent, qui nécessitent une adaptation de l'utilisateur — surtout ce dernier, où les utilisateurs doivent apprendre à superviser le modèle, communiquer précisément les exigences de la tâche, prendre des décisions complexes et potentiellement risquées concernant la sécurité, et trouver tout cela suffisamment utile pour vouloir ouvrir leurs portefeuilles.

26,44K
Arvind Narayanan a reposté
Beaucoup de ces résultats nous ont surpris, et nous prévoyons de les examiner de plus près. Mais les tendances à travers ces benchmarks confirment que GPT-5 n'est pas un changement radical et n'améliore pas les autres modèles d'OpenAI. Cependant, il brille dans les compromis coût-précision — souvent beaucoup moins cher que des modèles comparables.
6,59K
Arvind Narayanan a reposté
Comment GPT-5 se compare-t-il à Claude Opus 4.1 sur des tâches agentiques ?
Depuis leur sortie, nous avons évalué ces modèles sur des tâches difficiles en science, web, services et code.
Résultat principal : Bien qu'économique, jusqu'à présent, GPT-5 n'atteint jamais le sommet des classements agentiques. Plus d'évaluations 🧵

61,63K
Arvind Narayanan a reposté
📣 Annonce du lancement du programme inaugural des #CITP Technology Fellows - conçu pour connecter des technologues ayant une expérience gouvernementale afin de créer un réseau d'experts répondant à la pénurie d'expertise technique dans les organismes de réglementation à l'échelle nationale. Postulez en ligne👇

3,57K
Arvind Narayanan a reposté
Est-ce que GPT-5 est une bonne étape pour enfin cesser d'appeler tout "modèles" et commencer à différencier entre chatbots, API, poids de modèle et comparer/évaluer en conséquence ?
Il n'a aucun sens de comparer les sorties des chatbots (qui peuvent être le résultat de dizaines de poids de modèle différents) avec les sorties d'un seul poids de modèle, c'est comme comparer une voiture avec un moteur (livre de @random_walker @sayashk)


9,26K
Arvind Narayanan a reposté
📢 Nouveau document, publié par @knightcolumbia.
Nous parlons souvent des agents IA qui augmentent ou automatisent le travail, mais à quoi peuvent ressembler exactement les différentes configurations d'interaction humain-agent ? Nous introduisons un cadre en 5 niveaux pour l'autonomie des agents IA afin de décomposer cela.
🧵👇

4,77K
Meilleurs
Classement
Favoris
Tendance on-chain
Tendance sur X
Récents financements de premier plan
Les plus notables