DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

John Coogan

Hôte @TBPN

Après une semaine à observer les réactions très positives à Gemini 3, j'ai eu suffisamment de temps pour utiliser l'application au quotidien pendant quelques jours et me sentir confiant pour offrir un petit avis. Mon point de vue est plus axé sur le consommateur que sur autre chose. Il y aura de nombreuses niches du côté des affaires où certains modèles ont plus de sens que d'autres, mais du côté des consommateurs, j'avais essentiellement supposé que le jeu était terminé et que ChatGPT avait gagné. Est-il possible que l'IA grand public (principalement la récupération de connaissances) change de cap et que Google prenne les devants ? Cela finit-il par être fortement duopolistique ? Peut-être même plus fragmenté ? Travaillons là-dessus. J'ai utilisé l'application Gemini sur iOS auparavant, mais essentiellement seulement comme un moyen d'accéder à Veo 3. Au cours de la semaine dernière, je suis passé à l'utilisation quotidienne de l'application, en dirigeant toutes mes questions habituelles à travers elle. Le résultat était d'environ 15 minutes par jour dans l'application (à peu près le même temps que je passais historiquement dans ChatGPT). Il y avait beaucoup de choses à apprécier dans l'expérience. J'ai l'impression que Gemini 3 fait un excellent travail pour "dimensionner" ses réponses de manière appropriée. Certaines questions nécessitent juste quelques points, d'autres peuvent nécessiter plusieurs paragraphes pour être répondues de manière satisfaisante. ChatGPT s'est amélioré à ce sujet depuis un certain temps, mais Gemini semblait être un pas en avant ici. Les résultats semblent également plus rapides que ceux de ChatGPT. J'aimerais voir cela quantifié pour mieux comprendre l'écart, mais cela semblait plus rapide. Une grande partie de cela a probablement à voir avec le comportement appris de sélection de modèle dans ChatGPT. J'ai tendance à m'appuyer trop sur GPT-5 Pro et je devrais simplement utiliser Thinking plus régulièrement. Nano Banana Pro est un autre fort différenciateur. Il gère vraiment des images complexes avec beaucoup de texte à un niveau complètement différent. C'est aussi vraiment rapide. La génération d'images et de vidéos continue d'être le moyen le plus fiable de m'attirer dans l'application Gemini. Ce n'est pas parfait cependant, il y a beaucoup de détails rugueux, plus que ce que j'attendrais d'un produit Google qui est au cœur de leur stratégie depuis presque deux ans. J'ai eu l'impression que l'application avait du mal à maintenir une connexion avec les serveurs. Je recevais des erreurs de "déconnexion" étranges et je devais souvent soumettre à nouveau des requêtes. De plus, le mode de transcription vocale (que j'utilise constamment dans ChatGPT) est vraiment rudimentaire. Il manque souvent les premiers mots que vous dites après avoir appuyé sur le bouton et coupe souvent votre phrase, soumettant votre prompt prématurément que cela vous plaise ou non. Dans ChatGPT, vous avez la possibilité de terminer un enregistrement vocal et de prévisualiser le texte avant de l'envoyer. Je n'ai pas encore compris comment faire cela dans Gemini. J'espère vraiment qu'ils amélioreront cette fonctionnalité, c'est le plus gros point de blocage pour moi en ce moment. Le dernier "inconvénient" que j'ai rencontré était la difficulté à passer d'une modalité à l'autre. Si je génère une image en utilisant Nano Banana, j'ai l'impression d'être coincé dans un certain flux d'images, et je ne peux pas revenir à simplement poser des questions à Gemini 3. On dirait que les différents modèles ne sont pas unifiés, ce qui est étrange car j'entends toujours beaucoup de discussions sur la "multi-modalité". Peut-être que c'est juste un bug d'interface, mais j'ai l'impression que passer d'un texte à des images va être une fonctionnalité clé. "Parle-moi de TOPIC" ➜ "Visualise maintenant ce TOPIC." J'imagine que je vais continuer à naviguer entre les applications d'IA dans un avenir prévisible, mais je me demande si les consommateurs feront largement de même. Si Google n'avait pas autant de surface produit pour s'accrocher à Gemini, je serais assez sceptique, car ChatGPT est juste synonyme de "IA" à ce stade et un meilleur modèle ne va pas changer cela. La plus grande fragilité dans la thèse de l'agrégateur ChatGPT, du moins celle que j'ai personnellement expérimentée après avoir changé, était la réalisation que beaucoup des stratégies de "verrouillage" n'ont tout simplement pas réussi jusqu'à présent. Mes anciens journaux de chat ne me manquaient pas, je n'avais pas l'impression qu'il manquait de personnalisation, je ne laissais pas derrière moi un réseau de connexions avec de vraies personnes. Ces fonctionnalités pourraient mûrir, mais il semblait que le contenu principal, la raison principale d'ouvrir une application d'IA en premier lieu, était tout aussi bon, sinon meilleur, ce qui n'est tout simplement pas le cas avec les réseaux sociaux avec un véritable verrouillage. Il est clair que Google prend l'IA grand public incroyablement au sérieux et avec quelques corrections d'interface, pourrait avoir le meilleur produit. La question est de savoir à quelle vitesse les DAU et les minutes d'utilisateur vont réellement croître. Je m'attends à ce que chaque graphique et point de données ici soit analysé à fond alors que les guerres des modèles fondamentaux continuent de faire rage.

Meilleurs

Classement

Favoris