Nous avons donc des modèles agentiques puissants comme Opus maintenant, mais ils n'exhibent pas de tendances à rechercher le pouvoir, d'inclinations à mentir, etc. N'est-ce pas un coup fatal pour les arguments des pessimistes de l'IA selon lesquels ces traits (a) émergeraient nécessairement avec des capacités supérieures et (b) seraient difficiles à contrôler ?
Je me souviens quand « permettre aux modèles d'accéder à Internet sans autorisation » était une ligne rouge critique que l'humanité ne pouvait tout simplement pas franchir. On dirait que toutes ces personnes avaient tort, ou du moins qu'elles doivent déplacer les objectifs très loin.
1,15K