Přísahám, že každá výzkumná organizace se potýkala s otázkou: "Jak můžeme sdílet více WIP, aniž by to lidé považovali za konečné?"
Líbí se mi, jak kliknutí na novou stránku Poznámky @METR_Evals změní celý web na ručně psané písmo a křídové pozadí.
Silný vizuální výkřik "ne vážně, to je drsné".
• 20. srpna: xAI říká, že pokud je model >50 % na MASK, spustí se jeho prahová hodnota "ztráty kontroly"
• 26. srpna: Grok CF1 získal 72 % a xAI řekl, že nepředstavuje riziko
Zdá se, že oba jsou pravdiví MASK a xAI by měl vysvětlit, proč si to v průběhu týdne rozmysleli