DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Carta super interessante. Se un'IA disallineata genera una stringa casuale di numeri e un'altra IA è affinata su quei numeri, l'altra IA diventa disallineata. Ma solo se entrambe le IA partono dallo stesso modello di base. Questo ha conseguenze per prevenire le lealtà segrete: - Se un dipendente affina GPT-5 per essere segretamente leale a lui, potrebbe poi generare dati che sembrano innocui e affinare tutte le altre copie di GPT-5 per essere segretamente leali (ad esempio, inserendo i dati in ulteriori post-addestramenti) - MA questa tecnica non funzionerebbe per rendere GPT-6 segretamente leale nello stesso modo (Dubito che questa tecnica funzionerebbe effettivamente per qualcosa di complesso come una lealtà segreta sofisticata, ma questa è l'implicazione del modello qui se ho capito correttamente)

5,19K

Principali

Ranking

Preferiti

On-chain di tendenza

Di tendenza su X

Principali fondi recenti

Più popolari