Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nova postagem no blog sobre assimetria de verificação e "lei do verificador":
A assimetria da verificação – a ideia de que algumas tarefas são muito mais fáceis de verificar do que de resolver – está a tornar-se uma ideia importante, uma vez que temos RL que finalmente funciona de forma geral.
Grandes exemplos de assimetria de verificação são coisas como quebra-cabeças sudoku, escrever o código para um site como o instagram e problemas BrowseComp (leva ~ 100 sites para encontrar a resposta, mas fácil de verificar uma vez que você tem a resposta).
Outras tarefas têm quase simetria de verificação, como somar dois números de 900 dígitos ou alguns scripts de processamento de dados. No entanto, outras tarefas são muito mais fáceis de propor soluções viáveis do que verificá-las (por exemplo, verificar fatos de um longo ensaio ou declarar uma nova dieta como "só coma bisão").
Uma coisa importante a entender sobre a assimetria de verificação é que você pode melhorar a assimetria fazendo algum trabalho de antemão. Por exemplo, se você tem a chave de resposta para um problema de matemática ou se você tem casos de teste para um problema Leetcode. Isso aumenta muito o conjunto de problemas com assimetria de verificação desejável.
A "lei do verificador" afirma que a facilidade de treinar a IA para resolver uma tarefa é proporcional ao quão verificável a tarefa é. Todas as tarefas que são possíveis de resolver e fáceis de verificar serão resolvidas por IA. A capacidade de treinar a IA para resolver uma tarefa é proporcional se a tarefa tem as seguintes propriedades:
1. Verdade objetiva: todos concordam o que são boas soluções
2. Rápido de verificar: qualquer solução pode ser verificada em poucos segundos
3. Escalável para verificar: muitas soluções podem ser verificadas simultaneamente
4. Baixo ruído: a verificação está tão estreitamente correlacionada com a qualidade da solução quanto possível
5. Recompensa contínua: é fácil classificar a bondade de muitas soluções para um único problema
Uma instanciação óbvia da lei do verificador é o fato de que a maioria dos benchmarks propostos na IA são fáceis de verificar e até agora foram resolvidos. Observe que praticamente todos os benchmarks populares nos últimos dez anos se encaixam no critério #1-4; Benchmarks que não atendem aos critérios #1-4 teriam dificuldades para se tornarem populares.
Por que a verificabilidade é tão importante? A quantidade de aprendizagem em IA que ocorre é maximizada quando os critérios acima são satisfeitos; Você pode dar muitas etapas de gradiente onde cada etapa tem muito sinal. A velocidade da iteração é crítica — é a razão pela qual o progresso no mundo digital tem sido muito mais rápido do que o progresso no mundo físico.
O AlphaEvolve do Google é um dos maiores exemplos de aproveitamento da assimetria de verificação. Ele se concentra em configurações que se encaixam em todos os critérios acima, e levou a uma série de avanços em matemática e outros campos. Diferente do que temos feito em IA nas últimas duas décadas, é um novo paradigma em que todos os problemas são otimizados em um ambiente onde o conjunto de trem é equivalente ao conjunto de testes.
A assimetria de verificação está em toda parte e é empolgante considerar um mundo de inteligência irregular onde tudo o que pudermos medir será resolvido.

299,31K
Top
Classificação
Favoritos