Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Harmonic
Construindo a Superinteligência Matemática
JUST IN: A análise revela que o Putnam é 4X mais fácil / requer muito menos raciocínio do que o IMO.
O comprimento médio da prova do Aristotle Lean4 para os 10 problemas resolvidos do Putnam foi de ~250 linhas, em comparação com ~1000 para o IMO, uma redução de 75%.
Estamos explorando a aplicação de computação estendida nos outros dois (A5 e B4), para quantificar mais precisamente a dificuldade relativa.
Algumas ressalvas: houve melhorias de modelo / algorítmicas desde o resultado de nível de medalha de ouro do Aristotle no IMO, mas também a versão para consumidores disponível ao público é muito mais fraca do que a que foi usada internamente para resolver os problemas do IMO.
Como fãs do Putnam, até nós devemos admitir — o IMO ainda é o rei. 👑

Harmonic11/12, 06:56
ÚLTIMA HORA: A versão para consumidores do Aristotle supera Putnam, resolvendo e verificando formalmente 10/12 problemas em @leanprover.
Parabéns à matemática amadora @namrata_anand2, que usou a versão de consumo do Aristotle com um lançamento público antecipado dos problemas. Parece que o Aristotle os devorou no café da manhã, resolvendo 10/12 de forma totalmente autônoma.
Atualmente, estamos analisando os arquivos e compartilharemos mais detalhes mais tarde, mas duas coisas úteis a destacar agora:
▪️ Estes parecem ser as primeiras soluções totalmente formalizadas para os problemas de Putnam de 2025 lançadas publicamente.
▪️ Todos usaram a interface de linguagem natural recentemente lançada, na qual o Aristotle recebeu a pergunta em linguagem natural, depois a autoformalizou em uma declaração Lean4 e, em seguida, completou a prova, totalmente de forma autônoma, sem intervenção humana. No passado, focamos nas capacidades de prova de teoremas de ponta do Aristotle, mas ele também está se tornando bastante capaz em autoformalização.
Estamos entrando em uma nova era para a IA e a matemática. Devagar... depois tudo de uma vez!
66,7K
ÚLTIMA HORA: A versão para consumidores do Aristotle supera Putnam, resolvendo e verificando formalmente 10/12 problemas em @leanprover.
Parabéns à matemática amadora @namrata_anand2, que usou a versão de consumo do Aristotle com um lançamento público antecipado dos problemas. Parece que o Aristotle os devorou no café da manhã, resolvendo 10/12 de forma totalmente autônoma.
Atualmente, estamos analisando os arquivos e compartilharemos mais detalhes mais tarde, mas duas coisas úteis a destacar agora:
▪️ Estes parecem ser as primeiras soluções totalmente formalizadas para os problemas de Putnam de 2025 lançadas publicamente.
▪️ Todos usaram a interface de linguagem natural recentemente lançada, na qual o Aristotle recebeu a pergunta em linguagem natural, depois a autoformalizou em uma declaração Lean4 e, em seguida, completou a prova, totalmente de forma autônoma, sem intervenção humana. No passado, focamos nas capacidades de prova de teoremas de ponta do Aristotle, mas ele também está se tornando bastante capaz em autoformalização.
Estamos entrando em uma nova era para a IA e a matemática. Devagar... depois tudo de uma vez!

Namrata Anand11/12, 06:27
Aristóteles da @HarmonicMath resolveu 10/12 problemas em 7 horas no Putnam, a competição de matemática de graduação mais difícil do mundo!
Como sei disso? Bem, eu executei o Aristóteles eu mesmo através da API pública da Harmonic. E levei cerca de 10 minutos para começar e dar início!
9 dos 10 problemas foram completados em menos de 3 horas. O décimo (B5) levou 7 horas, uma hora a mais do que os concorrentes têm disponível.
Para todos os 10 problemas, eu forneci a Aristóteles as declarações dos problemas em inglês — e ele formalizou automaticamente as declarações, provou-as e produziu saídas verificadas de forma autônoma, sem nenhum feedback humano.
Como alguém que ama matemática, mas não é um especialista, é empolgante ter uma ferramenta tão poderosa ao meu alcance! 1/
130,48K
Top
Classificação
Favoritos