O conjunto de dados da Verifier Alliance agora tem mais de 8M de contratos verificados! @ethereum tem uma forte cultura de verificação, mas os dados estão isolados e são difíceis de acessar. Abrimos tudo em formato Parquet para pesquisadores, analistas e engenheiros de IA. Explore o esquema e faça o download do conjunto de dados👇
@SourcifyEth @blockscout @routescan_io Para que serve este conjunto de dados? - Testes de compilador - Identificação de padrões de vulnerabilidade em contratos - Treinamento de modelos - Análise de dados de contratos EVM ...muitos outros casos de uso que não seriam possíveis sem um conjunto de dados aberto Reunido por @blockscout @routescan_io @SourcifyEth
Como é que os dados se apresentam? VerA é uma base de dados PostgreSQL onde cada verificação é uma ligação entre uma "implementação" e uma "compilação". Os bytecodes e fontes são deduplicados em tabelas separadas. Veja o esquema:
O bytecode EVM é não estruturado. Portanto, as "transformações" marcam as alterações nos valores de dados necessárias para alcançar um bytecode onchain a partir de um bytecode recompilado. Isto inclui imutáveis, bibliotecas, cborAuxdata, posições e valores de constructorArguments.
Todo o DB é exportado diariamente em Parquet, um formato de dados moderno baseado em colunas que é diretamente consultável. Vá até a documentação e veja como fazer o download:
79,69K