Modelos de recompensas afins na fronteira de Pareto em um conjunto cada vez maior de envs RL. Venha começar a minerar modelos em ambientes RL. Ou crie uma sub-rede que bombeie modelos para esse mercado.
Florian S
Florian S1 de ago., 23:02
Ok, isso é bonito 🤯 Afim por @const_reborn basicamente é uma criptomoeda que é extraída "aplicando o melhor RL a um modelo". A mineradora cuja variante de modelo está no topo da tabela de classificação obtém as emissões. @willccbb: você deve usar sua magia para ganhar um pouco aqui? @drishanarora: aplicar IDA?
10,49K