Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

jack morris
@cornell @meta de pesquisa // modelos de linguagem, teoria da informação, ciência da IA
ok, preciso de ajuda! tentei ajustar o GPT-OSS no fim de semana. ele funciona por ~ 100 etapas e, em seguida, gera um erro de falta de memória CUDA
Meu palpite é que, de vez em quando, todos os tokens são encaminhados para um único especialista. então o treinamento trava.
Existe uma solução fácil? nunca ajustou um MoE antes
11,71K
Qual modelo devemos fazer a seguir?

jack morris9 de ago., 03:21
Curioso sobre os dados de treinamento dos novos modelos gpt-oss da OpenAI? Eu também estava.
então eu gerei 10 milhões de exemplos de gpt-oss-20b, executei algumas análises e os resultados foram ... muito bizarro
Hora de um mergulho 🧵 profundo

21,29K
explicação mais curta do GPT-5: isso é exatamente o que as leis de escala previram!
O modelo é melhor, os retornos estão diminuindo e, infelizmente, as melhorias absolutas da inteligência geral só diminuirão
A boa notícia é que ainda há muito a fazer. Personalidade, raciocínio, memória e criatividade ainda são problemas em aberto
26,5K
o mundo do VC oferece muito valor, mas às vezes parece que eles acabaram de incendiar dinheiro.
várias startups que conheço levantaram ~ 100 milhões no total há três anos para fazer IA, construíram software que ninguém nunca usou e agora todos trabalham em outros lugares em coisas não relacionadas.
Para onde foi todo esse dinheiro?
18,42K
estranho na era da mídia social sentir que todos estão trabalhando em revisões e refutações do NeurIPS agora, mas ninguém está falando sobre isso publicamente.
Contribuí para três refutações. Um dos três foi extremamente frustrante.
Quem mais está trabalhando em refutações? Como está indo para você?
12,67K
Passei as últimas horas conversando com o GPT-OSS e posso dizer com segurança que é diferente de qualquer modelo que testei
Em um segundo, está codificando para mim em um nível profissional, no próximo está inventando fatos básicos e se apegando a eles, não importa o que eu diga
algo muito estranho está acontecendo
32,3K
Melhores
Classificação
Favoritos
Em alta on-chain
Em alta no X
Principais fundos da atualidade
Mais notável