Eu construí o meu próprio ChatGPT do zero, e você também pode. O nanochat do karpathy é uma base de código única, limpa, minimalista e hackeável para construir um LLM moderno. Ao configurar isso, você aprenderá a: > treinar um tokenizador desde o início > pré-treinamento: dominar a previsão da próxima palavra > meio-treinamento: ensinar o modelo a manter conversas > sft: ajustar finamente em conjuntos de dados de diálogo de alta qualidade > avaliar e registrar cada etapa do processo Eu fiz isso em um estúdio LightningAI, e você pode reproduzir tudo com um único clique (sem configuração necessária). link no próximo tweet!