если вы ищете исчерпывающее руководство по дообучению LLM, посмотрите это! бесплатная 115-страничная книга на arxiv, охватывающая: > основы LLM > peft (lora, qlora, dora, hft) > методы выравнивания (ppo, dpo, grpo) > смесь экспертов (MoE) > 7-ступенчатый процесс дообучения > мультимодальное дообучение и вызовы > промышленные фреймворки (hf, sagemaker, openai) всё, что вам нужно знать, в одном месте! ссылка на скачивание в ответах!
ссылка на руководство:
23,03K