Давайте доопрацюємо OpenAI gpt-oss (100% локально):
Сьогодні давайте дізнаємося, як локально налаштувати найновіший gpt-oss від OpenAI. Ми надамо йому можливості багатомовного міркування, як показано у відео. Ми будемо використовувати: - @UnslothAI для ефективної тонкої настройки. - @huggingface трансформатори для його локального запуску. Давайте почнемо!
1️⃣ Завантажте модель Починаємо з завантаження моделі gpt-oss (варіант 20B) та її токенізатора за допомогою Unsloth. Перевірте це 👇
2️⃣ Визначення конфігурації LoRA Ми будемо використовувати LoRA для ефективного тонкого налаштування. Для цього використовуємо PEFT від Unslot і вказуємо: - Модель - ЛоРА низького рангу (р) - Шари для тонкої настройки і т.д. Перевірте цей код 👇
3️⃣ Завантажити набір даних Ми налаштуємо gpt-oss і допоможемо йому розвинути можливості багатомовного мислення. Таким чином, ми завантажуємо набір даних про багатомовне мислення, який має: - Запит користувача англійською мовою. - Міркування на різних мовах. - Відповідь англійською мовою. Перевірте це 👇
4️⃣ Підготуйте набір даних Перед тонким налаштуванням ми повинні підготувати датасет у розмовному форматі: - Стандартизуємо датасет. - Вибираємо поле повідомлення. - Застосовуємо до нього шаблон чату. Перевірте код і зразок 👇 даних
5️⃣ Визначити тренера Тут ми створюємо об'єкт Trainer, вказуючи конфігурацію тренування, як-от швидкість навчання, модель, токенізатор тощо. Перевірте 👇 це
6️⃣ Потяг З цим ми починаємо навчання. Втрати, як правило, зменшуються з кроками, що означає, що модель налаштовується правильно. Перевірте цей код і журнали тренувань 👇
Нарешті, на відео показана підказка LLM до і після тонкого налаштування. Після доопрацювання модель здатна генерувати лексери міркувань французькою мовою, перш ніж згенерувати остаточну відповідь англійською мовою. Перевірте це 👇
Ось і все! Якщо ви вважаєте її зрозумілою, повторно поділіться нею зі своєю мережею. Знайди мене → @_avichawla Щодня я ділюся навчальними матеріалами та ідеями про DS, ML, LLM та RAG.
Avi Chawla
Avi Chawla13 годин тому
Давайте доопрацюємо OpenAI gpt-oss (100% локально):
52,17K