Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Давайте доопрацюємо OpenAI gpt-oss (100% локально):
Сьогодні давайте дізнаємося, як локально налаштувати найновіший gpt-oss від OpenAI.
Ми надамо йому можливості багатомовного міркування, як показано у відео.
Ми будемо використовувати:
- @UnslothAI для ефективної тонкої настройки.
- @huggingface трансформатори для його локального запуску.
Давайте почнемо!
1️⃣ Завантажте модель
Починаємо з завантаження моделі gpt-oss (варіант 20B) та її токенізатора за допомогою Unsloth.
Перевірте це 👇

2️⃣ Визначення конфігурації LoRA
Ми будемо використовувати LoRA для ефективного тонкого налаштування.
Для цього використовуємо PEFT від Unslot і вказуємо:
- Модель
- ЛоРА низького рангу (р)
- Шари для тонкої настройки і т.д.
Перевірте цей код 👇

3️⃣ Завантажити набір даних
Ми налаштуємо gpt-oss і допоможемо йому розвинути можливості багатомовного мислення.
Таким чином, ми завантажуємо набір даних про багатомовне мислення, який має:
- Запит користувача англійською мовою.
- Міркування на різних мовах.
- Відповідь англійською мовою.
Перевірте це 👇

4️⃣ Підготуйте набір даних
Перед тонким налаштуванням ми повинні підготувати датасет у розмовному форматі:
- Стандартизуємо датасет.
- Вибираємо поле повідомлення.
- Застосовуємо до нього шаблон чату.
Перевірте код і зразок 👇 даних

5️⃣ Визначити тренера
Тут ми створюємо об'єкт Trainer, вказуючи конфігурацію тренування, як-от швидкість навчання, модель, токенізатор тощо.
Перевірте 👇 це

6️⃣ Потяг
З цим ми починаємо навчання.
Втрати, як правило, зменшуються з кроками, що означає, що модель налаштовується правильно.
Перевірте цей код і журнали тренувань 👇

Нарешті, на відео показана підказка LLM до і після тонкого налаштування.
Після доопрацювання модель здатна генерувати лексери міркувань французькою мовою, перш ніж згенерувати остаточну відповідь англійською мовою.
Перевірте це 👇
Ось і все!
Якщо ви вважаєте її зрозумілою, повторно поділіться нею зі своєю мережею.
Знайди мене → @_avichawla
Щодня я ділюся навчальними матеріалами та ідеями про DS, ML, LLM та RAG.

13 годин тому
Давайте доопрацюємо OpenAI gpt-oss (100% локально):
52,17K
Найкращі
Рейтинг
Вибране