Să reglam OpenAI gpt-oss (100% local):
Astăzi, să învățăm cum să reglam fin cel mai recent gpt-oss OpenAI la nivel local. Îi vom oferi capabilități de raționament multilingv, așa cum se arată în videoclip. Vom folosi: - @UnslothAI pentru reglare fină eficientă. - @huggingface transformatoare pentru a-l rula local. Să începem!
1️⃣ Încărcați modelul Începem prin a încărca modelul gpt-oss (varianta 20B) și tokenizatorul său folosind Unsloth. Verificați acest lucru 👇
2️⃣ Definiți configurația LoRA Vom folosi LoRA pentru o reglare fină eficientă. Pentru a face acest lucru, folosim PEFT al lui Unsloth și specificăm: - Modelul - LoRA de rang scăzut (r) - Straturi pentru reglare fină etc. Verificați acest cod 👇
3️⃣ Încărcați setul de date Vom regla gpt-oss și îl vom ajuta să dezvolte capacități de raționament multilingv. Așa că încărcăm setul de date de gândire multilingvă, care are: - Interogare utilizator în limba engleză. - Raționament în diferite limbi. - Răspuns în limba engleză. Verificați acest lucru 👇
4️⃣ Pregătiți setul de date Înainte de reglare, trebuie să pregătim setul de date într-un format conversațional: - Standardizăm setul de date. - Alegem câmpul de mesaje. - Îi aplicăm șablonul de chat. Verificați codul și un eșantion 👇 de date
5️⃣ Definește antrenorul Aici, creăm un obiect Trainer specificând configurația de antrenament, cum ar fi rata de învățare, modelul, tokenizatorul și multe altele. Verifică 👇 asta
6️⃣ Tren Cu toate acestea, inițiem instruirea. Pierderea scade în general cu pașii, ceea ce înseamnă că modelul este reglat corect. Verificați acest cod și jurnalele 👇 de antrenament
În cele din urmă, videoclipul arată solicitarea LLM înainte și după reglarea fină. După reglarea fină, modelul este capabil să genereze jetoanele de raționament în franceză înainte de a genera răspunsul final în engleză. Verificați acest lucru 👇
Asta e o încheiere! Dacă ți s-a părut util, redistribui-l rețelei tale. Găsește-mă → @_avichawla În fiecare zi, împărtășesc tutoriale și informații despre DS, ML, LLM-uri și RAG.
Avi Chawla
Avi ChawlaCu 16 ore în urmă
Să reglam OpenAI gpt-oss (100% local):
52,2K