Pojďme doladit OpenAI gpt-oss (100% lokálně):
Dnes se naučíme, jak lokálně doladit nejnovější gpt-oss OpenAI. Dáme mu možnosti vícejazyčného uvažování, jak je znázorněno ve videu. Použijeme: - @UnslothAI pro efektivní jemné doladění. - @huggingface transformátory pro jeho lokální provoz. Začněme!
1️⃣ Načíst model Začneme načtením modelu gpt-oss (varianta 20B) a jeho tokenizéru pomocí Unsloth. Zkontrolujte toto 👇
2️⃣ Definujte konfiguraci LoRA LoRA využijeme pro efektivní doladění. K tomu používáme PEFT Unsloth a specifikujeme: - Model - LoRA s nízkou hodností (r) - Vrstvy pro jemné doladění atd. Zkontrolujte tento kód 👇
3️⃣ Načíst datovou sadu Gpt-oss doladíme a pomůžeme mu rozvinout schopnosti vícejazyčného uvažování. Načteme tedy datovou sadu vícejazyčného myšlení, která má: - Dotaz uživatele v angličtině. - Uvažování v různých jazycích. - Odpověď v angličtině. Zkontrolujte toto 👇
4️⃣ Příprava datové sady Před doladěním musíme připravit datovou sadu v konverzačním formátu: - Standardizujeme datovou sadu. - Vybereme pole se zprávami. - Aplikujeme na něj šablonu chatu. Kontrola kódu a ukázky 👇 dat
5️⃣ Definovat trenéra Zde vytvoříme objekt Trainer zadáním konfigurace trénování, jako je rychlost učení, model, tokenizátor a další. Podívejte se na 👇 to
6️⃣ Vlak Když je hotovo, zahájíme školení. Ztráta se obecně snižuje s kroky, což znamená, že model se správně ladí. Zkontrolujte tento kód a protokoly 👇 školení
Nakonec video ukazuje výzvu LLM před a po doladění. Po doladění je model schopen generovat tokeny uvažování ve francouzštině před vygenerováním konečné odpovědi v angličtině. Zkontrolujte toto 👇
To je konec! Pokud vám to připadalo užitečné, sdílejte to znovu se svou sítí. Najdi mě → @_avichawla Každý den sdílím návody a postřehy o DS, ML, LLM a RAG.
Avi Chawla
Avi ChawlaPřed 21 h
Pojďme doladit OpenAI gpt-oss (100% lokálně):
84,82K