Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Pojďme doladit OpenAI gpt-oss (100% lokálně):
Dnes se naučíme, jak lokálně doladit nejnovější gpt-oss OpenAI.
Dáme mu možnosti vícejazyčného uvažování, jak je znázorněno ve videu.
Použijeme:
- @UnslothAI pro efektivní jemné doladění.
- @huggingface transformátory pro jeho lokální provoz.
Začněme!
1️⃣ Načíst model
Začneme načtením modelu gpt-oss (varianta 20B) a jeho tokenizéru pomocí Unsloth.
Zkontrolujte toto 👇

2️⃣ Definujte konfiguraci LoRA
LoRA využijeme pro efektivní doladění.
K tomu používáme PEFT Unsloth a specifikujeme:
- Model
- LoRA s nízkou hodností (r)
- Vrstvy pro jemné doladění atd.
Zkontrolujte tento kód 👇

3️⃣ Načíst datovou sadu
Gpt-oss doladíme a pomůžeme mu rozvinout schopnosti vícejazyčného uvažování.
Načteme tedy datovou sadu vícejazyčného myšlení, která má:
- Dotaz uživatele v angličtině.
- Uvažování v různých jazycích.
- Odpověď v angličtině.
Zkontrolujte toto 👇

4️⃣ Příprava datové sady
Před doladěním musíme připravit datovou sadu v konverzačním formátu:
- Standardizujeme datovou sadu.
- Vybereme pole se zprávami.
- Aplikujeme na něj šablonu chatu.
Kontrola kódu a ukázky 👇 dat

5️⃣ Definovat trenéra
Zde vytvoříme objekt Trainer zadáním konfigurace trénování, jako je rychlost učení, model, tokenizátor a další.
Podívejte se na 👇 to

6️⃣ Vlak
Když je hotovo, zahájíme školení.
Ztráta se obecně snižuje s kroky, což znamená, že model se správně ladí.
Zkontrolujte tento kód a protokoly 👇 školení

Nakonec video ukazuje výzvu LLM před a po doladění.
Po doladění je model schopen generovat tokeny uvažování ve francouzštině před vygenerováním konečné odpovědi v angličtině.
Zkontrolujte toto 👇
To je konec!
Pokud vám to připadalo užitečné, sdílejte to znovu se svou sítí.
Najdi mě → @_avichawla
Každý den sdílím návody a postřehy o DS, ML, LLM a RAG.

Před 21 h
Pojďme doladit OpenAI gpt-oss (100% lokálně):
84,82K
Top
Hodnocení
Oblíbené