Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Automatizace převodu textu do SQL je stále velký úkol a existuje jen velmi málo dobrých modelů s otevřeným zdrojovým kódem pro tento úkol.
Pojďme si to rozebrat -
>Modely převodu textu na SQL nejsou v podstatě nic jiného než modely kodér-dekodér s vrstvou více pozorností a vrstvou propojující schéma mezi nimi.
> Kodér zpracovává dotaz uživatele i schéma databáze a generuje kontextová vložení (kódování s ohledem na relace)
>Prostřednictvím propojení schématu jsou tokeny v dotazu zarovnány s odpovídajícími entitami schématu
>Mechanismus pozornosti s ohledem na schéma pak umožňuje modelu zaměřit se během dekódování na relevantní části schématu
> Dekodér postupně vytváří SQL tokeny (dekódování založené na omezeních)
Kde tyto modely chybí? -
>Většina dostupných modelů postrádá složité dotazy v samotných trénovacích datech, a proto mají špatný výkon u dotazů mezi doménami nebo ve smyčce.
> Požadavek na jazyk a dotaz není u běžného uživatele vždy správný. Dokonce i pravopisné chyby vedou k nesprávnému zadání a způsobují problémy při načítání, proto je výzva důležitou součástí tohoto úkolu.
Osobně jsem na tom podrobně pracoval, když jsem dělal end-to-end projekt, dokonce jsem vytvořil syntetická data a zkoušel trénovat svůj vlastní SLM, ale žalostně jsem selhal a pak jsem pokračoval v používání Open-source modelu.
Pokud se do toho chcete ponořit hlouběji, doporučoval bych si nejprve přečíst tyto výzkumné práce -
>LLM vylepšená generace textu do SQL
>Databázová rozhraní nové generace:
>Text-to-SQL analýza: Koncepty a metody
>RASAT: Integrace relačních struktur do předtrénovaného modelu Seq2Seq




Top
Hodnocení
Oblíbené

