Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Автоматизация преобразования текста в SQL по-прежнему является большой задачей, и существует очень мало хороших открытых моделей для этой задачи.
Давайте разберем это -
> Модели преобразования текста в SQL по сути представляют собой модели кодировщик-декодировщик с многоуровневым вниманием и слоем связывания схемы между ними.
> Кодировщик обрабатывает как запрос пользователя, так и схему базы данных и генерирует контекстные встраивания (кодирование с учетом отношений)
> Через связывание схемы токены в запросе выравниваются с соответствующими сущностями схемы
> Механизм внимания с учетом схемы затем позволяет модели сосредоточиться на соответствующих частях схемы во время декодирования
> Декодировщик последовательно производит токены SQL (декодирование на основе ограничений)
Где эти модели недостаточны? -
> Большинство доступных моделей не имеют сложных запросов в обучающих данных и, следовательно, плохо работают с междоменными или циклическими запросами.
> Язык и требования к запросу не всегда корректны со стороны обычного пользователя. Даже орфографические ошибки приводят к неправильным записям и вызывают проблемы при извлечении, поэтому подсказка является важной частью этой задачи.
Я лично работал над этим подробно, когда создавал проект от начала до конца, даже создал синтетические данные и пытался обучить свою собственную SLM, но потерпел неудачу и затем перешел к использованию открытой модели.
Если вы хотите углубиться в это, я рекомендую сначала прочитать эти научные статьи -
> Усовершенствованное генерация текста в SQL с помощью LLM
> Интерфейсы баз данных следующего поколения:
> Парсинг текста в SQL: концепции и методы
> RASAT: интеграция реляционных структур в предобученную модель Seq2Seq




Топ
Рейтинг
Избранное

